Текст
                    КЛАССИЧЕСКАЯ УЧЕБНАЯ ЛИТЕРАТУРА
ПО МАТЕМАТИКЕ
ЛЕКЦИИ
ПО ТЕОРИИ
УПРАВЛЕНИЯ
УЧЕБНОЕ ПОСОБИЕ


ББК22 181 1я73 3 91 Зубов В И 3 91 Лекции по теории управления Учебное пособие 2 е изд , испр —СПб Издательство «Лань», 2009 — 496 с —(Учеб ники для вузов Специальная литера гура) ISBN 978-5-8114-0985-3 Учебное пособие написано на основе курса лекций по теории управле ния, прочитанного автором студентам математикам ЛГУ Излагаются решение проблемы стабилизации программных движений, включая их построение, а также методы синтеза управлений, в том числе построения оптимальных управлений На основе второго метода Ляпунова строится подход к нахождению необходимых и достаточных устовин опти мальности в различных вариационных задачах, а также развиваются на этой основе вычислительные процедуры Проводится анализ стохастиче ских управляемых систем и систем, управляемых цифровым автоматом В заключение дается решение проблемы определения положения и управ ления вращательным движением твердого тела Учебное пособие рассчитано на студентов и аспирантов, инженеров и научных работников, специализирующихся в области прикладной мате ББК22 181 1я73 Обложка А Ю ПАПШИН Охраняется шконач РФ ао onmopcKOv праве будит преаедчнатмя в ii/OiOho i порядке •0 II щ\те-1ьство < Лань», 2000 Г В II Зубов, наследники, 2009 ©Ипатс-ьство <Лань» х\ 1оя оственное оформление, 2009
ОГЛАВЛЕНИЕ Глава I Проблемы стабилизации движения . 7 § 1 Линейные системы дифференциальных уравнений 7 § 2 Построение программных движений в управляемых системах . . 36 § 3 Устойчивость по Ляпунову программных движений 49 § 4 Область асимптотической устойчивости . 69 § 5 Стабилизация программного движения . 81 § 6 Дискретные регуляторы 100 § 7 Релейная стабилизация программного движения 105 Глава II Оптимальные системы управления 112 § 8 Понятие оптимальности 112 § 9. Экстремум функции многих переменных 122 § 10 Оптимальное демпфирование переходных процессов 127 Глава III Аналитическая теория оптимальных регуляторов 161 § 11 Синтез оптимального управления в линейных системах с беско- § 13 Системы с ограниченным временем 197 л.1ва IV Проблема синтеза управления . . . 210 § 14 Линейная независимость скалярных и векторных функций . . . 210 § 15 Синтез линейных управлений .... .218 § 16 Синтез управлений в квазилинейных системах и системах стабилизации . 231 § 17 Построение импульсных и релейно-импульсных управлений в ли нейной системе . ... ... 248 § 18 Релейно импульсные управления в квазилинейных системах и слстсмах стабилизации . . ... 254 § 19 Синтез линейных инвариантных управлений 263 § 20 Построение инвариантных управлений в квазилинейных системах и нелинейных системах в режиме стабилизации 268 § 21 Сш-тсз линейных управлений с последействием . 271 § 22 Построение управлений с запаздываниями в нелинейных системах 279 § 23 Определение элементов движения в линейных системах ... 291 § 24 Определение элементов движения в нелинейных системах .... 299 § 25 Построение управлений в линейной задаче преследования . . . 302 <i 26 Построение управлений в нелинейной вадаче преследования . . 309 лава V. Вычислительные методы приближенного нахождения оптимальных управлений 313 § 27 Метод последовательных приближений для отыскания оптимальных программных движений 313
4 ОГЛАВЛЕНИЕ § 28 Метод последовательных приближений для решения задачи синтеза оптимальных управлений . . . .331 § 29 Метод направленного поиска коэффициентов усиления в системах управления . . 343 § 30 Движения нелинейных систем, определяемые краевыми условиями 347 Глава VI Системы управления, оптимальные по вероятности . 368 § 31 Стохастические системы дифференциальных уравнений 368 § 32 Программные управления в линейных системах, оптимальные по вероятности 374 § 33 Программная настройка коэффициентов усиления 382 § 34. К построению программного управления в случае нелинейной стохастической системы уравнений 388 Глава VII. Применение цифровых автоматов в системах управления 391 § 35 Предварительное рассмотрение общих свойств систем управления 391 § 36 Управляющие автоматы и их структурная конструкция . 400 § 37 Алгоритмическое описание усовершенствованной модели движения 404 § 38 Исследование поведения объекта, управляемого автоматом релейной стабилизации . . . . 407 Глава VIII. Управление движением твердого тела, вращающегося вокруг неподвижной точки 410 § 39. Ориентация заданного направления . . . . 410 § 40. Ориентация осей, связанных с телом 425 § 41 Уравнения движения твердого тела, вращающегося вокруг неподвижной точки и содержащего маховики 432 § 42. Решение задачи ориентации заданного направления с помощью маховиков .... . 436 § 43 Решение задачи об ориентации осей тела с помощью маховиков 440 § 44. Цифровой навигационный автомат . . 445 § 45 Определение направляющих косинусов связанных осей . 452 § 46 Определение углов крена, рыскания, тангажа 455 § 47 Точность определения положения при двухвекторной системе контроля . . . 457 § 48 Ситуация неопределенности, возникающая при определении ориентации . . . ... 465 § 49. Определение положения оси собственного вращения в пространстве . . . 476 § 50. Определение параметров свободного вращения динамически симметричного тела . . . .... 486 Литература 495
ПРЕДИСЛОВИЕ К ПЕРВОМУ ИЗДАНИЮ Книга содержит изложение курса лекций по теории управления, читаемого автором студентам и аспирантам математико-механи- ческого факультета и факультета прикладной математики и процессов управления Ленинградского государственного университета Глава I содержит изложение методов решения проблемы стабилизации программного движения Она открывается теорией линейных систем и решением задачи об устойчивости установившихся движений В этой же главе даются основы построения программных движений в линейных и нелинейных управляемых системах, развивается теория построения непрерывных, дискретных и релейных управлений, стабилизирующих заданное программное движение Глава II касается вопросов построения оптимальных управлений по отношению демпфирования заданной функции На основе второго метода Ляпунова, который состоит в изучении движений с помощью некоторых функций, строится подход к нахождению необходимых и достаточных условий оптимальности в различных вариационных задачах, устанавливается связь такого подхода с принципами оптимальности Эрдмана — Вейерштрасса, с «принци пом максимума» Л С Понтрягина, с принципом динамического программирования Р Беллмана Глава III содержит построение управлений, оптимальных по отношению к функционалам, характеризующих, в частности, интегральную точность системы управления, исчерпывающим образом решается задача аналитического конструирования регуляторов, сформулированная А М Летовым, указываются способы построения синтезирующего оптимального управления через оптимальные программные управления, а также приводятся сходящиеся методы последовательных приближений для построения оптимального управления Глава IV содержит в ряде случаев решение проблемы синтеза управлений, решающих ту или иную задачу, в частности задачу перехода из одного фиксированного фазового состояния в другое фиксированное фазовое состояние При этом найдена конструкция в синтезированной форме семейства упомянутых управлений для линейного случая, квазилинейного случая и в режиме стабилизации Рассмотрены влияния запаздываний, а также дискретности и квантования по уровням сигнала в системе управления Построения управлений опираются на проводимые измерения, поэтому
6 ПРЕДИСЛОВИЕ в этой же главе изучен вопрос об определении элементов движения, а также вопрос о локализации движения В заключение главы строятся управления в задачах преследования. В главе V развиваются методы последовательных приближений для отыскания оптимальных управлений—как программных, так и в синтезированной форме, а также развиваются методы последовательных приближений для отыскания движений, удовлетворяющих краевым условиям Эти движения, как правило, удовлетворяют необходимым условиям оптимальности, и эти условия образуют, в свою очередь, совокупность краевых условий. Здесь же развиваются методы направленного поиска оптимальных коэффициентов усиления в системах автоматического регулирования с заданным законом управления В главе VI рассматриваются задачи построения управлений в системах, описываемых стохастическими дифференциальными уравнениями. Это построение осуществляется исходя из оптимальности вероятности осуществления определенных событий Построение проводится для наиболее простых случаев для линейных систем, а также указываются некоторые результаты, связанные с анализом нелинейных систем В главе VII развивается общий подход к математическому описанию процесса управления для того случая, когда в системе управления испольэуется конечный автомат с памятью или без нее Этот подход состоит в присоединении к динамическим уравнениям движения уравнений, описывающих функционирование конечной логической сети В этой же главе развивается подход к анализу таких процессов управления В главе VIII развиваются применения различных результатов предыдущих глав к решению проблемы управления вращательным движением твердого тела А именно, в результате этого рассмотрения найден вид управляющих моментов, действие которых приводит либо к ориентации вращающегося тела в заданном направлении, либо к сканированию осей, связанных с этим телом, по заданной программе. Наряду с этим показано, что упомянутые моменты можно создавать с помощью моментов кориолисовых сил, а также моментов относительных сил инерции В этой главе также развивается теория определения элементов движения для указанного случая. Автор считает своим долгом выразить глубокую благодарность профессору Ю А. Рябову за ценные советы и замечания, а также В. С. Ермолину, Е. Я Смирнову, А. А Улокиной за большой труд и внимание, которое они проявили при подготовке настоящей книги к печати. В И Зубов
Глава I ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ § 1. Линейные системы дифференциальных уравнений 1°. Пусть задана система линейных дифференциальных уравнений в векторной форме dxldt = Ax, (11) где А = {в//}?,/-1—квадратная постоянная матрица размерности их л, х—n-мерный вектор-столбец с координатами хх хп. Решение системы (1.1) будем искать в виде х = е*'с. (1 2) где с—некоторый постоянный вектор-столбец, координаты которых сх, .., сп зависят от выбора начальных условий системы (11), и Я,—постоянное число Подставив решение (1 2) в систему (11), получим (А—КЕ)-с = 0 (1.3) Заметим, что ||с||=5^0, а Е есть единичная матрица порядка п хп Для того чтобы существовало нетривиальное решение системы (1 3) относительно вектора с, необходимо и достаточно, чтобы det04—a.£) = 0 (14) Это соотношение представляет собой алгебраическое уравнение n-й степени относительно к Его корни ^ кп являются собственными числами матрицы А. Для каждого i = k/ мы получим решение с = Су системы (1 3) Можно взять в качестве координат вектора су алгебраические дополнения элементов любой строки определителя (1 4) при X = K/t если не все они равны нулю. Итак, частным решением системы (1 1) будет x/ = eVc/, /=1, 2 п (15) Чтобы получить общее решение системы (1 1), возьмем линейную комбинацию частных решений (1 5) х (0 = J2 yfr = .£ Y,eVc,. (1 5)
8 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ 1 Эта линейная комбинация является общим решением системы (1 1) при условии ^ФХу, если t'^=/ (точнее, корням Я,,, , Хп уравнения (1.4) отвечают простые элементарные делители матрицы А) В общем случае решение (1 5) представимо в форме Х/(<) = Ру(0еЧ /=1, 2 п, (17) где Ру (0—полиномы относительно t, степень которых меньше кратности корня А,у, а коэффициенты полиномов ру(/) являются постоянными векторами Рассмотрим случаи 1) все корни X, имеют отрицательную вещественную часть, т. е ReA,y < 0, /'= 1, 2, ..., п, тогда любое решение системы (1 1) стремится к нулю при неограниченном возрастании времени (, 2) существует по крайней мере хоть один корень Хуо такой, что ReAyo>0, тогда соответствующее ему решение (1.6) неограниченно возрастает при t—*+oo при любых, даже при сколь угодно малых значениях координат вектора ху в начальный момент времени Первый случай естественно назвать случаем устойчивости решений, а второй — случаем неустойчивости решений Наличие кратных корней Я, не меняет картины поведения интегральных кривых системы (1 1), так как p„(t)eKt—*0, если Разобьем все корни Я.х, . , Х„, т е все собственные числа матрицы А на три группы 1) A,lt .... A.ft—собственные числа с положительной вещественной частью, 2) Я.А+„ ..., А.л+/—собственные числа с нулевыми вещественными частями, 3) Я*+/+1, .. «... К+п—собственные числа с отрицательными вещественными частями. Известно [2], что существует неособое линейное преобразование х = 5у над вектором х такое, что система (1 1) приводится к следующей: dy/d/ = S-MSy, (18) где S"1—матрица, обратная к S. Систему (18) можно разбить на три подсистемы $"*♦* &-**• Ж=А~У» 0 9) где А + , Л0, Л_—матрицы, соответствующие указанным трем группам собственных чисел (это можно сделать, так как матрица А приводится к канонической форме Жордана). Вектор ух имеет размерность k, и все решения системы уравнений относительно yt возрастают неограниченно при t—«-oo, в то время как все решения системы относительно вектора у3 убывают и стремятся к нулю при t—*oo. Собственные числа матрицы А0
§ 1] ЛИНЬЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 9 имеют вид kj = i\x.y, и частное решение, соответствующее такому Ау, запишется в форме yi/ = e"Vct/. (1 10) так что оно выражает одночастотные колебания. Общее решение для вектор столбца у„ будет иметь вид у,= 2тЛс2/, (1 и) если считать, что \i/t / = 1, 2, .... 1/2, различны. Решение (1 11) описывает сложное колебание, представляющее результат наложения одночастотных колебаний Эти колебания будут периодическими, если частоты соизмеримы, и почти-периодическими, если частоты несоизмеримы Таким образом, все n-мерное пространство может быть разложено в прямую сумму подпространств, и решения в любом подпространстве ведут себя одинаковым образом, а движение во всем пространстве складывается из движений в этих подпространствах в указанном выше смысле Примечание 11 Из приведенных рассуждений возникает задача определения и анализа характера корней уравнения я-й степени det(,4— л£) = 0 (1 12) В частности, при выяснении вопроса об устойчивости решения надо определить, лежат ли все корни этого уравнения в левой полуплоскости комплексного переменного Я, Отобразим эту полуплоскость на единичный круг плоскости комплексного переменного р при помощи функции * = РгЙ- <113) При этом преобразовании корни уравнения (1 12) перейдут в корни уравнения det[^-£B^i]=0. (114) Умножая (1 14) на (1+р)", получим det[4 + £-p(£—Л)]=0. (115) Меняя в (1 15) р на —р и умножая обе части на det [(A—£)~1], получим det (б— р£) = 0, (1 16) где £ = (Л— Е)~ЧА->ГЕ)
10 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Таким образом, если Rea,y<0, где Xj есть собственные числа матрицы А, то все собственные числа матрицы В лежат в единичном круге. Обозначим корни (1 16) через рх, ..., р„ Известно, что матрица Bk будет иметь корни р*, .. , р£ Отсюда следует для того чтобы собственные числа матрицы А лежали в левой полуплоскости, необходимо и достаточно, чтобы 5*^0 при й-* + оо. (1.17) Действительно, В можно представить в виде B = S~*RS, где 5—неособая матрица преобразования подобия, a R имеет диагональную форму с р,, . ., р„ по диагонали или форму Жор- дана с такой же диагональю Тогда B* = S-^*S, (1 18) и Rk — 0, если р/( i = l, 2, ..., п, по модулю меньше единицы. Отсюда и следует (1 17) Условие (1 17) будет выполнено, если для какого-либо к окажется, что модуль каждого элемента ft* t матрицы В* не превосходит числа а/п, где а—любое положительное число меньше единицы, а п—число уравнений, т. е. если |^/|<о/я (1 19) Действительно, тогда каждый элемент матрицы Вгк не будет превосходить л — — = —, матрицы В3"—2L и т. д , что приводит к (1 17) Проверка этого критерия основана на построении матрицы В Мы имеем В = (А-Е)-1(А + Е) = (А-Е)-1[(А-Е) + 2Е], откуда В = Е + 2 (А — £)-*. Следовательно, матрица В будет построена, если будет найдена матрица С = (А— Е)~К В связи с этим возникают задачи Задача 11 Вычисляем следы матриц Sp B1 = su Sp Ba = s2, , Sp B" = sn Выразить через sl, , s„ необходимые и достаточные условия того, что ReXy<0, /=1. 2. , я.
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 11 Задача 12 Вычисляем SpBl = a„ Sp B2 = a2, Sp B* =a8, ... SpB2"-l = a„. Выразить через с,, ..., a„ необходимые и достаточные условия того, что Re Ху < 0, / = 1, 2, , л 2°. Рассмотрим систему дифференциальных уравнений п-го порядка dx/dt=A(t)x, (120) где A(t) вещественная, непрерывная, 2я-периодическая матрица A(t + 2n) = A(t) (121) Возьмем фундаментальную матрицу Y (t) решений \Ут Упп/ Y(t)=[ (122) любой столбец которой есть решение системы (1 20), а при t—0 У(0) = £, Е—единичная матрица Известно, что det [У Ц)]ф 0 Решение, удовлетворяющее начальным условиям х = х0 при /=0, будет иметь вид x(t) = Y(t)x0 (123) Ясно, что Y(t) = Y(t)C, (124) где С — некоторая постоянная неособая матрица, также является фундаментальной матрицей, и вообще любая фундаментальная матрица содержится в формуле (1 24) Рассмотрим матрицу Y(t + 2n) Она удовлетворяет уравнению Y = A{t + 2n)Y = A(t)Y и является, таким образом, также неособой фундаментальной матрицей, а следовательно, выражается через Y (t) по формуле (124) Y(l + 2a) = Y(t)C. (125) По аналогии Y{t+4n) = Y(t)C*. (126) Определение 1.1 Функции, обладающие свойством ф(* + со) = йср(0 (1 27) для любого t и кф\, будем называть периодическими функциями 2-го рода.
12 ПР0Б1ЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ 1 Положим Л(0 = Ф(0*-'/и. (128) тогда функция h(i)— ©-периодическая Действительно, Л(/ + о)) = ф(/ + о))А-('+")/» = *ф(0й-'/<о/г-1 = /г(0 Таким образом, периодические функции 2-го рода представляются в виде <р (/) = *"• А (О, (129) где h (t + <o) = h (t)—©-периодическая функция В соответствии с (1.25) фундаментальная матрица У (t) является периодической функцией 2-го рода с со = 2я, k = C Следовательно, можно представить У (0 в виде У(<)=Ф(/)С"<">, (130) где Ф (t) = Ф (t + 2л) и С—неособая постоянная матрица Положим 5=2^1пС, (131) и перепишем (1 30) в виде Y(t)=Q>(t)eBt, (132) причем матрица В —постоянная В системе (1 20) сделаем неособое линейное преобразование над вектором х по формуле х(*) = Ф(0*(0 (133) Оно приводит к системе дифференциальных уравнений с постоянными коэффициентами dz/dt = Bz (134) Покажем это Дифференцируем по / равенство (1 33) \=Фг + Фг = Ах = АФг (135) Учитывая (1 32) и тот факт, что Y (t)—фундаментальная матрица решений для (1 20), получим Y = <beBt+ ФВет = AY = АФевг, или [Ф + ФВ —ЛФ]ев' = 0, откуда Ф = — ФВ + АФ (136) Подстановка (1 36) в (1 35) дает — ФВг + АФг + Фг = АФг, или
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 13 Фг = ФВг, откуда z = 0-1(Dj3z = Bz, что и требовалось доказать Таким образом, существует неособая матрица преобразования такая, что систему (1 20)с периодическими коэффициентами можно свести к системе с постоянными коэффициентами (1 34), так что [3] Y(t) = 0(t)eBt (1-37) При этом, так как Ф(0— 2я-периодическая матрица, то можно получить, что В = 2^1п[К(2я).у-Ч0)]. (137') Это составляет содержание теоремы Флоке Рассмотрим теперь общий случай линейной системы dx/dt = A(t)x, (138) где A (t)—матрица порядка пхп, элементы которой являются вещественными непрерывными и ограниченными функциями, заданными при *>0 Пусть известна фундаментальная матрица решений Y (t) Тогда решение неоднородной системы dx'dt = A(t)x + f(t) (139) при любом выборе непрерывной векторной функции /(/) может быть найдено с помощью квадратур и дается формулой Коши х (0 = Y (О У-» (t0) x0+\Y (0V-> (t) / (т)dx. (1 40) Аналитическая природа функций, образующих фундаментальную матрицу Y(t), почти не изучена, хотя аналитическое представление этой фундаментальной матрицы весьма важно иметь для решения ряда задач теории управления и колебаний. Например, в качестве весьма трудной проблемы можно предложить следующую задачу Задача 13. Найти представление фундаментальной матрицы решений для системы х=Л(0х, (1.41) где /4(0= £ V* Здесь ДА —постоянные матрицы, цд — постоянные вещественные числа; N — некоторое натуральное число.
14 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Для изучения свойств фундаментальной матрицы А М Ляпунов ввел в рассмотрение характеристичные числа [10] Ниже излагается теория, принадлежащая А М Ляпунову Определение 1 2 Характеристичным числом %(/) непрерывной функции /(/), определенной на всей вещественной полуоси t^O, называется число К0, удовлетворяющее при любом е > 0, как бы мало оно ни было, условиям. 1) lim /(0e(*--e)'=0, Ve>0, 2) функция f(t)e^+^1 не ограничена при t—*oo Если при любом Я0 lim f(t)e}°' = 0, то считаем, что х(/) =+оо (характеристичное число нуля равно +оо). Если lim /(/)e*">'=oo при любом Х0, то считаем, чтох(/) = = —оо При этом условии функция /(О имеет конечное или бесконечное характеристичное число Нетрудно показать, что хф=,-Ш^Ш при *_* + «>, \(\ф0. Приведем некоторые из свойств характеристичных чисел функций, установленных А М Ляпуновым 1 Характеристичное число суммы двух функций равно наименьшему из характеристичных чисел этих функций, когда эти числа различны, и не меньше их, когда они равны 2 Характеристичное число произведения двух функций не меньше суммы их характеристичных чисел Отсюда следует x(/f) = o>x(/)+x(f). 3 Для того чтобы сумма характеристичных чисел функции / и 1// равнялась нулю, необходимо и достаточно, чтобы выражение — In|/(0I стремилось при t—+ + oo к определенному пределу 4 Если x(/f) = X(/) + x(j) = 0, то х(/ф) = %(/) +Х(ф). где ф —какая-нибудь функция 5 Характеристичное число интеграла не меньше характеристичного числа подынтегральной функции При этом рассматривается интеграл ]/(т)^т, если х(/)^0> в противном случае -5/(T)dT.
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 15 Пусть х, (() хп (() — какое-нибудь решение системы (1 38). Будем называть характеристичным числом рассматриваемого решения и обозначать через %(хи ..., хп) наименьшее из характеристичных чисел функций а*х, .., хп Всякое решение линейной системы (1 38), отличное от нулевою, имеет конечное характеристичное число Действительно, умножим (1 38) скалярно на х, и тогда, поскольку х*Лх==х* ,,4*х, получим ±\\х\\* = х'(А+А*)х, где • означает транспонирование. Обозначим собственные числа матрицы А + А* через Я.х \п и положим Я,= max l\Xs\\ < + oo. Ks<n Тогда, обозначая хо = х(0), легко получить ||x0|i2e-^<||x||2<||x0|[V. Таким образом, можно считать, что |х,(0К«"/8, s=l, 2 п. Это и означает ограниченность характеристичных чисел. Пусть К (0—фундаментальная матрица решений уравнения (1 38) Справедливо следующее утверждение система (1 38) не может иметь более п решений с различными характеристичными числами Так как общее решение системы (1 38) представляется в виде x(t) = Y(t)c, или xs=^lys/cJ, s=l, 2 п, где с} — произвольные постоянные, то характеристичное число решений x,{t) равно наименьшему из характеристичных чисел функций #*/(*)• /=1. 2, .... л, если последние различны (свойство 1) Пусть среди характеристичных чисел А,,, ..., кп какой-то фундаментальной системы решений имеются равные Тогда характеристичное число решения, являющегося линейной комбинацией решения с одинаковыми Ху рассматриваемой фундаментальной системы, может оказаться больше характеристичных чисел решений, входящих в комбинацию В этом случае полученное решение включаем вместо одного из комбинируемых решений в состав фундаментальной системы Если новая фундаментальная система опять будет иметь решения, комбинация которых дает решение с характеристичным числом, большим, чем характеристичные числа группируемых решений, то преобразуем эту систему, как предыдущую. Поскольку число различных характеристичных чисел
16 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ. I конечно, то в результате получим систему решений, в которой всякая линейная комбинация решений будет обладать характеристичным числом, равным характеристичному числу одного из комбинируемых решений Полученная фундаментальная система называется нормальной Характеристичные числа Xit ,Xn нормальной системы решений (среди них могут быть и равные) называются характеристичными числами системы дифференциальных уравнений (1 38). Пусть 5=2 h> тогда справедливо неравенство 5<Х exp{j2a,A} • которое получается из свойств характеристичных чисел и равенства det Y (t) = det Y (0) exp J J 2 assdx\ Обозначим |i=x[exp{-$ J;fl,/h:}j. Определение 13 Систему (1 38) будем называть правильной, если S + n = 0 Пример 11 Пусть dx/dt = Ах, где Л— постоянная матрица Обозначим через iij, , ц„ корни уравнения det (Л— ц£) = 0 Оказывается, что Я, = = Re( — ц,], s=l, , п. Пример 12 Пусть А (/) в системе (1 38) — периодическая матрица периода Т Тогда, в соответствии с (1 37), (1 37'), где 2я надо заменить на Т, Y (t) = <S>(t)eBt, причем B = j- In [Y (T) K-»(0)]. В частности, если К (0 —нормальная фундаментальная матрица, так что Н(0) = £—единичная матрица, то B~\nY(T) Обозначим корни уравнения det (В—ц£) = 0 через цх, . , ц„ Тогда Я.. = =Re[—p-i] Заметим, что система (1 38) будет правильной всегда, если А — постоянная или периодическая матрица 3° Рассмотрим теперь линейную систему уравнений в конечных разностях х*+1 = ЛхА, /е = 0, 1, 2, . . , (1.42)
§ 1J ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 17 где А — постоянная вещественная матрица размерности пхп, хк есть n-мерный вектор На систему (1 42) можно смотреть как на рекуррентное соотношение, определяющее каждый член последовательности х0, х1( . , xk через непосредственно ему предшествующий Таким образом, если задать вектор х„, то каждый член этой последовательности определяется по формуле хк = Акх0 (143) Из формулы (1 43) вытекает, что характер поведения решения системы (1 42) при k—♦ + <» определяется собственными числами матрицы А Так, например, ||xft|| -О при любом выборе вектора х0 тогда и только тогда, когда собственные числа матрицы А расположены внутри единичного круга с центром в точке р = О, т е. когда |ру.|<1, / = 1, 2, ., п, где plf ..., р„ — корни уравнения det(A —p£) = 0 (144) Несмотря на то, что система (1 42) и ее общее решение (1 43) имеют весьма простой вид, к такого рода системе сводится достаточно широкий круг линейных систем дифференциальных уравнений, описывающих, в частности, дискретные системы автоматического регулирования Пусть дана система вида х = Лх+2 [Лух((*-/)/i)+ 5;z((£-/)/t)], (1 45) z((* + l)A) = 2 [Cfidk-nhi + Dpak-nh)], (1 46) где h—некоторый положительный параметр (шаг дискретности;, х —вектор размерности п и z —вектор размерности г, А,, В;, С/, DJt /= 0, , / являются постоянными матрицами соответств\ющич размерностей Система (1 45) —(1 46) определяет движение при / £ [/г/г, [k + l)h] с начальным условием x = x(£/z)=xft Другими словами, для того чтобы определить движение с помощою системы (1 45) — (146), следует задать начальные значения x((k — /)/i) = xft_y, z((* — i)h)=4-^ / = 0, 1, .. , / Тогда интегрируя систему (1 45), можно определить единственным образом вектор-функиию x(t) при t£[kh, (k-\-l)h] и т. д
18 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ (ГЛ I Действительно, применив приведенную выше формулу Коши к системе (1 45), получим к(0 = ед<'-*А>х(*А) + + $ е* «'-*{ 2 [A,x«k-l)h) + BjZ«k-l)h)]\dT (1 47) kh V. '= ° ' при ^ € [*Л. (*+1)Л]. Полагая в (1.47) t = (k+\)h, найдем х ((ft + 1) h) = S И,х ((ft- /) Л) + Bjt ((ft- /) h)], (1 48) где через Af, Bj обозначены постоянные матрицы, получающиеся из (1 47) в результате приведения подобных членов и раскрытия скобок Будем рассматривать теперь уравнение (1 48) совместно с (1 4G) Для того чтобы записать эту совокупную систему в форме (1 42), введем в рассмотрение вектор 6*«Нх((*+1)Л). х(АЛ) x((ft-/+l)/z), z((ft+l)ft) z((ft-/ + l)A)> Тогда систему уравнений (1.46), (1 48) можно записать в виде £а+, = Л£». (149) где А — вещественная квадратная постоянная матрица порядка (/» + /■)(/+1) Согласно изложенному выше поведение решений системы (1 49) определяется собственными числами матрицы А Из формул же (1 47) и (1 46) вытекает, что поведение решений линейной системы (1 45) — (1 46) целиком зависит от поведения последовательности %к Таким образом, если собственные числа матрицы А лежат внутри единичного круга, то, как показано выше, будет х(0 —0, z(ftA)—0 при / — + оо, ft_, + oo, и, более того, при выполнении этого свойства собственные числа матрицы А будут лежать внутри указанного круга 4° Рассмотрим вопрос о представлении решений линейных дифференциальных уравнений с запаздывающим аргументом В последние годы выяснилась та большая роль, которую играют системы уравнений с запаздывающим аргументом в различных вопросах физики, механики и математики Поэтому приведем полную теорию наиболее важного класса систем диф-
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 19 ференциальных уравнений с запаздывающим аргументом—линейных систем с постоянными коэффициентами и постоянными запаздываниями. Система уравнений 1Г= Ё <W*i(t-h,). s=l п, (160) где с$ — вещественные постоянные, Л0 = 0, а 0<Л1<Л3<... . < Av—также вещественные постоянные, называется системой линейных стационарных однородных уравнений с v запаздываниями Обозначим через gsl(fi), s, 1=1, . , п, совокупность функций ограниченной вариации, заданных на [ — ft,0]. Рассмотрим систему л ° ^=£f*i('+*)4e,,(<>). s=i п. (i.5i) j=i -h Легко видеть, что система (1 51) включает в себя как частный случай систему (1 50) Положим далее G (ft) = {gst (ft)}£,_, Тогда систему (1.51) можно записать в матричной форме ■g-= J rfG (О) х (/ + #). (152) где х является векторной функцией, a dG (ft) = {dg,, ($)}£/_,. В (1.52) дифференциал относится только к элементам матрицы G. Мы ставим перед собой цель дать способы представления решений системы (1 52) при условии, что x(t) = <p(t), /£ [—Л, 0] (где ф—некоторая векторная функция, о которой речь будет идти ниже), а также исследовать поведение этого решения при t —► + оо Отметим, что подобные задачи для систем вида (1 50) или, точнее, для частных случаев таких систем были рассмотрены также в работах [4 — 6] В дальнейшем всюду будем использовать тот факт, что решение системы (1 52) существует для любой непрерывной векторной функции ф(/), заданной в [—Л, 0] и что во всем промежутке [ — h, +°°) имеет место оценка || х (t) || ^ Mect, где М, с — некоторые постоянные Обозначим через А (к) матрицу $ e?*dG(ft) — л£ В работе [7] показано, что все корни уравнения det4(A) = 0 (153) лежат в полуплоскости Re?t<c, где с—чисао, выписанное в приведенной выше оценке для ||х(/)||
20 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ 1 Обозначим через А,,, , л„, . все точки комплексной плоскости, в которых целая функция det А (к) обращается в нуль При эгом точки занумерованы так, что Re(X,)> Re(A.2)>... Пусть Sj есть кратность корня А,у уравнения (1 53) Разобьем точки Ау, /■= 1,2, , на группы, отнеся в одну группу те, которые имеют одинаковые действительные части Таким образом, каждая из групп будет характеризоваться одним из чисел а, > > а2 > , при этом Oj—действительная часть корней, входящих в / ю группу Покажем теперь, что каждая из таких групп конечна Лемма 11 Число корней уравнения (1 53), расположенных в вертикальной полосе, a<ReA<fr, a> —oo, (154) конечно Элементами матрицы j eMdG(u) являются целые функции о *!'**(*-)= ) eMdgs,(-&) Легко видеть, что эти функции ограничены в полосе (1 54) Поэтому функции bk в соотношении det А (а) = (— 1)"л» + 2 М.""* будут также ограниченными в указанной полосе, так как они являются конечными полиномами относительно функций i|^(A,) Отсюда следует, что если л принадлежит полосе (1 54) и | л- | > В > 0, где В—достаточно большое число, то | det А (к) | > 0 Таким образом, корни уравнения (1 53), лежащие в полосе (1 54), расположены полностью внутри области a< ReA.<6, |A,|< В, а точек сгущения корней в конечной области на комплексной плоскости быть не может Следоватеаьно, в указанной полосе расположено лишь конечное число корней Теорема 11 Каждому корню Лу уравнения (1 53) отвечает решение уравнения (1 52) Xj(t), представимое в форме x/(/) = 2ilJe-M-»(A)F(A)dX, (155) с/ где cf — окружность радиуса rj с центром в точке Я, = Я.у такая, что в круге |л—Лу|<;гу нет других корней уравнения (153), a F(a)—произвольная однозначная аналитическая функция в этом замкнутом круге Интегрирование в формуле (1 55) ведется против часовой стрелки Доказательство. Функция ху, определяемая формулой (1.55), определена при /£(— оо, -foe), непрерывно диффе-
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФКНЕНЦИЛЧЬНЫХ УРАВНПШЙ 21 ренцируема и, более того, является целой функцией относительно/ Подставим функцию (1 55) в систему (1 52), тогда потучим Щ"л~ (k)F(l)dX\— JdG(fl) ) eka+<»A-l(X)F(l)d},= = $<?x'fx£— J e™dG(OVjA-*(k)F(X)dX=— \euFCk)dX Последний интеграл, стоящий в цепи этих раснств, по теореме Коши равен нулю Таким образом, функции х, удовлетворяют системе (1 52) Следствие 1 Каждому корню Kj уравнения (1 53) отвечает целая функция P/(/)eV, являющаяся решением системы (1 52), где Р/(0 представляет собой полином относительно I степени не выше S/— 1 с векторными постоянными коэффициентами Действительно, функцию (1 55) по теореме о вычетах можно представить в следующей форме ч;-(0 = res^M-^tyF^) где А (А.)—транспонированная матрица алгебраических допотне- )И1Й для элементов А (К) Тогда х^ можно выразить в форме 1_ dSrx ГеЧ4(Х)Г(>.)(Л-Я// 11 При этом, ввиду произвольности однозначной аналитической функции F, постоянные векторы с, выражаются через st произвольных векторов при помощи линейных комбинаций с коэффициентами, зависящими лишь от матрицы А (к) Следствие 2 Если уравнение (1 53) содержит чисто мнимые корни, то система (1 52) имеет периодические решения В силу линейности системы (1 52) любая комбинация функций х,, взятых в конечном числе также будет решением системы (1 52) Следсвательно, если есть несколько рационально независимых
22 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I чисто мнимых корней, то система (1 52) имеет также почти-периодические решения (подразумевается на шчие попарно несоизмеримых корней) Введем в рассмотрение пространство векторных функций, заданных и непрерывных на сегменте [— ftlf 0], hY> h, ф(— hy) = 0 и удовпетворяющих на нем условиям Дирихле Совокупность этих функций будем обозначать через С0 Рассмотрим векторную функцию о * о B(k, ф)= J eMdG \ e-*T<p(T)dT—л $ е-*ху(х)dx—<р(0) (1 56) Здесь G(fl) = G(—А) при $£[— Ах, ft] Функция В (К, ф), определенная равенством (1 56), есть целая функция параметра X при любом ф£С0 и при закрепленном Я. является линейным ограниченным оператором из С0 в Е'п, где Е'п—«-мерное комплексное пространство Теорема 12 Функция *^ = Уи- [ ^А-^(%)Ь(К, <p)dk, (1.57) где а>с представляет собой непрерывное решение системы (1 52), удовлетворяющее условию х(0 = Ф(0, /€[-А, 0], Ф6С0, т е решение системы (1 52), удовлетворяюще условию х(/) = Ф(0. <€[-*!, 0], (1 58) при пюбом ф(0€С0 представимо формулой (1 57) Здесь V Р — ггавное значение интеграла Доказательство Векторная функция (157) получена "при помощи преобразования Лапласа из системы (1 52) и поэтому опредепена и непрерывна при /^—ht Покажем сначала, что функция (1 57) удов!етворяет условию (1 58) Для этого рассмотрим функцию ф(0 = ф(0 пРи ^6 [— Alt 0] и ф(0 = <Р(0) при t ^0 Легко видеть, что эту функцию можно выразить в форме VW-TrT8" ( I C-?T4>W^ + J£f)^ 0 59) Вычитая из равенства (1 57) почленно (1 59), получим х(0-ф(0=-^- l e"K{l)dK (1.60)
§ 1 ) ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ R(M—-Л-' о . о (л) J £юКе*<»-*>«р Вычислим интеграл, стоящий в правой части равенства (1 60), для чего рассмотрим систему окружностей сг с центром в нуле радиуса г > 0, г—»- + оо Рассмотрим замкнутый контур Lr, образованный дугами этих окружностей сг, лежащими в полуплоскости ReA,>cr, и отрезком прямой ReA, = o, лежащим внутри сг При любом t&t—hj^ будем иметь ip'RMdX-0. ибо внутри и на границе контура Lr подынтегральная функция является однозначной и аналитической Отсюда следует, что вычисление интеграла (1 60) сводится к нахождению предела У= Urn le><R(k)d\. (1 61) Легко видеть, что | R (К) \ —►О при к £сг и г —► + °° Поэтому по лемме Жордана У = 0 при /<0 Отсюда х(/) —<р(/) = 0 при t£[—Л1( 0) Из непрерывности функций x(t) и <p(t) следует, что х(/) = Ф(0 на /£[— К, 0] Покажем теперь, что функция х = х(/, ф) удовлетворяет системе (152) при /^0 Для этого введем в рассмотрение вспомогательную функцию Y=e-"'x(/, ф) (1 62) Тогда векторная функция (1 62) будет удовлетворять системе уравнений 4г= j>e (*) Y (/ + *), (1.63) где dGc (Щ = e"»dG («)—2cdG0 (fl), если только функция х(/, ф) удовлетворяет системе (1 52) и условию У = фе-*с< при t£[—hu 0] Здесь через О0 обозначена такая матричная функция ограниченной вариации, что имеет место соотношение J dGe(0)Y (<+*}=¥(/).
24 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Из [7] следует, что введенная нами функция Y удовлетворяет неравенству || Y(/)||< це~с' при />0 Положим ф1(0 = фб~гс/. ф€С0 Покажем, что функция Y = gi, V Р J &A? (К) Вс (к, ф,) dk (1 64) удовлетворяет системе (163) при /^0 Здесь —c<a<0, a матричные функции Лс и Ве определены так же, как и выше, но через Gc Рассмотрим функцию Y,=2^VP j & AT1 (К) Вс (?>, ф,) dk Эга функция непрерывно дифференцируема, и ее производная совпадает с векторной функцией Y Подставим векторную функцию Y, в систему (I 63), тогда получим =vpl"[' &Атх$.)Ве(К фх)— Г dGe{b)*lt+*>A7x (X) ВС(Х, у,) Ly_ Покажем, что интеграл, стоящий в правой части последнего равенства, при / > 0 обращается в нуль. Имеем ivpJj--^^K = iVP f (—t)|I **dGA e-"Vi(T)dT-4.1(0)|^ + O+foo 0 O-la, -A, Интеграл J, может быть вычислен при помощи леммы Жор- дана и обращается в нуль при / > 0 Интеграл J4 является
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ обращением преобразования Лапласа над функцией !(/), где С ф,(/) для /€[— Alf 0), Ф,(0) »(0 = для / = 0, 0 для / > О, поэтому он также обращается в нуль при t > 0 Следовательно, функция Yj при t> 0 удовлетворяет системе (1 63) В силу непрерывности этой функции и ее производной она будет также удовлетворять этой системе при f^sO Таким образом, имеем тождество при />0 (при / = 0 производная понимается как правосторонняя) Дифференцируя обе части этого равенства по /, получим, что функция (1 64) также при /^0 удовлетворяет системе (1 63) Отсюда следует, что функция (1 64), домноженная на е2С', будет удовлетворять системе (1 52) и условию Ye2c/ = q>, /€[— Ах, 0). Покажем, что егс1\ совпадает с функцией (1 57) Действительно, O + foo Y<?"' = 2^VP f е^+^'А71(Х)Ъс(Х, «pJrfA.. a-la Сделаем в последнем интеграле тождественные преобразования, положив Х + 2с = |х, (р1 = е-2<:'ф1 dGc = e"*dG(fl) —2cdG0(tt) Тогда получим Ас(к)= J e^dGe—л£ = о = Г е(Я+гс,*^С(^)_(х+2с)£ = Л(л + 2с) = Л((1). Таким образом, о # о Вс(л, 4>i) = j" eMdGc ^e-^ffA^dr—'k J в-^ф^т)^—ф^О)- о # = С <,<>.+«>tfdG(fl) С e-ta+")q,(T)dT_ о —(л + 2с) j е-1[^+ге)ф(т)йт—ф(0) = В(ц, ф)
26 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Окончательно получим Ye2"=iV P I Л4-1(,х)В(ц,ср)^. где а-*-2с>с. Таким образом, получено, что \eict — x(t, <р), где х(*. <р) определяется формулой (1 57) Итак, показано, что формула (1 57) доставляет решение системы (1 52) при /^0, удовлетворяющее условию х(/, <р) = «р, /£[—h, 0] В теореме 1 1 дано представление частных решений системы (1 52) при помощи формулы (1 55) Если брать линейные комбинации функций Х/(1) в бесконечном числе, то мы получим ряды, вообще говоря, формально удовлетворяющие системе (1 52). Возникает вопрос, какое решение системы (1 52) такие ряды могут представлять и в каком смысле? Для выяснения этого вопроса введем следующие определения Рассмотрим счетное множество точек г{ комплексной Плоскости "к, обладающее свойствами. 1) Rerf<.c, 2) \rf\—юо, 3) в любой полосе а^ Re X^Ь, а>—оо, существует лишь конечное количество чисел г,, 4) Rer1'^Rera^ Rers^ .. Припишем точке г} конечную кратность nt/ и разобьем эти точки на группы, относя в одну и ту же группу те точки r/t которые имеют одинаковые действительные части, и обозначим через nf число элементов /'-й группы Введем в рассмотрение функции F/(t) = p/(t)eГ/, где ру(0 — полином степени Шу—1, коэффициенты которого представляют собой п-мерные векторы Определение 14 Ряд 2 F/ будем называть асимпто- /=i тическим разложением первого рода функции (*(/)• заданной при t^O, если выполнены аедующие два условия 1) л, = л,= .. = 1, 2) IUo-SfJL-*'**_*<) II /=i II при t —»оо дпч любого k Точнее, ||^(0-SFy||e-ReV<Cft(e)e-[Re^-'*+,)-el' (165) для любого е > 0, а сА(е)—некоторые непрерывные функции, заданные при е€[0, 1J.
§ 1] ЛИНЕЙНЫЕ СИОТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 27 Определение 15 Ряд 2 F/ называется асимптотичвг скил/ разложением функции fi(t) второго рода, заданной при t^O, ест для любого числа k, представимого в форме k= 2"/' выполнено соотношение (1 65) Обозначим через уу(<, ф) те векторные функции, которые получаются из функций Xj{t), если в формуле (1 55) функцию F (а) заменить целой функцией В (л, <р) Теорема 13 Если в каждую группу af входит лишь по одному корню Лу, /= 1, , оо уравнения (1 53), то решение (1 52) х(/, ф) разлагается в асимптотический ряд первого рода \((, ф) = = 2у,(<.ф) Доказательство Рассмотрим функцию <р+ (t) l <Р(0, t 6 [—/»!, О), I о , г>о Эту функцию можно представить в следующей форме. Обозначим через х+ (t) функцию, получаемую из х(/, ф) по формуле х+(0 = х—ф+ = О + Ст Г ОТ j euA-l(X) В(л,ф) — Л(л) j Ф(т)е-и^т La (1 6G) Из формулы (1 6G) видно, что векторная функция х+ при />0 совпадает с функцией x(tf, ф), и поэтому для доказательства теоремы достаточно показать, что функция х+ разлагается в асимптотический ряд 1-го рода х+ = 2У/(*»ф) Производя преобразования в формуле (1 66), получим О + la, Г 0 0 -1 ^ШУР J t^'A-W \— ^ e^dG^<p(T)e-udx— ф(0)Ыл (1 67)
I ДВ11 -КЕНИЯ Выберем в интервале (ак+1, ак) точку а и рассмотрим последовательность замкнутых прямоугольных контуров, образованных отрезками '*=[<* — 'ViV. <* + <>*]• eN = [<Ч- *>ДГ. « —»>iv]. где р.^—►-foo при jV—>оо Замкну 1ый контур, образованный этими отрезками, будем обозначать далее через SN Число N можно выбрать столь большим, что все корни уравнения det А (X) = 0, лежащие в полуплоскости ReA.>a, попадут в прямоугольник, ограниченный контуром SN Поэтому будет иметь место следующее соотношение [о о -> -\ ^dGj<p(T)e-^dT-q>(0)U== -л, Ь J * г- 0 0 -. = £У/(Л«Р)-=2НГ$*"/!-> (М - J eMdG^(x)e-^dx-(p(0) \dk+ Г ° ° 1 + 2Й I С';М_1(?') - J e«dGJV(x)e-^dx-4)(0) U /"tf+'VOv I -h, О J (168) Преобразуем второй интеграл, стоящий в правой части последнего равенства, для чего прибавим и вычтем выражение о о J_ Г 0>,_-i Ч А Тог п получим ^~ f е^'Л-1^) — I e?*dOj(p(T)e-^dT—ф(0) dX = = i J |<*М-1(*)Г- I e^dG^(x)e-^dx-if(0)] + pA+9\' + Lff{ L -ft, * J
I 1| ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ -J eMdG ^е-Хтф(т)^х-ф(0)] ех' $ е*-*Л?$г-**ф(т)Л+ф(0) +ш I —~ Ч a=ji(o+j.<o. В интеграле J2 контур интегрирования можно заменить на дугу окружности с центром в точке К —0 и концами в точках а—[if/i, o + Hjtfi, лежащую в полуплоскости ReX^o Если N—+oo, то по лемме Жордана J2—►О при t>h Переходя к пределу при N—►» в интеграле о о A-l(k) f e™dG Гq>(x)e-^rfx + о о С eMdG \ ф(т)е-^^т + ф(0) + А-Ц\)<(,(0) + ~ получаем, что предел его равен нулю, так как модуль подынтегральной функции может быть оценен выражением вида ^LgRex/ По этой же причине существует предел интеграла „"гп.шИ }d который по модулю не превосходит величины с(о)е'° Таким образом из формулы (1 68) имеем ||х(*)-2у,(<. Ф)||<с(а)в'« где а—любое число из интервала (ак+1, ак) Умножая обе части последнего неравенства на е-"*' и полагая o" = aft+1-f-e, найдем, что |x(0-Sy/(<,<P)|e-cr*'<cft(e)e-(<J*-o*+.-e)' II /=i II при / > hv
30 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Таким образом, показано, что решение системы (1 52) х(/, <р) разлагается в асимптотический ряд 1-го рода Этим теорема доказана полностью Теорема 14 Если хоть одна из групп of состоит более чем из одной точки ?7, то функция х(/, q>), которая является решением системы (1 52), разлагается в асимптотический ряд 2-го рода 2У/С Ч>) /=1 Доказательство Утверждение теоремы 14 будет установлено, если показать, что х(*. <Р)-2 У/^чф"0*' <с,(е)<Г(°А-0А+г-е>' при t—>- + 00» где k—число, представимое в форме k== 2 nj (nj есть число корней, входящих в группу, определяемую вещественным числом Оу) Этот факт устанавливается точно так же, как в теореме 3, с одним лишь изменением, состоящим в том, что каждый раз k= 2 Я/ Замечание 1 Обозначим через С пространство непрерывных векторных функций, заданных на [—Л, 0] Тогда для^юбой функции <р(0€С существует решение системы (152) х(/, <р) такое, что х(*,<р) = ф(0. <€[-А,0], и представимое в следующей форме O + lm где Q(A, ф) = — J e^dG(v) 5в-Хтя>(т)Л + ф(0) (169) при t>0 Буквально, как это сделано в теореме 1 2, можно показать, что функция х(/,ф) удовлетворяет при ?>0 системе (152). Если ф£С, то x(t, ф) также разлагается в асимптотический ряд 2 У/(^> ф) 1-г0 или 2-го рода, где у.(/, ф) получены из функ- /=i ций ху путем замены F (а) целыми функциями Q (а) Впрочем, можно видеть, что уу (/, ф) = уу (/, ф)
§ 1] ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 31 Замечание 2 Если рассмотреть пространство С векторных функций <р(/), кусочно-непрерывных на промежутке [—А, 0], то можно утверждать, что решение системы (1 52) существует, представило в форме (1 69) и разлагается в асимптотический ряд 2 У/ 1-го или 2-го рода Теорема 15 Любое решение системы (1 52) х(^, ф), <р£С, разлагается в классе функций ?j при г^ — Хр /=1, 2, . , в аси чптотический ряд 1-го или 2-го рода единственным образом Доказательство Проведем доказательство теоремы 15 дтя асимптотических разложений 2-го рода Пусть х(/, ф) разлагается в асимптотический ряд 2 Fy 2-го рода Покажем тогда, что необходимо будет уу(t, <р) = F,(/), / = 1, 2, .... оо. Действительно, предположим сначала, что F/ = Y/ при /<1 2 ni По- кажем, что при этом предположении y/ = F/ при /^ 2 ni В силу того, что ряд 2 Fy является асимптотическим разложением функции х(/, ф) 2-го рода, имеем х(/, ф)— 2'"+1 Fy U"0n+''^cOT+1(8)e-'(a»'+i-<,«"+»-e),(l 70) Учитывая, что У/ = Р/ при /<;«!+... + «„, преобразуем неравенство (1 70) к виду Гп<+2 "n+,(F/-yy)L-'°«+I< <с,л + 1е-'(0-+'-°-+'-е,+ x(f, ф)_ 2 "+'у/ «"'"-+*. (171) Правая часть неравенства (1 71) стремится к нулю при t—юо, тогда как в левой части стоит норма полиномов, коэффициенты которых являются, вообще говоря, линейными комбинациями sin Bjt и cose,/, где е,—мнимые части корней, входящих в пт+1 ю группу Отсюда следует, что И2(У/—F;)|| = 0, т е yy=Fy при /< 2«/- Для завершения доказательства теоремы остается показать, что имеет место соотношение уу = F., j^tij Эти равенства будут
32 ПРОБЛЕМЫ С1ЛЫ11111Л1ШП ЛВИЖКПИЯ (ГЛ I вытекать также из (1 71), если в них положить ш = 0 Тогда получим 2(F,—У/) в-«.'<с1е-'<о.-о1-«+ х(*,ф)-$ У/1 в"0'' (1 72) /'=' И II /=i II Правая часть неравенства (1 72) стремится к нулю при t—*oo, поэтому, как и выше, заключаем, что y/- = F/ при /<«i, этим теорема доказана полностью Рассмотрим поведение решений системы (1 52) при неограниченном возрастании времени Введем для этого пространство С* матриц G(v) порядка п, элементами которых являются вещественные функции ограниченной вариации, заданные на [—h, 0] Разобьем пространство С* на непересекающиеся множества Скт, относя в каждое из них те и только те матрицы G(v), для которых т корней уравнения det Л (Я.) = 0 (173) имеют положительную вещественную часть и k корней имеют вещественную часть, равную нулю Ясно, что множества С%т не пересекаются и покрывают С* Пусть G£Ckm', К* •••! ^i,—корни уравнения (1 73) с положительными вещественными частями кратности р,, . , рл и ^/,+i> <h,+i,—корни уравнения (1 73) с нулевыми вещественными частями кратности рл+1 Рл+*, Обозначим через Ljr вектор, представляющий собой коэффициент в полиноме е~ ' У/(*. ф). стоящий при tr, r<py— 1 Каждая из величин LJr является линейным ограниченным оператором, действующим из С в Е„ Обозначим через 0Jr множество всех векторных функций ф£С, для которых L/rip = Q Ясно, что множество 0/г есть замкнутое линейное подпространство пространства С Обозначим через Скт подпространство, образованное пересечением всех подпространств Ojr, j^li + l^, r<py —1, и пусть Гкт есть пересечение Ojr, /</i, r^py— 1, с пересечением пространств 0,г, j^li+l, j^li + l2> Г^Р,-—К Ясно, что Скт и Ткт—замкнутые линейные подпространства пространства С При этом Скт^Гкт Теорема 16 Если матрица G^Coo. m0 любое решение системы (1 52) обладает свойством || х(/, ф)|| —0 при / —оо, (174) при этом существуют числа v>0> c = c(<p) такие, что ||х(/, ф)||<се-*, (175)
§ 1] ЛИН1 fillUL СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 33 Иными словами, саи все корни уравнения (1 73) лежат в левой полунюскости, то любое решение системы (1 52) удовлетворяет (1 74) и имеет место оценка (1 75) Доказательство Пусть а, < 0 есть наибопылая вещественная часть корней уравнения (1 73) В теоремах 1 4 и 1 5 было показано, что любое решение уравнений (1 52) представимо в форме асимптотических рядов вида 2 У/(*> ф) В частности, было показано, что |х(Л я)-Д У,С Ф)|е-°*'<сл(8)г-(0*-0*^-£>', откуда || х(/, q>)||<c0(e)e<e»4 «'<«-*, 7 = -Цг-« Из доказательства теоремы 1 4 легко видеть константа с сколь угодно мала, если |ф| достаточно мало, что следует из линейности и ограниченности оператора Q(K, ф) из С в Еп Этим теорема доказана Теорема 17 Если G £(?£„„ то решения системы (152) удов гетворяют х(/, ф) —0 при у£Скт и t—*oo (176) Доказательство По теоремам 1 3 и 14 решение уравнения (1 52) х(/, ф) разлагается в асимптотический ряд х(Л <р)~2У/(*» Ч>) '"г0 "Ч" 2-го рода При этом имеет место опенка J х (Л Ф)-'2'У/(Л n>)||<Ci,+f.(e)e<a'.«.«+e)<. причем o/i + ,j+, < О Выберем е= '"У"*"1, тогда c/i + /i будет сколь угодно малым, если ф достаточно мало При ф £ C*m имеем уу (/, ф) г 0, / < /,+/„ поэтому будет иметь место неравенство |х(/, ф)|<се-^, т. е. решения системы (1 52) удовлетворяют (1 74) и (1 75) при <f>£Ckm Теорема 18 Если G£C*km, кФО, то решения системы (\ 52) удовлетворяют (1 74) при ФбС*т, при этом система (1 52) имеет семейство периодических и почти периодических решений, если среди чисто мнимых корней имеются рационально независимые, каждое из таких решений остается в достаточно малой окрестности нуля при малом |ф| Доказательство В рассматриваемом случае, как было указано выше, система (1 52) имеет периодические, а также и •> 1353
34 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ ГЛ I почтн-периодические решения, если чисто мнимые корни рационально независимы Из теорем 1 3 и 15 II*С Ф)~ £'у/(/> Ч>)||<*/.♦«,(О*№' +'^+£". ь=-1 at + />+1 II /=i II При <р€Г*/я функция 2 У/(*. <f) является периодической или почти-периодической, а константа cli+lj сколь угодно мала, если |<р| достаточно мало Отсюда следует, что решения системы (1 52) удовлетворяют заключению теоремы Замечание Следуя работе [8], можно показать, что при выполнении условий теоремы 1 6 нулевое решение системы о £=£ dG((►)[х(/-И)+ F (/, х(/+(>))]. (177) (где F(/, x(/-j-0))— вектор, каждая компонента которого является нелинейным функционалом; будет также асимптотически устойчиво при надлежащем выполнении некоторых устовнн, накладываемых на F До сих пор мы рассматривали тот случаи, когда уравнение (1 73) имеет бесконечное число корней Однако возможны и такие случаи, когда таких корней лишь конечное чисто (вырожденный случай) Рассмотрим этот случай Лемма 12 Функция (let А (К) имеет конечный порядок р <11 Действительно, оценим функцию det А (К) в правой полуплоскости ReX>0 det А (Я.) = (—1)4" Н- 2 bkK"-", где функции bk(K) представтяют собой однородные многочлены степени к относительно величин поэтому |bfc|<<7ft, где qh — тот же многочлен степени к, что и Ьк, коэффициенты которого заменены на их абсолютные значения, а функции я|?„(А.) — на полные вариации VJt функций gs[(X) Таким образом, в правой полуплоскости имеет место неравенство IdeMWKIM'+ijfJXI»-*. (178> Оценим теперь функцию det А (л) в левой потуплоскосги ReXs^O.
§ 1J ЛИНЕЙНЫЕ СИСТЕМЫ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 35 В этом случае |^jj(^)Ke-hReXVf„ откуда |deM(>0|<mn+J]<7j*ln-*e-*',ReX. (179) Из неравенств (178) и (179) следует, что функция det Л (А.) имеет конечный порядок Теорема 19 Если уравнение (1 73) имеет конечное число корней, то функция det А (К) является полиномом степени п, равной порядку системы (1 52) Доказательство Пусть число корней функции det А (К) конечно, а именно равно s, и пусть эФп Тогда det Л (А.)= =Ps(k)e4<}>, где q(X) в силу леммы 12 имеет внд^(Я) = аЯ. Требуется показать, что s = /i it а = 0 Пусть s > n, тогда е \РЛЦ\ и при ReA,>0 см (1 78) m"+S?*ifci"-* <Re<aM< тал • (180) При Re(aA.) = 0 и | Л. | —► + оо имеем что невозможно при s>n Следовательно, s^rt Так как на мнимой оси det А (Я) растет, как j А. |", то s = « Покажем теперь, что а = 0 Для этого установим сначала, что а является вещественным числом Действительно, если это не так, то на оси ReA, = 0 левая часть неравенства (1 80) была бы функцией экспоненциального типа, а правая часть была бы ограничена Следоватечьно, a—вещественное число Из неравенства (1 80) вытекает также, что а не может быть положительным Таким образом, заключаем, что а<0 (181) В левой поауплоскости имеет место неравенство | Ps (л) | е*е<«м < | л |" + 2 | Я |"-*q„e-kh *eК Рассмотрим вертикальную прямую ReX = —— На этой прямой |Мп+2<7*|А.|'>-*е~*''~ ,0^ *Нмм1 • (182)
36 ПРОБЛЕМЫ СТЛБИ1ИЗЛЦИН ДВИЖЕНИЯ (ГЛ. I Ясно, что при \\\—юо правая часть неравенства (1 82) стремится к 1, но это невозможно Следовательно, а^О (183) Из (1 81) и (1 83) следует, что а = 0 Таким образом, det А (А,) = Рп (Я.) Следствие 1 Если det A(X) = Р„(А.) имеет конечное число корней, то любое решение системы (1 52) представимо в форме конечной суммы x(t, Ф)=Еу/(/, ф). <р€С, где k — число различных корней функции det Л (Д.), которым соответствуют собственные группы решений Следствие 2 Все теоремы о поведении решений при t —<• + оо переносятся на вырожденный случай без всякого изменения К рассмотренным выше уравнениям примыкают линейные системы, вкчючающие в себя как дифференциальные уравнения, так и разностные или интегральные уравнения § 2 Построение программных движений в управляемых системах Г. Рассмотрим сначала построение программных движений в линейных управляемых системах в простейшем стучае П\сть дана система п дифференциальных уравнении в векторной форме dx/dt = P(t)x \-Q(l)u \-F(() (2 1) Будем считать, что элементы матриц P(t) = {nxn\, Q(t) = {n ;<r} и компоненты вектора F (/) заданы при />0, вещественны и непрерывны Пусть заданы два постоянных вектора х0 и х, —начальное и конечное положение системы (2 1) Требуется найгп вектор-функцию и = и(/) размерности г такую, чтобы решение системы (2 i) начинающееся при / = 0 в точке х -= х,„ попадало при t — Г в точку х =- х, и при этом интеграл f u*(t)u (т)сгт. был ограничен. о Такие управтеипя и = и (/) будем называть программными Рассмотрим вопрос существования программных управлений и их построения Обозначим через Y (I) фундаментальную матрицу решений системы уравнений dx/d( = P(t)x (2 2) при начальном условии Y (0) = Е, где Е — единичная матрица.
§21 ПОСТРОЕНИЕ ПРОГРАММНЫХ ДВИ/Ki НИИ 37 Выполним в системе (2 1) замену искомой фчнкцин по формуле х =- Y (t) z, (2 3) где вектор г представляет собой новую искомою вектор-ф\нкцию. Эга векторная функция удовлетворяет уравнению dz/di = B(l)u + G(l), (2 4) где B(i) = Y-*(l)Q(() и G(0 = K-'(OF(0- Выполним далее в системе (2 4) замену 2 = 6 + JO(T)dT (2Я) о Тогда векторная функция |(0 будет удовлетворять уравнению d\ldt = В (0 и (2 6) В результате этих преобразований над исходной системой краевые (начальное х0 и конечное хх) условия переходят в такие 1(0) = |„ = х0, UT) = h = Y-HT)x,-<{Y-4T)F(x)dx о Дтя простоты положим г=1 Интегрирование уравнения (2 6) от 0 до Г дает 1,-Ь, = $Я(*)и(т)*т (2 8) о Таким образом, для нахождения программного ynpaBieiuni и (О получили систему (2 8) линейных интегральных уравнении Решение уравнения (2 8) будем искать в виде и(0 = В»с 4-0(0, (2 9) где с—постоянный вектор, подлежащий определению, a v(l) — некоторая функция, суммируемая вместе со своим квадратом на [О, Т] и такая, что г [bt(t)v{t)dt = 0, s= 1, 2, , n (2 10) Здесь bs(i), s=l, , n, означают компоненты вектора В, и равенство (2 10) выражает условие ортогональности функции у (О ко всем компонентам вектора В. (2 7)
88 ПРОБЛЕМЫ СТЛБИППЗЛЦИИ ДВИЖЕНИЯ (ГЛ I Подставляя (2 9) в (2 8), находим Ix-lo^^c, (2 11) г где Л(Г) = $В(/)В»(/)4/ о Уравнение (2 11) имеет решение, если 6eiA{T)=£0, либо ранг матрицы А (Т) совпадает с рангом расширенной матрицы А = = {А(Т), |t —iol Таким образом, справедлива Теорема 2 1 Для того чтобы существовало программное управление, переводящее систему (2 1) из любого положения х„ в любое другое положение х, за время Т, необходимо и достаточно, чтобы матрица А = ^ВЪ'Ш, где fi = 5/-lQ, была неособой При б этом все множество программных управлений дастся формулой u = fi*c + v, еде \{1)—суммируемая с квадратом на [О, Т] функция и $£vd/ = 0, с^-ЧЛ Y-4T)xl—[Y-i(x)F(x)dr—xt Определение 2 1 Функции bl((), . ., bn(t) будем называть линейно независимыми при f&sQ, ест существует число Т > О такое, что из равенства 2сД(0 = 0 при /€[0. Т) (2 12) следует с, = 0, 1 = \, .... п Теорема 22 Для того чтобы функции b,(t), ..., bn(t) быт линейно независимыми при t ^ 0, необходимо и достаточно, чтобы существовало число Т > 0 такое, что матрица г Л(Г) = $ВВ*Л о положительно определенная Здесь В(0—вектор с компонентами &,(/), .... МО Доказательство Необходимость Пусть функции bl(t), ...,bn(t) линейно независимы при />0 Покажем, что матрица А (Т) положительно определенная Действительно, из линейной независимости указанных функций по определению существует такое Т > 0, что при любом выборе постоянного вектора с, компоненты которого одновременно не равны нулю, будет существовать по крайней мере одна точка
§ 2) ПОСТРОЕНИЕ ПР01РАЧМНЫХ ДВИЖЕНИЙ 39 в промежутке [О, Т], в которой В*с=^0 Отсюда вытекает, что [В*с]г > 0 в этой точке, а в силу непрерывности компонент век- юра В(/) и в некоторой окрестности Следовательно, г $[B»c]2d/>0. (2 13) о Неравенство (2 13) можно записать в виде г с»5вВ*Л-с=сМ(7)с>0 при любом с, которое и означает положительную определенность матрицы А (Т) Заметим, что матрица A (t) будет также положительно определенной при всех t ^ Т Достаточность Пусть матрица А (Г)— положительно оп- редетенная, тогда для любого вектора с = {си . , ск\ и такого, что || с \\Ф О, будет г т сМ (Г) с = J c*BB*c dt = \ [с*BY dt>0 Следовательно, существует по крайней мере одна точка t£ [О, Т], где с*В(()фО Это и показывает, что функции &,, , Ьп линейно независимы при /^0 2° Пусть в более общем стучае граничные условия заданы в виде |сух(д=Н, (214) где Gj — вещественные постоянные матрицы порядка гпхп, Н — m-мерпый вектор, tj — моменты времени 0^/0</t< . <^<1Т Требуется найти условия, при которых существует программное управаенне и =и(0 и программное движение х=х(/), удовлетворяющие системе (2 1) и условию (2 14) При этом предполагается u (t) £L2, x (/) — непрерывная вещественная векторная функция, заданная на промежутке [0, Т] Выразим решение системы (2 1) с помощью формулы Коши, считая, что u = u(/) известно Тогда будем иметь х (0 = Y (0 х„ 4 j Y (0 У-* (т) Q (т) и (т) dx 4 J Y (<) У» (т) F (т) Л (2 15)
I СТАБИЛИЗАЦИИ ДВИЖЕНИЯ Подставляя (2 15) в (2 14), найдем £[G/Y ('/)] х« + S0 S GJY (0) K" W Q <T> u W dT + s '/ + .SS G^^y-M^FWdx^H Положим »/W-\0 при т6[0. Л- Тогда последнее соотношение можно переписать в форме г А1х0 + $В1(т)и(т)с1х = Н1, (2 1G) о где положено ^ = 2 0^), Bl = t<fJ(x)GJY(t/)Y-4T)Q{T) 1=0 Н» = Н-2 $ GyV (/y) K-4t)F(t) A Равенство (2 16) можно рассматривать как систему интегральных \ равнений, служащую для определения уравнения u=u(t) Полагая опять г = 1, будем искать решение этих интегральных уравнений в форме и = В;с -} v, (2 17) где v£L2—произвольная функция, удовлетворяющая условию ортогональности т \Btvdt=Q. (2 18) At=\BlBldt. Подставляя (2.17) в (2 16) и учитывая (2 18), найдем Alx9 + Ajc = Hl (2 19)
§ 2) ПОСТРОЕНИЕ ПРОГРАММНЫХ ДВИЖЕНИЙ 41 Теорема 23 Дгя того чтобы существовало программное управ книг (2 17) и соответствующее ему непрерьюное решение системы (2 1), удовлетворяющее условиям (2 14), необходимо и достаточно, чтобы ранги матриц {Alt Аг\ и {Л1, Ait HJ совпадали между собой Здесь матрицы {Alt Аг\ и {Л,, Аг, HJ получаются приписыванием столбцов Доказательство Необходимость условий теоремы устанавливается приведенными выше рассуждениями, так как было установлено, что из предположения существования управления (2 17) и соответствующего ему непрерывного решения х = х(/), удовлетворяющего (2 14), вытекает, что система (2 19) алгебраических уравнений совместна, а это и означает, что ранги матриц, упомянутых в теореме, необходимо совпадают между собой Достаточность условий теоремы вытекает из того, что линейная система (2 19) будет разрешима и какому-либо ее решению х,„ с отвечает управление (2 17) и решение, определяемое этим управлением и формулой Коши Упомянутое решение будет непременно удовлетворять условию (2.14), так как это эквивалентно выполнению условий (2 19) Замечание 1 В более общем виде линейное краевое условие (2 14) может быть записано в виде т $</G(0)x(tf) = H, (2 20) о где G — вещественная матрица, элементами которой, вообще говоря, могут являться произвольные функции ограниченной вариации Если умножить обе части формулы Коши на dG(t) оева и затем проинтегрировать почленно обе части в пределах от 0 до Т, то получим т т i J dG (t) Y (t) x0 + \dG (/) J Y (t) У-» (x) Q (t) u (x) dx + о о о т t + S<*G(0Sy(0V-JMF(T)A = H. о о Произведем перестановку порядка интегрирования во втором слагаемом Тогда будем иметь г < т J dG (/) J Y (0 К-» (х) Q (х) и (х) dx = $ В, (t) u (/) dt, oo о r где В, =- J dG (x) Y (x) /-• (0 Q (/).
42 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИИ [ГЛ. I Вводя, как и выше, обозначения г ^=SdO(/)K(o. о т t Н, =[dG(l) ]Y (t)Y-1(x-\?(x)dx, о о получим, что управление u = u(/), для которого существует непрерывное решение системы (2 1), удовлетворяющее (2 20), непременно будет удовлетворять системе интегральных уравнений г ^iX,+ jB,(0u(/)d/ = H1 (2 21) Дадим более конкретные условия разрешимости поставленной краевой задачи (2 20), чем те, которые вытекаюг из теоремы 2 3 Будем в дальнейшем считать для определенности m > n Столбцы матрицы Л, не образуют базиса в пространстве £,„, поэтому существует подпространство, являющееся ортогональным дополнением к подпространству, натянутому на столбцы матрицы Ах Векторы, входящие в базис этого ортогонального дополнения, расположим в виде матрицы Z Если k есть ранг матрицы Ах, то матрица Z будет иметь m — k столбцов и будет иметь ранг m—k Домножим систему (2 21) стева на матрицу Z*, тогда будем иметь Jz»BI(/)u(0d/=Z*HI (2 22) о Таким образом, установлено, что если система (2 1) имеет непрерывное решение х = х(/), соответствующее управлению u = u(0, которое удовлетворяет (2 20), то это программное управление будет удовлетворять системе интегральных уравнений (2 22) Будем разыскивать решение этой системы интегральных урав- гений в виде u = B,*c + v, где c = Zy и v, как и прежде, удовлетворяют условию т $5^ = 0 о Для вектора у, таким образом, получаем систему алгебраических уравнений ZM,Zy = Z*H11 (2 23)
§ 2| ПОСТРОЕНИЕ ПРОГРАММНЫХ ДВИЖЕНИЙ 43 где, как и выше, г Теорема 24 Если матрица Z*AtZ неособая, то при любом выборе векторной функции F и вектора Н существует непрерывное решение системы (2 1), удовлетворяюи{ее условию (2 20). При этом каждое программное управление представимо в форме u = BiZy + \, (2 24) где у есть постоянный вектор, определяемый единственным образом Векторная функция v суммируема с квадратом и удовлетворяет условию ортогональности jfi,vd< = 0 о Теорема 25 Если матрица Z*AtZ неособая и матрица At имеет ранг п, то каждому управлению (2 24) отвечает единственное решение х = х(/), удовлетворяющее условию (2 20) Если же ранг матрицы А1 есть k < n, то каждому управлению (2 24) отвечает семейство решений системы (2 1), удовлетворяющее условию (2 20) и зависящее от (и— k) произвольных постоянных Доказательство Приведем доказательство теорем 2 4 и 2 5 Найдем вектор у из линейной системы (2 23) и полученное с помощью его управление (2 24) подставим в систему интегральных уравнений (2 21) Тогда эти уравнения превратятся в линейные уравнения, служащие для определения вектора х0. Пусть k есть ранг матрицы At Тогда, если k = n, то эта система определяет единственное значение вектора х0 Если же £<я, то вектор х0 определяется с точностью до (п — k) произвольных постоянных Эти утверждения вытекают из того, что ранг матрицы Л, будет совпадать с рангом расширенной матрицы {Л,, (Ht — A2Z\)\ Это последнее утверждение справедливо потому, что вектор (Н, — AtZy) ортогонален всем векторам, являющимся столбцами матрицы Z, что следует из вектора у, и, следовательно, этот вектор располагается в линейном подпространстве, натянутом на столбцы матрицы Л, Этим теоремы 2 4 и 2 5 доказаны полностью, ибо по найденным векторам у » х0 указан способ построения уп- раваений и решений Теорема 2 6 Ест матрица Z*A2Z—особая и имеет ранг1, то решение системы (2 1), удовлетворяюще (2 20), существует
44 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИДСЫШ» [ ГЛ I тогда и только тогда, когда ранг матрицы {Z*AiZ, Z*H,} также будет равен I В этом случае каждое допустимое управ ienue представимо в фурме (2 24), однако вектор у зависит от т — k — / произвольных постоянных Каждому такому управлению при k = n соответствует единственное решение х = х(0, при k < п—семейство решений, зависящее от (n — k) произвольных постоянных Доказательство При выполнении условий теоремы 26 алгебраическая система (2 23) имеет решение, зависящее от m—k—l произвольных постоянных Подставляя это решение в (2 24) и затем в (2 21), находим, что, как и прежде, вектор х„ будет удовлетворять линейной системе Л,х„+ АгИ\ — Н, Как и выше, ранг матрицы А1 будет совпадать с рангом расширенной матрицы {Л,, W.-AM Следовательно, при k = n x0 определяется единственным образом, при k < п вектор х0 будет определяться с точностью до п — k произвольных постоянных Решения, соответствующие построенным таким образом управлениям и начальным условиям, будут непременно удовлетворять условиям (2 20) Обратное утверждение теоремы вытекает из рассуждений, в результате которых были построены уравнения (2 22) и (2 23) Заметим, что подобная задача была решена Н Н Красовскпм для счучая перехода из одной точки фазового пространства в другую'за время Т 3° Рассмотрим теперь построение программных управлений в сл\чае нелинейных систем П^сть задана система п нелинейных дифференциальных уравнений х=Р(/)х4 Q(/)u + F(/) + uG(/, х, и, ц) (2 25) Матрицы РЦ) — {пхп) и Q (/) = {пхг} заданы при 1^0, вещественны и непрерывны, G(t, x, и, и) — вещественная, непрерывно дифференцируемая по любой из компонент х и и вектор-функция, (х— малый положительный параметр Дтя простоты будем считать, что г = 1 П\сть заданы точки х0 и xt Требуется построить управление u = u(/), переводящее систему (2 25) из положения х„ в положение х, за время Т, при этом управление должно удовлетворять условию г lu'{t)dt < + оо о Эта проблема может быть разбита условно на две задачи задачу существования и задачу приближенною ошскання упо-
<j 2| nocTPOFHHF Ш'оп'лчмпых двн>К1 ний 45 минутого управления Решение этих задач дается следующей 1соремой Теорема 29 Пусть матрица т А (Г) -= J BB *di неособая Здесь B = K-1(OQ, Y (/)—фундаментальная система решений дифференциальных уравнений х — Р({)х с начальным условием К(0)=-£ Тогда для любых двух, ограниченных множеств С и G1 можно указать число ц° = \i0 (C°, G1) такое, что при всех ц < ц° существует управление и(/), переводящее систему из произвольной точки х0 £ G" в произвольную точку xt £ С1 зл время Т Это управление непрерывно и может быть построено как предел равномерно сходящейся последовательности, каждый член которой определяется единственным образом рекуррентным соотношением Доказательство Пусть задача решена, т е имеем и = = и(/) и х = х(/) такие, что они связаны уравнением (2 25) и движение х(/) переходит из точки х0 в точку х, за время Т под действием этого управления Используя формулу Коши, получим, что (2 25) эквивалентно саедующему интегральному уравнению *(0 = У(0х„ + + Y(t) \y-Ht)[Q(t)u(t) {-FW+ уХ1(х, х(т), и(т), ц)]<гт о Мы считаем, что х(/) и и(0 известны Тогда, полагая t = T, получим соотношение Y-1(T)xl—x0 = т т = J В (0 и (0 dt + J К-* (/) [F (0 + |iC (/, х (0, " (0. I*)] di. (2 26) о о Представим управпеиие и(/) в виде u = J3*c + v, (2 27) где функция v удовлетворяет условиям j*,vd/=0, s= l, 2, .. , л и (2 27') т 5 \%dt < + оо
ПРОБЛЕМЫ СТАБИЛНЗА1 Подставляя (2 27) в (2 26) и разрешая полученное уравнение относительно компонент вектора с, получим с = /1-х (Г) |к-' (Г)х,-х0- j У-1 (О F (ОЛ — -р.$У-Ч0С(Л х(0, и(0. И)««} (2 28) Подстановка (2 28) в (2 27) дает и(() = и0(1) + рВ*(1)А-ЧТ)\-{г-Ч-*)С(т, х(т), и(т). (2 29) |_jy-i(x)G(x, х(т), u(t). |i)dxj. (2 29] где МО = Я* CM"» (7) y-»(7')x1-xi-Jy-4x)F(T)dT +v(/). (2 30) По формуле Коши решением системы (2 25) при управлении (2 29) будет x(/) = x.(0 + |i| \Y(t)Y-4r)G(x, х(т), и(т), |i)dx- (2 31) М0 + и[$* -Г(0Л(0Л-»(Г)5у-'(х)С(т, х(т), u(t), \L)dx], <) I х, + J в (т) u0 (т) dx + I У-» (т) F (т) dx J . где x0 (/) = У (01 x0 + J\B (t) u0 (t) dx + \ У-» (t) F (т) rfx I. (2 32) Формулы (2 30) и (2 32) показывают, что решением системы (2 25) при \i = 0 и управлении u = u0 (f) является х = х„ (/), которое проходит через точку х = х0 при ( = 0 и через точку х = xt при / = Т. Соотношения (2 29) и (2 31) представляют собой систему интегральных уравнений для определения управления u(t) и соответствующего ему движения х(/) Покажем, что при любой функции v£Z.s[0, T], удовпетво- ряющей условиям (2 27'), система (2 25), (2 31) имеет единственное решение при ц<ц.°, гДе р°—некоторая положительная постоянная При этом решение этой системы дает искомое управление и(0 и требуемое движение х(/) Для доказательства этого
§ 2) flOCTPOFIIHF ПРОГРАММНЫХ ДВИЖРНИЙ 47 утверждения введем в рассмотрение вектор |=f J Тогда систему интегральных уравнений можно записать в виде S(0 = S.(0 + HK(1, ц, t), (2 33) Ч(ОУ щимся из системы (2 31) и (2 29) где !о(0 = (и°//\). К (I, р., О является оператором, получаю- К(6.М) = )Y(t)Y-i(T)G(T, х, u, n)dx — г -Y(t)A(l)A-*(T)$Y-4i)G(T, х(т). и(т), |i)rfr- о B*(1)A-i(T)\y-4t)G(t, x(t). u(x),|i)dT I Легко видеть, что при xtf€G0, x^G* и фиксированной функции v(/) имеем ||10(0II<^. rt>0 при /€[0, Т] Пусть гг> > Tj — некоторое число Так как К (1, Н-. О является непрерывным оператором своих аргументов, то при любой непрерывной функции 1(0 такой, что ||£(01КГ«. "Ри И<14 и /6[0. Т], имеем || К(1, ц, /)||<М, где М —некоторая положительная константа Выберем число щ такое, чтобы при любом ц<щ было iiio(0+fiK(i(o. i*. oik*-,, где §(/)—любая непрерывная функция и такая, что ||t(/)||^rt, t 6 [0, Т] Для этого достаточно взять (i.^minfii,, r-*jp] Построим последовательные приближения 10, 1,(0. •• . 1,„(0, по формуле l-«(0 = S.(0 + l*K(|.. |i, 0. m = 0, 1, 2. ... (2 34) При этом оказывается, что %m+l(t) является непрерывной вектор- функцией, заданной на [0, Т] и удовлетворяющей условию IISm+i(0ll<IUo(0ll + HIK(lm, m OIK'. + M^r., если топько Hi.WIK't при /€[0, Т] При fii-О и in -■= 1 последнее имеет место По индукции будем иметь || 1„ (/) |К г2 для всех /н^О Покажем теперь что
48 ПРОБПЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ. I существует число ц° < щ такое, что при любом ji^n0 ряд So+ <*,-&.)+ (2 35) сходится равномерно на промежутке [О, Т] Так как функция G(t, х, и, \а) непрерывно дифференцируема по компонентам векторов х и и, то, как легко показать, с> шествует положительна я величина L такая, что для любых векторов | и %, удовлетворяющих неравенствам ||f(OII^''s> II 1(0 II ^/"г. будет || К (|, \i, О-К (С, |1, 0||<^||1-1|| при /€[0, Т] и Вычтем почленно из равенства (2 34) при ш = п — 1 его же при in — n — 2 Тогда получим L-S^^HMS,,-,, и, 0-K(S„-2, \i, i)], откуда Hb.-S.-ilKl**. max Hk-iCO-S—COII (2 36) <€[0 T\ Обозначим через <p„ = max II |„—S»-ill Из неравенства (2 36) <€[0. Г) будем иметь также 9„<jiZ.<p„_l (2 37) Рекуррентное соотношение (2 36) дает Ф„<(|1^)"-,Ф,, (2 38) где ф1= max H^-lolKii max || K(S, \i. Oil = \lM /е io. rj /€io, г] Из оценки (2 38) вытекает, что упомянутый выше ряд равномерно сходится при t £ [0, Т] и любом выборе ц^щ, где n3L = 1 Положим |х° = min(m, ц3) При ц < \х0 построение последовательных приближений (2 34) оказывается возможным, каждая из !„(/) непрерывна и последовательность {1,л(0}» /п = 0, 1, . , равномерно сходится на промежутке [0, Т] Обозначим ее предел через |(/) = {х(/), и(/)}. Покажем, что 1(0 искомое Действительно, подставляя это управление и это движение в интегральное уравнение, получим тождество Дифференцируя по / обе части (2 31), находим, что х (/) удовлетворяет системе (2 25) при и = и (/) Если в (2 31) положить / = 0 и t = Т, то можно убедиться, что это движение переводит систему из положения х = х0 в положение х, за время Т Замечание Рассмотрение вопроса построения программных движений в общем случае краевых условий (2 20) проводится
§ 3] УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПРОГРАММНЫХ ДВИЖЕНИЙ 49 аналогично приведенным рассуждениям, так как интегральные уравнения дпя программных движений и управлений изменяются несущественным образом с точки зрения проведения всех оценок § 3. Устойчивость по Ляпунову программных движений 1° Пусть дана система обыкновенных дифференциальных урав- ь°ннй g = f(x, 0, (3 1) где х —вектор и f(x, /) — вектор функция размерности п Пусть знаем некоторое решение этого дифференциального уравнения х = х(0, (3 2) определенное при /^0 Зто решение условимся называть нсвоз- муирнным (программным) движением, а любое другое, в отличие or него, возмущенным Определение 3 1 Н евозмуиценное движение х = х (/) называется устойчивым по Ляпунову, если для любого /0 ^ 0 и любого числа е>0 можно указать число 6(е, /0) > 0 такое, что при ||х„—хц||<б(е, /0) будет ||х(/, х„ /,)—х(/)||<в при *>/„, где х (/, х0, /0) есть возмущенное движение, проходящее через точку х0 в момент t = /0, т е х(/0. х0, /0) = х0, а х(/0) = х0 Определение 3 2 Невозмущенное движение называется асимптотически устойчивым по Ляпунову, если 1) оно устойчиво по Ляпунову и к тому же 2) величину б(/0, е) для любого е> 0 можно выбрать так, что \\x(t, x0, *o)-x(0||7T720 Здесь под нормой понимаем || х || = Т/ V xj Сделаем в исходной системе преобразование координат по формуле х(о-у(0+х(0. (33) где у(/)— новая искомая вектор-функция В результате получим £ = !(у + х(0, 0-«(х(0. 0. (3.4)
60 проблемы С1льилнзлции движения [гл I Система (3 4) имеет решение (положение равновесия) У = 0 (3 5) Если это решение принять за невозмущенное движение, то определение 3 1 примет вид Определение 33 Нулевое решение у = 0 называется устойчивым по Ляпунову, если для любого t0 ^ 0 и любого е > 0 можно указать такое б (е, /0) > 0, что при || у01|< 6 будет || у (/, у0, te) |j < e при t^t0, причем y(t, y0, 10) —возмущенное движение такое, что У (t0. У*. <п) = Уо Пример 31 Рассмотрим систему ^- = А(х,()х (36) i при fSsO, х£С„ LAV г dt £** где В (х, t) = -^{A-\-A*) есть симметршованная матрица А Пусть bij— элементы матрицы В Тогда существует ортогональная матрица R такая, что R*BR = P где Р—диагональная матрица Сделаем линейное преобразование над переменными xt, , дополучим ^£ш'=Ёр.*? (38) Обозначим (.1 = max р(, \ = min р, (3 9) i <K n i<<< я Тогда верно неравенство XW<T57l|zi|2<N2"8 или 2 J).(i, Z(t))di 2 [|.ит z(T)) dx гЦ1ъ)е '• < z3 (0 < z2 (/„) e '• (3 10) Так как ортогональное преобразование (3 7) не меняет суммы квадратов переменных, то эта же оценка справедлива для векюр функции х (/) Если
§ 31 УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПРОГРАММНЫХ ДВИЖЕНИЙ 51 Ж0, то из формулы (3 10) следует, что положение равновесия хгО устойчиво по Ляпунову и при Я.«5а< 0 оно будет «кимптотически устойчиво по Ляпунову При этом предполагается, что решения существуют при / S* 0 Пример 32 Рассмотрим систему п дифференциальных уравнений dxs/dt = fs (х„ , х„, t), s = l, 2 п, или, в векторной форме, dx/d/ = f(x, О (3 11) Пусть система (3 II) имеет положение равновесия ш0, т с f (0, /) = 0 для V/ЗгО и™ / £ (—ю, +оо) Рассмотрим вопрос об устойчивости невозмущенпого движения х в 0, для чего умножим равенство (3 11) скалярно на х или 4jj7lx|« = xf<x. О (3 12) Вектор-функцию f(x, /) разложим по формуле конечных приращений f(x, t) = Ax. (3 13) где ^K^-f'^0}, I. ../-I. 2. . ..«. 0<т,<1. Тогда x*f = х*Их = x* —-z— x Пусть А-\-А* = В\ тогда равенство (З 12) перепишется в виде 1|1ху*=х*Ях. (3 14) Обозначая через ц(х, t) наибольшее собственное число квадратичной формы (3 14), через А(х, /) —наименьшее, имеем Ш||8< ^11х||2<Щ1х||а, или, интегрируя, получим J" Я. (х (т). т) rfx /ц(х(т),т)Л 11х(/0)||г е'° < ||х(0И2 < Их(/,)11а е'' (3 15) Убедимся, что при ц(х, /)<0 положение равновесия устойчиво Действительно, устойчивость означает, что по любому 8 > 0 и любому 1„^0 можно указать 6(/0, е) такое, что если только 1|х(/„)|| = ||х0||<6(/0. е), то будет || х (/) || < е при любом / г* <0 Возьмем е > 0 и положим, например,
52 проблемы стлвичизлшш авмжеиня [гл i 6 —осе, где а < 1 Тогда из неравенств (3 15) следует, что llx||*«£llx(f0)llV» i и при ц(х(т), т)<0 будет J" u (х (т). т) сгт < 0, следовательно, || х (/) || < б 1 = = at < ь при а < 1, что и требовалось доказать Здесь предполагается, что система (3 11) имеет решение, заданное при / > О Пример 33 Рассмотрим систему дифференциальных уравнений /=i где a — p/q, р и q — нечешыс числа величины aSj(t) — вещественные функции времени, заданные и непрерывные при / > 0 Умножим каждое из уравнений соответственно на х° и затем просуммируем Тогда получим l(£*p)-(«+>>y-«y. где по прежнему В = (А-\ Л')/2 (см пример 3 1) уесть вектор с компонен- Обозначим, как и выше, через X и ц соответственно наименьшее и наибольшее собственные числа матрицы В Тогда Х||у||2«у*ву<ц||у||! Положим Заметим, что так как а + 1— -—- и p-\-q — четное число, то г > 0 если не все Xj равны нулю Рассмотрим для функции ||у||2 г—"0/1о+1) наибольшее и наименьшее значения на поверхности г=1 Обозначим эти значения соответственно через а и Ь. Получим ог2о/с0+1)а£ ||y||2<bZ2a/(o+i) Из этих неравенств вытекает 1де а-Х(аЧ 1)в. р = ц(о + 1)& Проинтегрируем потученные неравенства 0 0 0
§ 3) УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПРОГРАММНЫХ ДВИ/КРНИЙ 53 Отсюда Пусть дтя определенности с > 1 Тогда так как ги > О, I —о < 0. то это перпвенство нокашвлет, что г—► 0 при t—► оо, т е что положение равновесия будет асимптотически устойчииым, ее ш Тогда также \ т—-a—Н оо, поскольку a < р, | , а > fX~5 P Функции справа и слева в неравенствах (*) стремятся к нулю при I—► оэ Если величины as/ являются вещественными постоянными, то это имеет место при условии, что наибольшее собственное число ц матрицы В отри- цатетьно 2° Геометрический смысл второго метояа исследования устойчивости по А М Ляпунову злктточается в том, что изучаем изменение расстояния от движущейся точки по траектории до положения равновесия или изменение некоторой другой функции, имеющей общие свойства с расстоянием В рассмотренных примерах в качестве такой функции была взята функция V(xlt , хп) = V (х) = х» Поверхности уровня V(x)=const в этом случае охватывают положение равновесия и составтяют систему втоженных поверхностей Рассмотрим полную производную по времени функции К(х) в силу системы (3 1) w = L i^• w=Ъ -яг'f(x> °=(gradv(x)-f(x< l)) Если (gradV(x), f(x, /))< О, т е угол между градиентом функции V' (х; и вектором f (х, /) больше угла л/2, то все траектории втекают внутрь поверхности V (х) = const
54 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Определение 34 Вещественная однозначная функция V(x, t) (rt-f 1) аргумента, заданная в области ||х||<А, />0, где h > О и У (0, /)=0 при любом />0, называется положительно определенной, если существует вещественная непрерывная функция W (х), заданная при ||х|КЛ, такая, что 1) №(0) = 0; 2) W (х)>0 при ЦхЦ^О, 3) V(x, /)>№(х) Если в этом определении свойства 2) и 3) функции W (х) заменить свойствами 2') №(х)< 0 при || х||=^0 и 3') V (х, l)^W(x), то функцию V (х, t) будем называть отрицательно определенной Например, функция V (х, у, t) = x2-\-j—^-. не является положительно определенной, а функция V-x^ + ^ + yA-ysin/ положительно определенная Рассмотрим систему дифференциальных уравнении в векторной форме dx/dt=i(x, 0, (3 16) где f(x,/)—вещественная и непрерывная вектор функция, заданная при ||х|КЛ0, t^O, и удовлетворяющая условию Липшица относительно х в этой области Система (3 16), предпоаагаем, имеет положение равновесия х-=0, т е f (0, /) = 0 при V/^0 (V означает «любой») Очевидно, что через каждую точку ||х„||<Л0 при t^t0 нрохо дит единственное решение х = х(/,х0, /0) (3 17) Если существует производная функции V, (Л x0, tn) — = V(x(t, x0, /0), t) no t, то говорят, что функция V(х, 0 дифференцируема в силу системы (3 16) вдоль выбранной интеграть- ной кривой и Теорема 3 1 (теорема об устойчивости) Для того чтобы нулевое решение системы диффгргнциааьных уравнений (3 16) было устойчивым по Ляпунову, необходимо и достаточно, чтобы существоваш функция V (х, /), удов отворяющая следующим условия м
§ 3| УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПРОГРАММНЫХ ДВИЖЕНИЙ 55 1) функция V(x, () задана при ||х|КЛ0, /^0, где п0—положительная постоянная, 2) функция V(0, 0=0 для W>0 и при фиксированном значении t непрерывна по переменной х в точке х = 0, 3) функция V (х, /) — положительно определенная, 4) функция V1(l, х,„ /,,) = К(х(/, х0, /0), /) не возрастает при /^Л|^0 для всех х0 таких, что ||х0|ХЛ0 Все функции, которые решают вопрос об устойчивости, называются функциями Ляпунова Доказательство Достаточ ность [14] Предположим, что существует функция V (х, /), удовлетворяющая условиям георемы Требуется показать, что в этом случае нулевое решение системы (3 16) устойчиво по Ляпунову Для этого возьмем е > 0 (е<Л0) и зафиксируем число t0 > 0 Рассмотрим сферу ||х|| = е и найдем наименьшее значение W (х) на этой сфере. W (х) определена и непрерывна, так как V(x, /) по условию теоремы положительно определенная Пусть ini W(x) = l>0, (3 19) 11«Н = е причем точная нижняя граница достигается В силу непрерывности V(x, /„) в точке х = 0 существует чис ло б(/0, е) такое, что V (х, /„) < К при || х ||< б (3 20) Покажем, что найденное число 6(/0, е) отвечает определению устойчивости Возьмем любую точку, удовлетворяющую неравенству IIх„ц<«С. в) (3 21) Тогда по свойству (3 20) V(х„, t0) <X (3 22) Далее в силу условия 4 теоремы функция У, (/, х„, /„) является иевозрастающей при / > /0 Поэтому Vi(t, х0. /оХ^х,, t0)<k при />/, (3 23) и, следовательно, ||х(/, Хо, /0) И < е при V/>/0, ибо в противном случае существует момент Т > /0 такой, что || х (Г, х0, /в)|| = е Но тогда в силу свойств полол<ительио определенной функции
5С> ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [Г,1 I ^(х, /) и опредеаения (3 19) числа X будем иметь VAT, x0,t0) = V(x(T, x0,t0),T)^W(x(T,x0, t0))^X, что противоречит неравенству (3 23), справедливому для Vt^t0 (в частности, и при t = T>t0) Полученное противоречие доказывает наше утверждение Необходимость [20] Пусть положение равновесия устойчиво по Ляпунову Покажем, что в таком случае существует функция Ляпунова, удовлетворяющая теореме 3 1 Рассмотрим решение (3 17) х —х(/, х0, /0) при каких-либо х0, /0, удовлетворяющих условиям ||х0||<8 и to^0 (3 24') Функцию V в любой такой точке (х0, /0) определим следующим образом V(x0l/0)=sup ||х(/,х0,/0)|| (3 24) Рели окажется, что на интегральной кривой х(/,х(1)/0) правая часть соотношения (3 24) >Л0, то положим в этой точке V (х0, /0)=Л0. Заменив в (3 24) х0 на х и /0 на /, получим однозначную функцию V (х, t), определенную единственным образом и заданную (в соответствии со сдепанным замечанием) в области ||х||^Л0, />0 Таким образом, первое условие теоремы 3 1 выполнено Так как точка х = 0 явтяется положением равновесия системы (3 16), то V(0, 0=0 при t^t„, что счедует из (3 24) Покажем, что функция V (х, t) непрерывна при фиксирован- ioj / ^/0 в точке || х || = 0 Возьмем е, > 0 Так как имеет место \сюйчивость,то существует б (/„,£,) >0 такое, что||х(/, хи, /0)|| <е, для всех t^t,, при усчовии || х|| < 6(/0, е,) В силу (3 24) V(x, /0)^е1, т е при заданном et > 0 существует 6 > 0 такое, что как только || х || < б, то V (х, /0) <е,, что и доказывает выполнение свойства 2 теоремы Легко видеть, что V (х„ /,) > || х (/, х, /,) || = W (х) > 0 (поюжитечьная определенность функции V(x,/)) Проверим теперь условие 4 Для этого следует установить, что если х = х(/, х„, /„)— некоторая ннтеграчьная кривая, проходящая при / = /„ через точку х0, то функция V{x, t) вдоль этой интегральной кривой не возрастает Другими словами, если /, и t2—произвольные два момента такие, что /e^'i<**» a х, = х(/1, х0, /„), Xj = x(/2, х„, /0)—соответствующие точки на рассматриваемой интегральной кривой, то должно иметь место не-
§ 3] УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПР01РАММ11ЫХ ДВИЖЕНИЙ 57 равенство К(Х1,/1)^К(Хг, /г) (*) Действительно, в соответствии с нашим определением функции V(x, t) мы имеем V(xt. /f)= sup [|х(/, хж, /JH. V(x2, /,)= sup||x(/, х21 (2)\\, где х(/, х1? /J —интегральная кривая, проходящая при / = /, через точку х,, а х(/, х2, /г) — интегральная кривая, проходящая при t — ts через точку хг В силу единственности решения исходной системы (3 16) обе эти интегральные кривые совпадают с рассматриваемой интегральной кривой х(/,х0,/0), поскопьку при il и t2 эга интегральная кривая проходит именно через точки х, и х^ соответственно Таким образом, V(x,, tj и V (хг, t2) равны верхним пределам нормы одной и той же функции х(/,х0,/0) при t^t, и t~^tl соответственно Но так как /, < (г и область (/,, оо) включает в себя область (/2, <х>), то первый верхний предел не меньше второго, т е справедливо неравенство (*) Этим необходимость условий теоремы 3 1 доказывается полностью Следствие 1 Требования, предъявляемые теоремой 3 1 к функции V (за исключением условия 4)), легко непосредственно проверить Условие 4) на первый взгляд представляется необозримым, так как интегральные кривые системы (3 17) неизвестны, и, слечова тельно, проверить непосредственно это условие не иредставтяется возможным Однако функция V, согласно этому условию, монотонная вдоль любой интегральной кривой при t^t0 и потому дифференцируемая почти дая всех значений t при / ^ ta (сопасно теореме Лебега [21] о существовании почти везде прошводной у монотонной функции) При этом почти везде имеет место соотношение dV/dt = W < О Таким образом, условие 4) можно проверить непосредственно путем нахождения полной производной функции V в силу системы Следствие 2 [20] Если функция V(x, t) является поло жительно определенной и непрерывной по переменной х в точке || х || = 0 равномерно относительно t при t^O и dV/dt ^ 0, то нулевое решение системы (3 16) будет устойчиво равномерно от носительно 1п ^ 0, т е в, определении устойчивости можно выбрать 6(/0, е) = 6(е) независимым от /0
58 ПРОБТЕМЫ СТЛБ1ПИЗЛЦШ! ДВИЖЕНИЯ (ГЛ | Доказательство Пусть существует такая функция V (х, /) Покажем, что нулевое решение будет устойчивым равномерно относительно /0 Действительно, при доказательстве теоремы 3 1 число 6(/0, е) выбиралось из условия V(x, /0)<Я при ||х||<6(/0, е). Так как функция V (х, /0) непрерывна по х в точке ||х||=0 равномерно относительно / при />0, то существует число 6(e) такое, что V(x, /,)<*. при ||х||<б(е) для V/0^0 Далее ясно, что число 6(e) соответствует выбранному числу е > 0 из определения устойчивости Этим доказано следствие 2 Следствие 3 [21] Пусть функция V(х, /) удовлетворяет условиям следствия 2, т е она положительно определенная, непрерывная по х при х = 0 равномерно относительно t при /^0 и, кроме того, такая, что dV/clt = - W (х, /), (3 25) в силу системы (3 16), где W (x, t) — положительно определенная функция Тогда положение равновесия х — 0 асимптотически устойчиво по Ляпунову равномерно относительно /0 ^ 0 Доказательство Покажем, что ||х(/)||—>0 при t—* + oo, т е что по любому е'> 0 можно указать Г(е') такое, что IIх(Л х,„ /,)||<е' при />Г(е') С этой целью заметим, что по заданному е' > 0 можно найти в соответствии со следствием 2 б(е') = б'>0, удовлетворяющее определению устойчивости и не зависящее от /0 При этом б' < е'. Тогда возможны два случая 1) существует Т такое, что IIх(Г, х0, /,)||<6', 1|х,||<6\ и, следовательно, II х(/, х0, /,)||<е' при V* >7\ 2) не существует такого Т, т. е для V/ ^ /„ всегда будет || х(*. х0, /0)||^б' В этом случае, так как U?(x, 0 — положительно определенная функция, то всегда W (х, 0>а>0лля х = х(*. х0, /0) Стедоватепьно, всегда
3] \стойчнвость ПРОГРАММНЫХ ДВИЖЕНИЙ Интегрируя (3 25'), получим V(x(l, х„ /,), /)< — «(< — tB) + V(x0, t0) (3 26) Так как \\x(t, х0, f0)||>6' при V/>/0 и функция V (х, I) поло- житеаьно определенная, то V(x(t, x0, /0), 0>Р>0 Правая же часть неравенства (3 26) с ростом / стремится к —оо Таким образом, получили противоречие, так что случай 2) невозможен Следовательно, имеет место только случай 1), который и соответствует тому, что IIхС х0, 'о)II—*0 при /-+Н оо Следствие 3 доказано Пример 34 Рассмотрим систему дифференциальных уравнений dxsidt = fs(xu . , х„) s=l, 2, , я, (3 27) где ls (jt|, , ж,,)—функции, заданные в /?", вещественные и непрерывно диф ференцируемые Предполагаем, что система (3 27) имеет единственное положение равновесия х=-0, т е M*i *«>и=*,= =*„=о=°. *=»•2- ■» функции Ляпунова возьмем V(x)=2/?(x) = /*(x)Hx) дх. dt ~ dxi Us. dxt dx7,) mm Если все собственные числа матрицы В не превосходит пуля, т е '*Bf<0, то выполнены условия теоремы об устойчивости, и положение х = 0 будет устойчивым Если все собственные числа матрицы В отрицательны и могут обращаться 8 н>ль лишь в положении равновесия, т е f*flf < 0, то dV/dl = — W (х), и положение равновесия х = 0 будет асимптотически устойчивым по Ляпунову.
GO ПРОБ1ЕМЫ СТАПИ 1ИЗАЦНИ ДВИЖЕНИЯ [ГЛ | Задача Дани система дифференциальных уравнений вича dxs'dt^x's"" (Xi, . *„). s=l,2 , п, где xl"" (х{, , х„)— однородные формы ш ременных хи , х„ степени т с вещественными коэффициентами Тр_'б)ется найти необходимые и достаточные условия, напагаемые на коэффициенты, при которых 1>оложенис р.тповесия х —0 асимптотически Теорема 32 (о неустойчивости) Для того чтобы нулевое решение системы (3 16) быю неустойчивым по Ляпунову, необходимо и достаточно, чтобы существовали две функции V (х, I) и W (х, t), обладающие следующими свойствами 1) функция V (х, t) ограничена в некоторой окрестности точки х-0, т_е V(x, /)< / при ||х|КЛ0, 2) 3t0 ^ 0, в сколь угодномаюй окрестности точки_х==0 су ществует по крайней мере одна точка х такая, что V(x, /0) > О, 3) полная производная функции V (х, t) в силу системы (3 16) удовлетворяет соотношению dV/dt=W+W(x, t), где л > О, a W (х, () является неотрицательной функцией при || х |К /г0, вещественной и непрерывной Доказатечьство Необходимость [20] Пусть имеет место неустойчивость, что означает существует такое е > 0 и ^0>0, что, какое бы б>0 ни взять, обязатетьно найдется по крайней мере хоть одна точка х„(||х01|<б), время т(х0, ta) такие, что ||х(т, х0, /,)||>е Возьмем любую точку х0, удовлетворяющую }1еравенству ||Х„||<6 (6 < е </г0) Возможны два стучая 1) шбо \\x(t, х„, /0)||<е при t^t0, 2) чпбо существует такой момент т^/0, что||х(т, х0, /0)||~е Почожим V (хп, to)--0 в первом случае и V(x0, /0) = е-<т-'»> = = е'»_т во втором случае Таким образом, функция определена в любой точке множества {х ||x|j<6} и oi раппчена там V(x, /) < 1 Как было отмечено выше, точки х второго типа существуют в любой сколь угодно малой окрестности точки х = 0 Поэтому построенная функция У(х, /) удовчетворяет усювию 2) Покажем теперь, что функция V(x, /) удовлетворяет также усчовию 3) Действительно, ее пи точка х относится к первому типу, то V==0, так как 1|х(/', х, /)||<i, поэтому dV/dt = V вдоль любого такого движения Если точка х второго типа, то V (х, 1) — е'-х, откуда счед\ет, что dV'dt = V Таким обра юм, условие 3) выполняется вдоль любого движения х(Г, х, /), ;'>/ при U1 и №=0
§ 31 УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПРОГРАММНЫХ ДВИЖЕНИЙ 61 Достаточность [20] Пусть существуют функции V(x, Л, И?(х, /), удовтетворяющие >словиям теоремы Покажем, что < = 0 неустойчиво Пусть, напротив, положение равновесия х = 0 устойчиво Тогда по любому f > 0 можно указать величину б > 0 такую, что при ||х0|| < б будет ||х(Л х0, tn)\\<t<hB при *>/„ Тогда на любом движении х(/, х0, /0) функция V(x, /) ограничена при t > /0 и || х01| < б (свойство 1)) По свойству 2) существует точка х„ такая, что К(х0, /0) > 0 Функция V(\(t, х„, tB), /) удовлетворяет линейному дифференциальному уравнению dV(x(t,xo, /„) 0^mx(/| Xot g( ()+W(x(t, x0, /0), 0 с начальным условием V(\(t, х0, /„), /) = V(x0, /0)>0 Интегрируя это уравнение и перехочя к неравенству, попучпм V(x(t, х01 t0)^V(x0, ;о)^«-'«> при />/0, что противоречит ограниченности функции V(x(t, x0, г0), /) Полученное противоречие показывает, что положение равновесия х = 0 неусюйчпво 3° Рассмотрим линейную систему дифференциальных уравнений % = P(t)x, (3 28) где функции pSi(t) явтяются вещественными, непрерывными и ограниченными, заданными при i~^0 Систему (3 28) можно рассматривать как линейное прибтп- женне системы (3 16), поэтому характер решения системы (3 28) существенно связан с поведением решения системы (3 16) Точнее, если нулевое решение системы (3 28) устойчиво нти асимптотически устойчиво, то н) тевое решение системы (3 16) также будет соответственно устойчиво нти асимптотически хстойчиво при довольно широких допущениях относительно нелинейных чтенов Из сказанного стедует значимость критериев устойчивости и асимптотической устойчивости линейных систем при решении общей задачи об устойчивости нулевого решения системы (3 16) Если в системе (3 28) все коэффициенты явтяются постоянными, то решение вопроса об асимптотической устойчивости сводится к нсстетованпю корней уравнения det(P— КЕ) — 0 В общем стучае вопрос остается открытым
62 ПРОБЛЕМЫ СТЛБИ1ИЗЛЦИИ ДВИЖЕНИЯ [|Л I Теорема 33 [14] Для того чтобы любое решение, проходящее через точку х =- х„ при t = t0 системы (3 28), удовлетворяло неравенствам вида а,|!х01|е-»« «'-'•><||х(/)||<а21!х01|е-й«('-'«> при / >/„, (3 29) необходимо и достаточно, чтобы существовали две квадратичные формы V(x, /) = х»Л(/)х, (3 30) Г(х, t) = x*B(t)x, (3 31) удовлетворяющие условиям 1) функция V(x, t) положительно определенная, a W (x, t) отрицательно определенная, и для них справедливы неравенства о1||х||»<|/(х, /)<а2||х||*, (ЗЗГ) -Pi||x||»<r(x, /)<-pt||x||«, где a/t p/t ah bh i = \, 2,— положительные константы, 2) выполнено соотношение в силу системы (3 28) dV/dt = W (3 32) Доказательство Необходимость Пусть V (/) — фундаментальная матрица системы (3 28), тогда любое решение, проходящее через точку х —х0 при / = *„, представится формулой х(0^П<)^_1(Ох«, (3 33) Пусть любое такое решение удов ют воряет неравенству (3 29) Тогда возьмем квадратичною форму W (x, t) в виде W (х, /)= =—х*-х Положим ¥{*•• '.) = — $ W(x(t, x„ /,), t)dt (3 34) Ясно, что НР(х, 0 удовлетворяет неравенствам (3 31) при р",-- =Р,= 1 и dV/dt = W Покажем, что V (х, 0 является квадратичной формой, удовлетворяющей неравенствам (ЗЗГ) Действительно, У(х„. *.)=■- $х*(т. х„/,)х(т, x0,/0)dx- =-х0* J У-1«(/,)У(т)К(т)У-х('.)Л xn.
§ 31 устойчивость по Ляпунову программных движение 63 Учитывая неравенство (3 29) н интегрируя (3 34) в пределах от i0 до -j-oo, получим J flf||x0||2e-'*.<l-'.)dT<V(x0, t0)= J x2(x)dx< < J а\\\х0\\ге-2Ь*«-^йх Ясно, что функция К(х, /) положительно определенная и существуют положительные числа alt аг такие, что aJxH'^Vix, 0<«,1|х||«. Достаточность Пусть существуют функции V и W, удовлетворяющие условиям теоремы Тогда, согласно следствию 3, по поженив равновесия асимптотически устойчиво Покажем далее, что любая интегральная кривая системы (3 28) не только стремится к началу координат при t—<•<», но и удовлетворяет неравенствам (3 29) Действительно, разделим обе части равенства (3 32) на V и проинтегрируем в пределах от tn до t. Тогда получим откуда М'. х». t,) = VU{t, x0, г0), /) = V(x0, /,)«'• . (3 35) Функция Vx, стоящая в левой части равенства (3 35), является значением функции V на выбранной интегральной кривой системы (3 28) Оценим интеграл, входящий в правую часть (3 35) Для этого рассмотрим подынтегральное выражение W _ \*B{t)x V ~хМ(0х Если теперь числитель и знаменатель этой дроби заменить большими значениями из условий теоремы 3 и наоборот, полечим оценки
64 ПРОБЛЕМЫ СТЛЫПИЗЛЦИИ ДВИЛКНИЧ [1Л I Применяя их к соотношению (3 35), имеем V(x0, t0)e~^U~'°)^V1(l, х„, g<K(x0, *0)е~^Г('"'',) Заменим функцию V(x0,/0) на ее наименьшее значение (условие 1) теоремы 3 3), а функцию V, (t, х„, <„) — на ее наибольшее значение из того же неравенства Тогда Pi «х II х. ||* с" «- ' <а2||х(/)||2 Аналогично «. II х (/) ||* ^ а. || х„ ||-в " ^ " "'*' Извлекая из обеих частей последних неравенств квадратный корень и объединяя их, получим неравенство (3 29), что и требовалось доказать Замечание Запишем в развернутом виде соотношение (3 32) в соответствии с (3 30) Заменяя dx/dt и d\*/dt из системы (3 28), получим равенство ^=х* [p*(t)A(t) + % + A(t)P(t)] x = x*Bx, которое имеет место вдоль любой траектории системы, т е d^ + P*A + AP = B (3 36) Уравнение (3 36) называют матричным уравнением Ляпунова Если Р = const, то и матрица А — const, тогда (3 36) есть атгебраическое матричное уравнение вида Р*А + АР = В (337) Цля решения вопроса об асимптотической устойчивости х = 0 системы (3 28) необходимо и достаточно, чтобы уравнение (3 36) и ш (3 37) имели решение в виде положительно определенной матрицы А при условии, что матрица В является отрицательно определенной Рассмотрим наряду с системой (3 28) нелинейную систему х = Р(/)х-Ю(х, 0. (3 38) где G(x, t) — вещественная непрерывная векторная функция, заданная при t^Q, |jx|K/i„
§ 3| УСТОЙЧИВОСТЬ ПО ЛЯПУНОВУ ПР01РЛММНЫХ ДВН/КГПМЙ 05 Теорема 34 Если векторная функция G(x, 0 удовлетворяет ус ювшо |G(x, 0||<с(е, 0II х II пР" 1|х||<б, />0, (3 39) где с(г,()—►() при е—^0 равномерно по отношению к t^O, то из асимптотической устойчивости системы (3 28) и оценок (3 29) вытекает, что положение равновесия х — 0 системы (3 38) будет асимптотически устойчивый, и любое решение этой системы, начинающееся в достаточно малой окрестности х = 0 будет удов летворять оценкам (3 29) с некоторыми другими константами, входящими в эти оценки Д о к а з а г е л ь с т в о Из асимптотической устойчивости по то- жения равновесия системы (3 28) и оценок (3 29) вытекает существование квадратичных форм V и W, удовлетворяющих оценкам (3 30) и (3 31) Найдем полн\ю производную функции V в силу системы (3 38) dV,dt = W + Wx,' где Wx = (gradV, G), откуда имеем |UM< <7 c(e»0llxll2 пРи llxll^fc Здесь у —некоторая положительная постоянная Из этой оценки вытекает, что функция W-\-Wx определенно отрицательная, во всяком случае, в достаточно малой окрестности положения равновесия х= 0 системы (3 38), и, следовательно, это положение равновесия асимптотически )стойчнво При доказательстве достаточности условий теоремы 3 3 не использовалось свойство линейности системы (2 28), а также не использовались свойства функции V и W как квадратичных форм по отношению к компонентам вектора х Строго говоря, оценки (3 29) были полечены на основе использования (3 30) и (3 31) Укажем теперь е0 > 0 такое, что функция f-J If', будет удовлетворять оценкам (3 31) при ||x||^t-0, /^0, разумеется, с некоторыми другими константами Согласно свойству асимптотической устойчивости существует б0 > 0 такое, что движение, начинающееся в точке х0, |j х01| ^ 60, при t^=t0, будег удовлетворять оценке ||х(/, х0, /„) II < е„ при Вдоль таких движений б\дут выполняться все неравенств (331) Следовательно, эти движения будут удовлетворять оценкам типа (3 29) во все время движения t~^t0, если только || х01| ^ б0, что и требова лось доказать Следствие Рассмотри и управ i яемую систе чу x~P(t)x-Q(t)u\-G(x,u,t, (3 40) Ест || G (х. и, 0||<с(е, /) [ || х\\-\ || u ||] при ||xl|< е, || и || < е и c(e,t)—»0 равномерно по отношению к t~^0 при е—>0, то при тобом управ чении и —и(/,х), заданном при |! х|| «^/г0, '>0и удовлетворяющем ус ювшо \\ и || < y (е, 01| х || при \\ х ||< с,
()f> IIHOb IFMIJ СТЛЫ1ЛПЗЛЦ11И ДВИЖЕНИИ [1Л 1 y(e,t)—+0 при е—»0 равномерно по отношению к /^0, tucmcMQ (3 40) будет иметь асимптотически устойчивое положение равновесия х = 0 При этом будет существовать некоторая окрестность, в которой все движения будут удовлетворять оценкам типа (3 29) Здесь предпопагается, что функция и(/, х) и компоненты векторной функции G вещественны п непрерывны но совокупности аргументов прн /^0, ||x||</i0, ||u||</i0 Рассмотрим далее квазилинейную систему x = P(l)x-\ F(0 + |iC(x. /), (3 41) где F (/)— вещественная векторная функция, заданная прн г ^ 0. непрерывная и ограниченная Векторную функцию G (х, /) будем считать заданной при /^0, х(=£„, вещественном, непрерывном и непрерывно дифференцируемой по отношению к компонентам вектора х При этом как векторная ф\нкипя G(x, I), так и се частные производные по компонентам вектора х, ограничены в побои конечной области равномерно по отношению к / ^- 0 Теорема 3 5 Если решения системы (3 28) удовлетворяют оценкам (3 29), то дм любого г, > 0 можно указать число г, > г{ и чиспо ц0 > 0 такие, что любое решение системы (3 41), начинающееся в области Цх,!!^/-,, будет ограниченным и оставаться в области \\ х || ^ г, при t ^ /„, ее ш то 7ько вещественный параметр |i в системе (3 41) удовлетворяет неравенству |u.|^u„ Каждое из упомянутых решений будет асимптотически устойчивым, и, кроме того, если х=-х_(/, х0, /0) взято в качестве невон- мущенного движения, а х = х(/, х0, /„)—в качестве возмущенного движения, то функция z = x — х будет удов отворять оценкам типа (3 29) при любом выборе х0 и хп из условия ||х0//<:/•,, II хо II ^= ri- & оценках (3 29) следует заменить х на г, хп на 7„ = =.- х0—х0 Доказательство Из (3 29) вытекает с\шествование двух квадратичных форм V и \Х , удовлетворяющих оценкам (ЗЗГ) Предположим, что число г, > 0 задано Найдем полною производную V в силу (3 41) Тогда будем иметь dV/dt = \V + (grad V, F) -t- u (grad V, G) Выберем r > rx так, чтобы бы ю V/ -(grad V, F) < 0 i.pii II x||^7. t>0 Такое г существует в ситу (3 31) н_ ограниченности фмич цчи F Положим ш = та\1 при ||х|| = г, t^zO В качеств," гг> г выберем такое чисто, чтобы было V>m при ||х|| = а2. /^0 Выберем далее число ц, > 0 так, чтобы при /^0, л< ^IhiK'i было IV/ -j (grdd К, F)-; (i (grad Г, G> < 0 прн |ц|^
§ 31 JCTOd'lIIBOC11. 110 ЛЯПУНОВУ Ili'OIHAMMIIMX ЛШ1/КРПИЙ 67 «^ u, Покажем теперь, что тюбое решение, начинающееся при (=t„ в обтасти HxJI^Tj, будет оставаться в области ||х||^л4 при t>l, Действнте 1ыю, осли это движение пересечет поверхность |1х|| = г, то, начиная с момента пересечения, будет dV/dt < О Это неравенство 6vier сохраняться до тех пор, пока движение б\'дет распотагаться в об тает и ''<||х|Клг При этом должно также быть V-s^m Если предположить, что в какой-либо момент движение достигнет иоверчиости. то в этот момент будет необхо- чимо выполняться противоположное неравенство V > т, следова- течыю, in этого противоречия вытекает, что имеет место лишь одна возможность движение будет оставаться в об части Цх||<га при t^t0 Возьмем теперь какие-либо две начальные точки х0 и х„ из обмети ||х||О, и построим соответствующие им движения х-=х(/, х0,/0) и х = х(/, х„,/„) Топа ф\икцпя z = x—х будет удовлетворять системе уравнений z=-/>z ( nj^j. г (3 42) Система (3 42) получена из системы (3 41) после подстановки и нее решений х и х и почленного вычитания При этом матрица ^-> получается в результате применения формулы конечных приращений к разности G(x,/)-G(x./), и, счедоватетыю, эчементы этой матрицы б\д>г ограничены при ( > /„ равномерно дтя всеч х„, х0, так как по доказанному выше соответств\ющне решения х и х б\'дуг оставаться в об части Найдем полную производную ф\икцни V(г, t) в cmv (3 42) Тогда по1\чнм %=W(zJ)-\-v[g™uV,{d£\z). (343) 1Ь вита (3 43) вытекает, что с>ществ\ет и,>0 такое, что при |}i|<u, правая часть 6} дет удовлетворять оценкам типа (3 31), и которых следует х заменить на г \\\ этих оценок и оценок, существующих дтя функции V, б\дет вытекать тогда, что векторная ф\икция z будет удовчетворять оценкам типа (3 29), если в них х заменить на г, что и требовалось доказать.
G8 ПИ0В1ЕМЫ СТАБ1ИИЗАЦНИ ДВИЖЕНИЯ |l 1 1 Следствие Рассмотрим управ гяемую систему x = P(t)x+Q(l)u + F(t) + \iG(x, и, /) (3 44) Пусть U—семейство управлений, заданных при /^0, непрерывных и ограниченных в совокупности Будем считать, что элементы матриц Р, Q, F заданы при 1^0, воинственны, непрерывны и ограничены Если G(x, и,/) задана при х£.Е,„ и££г, /^0, вещественна, непрерывна по всем своим аргументам и непрерывно дифференцируема по компонентам вектора х, а также есш упомянутые частные производные ограничены вместе с G равномерно по отношению к t^O во всякой конечной области изменения х и и, то при любом выборе /-j > 0 можно указать и.„ >0н г, > гх такие, что область достижимости для любых решений, начинающихся в области II хо II ^ ri при 1 = 'с будет располагаться при любом t^?tBe области || х || ^ г2 При этом любое програм мное движение, начинающееся в области || х„ || <! г,, / - /„, будет асимптотически устойчивы и Денствнте тыю, обозначим через х = х(/, х0, /0, и) решение системы (3 44), начинающееся в точке х=^х0 при / = /„ и соот- ветствмощее выбранному управтенпю u-=u(t)£U Совокупность всех векторов х(/, х„/0, и), и £ U в уомеиг / образует в фазовом пространстве некоторое множество, которое называют обычно множеством достижимости Найдем потную производную функции V в any системы (3 44) Тогда будем иметь — = W + {gradV, Qu)-r-(gradV, F) bu(gradK, G) Выберем г теперь так, чтобы было W + (grad V, Qu) | (grad V, F) <0 при || х ||^г, /^0 и u £ U Далее выбираем г, и /■„, как в чоказательстве предыдущей теоремы Легко видеть, чго onществуег р., > 0 такое, что dV/dl < 0 при rt < ||х||< г,, t >0, u£U, ее in только |p.|<(.i, Из этих неравенств устанавливаем с помощью таких же рассуждении, как и при доказательстве предыдущей теоремы, чго область достижимости будет располагаться в ||х||<г2при t^t0, так как таким свойством будет обладать чюбое программное движение Матрица {dG/dx} в данном случае будет зависеть также и от управления Однако по-прежнему можно выбрать р.г > 0 так, чтобы при |р-|^и^ было возможно оценить № (z) -j- p. (grad V, {dG/dx} z) так же, как это было сделано в предыдущей теореме Из этого б\дет следовать асимптотическая устойчивость любого
§ 4) область Асимптотической устойчивости 6') программного движения х = х(/, х0, /0, и) и справедливость оце нок (3 29) для векторной функции z = x(/, xn, /0, u) — xty, х0, /„, и) при любом выборе х0 и х0 из области [J x jj ^ rt и тюбом выборе управления и € V § 4. Область асимптотической устойчивости 1° Рассмотрим автономную систему дифференциальных уравнений ^ = M*i *«). s=l,2, ,«, (4 1) правые части которой определены, вещественны и непрерывны при — oo<ic<-f-oo Кроме того, пусть функции /, (vlf , х„) удовлетворяют условию Липшица по переменным vlt , v„ в любой конечной области G пространства £„, т е для любых Xj х„, xt, . , х„ в области G |/,(*.. . v„)-/x(xlt . , vj|<£0(jj|*,-*,|), где L0—постоянная, независящая от xv , х„ и опредетяемая областью G Пусть начало координат является положением равновесия для системы (4 1), т е /,(0, , 0)-=0, s =1, 2, . , п, и пусть оно асимптотически устойчиво по Ляпунову Обозначим решение системы (4 1) при начальных условиях /=/„. х = Xj через \{t, x0, /„) Опредеаение 4 1 Множество А веек точек х„, с7лч ко/«у- Цх(/,х0, /.) Н —► 0 при /— | оо называется областью1) асимптотической устойчивости (или областью напряжения) Опрелеаение 42 Система называется асимптотически устойчивой в цечоч, если А — Еп 1) Под областью G вообще мы будем понимать непустое множество С точек, обладающее двумя свойствами 1) каждая точк.1 множества G есть ин\трепня», т с принадлежит ему вместе с некоторой своей окрестностью, 2) множество О связно, т е каждые две точки этого множества можно соединить ломаной, состоящей из конечного числа звеньев, которая целиком лежит внутри G Совокупность точек, которые являются предельными для точек об мсти G, 1,0 ме принадлежат этой области, называется граш.цей области С
70 ПР01ЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ. I Здесь нужно обратить внимание на фундаментальное различие между линейными и нелинейными системами, в линейных системах всегда бывает асимптотическая устойчивость в целом, тогда как в нелинейных системах она может не быть таковой (область А не совпадает со всем пространством) Замечание Рассмотрим линейную систему и некоторый класс допустимых характеристик нелинейности. Возникает задача (задача Лурье) указать необходимые и достаточные условия асимптотической устойчивости такой системы независимо от начального состояния системы и конкретного выбора допустимой характеристики нелинейности В этом случае говорят, что гарантирована абсолютная устойчивость системы Таково различие между понятием асимптотической устойчивости в целом и абсолютной устойчивостью системы Легко показать, что множество А открыто и связно Те о р е м а 4 1. Для того чтобы наперед заданная инвариантная область А, содержащая точку х = 0, была областью асимптотической устойчивости положения равновесия системы (4 1), необходимо и достаточно, чтобы существовали две функции V (х) и ^(х), обладающие следующими свойствами 1) Функции V(x), W (х) заданы в А, вещественны и непрерывны, 2) функция V(x) отрицательно определенная и W (х) положительно определенная; 3) в области А выношены неравенства — l<V(x)<0 при Чх£А,хф0, (4 2< W(x)^V(x)|/n-Si/J, (4 3) где ф(х)—некоторая положительно определенная функция такая, что Ф(х)>а>0 при ||х||>р>0. (44) 4) вдоль интегральных кривьк системы (4 1) функция V (х) непрерывно дифференцируема и fVJU^Wil+V) (4 5) в силу системы (4 1) Доказательство Достаточность Пусть выполнены условия теоремы Тогда, так как функция V(х) отрицательно определенная (условие 2)) и ее полная производная в силу системы (4 1) является положительно определенной функцией (условие 4)), будет выполнено условие асимптотической устойчивости положения равновесия х = 0. Следовательно, по'любому е>0 можно
§ 4) OD lACTb АСИМПТОТИЧЕСКОЙ УСТОЙЧИВОСТИ 71 указать б (е) > 0 такое, что при || х01| < б будет 1) || х(/. х,)||<е, 2) lim || х(/, х0)||=0, (4 6) где х(/, х0) — решение системы (4 1) с начальным условием х(/„ х0)-х0 Покажем теперь, что любая интегральная кривая, начинающаяся в области А(ха£А), обладает свойством II х(/, ж,) || —► 0 при /-+ |-оо. Сделаем в системе (4 1) замену ds = dt]/1+ Sfl. (4 7) Тогда получим систему уравнении причем правые части системы являются непрерывными функциями вектора х и ограниченными, так как \\у i+2j//(x) Это обеспечивает существование решения на всей оси — оо < s < < + оо Покажем, например, что интеграаьная кривая x = x(s, х„) системы (4 8) определена при всех s > О Действительно, возможны два случая либо эта интегральная кривая ограничена при s > О, либо не ограничена при s^O В первом случае последовательное применение теоремы существования показывает, что интегральная кривая определена при всех s > 0 Во втором случае предположим напротив, что интегральная кривая определена лишь при
ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ Тогда, как следует из равенства )/,+1« Ri*L и (4 8*), получим оценку \x,(s. x0)|<|*j-»| + s», / = 1.2 я, (49) что противоречит предположению о неограниченности интегральной кривой Возьмем любую точку х0£А и покажем, что ||x(S, Х0)||—«-0 При S—«-+00, т е. по любому в' (можно взять его меньше б = б (в)) в (4 6)) существует S(e') такое, что для всех s^S(t') будет l|x(s, х0)||<е\ Достаточно существования такого S(e'), что ||х(3, х0) || = е'. Тогда по имеющейся асимптотической устойчивости (4 6) ||x(s, x0)||—«-0 при s—* + oo Ясно, что для любой точки х„£ А возможно: либо существует такое 5(е'), либо не существует В последнем случае для всех s > 0 будет || х (s, х0) || > е' В этом случае в качестве функции Ляпунова возьмем F= In (1 + 10. (4 10) которая будет отрицательно определенной, а полная производная в силу системы (4 8) dV 1 dV dt 1 П7/1 , i/ч 1 ^ / \-^ / м ^ п 4r = T+V-di-Ts = r+vW{l + V) / — ><К*)>*(*)>0 у 1+2 Л (4 11) по усювию (4 3) Отсюда V>V0 + s a(e'). (4 12) Таким образом, функция V будет сколь угодно большой при s—++оо, что невозможно (Р отрицательна) Полученное противоречие показывает обязательно существует S(e'), что и доказывает наше утверждение
§ 4] ОБЛАСТЬ АСИМПТОТ ИЧГ.СКОЙ УСТОЙЧИВОСТИ 73 Определение 43 Множество М точек х = {х1 хп) фазового пространства системы (4 8) называется инвариантным, если из условия х0 £ М следует, что х (s, х0) £ М при s g (— оо, -f oo). Замечание. При доказательстве достаточности условий теоремы используется факт инвариантности области притяжения А Согласно условию 3) настоящей теоремы, соотношения (4 10)—(4 12) справедливы разве лишь в области А, т е когда x(s, x0)gi4, для всех s>0, где х0£Л Последнее справедливо в силу определения 4 1 и единственности решения системы (4 1) Необходимость Пусть А является областью асимптотической устойчивости, что означает 1) любая интегральная кривая х(/, х„) системы (4 1), начинающаяся в области А, при любом / принадлежит области А, 2) имеет место устойчивость решения х = 0 и Н*С *о)||—72° при х0£А (413) Построим функции V и W, удовлетворяющие условиям теоремы. Мы будем рассматривать систему (4 8), решение которой определено при всех s£(— ею, +оо) Однако геометрически интегральные кривые систем (4 1) и (4 8) будут совпадать Изложим сначала программу действий. 1 Покажем, что из асимптотической устойчивости, равномерной относительно s0[/0] (правые части систем (4 8) и (4 1) не зависят явным образом от s [t]), следует существование непрерывной функции L(s), заданной при s>—oo, строго монотонно убывающей от -f-oo до 0 при s—»- + оо и такой, что ||х(5, x0)||<L(s) при s>0 и ||х0||<б (4 14) 2 Выберем функцию Ф (х) = || x(s,x0) || <?-*•-<» ms. х„) in, (4 15) где £->(£)—функция, обратная к L. 3 Положим У(х0) J yds, (4 16) о причем требуемые в теореме функции V и W выражаются через фи V следующим образом Ф = r W -, V = ln(l+K). (4 17) у i+ijfl Во исполнение этого плана возьмем е>0 Согласно определению равномерной асимптотической устойчивости, найдем 6(e) >0
74 ПРОБЧЕМЫ СТАБИЛИЗАЦИИ ДВИЖЫ1ИЯ [1Л 1 такое, что при ||х0||<б 1) ||x(s, х0)|| <е при всех s>0, 2) ||х(s, х0)|| —О при s^ + oo. Положим L(s)= sup || х (5, х.)||. Их. ||<в Ясно, что фикция L(s) задана при s>0 и обладает свойствами: 1) 0<L(s) <е при s>0, 2) /T(s) —► 0 при s —+ оо Выберем теперь строго монотонную функцию L(x), заданную и непрерывную при —оо <т<Н-оо, строго монотонно убывающую от + оо до О при возрастающем т от — оо до + оо и такую, что L(s)^L(s) Легко видеть, что построенная таким образом функция удовлетворяет всем требованиям пункта 1 нашего плана Функция <р положительно определенна, так что W в силу соотношений (4 15), (4.17) удовлетворяет условиям 1)—3) теоремы. Покажем теперь, чго интеграл в (4 16) сходится при ха$А Если х„ £Л, то можно указать величину S(x0) такую, что ||x(s, x,)||<6 при s>5(xu) Разобьем интеграл ] yds на два: о + •» S(x0) +<o $ yds = J yds-\- $ yds. (4 18) В последнем интеграле сделаем замену переменной интегрирования s = s'+S, получим J Ф ds = J || х (s' + S, х0) || e-L-м и х v+s. x,) ч) ds' e = J ||x(s', x0) H e-'--, HI x (.'.Lungs', (4 19) где x0==x(S(x0), x0), ||x„||<6 в силу выбора <S(x0), а тогда ||x(s', x0)||<e для всех ь'> О К тому же имеем неравенство (4 14) ||x(s, x,)||<L(s) при s>0 и || х, ||< в,
^ 4) ODIICTb АСИМПТОТПЧЬСКОЙ УСТОЙЧИВОСТИ 7*5 откуда путем применения обратной функции к неравенству (4 14) получим s<L-'(||x(s, х,)||) (4 20) Легко получить из (4 20) ||x(s, xi)|fe~* > || х (s."x0)||е-1--' с и« u x.i и> (4 21) Применяя (4 21) к оценке интеграла (4 19), получим ] yds <e J е-''ds' < е Таким образом, сходимость (4 18) доказана Ясно, что из непрерывности V(\0) следует непрерывность V(x) Покажем непрерывность 17(х0) при х0£/1 |7(х<»)-У(х«>)|= 5 (Jp(||x(s,xi»)||)-Jp(||x(s,x?>)||))ds . I о I (4 22) Так как xj,l>, xj>2)£ А, ю можно указать величину 5> 0 такую, что J Ф(||х(5, x«„»)||)ds<4-eI и j ф(||х(5, xi»)||)ds<leI. i S где г1 — некоторая положительная константа. В силу интегральной непрерывности по числу 5>0 и /",>0 можно выбрать г, = rx (S, /•,) такое, что при Цх^1' — х'„г>|| < лх будет ||x(s, х^1')—x(s, xj,2)) || < л, при всех s£[0, S]. Далее, г2 можно взять столь малым, чтобы |Ф(||Х(5,Х'01')||)-Ф(||Х(5, х«,»)||)|<у--§- Пр.! se[0,S], а тогда из (4 22) получим |V(xi»)-V(x?')|<ei при ||xi»-xi»||</v (4 23) Таким образом, по Ej > О указано q>0 такое, что имеет место (4 23), а это означает, что функция V(x) непрерывна в Л (в силу произвольности выбора точки, например, х{,1)) Покажем, что функция V(x) отрицательно определенная Рассмотрим функцию />)= in! Цх(т, х,)Ц. (4 24) те [О s\ II *t И—*
76 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Легко видеть, что inf достигается и функция 7(s) обладает свойствами 1) l(s) не возрастает с ростом s, 2) l(s)—«-О при s—► |-оо, кроме того, l(s) в нуль не обращается Пусть это не так, т е существует s_TaKoe, что7(s) = 0 Тогда существует такие х0 и т, что ||х(х0, т)||— 0, или х(х0, т) = 0 Последнее невозможно в силу единственности решения Полученное противоречие показывает, 4to7(s)^0 для всех s>0, 3) ||x(s, x,)||>7(s) при К || = б (4 25) Можно взять непрерывную функцию /(s)<7(s) Возьмем теперь любое х0 € А Существует 5 такое, что || х (S, х0) || = || х„ || = б, Тогда имеем V(x0) = — $<pds — jj yds О 6 Поспе замены переменной интегрирования в последнем интеграле s = S + s' получим S +« S Г(хп) = —$<pds — J ф( || x(s',xe) ||ds'= — \<pds +V(x0) (4 26) oo и Так как ||x(s, х0)||>б1 при s£[0, S], то существует такое ам что ф(х)> Cj, a тогда jqjds'^a, (4 27) о Рассмотрим V(x0) при ||х0|| = 6 Обозначим } cp(/(s))c/s = /i о С учетом неравенства (4 23) пегко показать, что ^(х„)<— h (4 28) Из соотношений (4 26)—(4 28) имеем F(x0)<-(5aH-/0 (4 29) Покажем, что Г(х£*>)—«-О при Цх^'Ц >-0 Можно взять ||х10*'|| < б, & = 1, 2, . , и из полученной оценки интеграла (4 19) следует требуемое Таким образом, V(x) пршшмает в обпасти А отрицательные вначения, и лишь при х = 0 V(x) = 0
§ 4] ООЛАСТЬ АСИМПТОТИЧЕСКОЙ УСТОЙЧИВОСТИ 77 Покажем далее, что Mm V(xJ*>) = — °°. если топько MrnxJ*'—xj, |де xi*'£A, х'в£А\А (Л —замыкание множества А) Пусть в моменты 5Л интегральная кривая x(s, xj,*') попадает на поверхность сферы ||х|| = б,<6 Последовательность \Sk\ при этом стремится к +оо Покажем это П>сть Sk не—>--{-оо Тог та можно выделить ограниченною подпоследовательность Обозначим ее {Sk\ В силу интегральной непрерывности по s и /^ можно выбрать Иг > 0 такое, что ||x(s, xj,*') —x(s, xj)||</ij для всех s€[0, s] при \\xf} — xj || < /ij Да lee/i, можно взять столь малым, чтобы l|x(s, х„)||<6 Этим самым х„€<4 вопреки, предположению Стедоватетьно, 5ft—с-1 оо при к—<-Ч-оо Рассмотрим V(x{0k)), Проводя оценки (4 26)—(4 29) (всюду s' и х„ следует заменить на Sk и х£*>), получим V(x0)<-(Skai + h), что и доказывает свойство 3) функции V(x) Наконец, определим dV,'ds Для этого возьмем интеграчьную кривую x(s, х„) и фиксируем момент s Тогда V(х(s, х„)) = - $ ф(|| х(s', х(s, xd)) \\)ds' (4 30) K(x(s-f As, x°))=- $ ф(|| х(s'. x(s + As, x.)) || )ds' (4 31) Вычитая почтенно (4 30) из (4 31) и деля обе части на As, получим 5F = 5i} Ф(ИХ(П. x.)H)dn. (4 32) где Д1' означает приращение функции V вдоль интегральной кривой Уаремляя As к 0, получим dV/ds — Ц) вдоль ингегратиной кривой Этим теорема доказана полностью Следствие 1 При помощи функции V(х), о которой идет речь в теореме, можно всегда принципиально решить задачу отыскания границы области асимптотической устойчивости Если последовательность точек xj,*' стремится к граничной точке, то, как екдует из доказательства необходимости, в этом случае и иеем V{xj*>)—*— I при к — + оо.
78 ПР0Б1ЕМЫ СТАЫШиЛЦШ! ДЦП/КСНИЯ (ГЛ 1 Уравнение границы области А будет V(x) = -1 (4 33) Граница области А состоит из целых траекторий и представляет собой инвариантное множество Это следует из того, что dV/dt = W(l \V) = 0 при V = — l Следствие 2 Если V(x)—* — 1 при ||х||—» + оо и выполнены все условия теоремы, то имеет место асимптотическач устойчивость в целом Нужно отметить, что впервые необходимые и достаточные }сповня асимптотической устойчивости в целом были даны Бар- башнным и Красовским 2° В некоторых задачах теории автоматического регулирования, особенно в теории электрических систем, возникает саедую- щий вопрос П^сть х —0 есть установившееся состояние исследуемой системы Известно, что параметры системы можно выбрать так, чтобы это установившееся состояние было асимптотически устойчивым Необходимо определить множество начальных возмущении х„, при которых рассматриваемая система возвращается и заданную окрестность установившегося состояния Можно также рассматривать вопрос выбора параметров регулирования системы так, чтобы это множество начальных отклонений было в некотором смысле наибольшим Предположим, что переходные процессы рассматриваемо."! системы можно описать при помощи системы дифференциальных уравнений тЗг = 2°*Л + Xt, s=\,2, , n, (4 34) i=\ где Xs—функции, разлагающиеся в сходящиеся ряды в окрестности точки х = 0 н не содержащие членов ниже второго порядка относительно х Далее, пусть вещественные части корней характеристического уравнения det (Л — КЕ) отрицательны Построим для этой системы уравнений функции, о которых идет речь в теореме, чтобы с их помощью построить область асимптотической устойчивости нулевого решения (4 34) или же аппроксимировать эту область изнутри некоторыми вложенными областями Для этого рассмотрим уравнение в частных производных Zir(ttas^ + ^s) = W(x)(l+V). (4 35)
§ 41 область лснмгпошчгской устойчивости 79 Б>дем искать решение V(х) в виде ряда V(x) = Vt(x) + Vt(x) I . . t-V.(x)+. . (436) 1Де Km(x)—-однородная форма m-й cieneHii относительно v,, , \„. Подставляя (4 36) в (4 35), пол\чим дая определения форм Vm{x) систему уравнений Xlf(X^) = ^W. - = 3.4 1де R,„ является известной формой /n-й степени, если найдены формы Уг, , У,я_, При этом в качестве W (х) можно взять любую гочоморфную положительную функцию, наименьшие тепы в разложении которой по цечым положительным степеням величин v,, , х„ образуют квадратичную положительно опреде ien- ную форму Из системы (4 37) постедовательно найдем формы Vt, К,, Отыскание этих форм осицествтяется следующим образом Рас- смотрнм систему обыкновенных дифференциальных уравнений, соответствующую системе (4 37) d\/dt = Ax, dVm'dt = Rm, ш = 2, 3, 4, ... (4 18) По теореме 3 3 существует отрицательно oiipeieieiinasi квадратичная форма Vt, которую можно представить в опте V,= — 5 Wt(x)dx. Hoc 1етовате 1ьно определим Vm= - J Rindx, ш = 3, 4, .. Рят (4 36) формально можно построить, и сходимость его в достаточно матой окрестности начала координат следует из вспомогательной 1еоремы Ляпунова Отметим, что выбор функции IV (х) в уравнении (4 35) втияет на область сходимости этого ряха Например, д>я системы v,=—х, уравнение (4 35) примет иид
80 llPOini МЫ С1ЛШ1 1ИЗЛЦИИ ДВИЖЕНИЯ 1ГЛ I При W = 2 2 х\ оно имеет решение V(x)=c , = l -1, а при — решение в виде V(x) = exp(7l-u2*?Yl/3_A -1 Если искать в этом примере К(х) в виде ряда, то областью сходимости его в первом случае будет все пространство, тогда как во втором — лишь его ограниченная часть Теперь построим область, целиком погруженную в А Для этого рассмотрим семейство поверхностей V,(x) и, (4 39) где [16(0, -t-oo), p. = const Если поверхность а является границей области А, то найдется такое значение ц = р,*, что ^а(х)= —I-1* касается поверхности а в некоторой точке х Действительно, так как семейство (4 39) заполняет все пространство, то существует такое значение \i, при котором V~ = —ц пересекает поверхность а Обозначим через ( — ц*) наибольшее значение V2(x) на к>ске поверхности а, заключенной внутри К2 = —ц Тогда Vz(х) =— р.* будет касаться а Поверхность а задается уравнением I -\-V(x) = 0 Тогда в_точкс касгния_х имеем (gradV (х))(Ах +Х) = 0, откуда (gradV(x))=- Я. (grad ^(x)), (grad Уг)*(Ах + Х) = 0 Рассмотрим V2(x) как функцию Ляпунова для системы (4 34). Найдем dVjdt в силу этой системы dVjdt = (grad Vt, (Ax + X))=W (x) Почожим W0 = \х Ц7(х) = 0, х^=0} (W0 не пусто, например, x£\Vn) Найдем наибольшее значение функции Уг(х) на множестве W0 и обозначим его через (— р,0) Очевидно, что поверхность ^2(х)=^о целиком содержится в области А Аналогично с спехом можно использовать семейство поверхностей
§ 5) CTADinil3/\mi!l ПРОГРАММНОГО ДШ'ЖЬНИЯ Ы и найти такое |iJV), что поверхность Vs = — р.;/' будет целиком содержаться в области А В связи с этим возникают вопросы разработки удобных методов построения границы области Л (изнутри или снаружи) для инженерных задач § 5 Стабилизация программного движения 1° П\сть задана система дифференциальных уравнений x'=F(/, х, и), (5 1) где х—/(-мерный вектор, и — /-мерный вектор, F — и мерная вектор-функция Система (5 1) описывает движение некоторого управляемого объекта, причем величины х = {дг1, , х„\ являются фазовыми координатами этого объекта, a u = u(/)={u,, , м,} — его управляющими органами, или законом отклонения рулей Будем называть u = u(/) управление и Рассмотрим некоторое управтение и = ир(1) Пусть известны начальные данные х(*0) = х0 Тогда система дифференциальных уравнений (5 1) при довольно широких допущениях относительно функций F (теорема Каратсодори) имеет единственное решение х = хя(/)-=х(/, х,„ /„ и,) (52) Это движение может быть построено из различных соображений, в частности программные управления up(t) и программная траек т&рня \p(t) могут быть оптнмачьнммн в том или ином смысле В настоящем параграфе ставится задача отыскания такою закона управ тения объектом, при котором программное движе нне оказывается устойчивым, или, скажем, стабильным (в каком смысле—будет оговорено ниже) Здесь займемся вопросом устойчивости, точнее, аснмптотнчс ской устойчивости программною твпжения по Ляпунову Сделаем в системе (5 1) замену искомых функций и управ ляющнч величин по формулам х-Х/ДО + у, u u,(0 + v Тогда система (5 1) примет вид dy/dt=G(t, у, v), (5 3) где G(/, у, v) = F(f, хр + у, ир ! v)-F(/, xp. и,,) /54) причем G(/, 0, 0)г=0 Из (5 4) вытекает, что при упрлвтешш v = 0 система (5 3) имеет движение у — 0.
82 ПРОЫЕМЫ СТАЫИИЗАЦИП ДВИЖЕНИЯ 11Л I Здесь нас могут интересовать следующие вопросы 1) Существуют ли управления (у,, , vr), при которых положение равновесия у —0 асимптотически устойчиво но Ляпунову' 2) Пусть существуют такие (о,, .., vr) Как их построить1 Л) Пусть можно построить такие (t\, . ., vr) и не етннствен- ным образом Как из множества управлений (у,, ...,vr) выбрать оптимальное в том или ином смысле' Выделим в системе (5 3) чаены, линейные относительно у и v Toi,ia получим dy/ttt = /l(0y+fl(0v + H(/, у, v), (5 5) где будем считав, что A(t), B(l) — вещественные непрерывные матрицы, заданные при />0, с ограниченными элементами || Н (Л у, v)||<L(ily|H-||v||)I+a, (56) причем oc=const>0, L — const Предположим, что при управлении v=C(/)z (5 7) нулевое решение системы dz/dl = A(t)z-i B(t)v (5 8) асимптотически устойчиво по Ляпунову и любое решение ее удовлетворяет неравенствам || z. || агв—-«'-'-> ^ || z (/, <о. z0)||<wl||z„||e-t,.('-'.i (5 9) Тогда Теорема 3 3) существуют две квадратичные формы V(z, t) и \V(z, t) такие, что f,||z||«<P(z, /)<-ca||z||', -d.Hzll^Wtz, 0<-d,ll2||». где a,, bh ch clt (i =_1, 2) —поюжитеиные постоянные, и выполнено соотношение dV/(ll = W в силу системы (5 8) при \ = С(1)г Продифференцируем квадратичную форму V в силу системы (5 5) Тогда получим Легко видеть, что Islj^C' у.. с(/)у)|<л||у||'+«, где h = const > 0.
<j 5J СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖЕНИЯ 83 Таким образоп, dV/dt = U7, (5 10) в ciny системы (5 5) при управлении v = C(/)y, (5 11) причем IF, —отрицательно определенная функция при достаточно малой || у || Ввиду оценки (5 6) ^1<Цу||2(-^ + Л||У||а) (5 12) Отсюда следует, что положение равновесия у = 0 нелинейной системы (5 5) асимптотически устойчиво Итак, имеет место следующая Теорема 5 1 Если при управлении (5 7) решение z = 0 системы (5 8) асимптотически устойчиво и выполнены неравенства (5 9), то решение у=0 системы (5 5) асимптотически устойчиво при управлении (5 11) и любое ее движение, начинающееся в достаточно малой окрестности точки у = 0, удовлетворяет оценкам типа (5 9) Осталось показаль, что для у(/) выполнены неравенства типа (5 9) Легко видеть существуют такие г,, rt, б — положительные константы, что -'illyll*<tt'i<-'-,||y||1. (5 13) ее in только || у || < 6 Аналогично, как и в теореме 3 3, получим требуемые неравенства 2° Рассмотрим теперь линейную систему dy/dt = Ay + bu. (5 14) Предположим, что для простоты г— 1, т е. имеется один управляющий орган, и пусть матрица Л и вектор b постоянны. Теорема 52 Пусть векторы Ь, ЛЬ, ЛгЬ, . ., Л'-»Ь (5 15) линейно независимы В этом случае всегда можно построить управление вида и = с»у, (5 16) доставляющее системе (5 14) любые наперед заданные собственные числа Доказательство Введем в рассмотрение матрицу S = {b, ЛЬ, Л2Ь, .... Л'-'Ь},
84 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ (ГЛ I которая является неособой в силу линейной независимости системы векторов (5 15) Сделаем в системе (5 14) замену искомых функций по формуле у = 5х Тогда для новой искомой векторной функции получим систему уравнений £ = S-1ASx + S-1hu. (5 17) Так как S~2S = E, то 4D- Вектор А"Ъ может быть разложен по векторам Ь, ЛЬ, .... А"-1Ъ, как по базису, причем это разложение представимо в форме ЛЛЬ = —р„Ъ — р„_1АЪ — . — plAn~lb= — *2iPsAn-'h, система (5 14) примет вид dXl/dt=-pnxn + u, dxs/dt=xs.1—pn.s+lxn, s = 2, 3, . .,п (5 18) Положим г=х„ и будем дифференцировать это равенство, определяя правую часть из системы (5 18) Тогда получим dz/dt = dxn/dt = хл_,—ptxn = xn.l—plz или dz/dt + р1г=хп_1 Дифференцируя еще п—1 раз, для г будем иметь уравнение г<"> + Лг««-« + ... + р„г = и (5 19) Положим м = Т]г(л-1)_|_^2(Л-2)+ ш ш. -f y„z. (5 20) Тогда г"» + (р,—Yi)2("-X) + (P2—Y2)z(n-2)+...+(jt>n—Y„)2 = 0, и каковы бы ни были числа Klt ..., Кп (в случае комплексных будем считать, что есть и комплексно-сопряженные), всегда по формулам Виета можно записать зависимость коэффициентов
§ 5) СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖН1ИЯ 85 многочлена через его корни. Y* = Pa-J>A/. (5 21) Осталось показать, что -у,, . ., уп единственным образом определяют набор чисел с,, . , с„ и, следовательно, ы = с*у Действительно, подставляя в (5 20) значение г,. ., г'"-1' через \j х„, выразим и как линейную форму *,, , \-„ "=21 УЛ. (5 22) откуда, учитывая, что x = S_1y, получим " = 2 cty, = с»у Теорема доказана Следствие Если векторы Ь, ЛЬ, , Л"_1Ь линейно независимы, то решение у —0 всегда можно еде iamb асимптотически устойчивым управлением вида и - с*у В ходе доказательства теоремы дан конструктивный метод построения управтения и, при этом коэффициенты уситения с,, ., с„ определяются в замкнутой форме через элементы матрицы А и вектора b 3° Усчовие (5 15) теоремы 5 2 является, вообще говоря, излишне жестким Определим подход к построению системы автоматического управления, обеспечивающей асимптотическую устойчивость программного управ пения для тех случаев, когда оно может не выполняться Пусть >,, , 'к„—собственные числа матрицы А Преяпою- жнч, что среди них имеются в точности k таких, у которых вещественные части неотрицательны Тогда неособым линейным преобразованием над фазовыми переменными линейную систему (5 14) можно привести к виду rfy1/d/^i4+y1 + b1u, dyJdt^-A^y, \-Ьги, (5 2J)
86 ПРОВПЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ. I где А+, b,, yt —размерности k и Л_, Ь„ у, —размерности п — k iMaTpnua A+ имеет собственные числа Xlt ...,Kkc неотрицательными вещественными частями, а матрица Л_—только с отрицательными. Теорема 5 3 Если векторы b,, A + bu ..., Ак+~1Ь1 линейно независимы, то положение равновесия у = 0 можно сделать асимп- тотинески устойчивым выбором управления и - с»у (5 24) Доказательство Как следует из доказательства теоремы 5 2, для первой группы уравнений системы (5 23) можно выбрать управление u = r*yj так, чтобы нулевое решение этой системы было асимптотически устойчивым Рассмотрим теперь совокупную систему уравнений (5 23) при етом управлении Матрица этой системы имеет вид Л^ + Ь.Г-, О N V Ь.Г-, А.)' по теореме Лапласа характеристическое уравнение запишем так. det (Ф—Я£) = det (А+ + Ь,Г*—?,Ek) det (Л_ — Я£„_А) = О Отсюда следует, что все собственные числа матрицы Ф имеют отрицательные вещественные части Таким образом, положение у = 0 асимптотически устойчиво Замечание 1 При обратном переходе к системе (5 14) ) правление (5 24) подвергнется линейному преобразованию Ясно, что управление ы = с*у стабилизирует систему (5 14) Замечание 2 Теорема 5 3 заключает в себе необходимые и достаточные условия стабилизации программного движения по первому линейному приближению Предположим, что условия теоремы 5 3 не выполнены, т е среди векторов blf А+Ъи .. , Ah+-ibt (5 25) имеются линейно зависимые Пусть I <k первых векторов (5 25) линейно независимы, тогда k — l остальных векторов представляют собой линейные комбинации первых Дополним систему из / векторов до k так, чтобы совокупная система была линейно независимой bj, Л + Ь1( ..., А!г%, Ь„ Ь,+1, , ЬА (5 26)
(51 СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖЕНИИ Образуем из них матрицу S и сделаем замену по формуле у, -= Sz. Тогда первая группа уравнения (5 23) примет вид Го о .. о -р. I О о о с, * + (5 27) Здесь можно различить два случая 1) среди собственных чисел матрицы С, есть собственные числа с положительными вещественными частями, 2) собственные числа матрицы С, имеют только равные нулю вещественные части В первом случае программное движение не может быть стабилизировано управлением вида " = Су+ о(|| у ||), как бы ни выбрать вектор с, поэтому, верно следующее \ тверж- дение Теорема 54 Если при любом управлении ы = с«у (5 28) среди собственных чисел матрицы А + be* существует хоть одно число с положительной вещественной частью, то положение равновесия у = 0 системы dy/dt = Ay + bu+H(t,y,u), (5 29) где ||Н(/,у,и)||<М11у|1 + ||"||)1+а. L>0, ос>0, нельзя сделать устойчивым (асимптотически) по Ляпунову путем выбора управления такого, что ИКР1М1. Р>о.
88 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ (ГЛ. I Доказательство Докажем ее с помощью теоремы Ляпунова о неустойчивости, т е построим соответствующие функции V и W Рассмотрим самый простой и характерный случай единственною положительного корня Тогда линейные члены дифференциальных уравнений (5 29) при управлении (5 28) можно привести к виду dyjdt = ХхУ1, dy/dt = Ay, (5 30) где у*-={у2, .. , у„), Я-!> 0. Рассмотрим функцию V = VX + VV где Vi-Jfl. Vt=VM(y„ . ., у„) Будем считать, что ysO асимптотически устойчиво по Ляпунову и функция Vt(y) отрицательно определенна Тогда dVt(y)/dt = Wt(y~) в ситу второй группы уравнений системы (5 30) будет положительно опреаеленной Вычислим полную производную dV/dt в си чу системы (5 30): ^2Xyi + W1=2Klyt+Wi+\iV-iiV^]iV+(2X1-Vi)yl+(Wa-iiVt). Пусть 2Я, > ц > 0, тогда dV/dt=--iiV+\V, (5 31) где W (y) = (2Kl — \i)yl + (\Vi—\ilVi) является положительно определенной функцией переменных ylt , у„ Ясно, что функция V в сколь угодно малой окрестности точки у = 0 принимает положительные значения Таким образом, выполнены все условия теоремы о неустойчивости для системы (5 30) Теперь перейдем к нелинейному случаю Полная производная dV/dt в силу таким образом преобразованной нелинейной системы будет ^- = li.V + W + [gradV,H(t, у, c«y)]=uy + U7, (5 32) Ясно, что существуют такие положительные постоянные аи а2 и б, что а, IIУII* <^i< а. IIУ IP. если только ||у|| <б Этим теорема доказана полностью.
§ 5] СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖЕНИЯ 89 4е. Во втором случае, когда ReXy = 0 для матрицы Сг, во многих задачах оказывается возможным сделать программное движение стабильным устойчивым или асимптотически устойчивым. Эти случаи носят название критических (сомнительных) Предположим, что система дифференциальных уравнений имеет вид $-Лу + 1ш + £у-. (5 33) где у'л—однородные формы степени т относительно отклонений J/u • ■ I/» и управлений ы„ . , иг Коэффициенты этих форм пусть не зависят от времени / Будем считать, что управление ы==с*у не может быть выбрано так, чтобы положение равновесия было асимптотически устойчивым Кроме того, матрица Л + Ьс* не имеет собственных чисел с положительными вещественными частями Пусть при некотором выборе с матрица А + be* имеет k собственных чисел, равных нулю, которым отвечают простые элементарные делители, и остальные п — k чисел с отрицательными вещественными частями Тогда систему дифференциальных уравнении (5 33) при управлении и = Су можно привести к виду ^=Х,(х. у;. s = l, 2, . k, . n (5 34) % = 2р^/ + ^(х,У), '=1. 2, . , N, N = n-k. где Xt = 2 XT, Y{ = 2 У? (5 35) m = 2 n =2 и XT, Yf являются однородными формами степени in относительно переменных хи , хк, ylt ., yN с коэффициентами, не зависящими от времени / Ряды (5 35) сходятся при достаточно малых |х,|, s= 1, ,/г, и \Vt\t ' = 1. . , N Собственные числа А.,, , Я.„ матрицы р — {Рч) имеют отрицательные действительные части А М Ляпуновым рассмотрен случай одного и двух нулевых корней и даны условия, при выполнении которых имеет место >стойчивость, асимптотическая устойчивость и неустойчивость Нерешенная задача дать условия, при которых в случае k нулевых корней будет иметь место устойчивость, асимптотическая устойчивость и неустойчивость Рассмотрим систему уравнений в матричной форме Ру + У(*. У)=0. (5 36)
90 ПРОБПСМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ. I Левые части этих уравнений обращаются в нуль при *,•=*,= ...=л-А = 0, 1/1=.. -=1/^=0 По нх функциональный определитель по отношению к у,, ...,yN при значениях xs = 0 и г/, = 0 обращается в величину, неравную нулю Поэтому в силу известной теоремы из теории неявных функций, уравнения эти разрешимы относительно величину,, ...,yN и чопycK.noг одно опредетеппое решение вида '/,= ",(*,. .. , хк), f = l, 2 N. (6 87) 1де «/(а-,, ...,хк) суть голоморфные функции переменных дг,, , хк, обращающиеся в пуль при х, = 0 Поде гавим решение (5 37) в функции X, (х, у) Тогда X, (х, и (х)) представляют собой голоморфную функцию переменных xlt ..., х„ Возможны два случая либо Xs(x, и(х))е=0 для всех s, 1 <;«<£, либо дчя некоторого s„ будет Xs<i(\, и(х))Ф0 Первый случай А М Ляпуновым на»ван особенным, второй—общим Рассмотрим особенный случай Сделаем в системе (5.34) замену д% — \s, У! = У; I-«/(*), s-1, . ., к, 1 = 1 N. (5 38) 1о1да система (5 34) примет вид | = 1р,7!//-|-^(х, У). (5 39) где функции X, (х, y) = Xs (х, и (х) + у) и Y, (х, у)=К, (х, и (х)+у)— — Yi(x, u(x) — Y1. "- ХАх, у) явтяются голоморфными при '=' -дХ/ достаточно малых \xs\, \yt\ и разложения нх по целым положительным степеням а,, ..., хк, ух, ..., yN не содержат членов, линейных относительно этих величин Система (5 39) имеет целое семейство положений равновесия xs = cs, J/, = 0, s=l, .... A, t = l N, (540) так как Х,(с, 0) = Х', (с, "(с) + О)е0 (особенный случай). Изучим движение около этих положений равновесия, для чего рассмотрим систему дифференциальных уравнений с частными производными v - / N — _ \___ H-T^- ~ PiJji-\ Г-^ У) ) = ХЛх, у). (5 41)
§ б] СТАБИЛ!13\ЦИЯ ПРОГРАММНОГО ДВИЖЕНИЯ 91 Сделаем в системе (5 41) замену xs = cs + zs, где zs — новые искомые функции, а с3, s=l, . , k—достаточно малые произвольные постоянные При этом система (5 41) перейдет в Z-^-(L Л/(с)У/+^)-£ МОУ/ + *,. (542) которая полностью совпадает с (6 41) при ||с || = 0 На основании вспомогательной теоремы Ляпунова при ||с|Кс« всегда можно найти систему голоморфных функций переменных Hi Уы *,=»*, (0i. •• . Ум ci. •• ск), (5 43) удовлетворяющих уравнениям (5 42) и обращающихся в нуль при !/,= ...=■ г^=0, т. е 7,(0 0, Cj C„)^0, S=l, .. , k Каждая из этих функций также обладает свойством г,(у~и -. H.V. 0, ,0)э0 Возвращаясь к прежним искомым функциям, получим xt = ct + z,(ylt . ,y~it,clt , cN), s = l k (544) Система (5 44) в силу свойств функций г, разрешима относительно сх, .. , ск так, что с,= *, + фЛЧ. • . Ч, у~х, .. , yN), s = l, ,k (5 45) Полагая в (5 45) xs = xs, t/i=yi—Ы/(х), получим систему голоморфных интегралов, не зависящих от t, для системы (5 34) с, = *, + Ф,(*1 х„, у1 — и1{х), . .,yN— uN(x)), s = l, .. , k. (5 46) С помощью этих интегра юв можно понизить порядок исходной системы Исключим из второй группы уравнений (5 39) функции х3 с помощью соотношений (5 44) Тогда получим для определения функций yt, 1 = 1 /V, систему уравнений _ n •f' = EP//(c)^ + >r/(y. с) (5 47) Hvieaoe решение системы (5 47) асимптотически устойчиво по Ляпунову, причем устойчивость равномерная по отношению к парамеграм cs, s=l, ...,£. Последнее означает, по любому
92 ИР0Ы1 МЫ СТАБИ'ШЗЛЦИИ ДВИЖЕНИЯ [П I е > 0 можно указать такое б > 0, что при всех достаточно малых \cs\ НУ/С. У.)И<е yt>t. при ||у.||<в и Ну С, у.) II — о при <-*оо Действительно, найдем положительно определенную квадратичную форму величину!, . , yNB ситу аинейной системы (5 47) при || с ||= 0 Так как Я(с)|с=о = Р, то существуют V и W такие, 410 dV/dt = W в силу линейной системы (5 47) при ||с||=0 Вычисляя dV/dt в силу системы (5 47), получим % -■=w + ferad v> (р (с)-р (°) у)]+(gfad v>? (у. с)) = tt/i (5 48> За счет выбора \cs\<c0 можно добиться, чтобы Wx была отри- 1Ы1Слыю определенной для всех cs Из теоремы 3 4, § 3, следует высказанное утверждение относительно функций y{t) Подставляя функции у(/) в интегралы (5 44), получим, что *(/)—>-О при t—*-\-oo, а значит, y(t)—+u(clt . , ск) при *— 1-оо Таким образом, в особенном случае нулевое решение системы (5 34) устойчиво Если выбрать достаточно малые величины x{s0> и ///0), s— 1, . . , /г, i = l, , W, то из (5 45) можно определить единственную систему величин с?, s = l, , k Если последние достаточно малы, го любое решение (5 39) обладает свойством MO-"!. у(1)—-0, при /—+оо, поэтому y(t)—>ы(си) При с!| = 0, ы(0) = 0 Следовательно, имеет место условная асимптотическая устойчивость нулевого решения, так как величины v° определяются в этом случае не произвольно, а из интегралов системы (5 46) при с£ = 0 Рассмотрим теперь общий спучай, когда *,(«!. • . хк, щ(х) иа(х))ФО Положим у = 0 в функциях Xs(x, у) и Y,-(k, у), которые определены в системе (5 39) Получим X «" (х) = Хх (х, 0) = Xs (х, и (х)) = 2 *J". (5 49) У1т(х)-У/(х, о)= 2 >Т.
§ 5] и млинзлции 111'огр\мчмого движения 93 Здесь \i и v означают ианнизшую степень однородных форм относительно переменных л,, , лл, с которых начинаются в действительности разложения функций X(s0) и У|0) соответственно Из вида функций У,.(х, у) следует, что v^p.+ l Отметим, что в общем случае может иметь место устойчивость, асимптотическая \стойчивость и неустойчивость И решение вопроса об устойчивости в ряде случаев сводится к рассмотрению проблемы устойчивости нулевого решения системы дифферента тьных уравнении с однородными правыми частями ^--ЛТ. s=l, . , k (5 50) Определение 5 1 Функцию f(rlt , xk), заданную в Rk, называют однородной порядка ц, если имеет место равенство f(cxlt , cxk) = c>xf{xl, . , xk) При этом функцию f(\\, .. , хк) будем называть положительна однородной, если с > 0 Из анализа известно, что /(х)^С1 удовлетворяет уравнению Эйлера £^v(-P-/(x) (5 51') Система (5 50) имеет пулевое решение х = 0 Если х(/, х0) является интегральной кривой системы (5 50), то х = ос(с,1-Ч, х0) (5 51) также является интегральной кривой этой системы, причем сх (с»1-»/, х,) = х (/, сх0) (5 52) Действительно, вычисляя производную по t от равенства (5 51), получим Ti=c ^"Г'' Х")с"~1 =<?Х,т(х(<Г-1<. ха)) = Х">(сх(с»-Ч, х,)), т е dv.,dt = XW) (х) Равенство (5 52) выполняется при /=0, а при /=£0 оно будет иметь место в силу единственности решения (5 50) Таким образом, семейство интегральных кривых (5 51) заполняет коническую поверхность, вершина котором лежит в точке х = 0, а направляющим множеством является интегральная кривая M0-v(/, x„)
94 ПРОБЛЕМЫ СТАБ1ПИЗАЦНИ ДВНЖПШЯ [l Л | Теорема 55 Нулевое решение системы (5 50) не может быть асимптотически устойчивым при \х четном Доказательство Пусть нулевое решение х = 0, напротив, асимптотически устойчиво Toi да существует интегральная кривая х(/, х0) системы (5 50), облачающая свойством х(/, х0)—>0 при Рассмотрим интегральную кривую x(t, — x0) Из равенства (5 52) прн_с = — 1 имеем х(/, — х0) = —х(— /, х„), откуда следует, что х(/, —х0)—>0 при /—<• — оо Последнее противоречит наличию асимптотической устойчивости нулевого решения системы (5 50) Теорема 56 Для того чтобы нулевое решение системы (5 50) было асимптотически устойчивым, необходимо и достаточно, чтобы существовали две функции V (х) и W (х), удовлетворяющие следующим^ услови чм 1) функции 1/(х)_и W (х) — положительно определенные, 2) функция W (х) — положите пьно однородная порядка ш, функция V(х)—положительно однородная порядка m+l — \i, 3) функция W удовлетворяет уравнениям t-Sz *?" = *. t^ = <« + i-i0*' (353) Уравнения (5 53) могут быть разрешены всегда, так что функция V(x) определяется через функции x(sl" и W Теорема 57 Если нулевое решение системы к уравнений (5 50) асимптотически устойчиво, то nyieeoe решение системы п уравнений (5 34) также будет асимптотически устойчиво Правые части системы (5 50) представляют собой однородные формы степени и. отноентечьно величин хх, ..,хк и являются первыми формами в разложении функций AT (х) = Х,(х. 0) = Xs(x, и (х)) Доказательство Сдеэаем ряд преобразований над исходной системой, которые не меняют задачи об устойчивости Замена (5 38) приводит нас к уравнениям (5 39) Положим да нее в системе (5 39) ^ = ^ + Ф,01„ .. , пА), s = 1, . ., k, //,-н,, f-=l. . , Л'. (5 54) где ф) нкцин xs — (|>, (у1г .... ух) представляют собой голоморфное
$ 5J CTABimiJMimi ИРОПЛММН010 диплопия ')5 решение системы (5 41), существование которого следхет из вспомогательной теоремы Ляпунова, причем Ф,(0, 0, . ,0)^0, s-1, . к Посте замены (5 54) система (5 39) б\дет иметь вид d^ldt = F (£, 11), dt\'d( = Pn -i G (S, 1,), (5 55) где F(E. Ч) = Х(£ + Ч>, Ч)-*(Ф. 11), G(S, il)=Y(S + <p, Ч) Ясно, что F(£, i])|;_o^O При указанной замене имеют месю следующие равенства в0* (О = f, (£. 0) -= Xs (Е, 0) - Xjo, (g) = ^ (£, и (6)), 07 (6) = О/ (С. 0) = У, (С, 0) = У;« ф Положим Gy(6. i])-c^>({:)+i:c}", где функции F<" и G}" представ 1яюг собой однородные формы величин £,, , £л порядка / с аналитическими по i),, х\г, , >|,v коэффициентами, уничтожающимися при i), = i|2 — . = 11л' = 0 Отметим, чю Gf (т)) = G, (0, ц) -Г(ф(ц), г\) не содержит ч шнов, линейных относительно неременных i|,, Нашей ближайшей целью б\дег построение такою преобразования, которое спстсмх (5 55) прпвоаит к виду dl'dt -?{%, 7)), </Т, dl = Pi'i | G (l, ц) (5 56) Здесь F (£, Ц) --- F"«« (?) -I- ( i ] F<", G (£", i» = G<«> (?) -f- ^ G«". a фхпкцин Fl" и G~U1 cjtj, однородные формы степени / относч- лелыю ветчин £,, , £* с аналитическими по i^, .. ,_ Чд/ ко- э(|хрнцнента\1Н, уничтожающимися при i], =i]2= ... =t)jV —О Сделаем замену в системе (5 55) по формулам С. =CS h il aj"", s=l. .... *. i), = i),, »=-!. • - л'. (557) где «'"" — о цюролные формы относительно величин £,, ..., J* поря п<а т с коэффициентами, аналитическими по т),, , »1лг
9G пробтемы стлы1'шз\цш1 движении 1гл i и подаежащими определению Другими словами, н)жно покачать, то коэффициенты форм с^"" можно выбрать так, что замена (5 57) искомых ф\нкцнй в системе (5 55) приводит к уравнениям (5 56) Подставтяя формулы (5 57) в систему (5 55), полечим (5 58) ^-Гр/ДуНС; (5 59) Здесь через /"< и С,- обозначен рез> чьтат подстановки величин g, и 1], в функции Fs и G, по формулам (5 57) Далее, прирав- нивая слева и справа в равенстве (5 58) формы, не содержащие dt,sjdt, но одного измерения относительно величин £,, , t,k, получим систему уравнений, из которых последовательно определим коэффициенты этих форм Действительно, при т—\ поюжиы к _ _ '4° = 2 X,A(tl„ . , Г,ЛКЛ, h=] и п)сть Flsl) (£) = ^] fSj(r\lt . , 11д-)£/, причем fsi являются /=i иззестнымн аиачитическимн ф\нкциямп относитеаьно ii,, п.,, , 11д,, уничтожающимися при ц., — . = г|Л. = 0 (см систему (5 55)) Дтя опретеления функций х5,(п.1. . , t|v) в результате приравнивая форм первой степени относительно величин £,, , ., t,k cieea и справа в (5 58) пот\чим систем) уравнений в частных производных £ пН Z Р,Л- Ь С10> (м) = £ (У-,н + «*/) /,/. (5 60) ,= 1 "'ii L /=i J <=t /i=l, .. , к, s- 1, , к, где бА|— ciiMBoi Кронекера Система (5 60) определяет единственн>ю совокупность k го- ломорфных функций xjA(i],, , 11л,), уничтожающихся грн 1], = =1bv"=0- ЧТ0 непосредсгвенно следует из вспомогательной теоремы А М Ляпунова Действуя далее подобным же способом, найдем единственным образом коэффициенты всех форм с£"0(£), m^.\i—1 ввпт,е го ю-
§ 5] СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖРНИЯ 97 морфн_ых функций относительно %, .. , r\N, обращающиеся в нуль при 4i= ••=1Lv=0 Перенесем все члены, содержащие формы ^ й степени относительно Ci. • • . Сь в правую часть (5 58) Полечившуюся там в результате этого форму ц-й степени относительно £,, . ., 1,к обозначим через Fim (£) Очевидно, что коэффициенты форм ctf > можно выбрать в виде голоморфных функций, уничтожающихся при %= ..=1^ = 0 таким образом, что коэффициенты форм F(sw (£), s—\, .... k, будут наперед заданными аналитическими функциями величин х\и .... ч\ы уничтожающимися при Ti!= ... =t)v = 0 Разрешим равенства (5 58) относительно величин dt,sidt, тогда поучим §- = F, (6. Ч) = Й°> (I) + Z F«>. (5 61) Легко проверить, что коэффициенты функций F(^ (£) можно выбрать так, что F^'ssO Таким образом, показано, что преобразование (5 57) можно выбрать так, что после применения его к системе (5 55) полечим систему (5 56) Перейдем теперь к непосредственному доказательству теоремы 5 7 Все преобразования, которые приводят исходную систему к виду (5 56), не меняют вопроса об устойчивости. Обозначим F«>(6) = SW(6) +JS^S10. Так как нулевое решение системы |-= S«" (g) (5 G2) асимптотически устойчиво по условию теоремы 5 7, то существуют две однородные функции V(£) и W (£) со свойствами, указанными в теореме 5 6 Выберем далее функцию У, (ц) в виде положительно определенной квадратичной формы, удовлетворяющей уравнению 1^(1 '/л)~£э. Это всепа можно сделать ввиду отрицательности вещественных
98 ПРОБПИЧЫ С1ЛШ1ЛИЗЛЦНИ ДВИЖЕНИЯ (|Л 1 частей корней уравнения det|P-X£| = 0 В качестве функции Ляпунова возьмем Vt(t Ч) = У^) + Уг^), (5 63) полная производная которой в силу системы (5 56) будет откуда следует, что § = ИЧТ)- £ nf + (grad^)*^X ( S">(g) + ^ f^ F<")] + -MgradVJ* f;G«ft + Ge(5) (5 64) При достаточно малых |£J и \r\j\, s= 1, .. , A, /=l, , N, имеем (gradK)* £ 2<0(S)+ £ F«" <оЕ1Г*Г + ,.(5 65) L/-=H + I / = u-rl J s=l так как функции dV/dts явтяются однородными порядка т — |х Вторая сумма в выражении (5 64) не превосходит величины р £ % г Е к-'+ £ л? Е icj (5 66) Положим теперь /л = ц.-(-1 и учтем, что v^n + 1 Получим dV2/d/ = #($, й, где № (£, ц) является отрицательно определенной функцией за счет выбора достаточно малой окрестности точки £, — 0, п., = 0, а тогда нулевое решение системы (5 56) асимптотически устойчиво Теорема доказана 5° Если матрица А + Ьс* имеет k пар чисто мнимых корней и им соответствуют простые элементарные делители и n — 2k корней с отрицательными действительными частями, тогда
§ 5] СТАБИЛИЗАЦИЯ ПРОГРАММНОЮ ДВИЖЕНИЯ 99 система (5 33) может быть преобразована dxt/dt=* — \~yt+~Xt(k, у, г), dys/dt=Xsxs + Ys(x., У, i). s=l. ../г, (5 67) dz/dt = Pz + Z(x, у, z) Здесь функции Xs и Yt обладают свойством A',(ii. У" i)k.f.oa°. ?Лх, у, i)|lV.„aO, s = l, .. , ft, Будем искать решение в виде *> х, = с<юе, с, + S r*""(elf . , eA, < L m = 2 ir, = slnejc,+ S ^""(Ow • . 0*. ct ck)\ , (5 68) г,= S zl/"(e„ .. . e4, r,, . , c,) Заесь функции ZJ"" и Z}"" являются однородными формами относительно ct ск степени т с периодическими коэффициентами относительно Qlt ..., Gft, подлежащими определению Функции 0Х, .. , 0Й удовлетворяют уравнению dQ,/dt = \t + e, Эти уравнения получаются из системы (5 67) после введения полярных координат ,v, = rs cos Qs, ys = rs sin 9, При некоторых ограничительных предположениях устанавливаются следующие теоремы Теорема 58 [14] Если система (5.67) имеет семейство ограниченных решений (5 68) то нулевое решение (5 33) устойчиво Интегра\ьные кривые, входящие в семейство (5 68), являются либо периодическими, либо почти-периодическими в зависимости от выбора произвольных постоянных Теорема 59 [14] Для того чтобы система (5 67) имела семейство ограниченных решений (5 68), необходимо и достаточно, чтобы суирствовало k голоморфных интегралов специального вида Возникает в связи с этим задача построения стабилизирующего управления ы = с*х такого, чтобы положение равновесия х = 0 непинейной системы (5 33) было устойчиво, либо асимптотически устойчиво Необходимо дать способ фактического построения такого управления в сомнительных случаях.
100 ПРОБЛЕМЫ СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [П I § 6. Дискретные регуляторы Использование цифровых машин приводит к дискретному регулированию, т е регулированию с помощью кусочно-постоянного управления, являющегося функцией фазовых координат объекта, вычисляемых в некоторые дискретные моменты времени. Пусть система в отклонениях имеет вид dy/dt = Ay + bu, (б 1) где " = S Citji(kh) при t£ [kfi, (k+\) h]; (62) ft>0—некоторая постоянная, k = 0, 1, .. , y(0)—начальные данные системы (G 1), характеризующие начальное отклонение от программного движения Рассматривая уравнение (6 1) на промежутке [0, Л], имеем систему dy/dt = Ay + bc*y (0) с начальным условием у(0'=о = У(0). При /£ [h, 2Л] система (6 1) примет вид dy/d/ = i4y + bc*y(A), у(01/=» = У(Л). Таким образом, интегрируя последовательно систему (6 1)на промежутках времени [kh, (k+l)h], Л = 0, 1, 2, .... пол\шы интегральную кривую. Возникает вопрос при каких коэффициентах усиления си ..., са и при каком шаге дискретности h программное движение исходной системы является асимптотически устойчивым? Теорема 6 1 Если векторы Ь, ЛЬ, .... Ап~1Ъ линейно независимы, то существуют коэффициенты усиления с* = (clt... ,г„) и ветчина h такие, что нулевое решение системы (6 1) будет асимптотически устойчивым. Кроме того, для любого непрерывного управления и = с*у(/), которое стабилизирует нулевое решение, существует число Л0 > О такое, что для всех h < ha дискретное управление u = c*y(kh), t£[kh, (ft+l)AJ, k = 0, 1, 2. ... будет также стабилизировать это движение Доказательство Выберем вектор с так, чтобы матрица j4-f-bc* имела собственные числа с отрицательными вещественными частями Построим квадратичную форму V(y), удовлетворяющую уравнению 1^1 («.7 + V,) V, = - Z Ul
§ б) ДИСКРЕТНЫЕ РРГУ1ЯТ0РЫ 101 при этом К (у) положительно определенная Найдем ее потную производную в силу системы (6 1) при управлении (6 2) ТогЧа f^ = (grad V)* (Ау + Ъи) = -(y*y) + (gradVrbc* [у (Щ-у (Щ (6 3) Введем в рассмотрение вектор z (/) = у (/)—у (kh), t £ [kh, (k + I) h] k = 0, 1, 2, . и оценим его норму Из системы (6 1) имеем ~ = Az-\-(A-)-bc*)y(kh), z(kh) = 0, k^O, 1, 2, . . (6 4) Умножая обе части (6 4) скалярно на z*(i), получим z,j=^=!iiMv+z,(,hbc,)y(A/i) (б5) Перейдем в равенстве (6 5) к нормам и положим ||z|| = t Тогда получим £<*£ +Ml У (АЛ) ||, (66) гдеО<Я = ||^||, 0 < и. = |М-Ь Ье-1| Умножая неравенство (6 6) на е~и и затем интегрируя от величины kh до t, получим &(0<£l|y(Aft)||[e,,'-Wk,-l] (6 7) при t£[kli, (k+l)h), откуда С(0 <£IIУ (*Л) II [«"-I] (6 8) И III C(0<c,/t||y(*/i)||, /€[ЛА. (Л+1)Л]. А-=0. I. 2. . . (6 9) Здесь ^—-положительная константа, которая не зависит от h при ft<A1, K>0 Положим V = p2, p--const и рассмотрим отношение -5у*у. Ясно, что существуют такие положительные константы о, и аг, удовлетворяющие неравенству а1<У1У.<аг О i сюда о,р2<у*у<о,ра (6 10) Функции dV/dijt, i- l, 2, , являюгея линейными формами
102 ПРОБПЕМЫ СТАВИ1НЗАЦИИ ДВИЖГИИЯ [ГЛ I относительно вектора у, поэтому |£|<».- где Ь, > 0, 1 = 1, 2, .... п, или 1^1 <*Р. Ь>° <611> Обозначим норму матрицы be* через гг Учитывая неравенства (6 9)—(6 11), из соотношения (6 3) легко получить dp (t)/dt <—aiP (t) + щ/ip (kh), (6 12) где *.-3->of m-61^ Сг >0- Проинтегрируем неравенство (6 12), считая, что величина p(kh) задана p(0<p(feft)[^ + (l-^)e-M<-*/o]. Полагая t = (k+l)h, получим p((k+l)h)^p(kh) [^ + (l-^)e-M] . (6 13) Величина ^ + (1—^1]е-М> при достаточно малом h(h<ht) может быть оценена следующим образом 0 < ^(1 — е-М) + «-М < 1 — aft, где a > 0 и не зависит от h < ft2 Итак, имеем рекуррентное соотношение p((£+l)ft)<p(fcft)(I — aft) (6 14) или p((*+l)ft)<(l-aft)*+ip(0) (6 15) Из (6 15) и (6 10) следует, что y(kh)~>0 при £—+ + °° Следовательно, у(0—»-0 при t—► + оо, ибо IУ (0II ^ IIУ (*Л) 11 + IIУ О—У (ЛА) II ^ IIУ (*Л) || + сжА || у (АЛ) || = = (l+Ctft)||y(Aft)|| (6 16) Этим мы показали, что все траектории попадают при выбранном управлении в окрестность нуля Покажем, что по любому е > 0 можно указать 6(e) > 0 такое, что при ||у (0)|| < б будет ||у(0Н<е Д™ всех / >0.
§ 6] ДИСКРЕТНЫЕ РЕГУ1ЯТ0РЫ 103 Действительно, при всех Л < Л0 = min (/г., Л.) в силу неравенств (6 Ю), (6 15), (6 16) ||у(0||<К^(И-с1Л)(1-аЛ)*||у(0)||<с,||у(0)Ц, (6 17) где с8 = ^(1+сЛ) Нт (1—аЛ0)\ откуда при б(е) = р/с3 и ||у(0)||<6 будет ||у(/)||<е для всей Этим полностью доказаны сделанные выше утверждения Замечание 1 Можно доказать, что почти для всех Л>0 при выполнении условия теоремы 6 1 можно выбрать вектор с так, чтобы при управлении u = c*y(kh) при /€[*А. (*+1)А]. А = 0, 1, 2, . , решение ys=o системы (6 1) было асимптотически устойчиво по Ляпунову Действительно, интегрируя систему (6 1) при управлении (6 2) на промежутке kh ^ / ^ (k -f- 1) ft с начальным условием у (/) |<_ы,= —y(kh) будем иметь у((А + 1)А) = [£ + Я(Л + Ьс»)]у(АЛ), (6 18) где и Г A ih т. J V Л"1/!"*1 Я=Г ' T,dT==^0l^FTjr о т=0 Из равенства (6 18) следует, что если корни матрицы E + H(A-l-bc*) можно выбрать так, чтобы они лежали вн\три единичного круга с центром в начале координат, то будет у (/)—+0 при /—► f оо Положим P = eAh и рассмотрим систему дифференциальных уравнений z = Pz+Hhu (6 19) Если матрица (НЪ, РНЪ, . ., Pn~1Hb) или матрицы Я и (Ь, РЪ, , Pn_Ib) неособенные, то выбором управления u = c*z можно добиться, чтобы матрица Р-\-НЪс* имела любые наперед заданные собственные числа, в частности лежащие в единичном круге с центром в точке Я. = 0 комплексной плоскости X йеШфО при всех Л > 0 Векторы Ь, РЪ, , Р"_1Ь линейно независимы при всех ft > О, если среди собственных чисел матрицы А нет чисто мнимых, в противном случае они будут линейно независимыми лишь для тех ft, которые не кратны ветчинам 2л/о>-, где »(», — собственные числа матрицы Л.
104 ПРОБЛЕМЫ СТАБИЧИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Если ft = — k, k — \, 2, .... то среди собственных чисел мат- рицы Р-\-НЪС* обязательно будут числа, модули которых равны единице В этом случае решение унзО можно сделать лишь устойчивым по Ляпунову, в чем легко убедиться приведением матрицы А к жордановой форме Полученный результат оказывается справедливым для систем вида (6 1), которые могут быть стабилизированы управлением u = Cz Здесь С—(пхг)-матрица Замечание 2 Аналогичный результат может быть получен и тогда, когда дискретное управление имеет форму u(/)=i 2c/y0,((ft-/)A), '€[**. (* + 1)Л), *>/, (6 20) т е управление и является линейной комбинацией фазовых координат объекта, вычисленных в разные моменты времени Этот случай охватывает, в частности, регуляторы, в которых используются сигналы-измерители, последовательно выдающие координаты объекта регулирования Например, выдается сигнал y1(h), затем г/2(2Л) и т д Выходные сигналы различных измерителей могут выдаваться с шагом дискретности При этом некоторые из них могут выдавать сигналы с различными запаздываниями Пусть й„ .... Л,— различные интервалы дискретности выходных сигналов измерителей, ти ..., т, запаздывания, имеющие место в этих измерителях. Возникает проблема выбора таких коэффициентов усиления этих сигналов, при которых программное движение исходной системы будет асимптотически устойчивым, т е. положим «=2 2 2 с,у*У((*,— /)Ь-т») при /<=[М, (« + 1)А] Надлежащим выбором коэффициентов cijk можно сделать систему (6 1) асимптотически устойчивой при любых достаточно малых hu . , /г, и т„ ., Tj. В связи с изложенным возникают задачи: 1) рассмотреть вопрос о дискретной стабилизации для нестационарных систем, 2) рассмотреть вопрос о дискретной стабилизации с точки зрения уравнений в конечных разностях Система дифференциальных уравнений dx/dl = Рх может быть заменена системой в конечных разностях х {(k + 1) А) =х ikh) -\-hPx (kh) = {E + Ph) x (AA),
§ 7] РЕЛРЙНАЯ СТАБИЛИЗАЦИЯ ПРОГРАММНОГО ДВИЖЕНИЯ 105 решение которой можно сделать сколь \ годно близким к решению исходной системы за счет выбора величины h Общий вид системы в конечных разностях у((к+1)Н)^А1У(Шг) + АМ, где управление и выбирается в виде линейных комбинаций вектора y(kh), либо у ((£—/) Л) § 7. Релейная стабилизация программного движения Г. Рассмотрим сначала простой пример системы дифференциальных уравнений 2-го порядка dx/dt=x—у + ах{х*+у*), .. dy/dt=x + y + ay(x* + y*) { ' Точка л=0, «/ = 0 является решением системы (7 1) Для исследования ее на устойчивость возьмем в качестве функции Ляпунова V = x* + y*. (7 2) Тогда dV/dt = 2х (х—у) + 2у(х + у)=* 2V в силу линейного приближения системы (7 1). Имеем, что выполнены все условия теоремы о неустойчивости, следователь.ю, все интегральные кривые (7 1) удаляются от начала координат Положим параметр а= — 1/г2 Тогда ** + </* = /-» (7 3) будет интегралом системы (7 1) Полная производная функции V(x, у) в силу системы (7 1) dV/dt = 2V (1 + aV) = 2V (1 - V/r*), (7 4) и при V > г' она отрицательна Следовательно, все траектории вне окружности (7 3) стремятся к этой окружности, в то время как внутри окружности все траектории удаляются от начала координат. Эта кривая—окружность—есть устойчивый предельный цикл Пусть г—достаточно малое число, г<е Тогда ясно, что все интегральные кривые попадают в е-окрестность н>ля Такое явление очень часто наблюдается при стабилизации программного движения программное движение неустойчиво по Ляпунову, но все движения стремятся в его достаточно малую окрестность. 2°. Пусть дана система дифференциальных уравнений #=/(У). (7 6)
106 ПРОВПЕЧ1.1 СТАБИЛНЗЩНИ ДВИЖРНИЯ (ГЛ I Претположим, что система (7 5) имеет периодическое решение У = Ф(0 (7 6) периода Т Соответствующую этому решению интегральную кривую в фазовом пространстве обозначим через М Под расстоянием от точки у до множества М понимается р(у, М)= inf || у —х ||, где \\z\\ = V¥i. Определение 7 1 Периодическое движение у = ф(/) называется периодическим автоколебанием, если для любого е>0 можно указать б = б(е)>0 такое, что при р(у0, М)<б р(у(/, у0), М)<г для всех i^O и р(у(/, у0), М)—+ 0 при t—*+oo Здесь у(*, у0) есть решение системы (7 5), проходящее через точку у0 в момент / = 0 Определение 72 Периодическое движение у = <р(t) называется орбитально устойчивым, если по е > 0 найдется б > 0 такое, что из р (у0, М) < б вытекает р (у (/, у0), М) < в для всех t^O, при этом q>(t) называется орбитально асимптотически устойчивым, если число б (в) можно выбрать, к тому же так, чтобы р(у(/, у0), М)—-0 при t—►+°° Теперь автоколебание можно определить так Определение 73 Периодическое движение называется периодическим автоколебанием, если оно орбитально асимптотически устойчиво Понятие орбитачыюи устойчивости можно наглядно пояснить геометрически, а именно все движения, начинающиеся в начальный момент в достаточно мааой окрестности М, остаются в сколь угодно малой окрестности М при /^0 Ввиду того, что могут быть совершенно различные скорости движения изображающей точки вдоль каждой траектории, орбитальная устойчивость может иметь место и при отсутствии устойчивости по Ляпунову, в то время как устойчивость по Ляпунову влечет орбитальную устойчивость положительной полутраектории у (/, у0) Известно, что инвариантное множество М состоит из целых траекторий системы (7 5) Если М есть ограниченное множество, то его естественно рассматривать как множество колебательных движений, описываемых системой (7 5) Будем считать М состоящим более чем из одной точки Определение 7 4 Замкнутое, ограниченное, инвариантное множество М называется стабильным колебанием системы (7 5), если существуют такие е>0 и б = б(е)>0, что при р (у0, УИ)<б будет p(y(t, Уо), М)<в при t^O Из определения 7 4 вытекает, что стабильным колебанием может быть периодическое, почти-пернодическое или рекуррент-
§ 7] pi1КЙНЛЯ СТЛБ1ПИЗАЦИЯ программного движения 107 ное движение, а также любое движение, ограниченное при /б(-оо, +оо) Поясним несколько эти высказывания Выделим из множества М такое непустое множество М(0), которое является инвариантным, замкнутым и ограниченным в силу ограниченности М и не содержит никакого собственного подмножества с такими же свойствами Тогда по теореме Биркгофа оказывается, что все движения, входящие в Мт, будут рекуррентными Если множество М есть стабильное колебание системы (7 5), то Mw—стационарное стабильное колебание (7 5) Для описания стационарных колебаний можно использовать лишь такие функции, которые каким-то регулярным образом возвращаются в окрестность своих значений, однажды >же принятых этими функциями Определение 75 (почти-периодической функции) Вещественная непрерывная функция ц>((), ^6(—°°. +°°) называется почти-периодической, если для любого е>0 можно указать число L(e) такое, что в любом промежутке [a, oc-)-L(e)], <х£(— оо, + оо) существует по крайней мере одно число т(е)(т(е)—почти- период функции q>(t)) такое, что для всех /£(—оо, +оо) будет |<р(/+т)-ф(/)|<е Определение 76 (рекуррентной функции) Если в определении 7 5 существует число т = т(е) в зависимости от t, то функция ф (() в этом случае называется рекуррентной по Биркгофу В результате наложения колебаний вида akcos'kkt, bks'mXkt, fc = 0, I, , п, гдел.0 = 0, ak,bk, Xk—вещественные числа, поту- чим суммарное колебание вида Ф„(0 = 2 (akcoslkt+bksmlk(). (7 7) *=о Если все числа Я,, , л„ оказываются попарно соизмеримыми, то накладывающиеся колебания имеют общий период to, и, следовательно, функция (7 7) будет в этом случае со-периоди- ческой Если же некоторые из величин klt .. , а„ оказываются несоизмеримыми между собой, то в результате получается так называемое почти-периодическое колебание При рассмотрении всех равномерных по отношению к t£(—оо, +оо) пределов всевозможных последовательностей вида (7 7) получим все почти-перио- днческие функции В отличие от почти-периодическич функций полная теория рекуррентных функций еще почти не разработана, в то время как наиболее общим случаем стационарного режима котебатель- "ого характера следует считать рекуррентное движение Определение 77 Будем говорить, что интегра 1ьная кривая y(t, у„) стремится к стабильному колебанию, если
108 ПРОБЧГМЫ СТ\БМЛ1ПАЦИМ ЛОМЖРНИЯ [гл , существует такое число Т > 0, что р(у(7\ у0), М) < 6, а тогда p(y(t, у0), М) < е при любом t~^T', где в и б — числа из определения 7 4 Число г выступает в качестве меры отклонения от стабильного колебания М Обратимся теперь к проблеме стабилизации программного движения с помощью релейного управления Эта стабилизация будет осуществляться в результате возникновения в сколь угодно малой окрестности программного движения стабильных колебаний, обладающих тем свойством, что любое движение, начинающееся в некоторой фиксированной окрестности программного движения, стремится к упомянутому стабильному колебанию, причем мера отклонения от него е может быть выбрана сколь угодно малой Пусть система в отклонениях от программного движения имеет вид dy/dt = Ay + bu, (7 8) где ы = ф((т), а= 2 Y/0/. | -pi при а> — /, YV ' 1—1 при а</. v ' Здесь управление при о£ (— /, /) определяется однозначно Будем считать, что любая интегральная кривая системы (7 8), начинающаяся при < = 0 в области а>/, входит в область а < / при возрастании (убывании) времени при управлении ы = +1 Тогда в области —/<а</ ее следует продолжать с тем же управлением Далее, если интегральная кривая (7 8) начинается при / = 0 в области а< — / и при возрастании (убывании) времени входит в область а >—/ при и — — 1, то и в этой области она должна продолжаться с управлением и — — 1 Это соглашение принимается с учетом физической картины явления, описываемого системой (7 8), и однозначно определяет поведение интегральных кривых Д 1я того чтобы задачу поведения системы (7 8) сделать вполне определенной в области —/ < о < /, требуется наряду с начальными данными движения указывать, какое именно из двух значений принимает управление и Указание значения ср(а) определяется тем положением, например, рычажка реле, которое имеет место на самом де^е Эти обстоятельства позволяют определить однозначно все движения системы (7 8) Теорема 7 1 Если векторы Ъ, АЪ А"~1Ъ (7 10) линейно независимы, то существует такое релейное управление вида (7 9), при котором в системе (7 8) при любом выборе I < /0
§ 7J РЕЛ1Л1ИАН СТЛ1>11Л1тШ1Я ПРОГРАММНОГО ДВИЖЕНИЯ Ю9 возникают стабильные колебания М в окрестности точки у = 0. Здесь 10—достаточно малая положительная константа Далее, любая интегральная кривая (7 8), начинающаяся в некоторой фиксированной окрестности точки у = О, при таком управлении будет стремиться к указанному стабильному колебанию, мера отклонения которого может быть сделана также сколь угодно малой Доказательство В силу линейной независимости векторов (7 10) существует такой вектор с, что собственные числа матрицы А + be* будут иметь отрицательные вещественные части Тогда положение равновесия у = 0 системы dy/dt = (А + Ьс*)у (7 11) асимптотически устойчиво по Ляпунову Следовательно, можно выбрать положительно определенную квадратичную форму V(y) так, чтобы (grad V)* (А + be») у = — у*у (7 12) Найдем полную производную dV/dt в силу системы (7 8) при управлении (7 9) dV/dt = (grad V)* Ay + (grad V)* Ьи. (7 13) Положим a = (gradl0'b. (7 14) Ясно, что а—линейная форма относительно переменных у1 у„ Введем управление ы0 и„ = -ф(о), (7 15) где функция ф(а) определяется по формуле (7 9) при о из (7 14) Запишем равенство (7.13) в виде dV/dt = -y*y+o(u0—с»у) (7 16) в силу равенств (7.12), (7 14) и (7 15) Покажем, что построенное управление «„ (7 15) является таким, о существовании которого идет речь в теореме 7 1 Заметим, что можно выбрать столь малую окрестность точки у = 0, что и0—с*у будет иметь такой же знак, как и функция ы0-= — ф(а), т е существует е >0 такое, что при ||у|| <е будет sign (к„—с*у) = sign ы0 Тогда в этой же окрестности _функция о(«ц—с*у) принимает отрицательные значения при о£(— /, /) и / достаточно малом При а £ (— /, /) ничего определенного сказать нельзя Возьмем произвольные 0<е,<е,^ь П^сть Ь/= »nf V(y), t = l, 2. 1|УН = е,
110 riPOBlFMU СТАБИЛИЗАЦИИ ДВИЖЕНИЯ [ГЛ I Выберем числа б/>0, б,< в, такими, чтобы V(y) < К,- при ||у||<б,- Теперь можно выбрать / столь малым, чтобы выполнялось неравенство -6? + /а<0, (7 17) где а = | и0—с*у | < 2, так как рассматриваем окрестность || у || < е При таком выборе / </0 в силу (7 16) и (7 17) будет dV/dt^O при o.s^UylKe (7 18) Любая интегральная кривая системы (7 8), начинающаяся в области ||у0||<ба, при управлении (7.15) будет оставаться в области || у || <es. Пусть это не так Тогда существуют такие два момента времени tlt /, (0 <tt<tM), что ||y(/lf у.) || = в.. ||у(<„ у,)|| = е, и в.<||У(*. У.Ж*. ПРИ <€[/i. <,] Для этих моментов /х и t2 будет V(y{tlt y0)) < \3 и У(у(*»» Уо))^^г> следовательно, функция Vl(t) = V(y(t,y0)) должна иметь неотрицательную производную в промежутке [tu t2], что противоречит условию (7 18) Таким образом, для любых || у01| < б2 будет ||у(/, у0)|| <ег при /^0 Возьмем любую точку у„ такую, что ||Уо11 < б„ Утверждается, что существует конечный момент Т такой, что интегральная кривая у(/, у„) выходит в область IIУII ^^i ПРИ t = T и, следовательно, остается при />Гв области ||у||<е Действительно, в случае б2 < б, это очевидно При Oj > °\ пусть ||у (/, уп)|| > б, при любом t > 0 Вдоль исследуемой интегральной кривой в этом случае (7 18) выпочняется неравенство dV/dt < — 6\ + al<0, откуда интегрированием получаем V(y(t, у.)) <V(y„) + < (-«? + <*/). (7 19) Левая часть (7.19) с ростом t стремится k — <х>, что противоречит положительной определенности функции К (у) Это противоречие и доказывает наше утверждение, причем указанное Т будет удовлетворять неравенству Т <Т = ^(Уп) х Ы-al ' Определение 78 Точка у фазового пространства называется о> предельной точкой точки у0, если существует последовательность моментов времени {ta}, tn—«--J-oo при п—юо такая, что у= lim y(tn у,).
§ 7] РЕ1СЙПАЯ СТАБИ1ИЗАЦНЯ ПРОГРАММНОГО ДВИЖЕНИЯ 111 Если же tn—*—oo, то точка у== lim у(/„, у0) называется а-преде 1ьной точкой точки у0 Покажем теперь, что множество М стабильных колебаний расположено в области || у || < et Обозначим через Муо множество всех (о-предельных точек интегральном KpiiBoii y(/, у0) и найдем М = U Му. II у. IK в Отметим, что если решение у(/, у0) ограничено при t^O, то его со предельное множество М не пусто и является замкнутым, ограниченным и инвариантным множеством Ясно, что Mcjy ||y||<ej Выбор е, _и е, был произвольным Можно взять в, < б2 < ег Положим б = 62—6j и е = е2—et Тогда все интегральные кривые, начинающиеся в 6-окрестности множества М, при неограниченном возрастании времени остаются в е-окрестности, следовательно, М является стабильным колебанием Теорема доказана полностью Замечание Вместо вектора Ь можно рассмотреть (пхг) матрицу В, при этом все рассуждения остаются в силе Для системы (7 8) при управлении (7 9) у = 0 не является положением равновесия Рассмотрим систему уравнений f-^y+Sty,,, (7 20) и пусть |и/К 1 Возьмем положительно определенную квадратичную форму V(y) и рассмотрим задачу об оптимальном демпфировании этой функции Оптимальное управление в этом случае будет и, = — sign о,, где aj = (grad V)* by В этих случаях, если определить управление по (7 9), вновь полученная система при достаточно малых 1}, /=1, 2, ..., г будет сколь угодно близкой к системе, оптимальной по отношению к демпфированию функции V(у) Все ее интегральные кривые стремятся при ReA.^0, / = 1, 2, ..., п к стабильному колебанию, расположенному в достаточно малой окрестности точки у = 0. Возникает задача определить, какое же колебание имеет место в системах с управлением, имеющим петлю гистерезиса, точнее I) найти необходимые и достаточные условия наличия периодического автоколебания в системе (7.20), рассмотреть вопрос об его единственности, 2) выяснить возможность почти- периодического и рекуррентного движений в такой системе.
Глава II ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ § 84 Понятие оптимальности Iе. Пусть задано некоторое множество М элементов р, природа которых безразлична Определение 8 1 Если задан закон или некоторое правило, согласно которому любому элементу р£М соответствует вещественное число V(p), то говорят, что на множестве М задан функционал V Предположим, что на множестве М заданы функционалы V'„. Vu V V„ Определение 82 Элементр„^.Мназываетсяоптимапьным олементом множества М по отношению к выбранной совокупности функционалов Vj, /== 1, 2, .., k, или просто оптимальным, если среди всех значений р£М элемент р0 доставляет наименьшее возможное значение функционалу V9 при условии выполнения ограничений Vj^lj,j=l, 2, .. , k, где lj—некоторые вещественные числа. Обозначим через М0 множество всех оптимальных элементов Множество М0 будем называть оптимальным подмножеством множества М Ясно, что при V0(p)=l для любого р£М оптимальное подмножество М„ будет состоять из исех тех элементов, которые удовлетворяют ограничениям У;(Р)<1,, 1=1, 2, . , k Пример 8 1. Рассмотрим систему x = f (х, и, 0 (8 1) Предположим, что заданы две точки х0, х, в фазовом пространстве системы (8 1) и множество М всех измеримых функций, ограниченных по модулю единицей Требуется выбрать управление и £ М так, чтобы интеграчьная кривая системы (8 1), начинающаяся при < = /„ в точке х0, за минимально возможное время достигала точки ху Здесь в качестве функционалов Vj, / = 0, 1, , /г, можно взять Ve = < — t0, Vj=Xj(t, tt, x0, u)—x/1', /=1, 2, , n Требуется найти управление и £ М так, чтобы V0 принимай минимальное значение при условии У/ = 0, /•=!. 2, , п Основной задачей теории управления явпяется отыскание множества M0 Эта за чача в общем случае сводится к нахождению экстремума функции многих переменных Оставляя в стороне
§8] понятии oiniPii ibHOCiu 113 доказательство этого утверждения, заметим, что оно позволяет вывести ряд необходимых и достаточных условий оптимальности, которые используются для построения последовательных приближений, позволяющих отыскивать с наперед заданной точностью оптимальные элементы 2° Пусть задана управляемая система x = f(*. х, u), х££„, u£U, (8 2) где U — множество г мерного евклидова пространства Ег Пусть каждому кусочно-непрерывному управлению и (0, заданному при t(z[tlt tt], u(t)£U, соответствует кусочно-непрерывно дифференцируемая функция х = х (/, и), заданная при t£[tlt t2] и удовлетворяющая системе (8 2) при u = u(0 Говорят, что управление u (t) перезодит систему (8 2) из состояния х, в хг за время t2—tlt если х, = х(/,, u), i — 1, 2 Управление и(/) будем называть допустимым, если определяемое им движение удовлетворяет граничным условиям ^(х,, х2, tu /s) = 0, /=1, 2, . , k (8 3) Доп\стимое управление u0(t) будем называть оптимальным, по отношению к функционалу J(u)=g0(x„ x2, tlt /,) + $/.(<. х> ")<". (8 4) если функционал (8 4) принимает наименьшее возможное значение среди всех допустимых управлений Задачу отыскания оптимальных управлений и соответствующих им оптимальных движений для ф\нкционала (8 4) называют иногда в вариационном исчислении задачей Больца Предположим, что оптимальное управление un(t) существует. Обозначим через х° (/) соответствующее ему движение Будем считать, что это управление и движение заданы на промежутке [tx, tt], и система при этом переходит из состояния xt в состояние хг с соблюдением граничных условий (8 3) Найлем необходимые условия оптимальности, опирающиеся на условия минимума функции одного переменного С этой целью предположим, что существует семейство управлений u = u(/, e), и пусть х = х(/, е)—соответствующее ему семейство движений Пусть эти семейства удовлетворяют условиям 1) вектор-функция u = u(/, e) задана при всех достаточно малых е и при / 6 К (е). Me)] кусочно-непрерывна по отношению к /, вектор-функция x = x(t, е) задана при всех достаточно малых е, при < € [Ме)« М6)] кусочно-непрерывно дифференцируема по отношению к / и удовлетворяет системе (8.2),
114 оптимальные системы угп-авльнпи [гл it 2) u(/, e) = u0(0, х(/, е) = х°(0 при е = 0, и(/, е) £ U дня всех достаточно малых е и /^[^(е), Ме)]> 3) управление и (/, е) допустимо при любом достаточно малом е, т е fi7(Xi(Me).e).x,(Me).e), /,(е). /,(«)) = 0. /=1. 2, . , к, 4) существуют производные ^и(Л е) = т|(/), "jb =1(0. -ii5i = T/, i'=l, 2, при е = 0, где т)(/) —кусочно-непрерывная вектор-функция, 1(0 — кусочно-непрерывно дифференцируемая функция, т,—вещественные числа, i\(t) обычно называют вариацией управления, а 1(0— вариацией движения Значение функционала (8 4), вычисленного на семействе управлений и(/, е), будем считать непрерывно дифференцируемой функ цией параметра е Эта функция J(u(t, e)) = q>(e) будет иметь минимум при е = 0 Следовательно, dq>/dt = 0 при е = 0 Последнее равенство представляет собой необходимое условие оптимальности управления и0(0 и движения х" (() Произведем ряд преобразований над этим условием с тем, чтобы его записать в явной форме Обозначим через 1,, г* =1,2, значение вектора 1 на концах промежутка [/1( /„] Тогда uy"=S/ + f(<„ х°(/,), и„(/,))т,-, ,- = 1, 2, при е = 0 Дифференцируя функционал (8 4), найдем *.*,6,+*«»&+[*«,+*.* »('i. х°^). «о (Л))-/. (*,. х°(Л), и0 (/1))]т1 + + [e./,+g.„t(/„ х°(/а), и, (/,)) + /.(/„ х°(/г). и, (/,))] х,+ + {(/.Л + /.«Ч)Л = 0 (85) Поставим u(t, e) в систему (8 2) и продифференцируем по е Тогда, полагая е = 0, получим i = f,l+f„4 (8 6) Дифференцируя граничные условия по е и полагая е = 0, найдем Е,,Л,+8/,Л + 18л,+8/х1П*1. x-tf,). UoU,))]!,-!- £». + В/я*Ч*ш> Х°(М> М<,))И, = 0. /=1, 2, ... А (8 7) В формулах (8 5)—(8 7) через g0Xi, gUx^ g/x>, ix, f„ обозначены соответственно матрицы Якобн, получаемые при дифференцировании по компонентам векторов, указанных в индексах и вычисленных при u = u0(0 и х = х°(/). Например, g0Xt есть одностолбцовая матрица с элементами з^-£о(х,, х., I., t.), .... -Jt-t>a(x,, х„, /,, /„)
§ 8] ПОНЯТИЕ ОПТИМАЛЬНОСТИ 115 Обозначим через Y фундаментальную систему решений для однородной системы дифференциальных уравнений l = f*S (8 8) с начальным усчовием Y(/,) = £, где Е—единичная матрица. Тогда получим Ut) = Y(t)ll+lY(t)Y-*(T)tu4dT (8 9) и соответственно !2 = V(/2)Sx+$V(/2)r-i(T)fuT,dT (8 10) Условия (8 5), (8 7), (8 9), (8 10) представляют собой необходимые условия оптимальности в развернутой форме для управления и0(/) и движения х°(/) Естественно, в такой форме эти условия оптимальности не используются Сделаем дальнейшее предположение Пусть семейства x(t, e), и((, с), указанные выше, существуют при любом выборе величин £,, т, и любом выборе кусочно-непрерывной вектор-функции i\(i) Однако ясно, требуется выполнение условий (8 5)—(8 7), (8 9), (8 10) Исключая векторы %(t) и |2 из (8 5) и (8 7), найдем [&„ + &,/(<,)Hi+[&,, + *.*,•»(*!. *• d), u.('i))- -f0(tlt xe(/t), u0(/,))] xt +[ft,,+ ?«*,*('.. xeC). «•('.)) + + f9(tt, x°(/2), u0(t2))]T2 + g0xY (t^Y-* (T)iui]dx + + t hxY dilx+Uf0xlY (t)Y-^x)iu4dx + f0uJdt ==0. Переставляя порядок интегрирования, получим -/.('i. х°(Л). Uo(',))jTI + [ftf, + ftx,f(/„ xe(/f). ue(*t)) + + /,(<„ x°(/2), и.(/,))]т2 +J x (04(0^=0, (811) где
116 ОПТНЧАТЬИЫЕ СИСТЕМЫ УПРЧВЛЕНИИ U'l а При исключении |, из (8 7) запишем + [giu+eJXHtt, xe(/t), uu (/,))] т2+ H-g/,1Jy'^)y"1tT)f«4^ = 0. /=1.2 Л (812) Положим в (8 11) и в (8 12) ч} = о, тогда получим +teo<1 + g.x,f(','' х°Ci). u.('i))-/.('i. х°(Л). u.(/,))]xt + + [&ti + ft*.f(',. «'С). ".</,)) + /.(/„ x«(/t), u (/,))] т2 = 0, (8 13) + [«/«. + «/*,'(',. xe (<i). M'*))K = 0 (8 14) Будем рассматривать компоненты вектора §, и величины Tj, т, как вещественные переменные Тогда ранг матрицы системы уравнений (8 13)—(8 14) оказывается меньше числа уравнений Действительно, предположим противное Пусть ранг системы (8 13)—(8 14) совпадает с числом уравнении Обозначим через SJt /=1, 2, ..., k, левые части уравнений, рассмотрим систему S0 = a, S, = 0 Sk = 0, где a—некоторая положительная постоянная Непременно существует вектор б, и величины т, и т„, удовлетворяющие этой системе Согласно предположению будет существовать семейство управлений u = u(/, e) и семейство движений х = х(/,,е), отвечающее вариации ii = o и найденным значениям £j(a,T,(a), тг(а)) При этом семейство и (/,е) буает допустимым н u(/,0) = u„(/) Тогда, с одной стороны, должно быть г\ -о. de |e = o и, с другой стороны, £L.-«>° Стеаовательно, предположение о том, что ранг системы (8 13), (8 14) совпадает с числом уравнений, неверно Итак, существуют вощеавенные постоянные 10, /,, ..., 1к, одновременно не равные нулю, такие, что вектор, составленный из них, ортогонален к любому столбцу матрицы системы (8 13), (8.14). Иначе говоря,
А 8] ПОНЯТИЕ O.IXIIM Ч 1ЫЮС111 П7 буд\т иметь место соотношения /nLv,+*o,/(0 + U«™]+ j£/yfeAl+*A/('*)] = <>. (8 15) /„[*.». +ftv.'Cl. *4U), Ue(/l))-/,(/l. Х°('г). U, (/,))] + + ioi^f. + WCx. x°('i)' и.(Щ = 0,(8 16) 1Л8«, + 8*хМ*ш. х» (','). и„ (',)) +Ы',. х° С), "о ('.))] + + 2 l/tefr + S/xMI» x°(/.). ".('.))] = 0. (8 17) Условия (8 15)—(8 17) называются условиями трансверсальности Умножим теперь равенство (8 11) на /0, а равенство (8 12) на lj и почленно сложим полученные результаты Учитывая условие трансверсальности, получим $ ['.* + ,2 //*/*/«.)Г"1 (О*.] 4^ = 0. (8 18) Положим теперь п=[/.хч-2/Уг/х/(/,)У-Ч0'.]. Тогда (8 18) примет вид ^ Tj-d/ =0, а из кусочной непрерывности функции 1] вытекает, что '.* + 2 Off/x/ (',) У"1 (т) f0 = 0 (8 19) Условие (8 19) является окончательным видом необходимого условия оптимальности управления и0(/) и движения х0(0 Оно рассматривается совместно с условиями трансверсальности (8 15)— (8 17) Выразим теперь условия (8 19) с помощью множителей Лаг- ранжа Условия (8 19) можно записать в форме '</оя + М.= 0. (8 20) где X^Y*-1 (t)Y* (1г)кл-\-101у*-> (l)Y* (T)dx. (8 21)
118 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ (ГЛ II Легко видеть, что векторная функция л, удовлетворяет дифференциальному уравнению \ = — ГХК—l0f'ox (8 22) и условию Я = Я2 при t = tt, где K = glJ, (8 23) при этом g = (g0, gt, .. , gk), / = (/„, /,, , /*) Если положить Я.0 = /0 и Н= jg %/fj, то окажется, что велн- /=> чины Xj и компоненты вектора к связаны между собой системой Гамильтона <bj _ дН dF-Щ' (8 24) При этом для координаты х0 имеем A'.(0=&(Xp Х2, /,, tt)+Ut(t, X, U)dt. Условия (8 19) через функцию Н могут быть записаны в форме OH.'dUj 0. / = 1,2,. , г (825) Итак, необходимые условия оптимальности управления uu(/) и движения х°(/) могут быть сформулированы следующим образом Если и(/) есть оптимальное управление и соблюдены условия существования упомянутого семейства и(/, е), то с>ществуют кусочно-непрерывно дифференцируемые функции Я.у(/), связанные с оптимальным движением системой Гамильтона (8 24), при этом имеет место условие (8 25), а также выполнены условия трансверсальности (8 15)—(8 17) и (8 23) 3° Пусть задана управляемая система x=f(/,x,u), (8 26) где х££„, и —r-мернын вектор управления, и £ U, U С Ег Будем предпоаагать, что f(/, 0, 0) = 0 Пусть задан функционал 7(х0, и)=$со(/, х, u)dt. (8 27)
§8] ПОНЯТИЕ ОПТИМАЛЬНОСТИ 119 Управление u — u{t, х) будем называть допустимым, если система (8 26) при этом управлении имеет асимптотически устойчивое положение равновесия х = 0и функционал (8 27) существует, во всяком случае, для начального вектора х0, расположенного в достаточно малой области, содержащей это положение равновесия Допустимое управление и = и0(/,х) будем называть оптимальным, если оно доставляет функционалу У(х0, и) наименьшее возможное значение среди всех допустимых управлений при любом выборе начального вектора х0 из некоторой достаточно малой окрестности точки х = 0 Пусть и(/, х) есть допустимое управление. Положим V(t, х)=$со(/, х, \x)dt. (8 28) Очевидно, что К (0, х„) = У(хл, и) (8 29) Функция V(t, x) есть функция Ляпунова Р Беллман предложил использовать такого рода функции для построения оптимального управления и оптимального движения с помощью сформулированного им принципа оптимальности Содержание принципа оптимальности Беллмана заключается в следующем. Если некоторое движение соединяет точки Л и С и является оптимальным, то движение, соединяющее точки В и С, будет также оптимальным при любом выборе точки В на оптимальной траектории АС В общем случае этот принцип оптимальности является неправомерным Однако в тех случаях, когда он оказывается справедливым, его можно успешно использовать для построения оптимального управления и оптимального движения Для справедливости следует заметить, что установление правомерности принципа Беллмана не всегда является простым делом Итак, предположим, что в сформулированной выше задаче этот принцип справедлив, и пусть и0(/, х) есть оптимальное управление и V0(t, x) —соответствующая ему функция Ляпунова Попожим A = (t, х°(0). С = (+оо, 0), B = (t + s, x°(/+s)) При допустимом управлении и(/, х) запишем V*{t, x)<V(f, х; = $ы(т, х, u)dx = = J w(t. x, u)rfx+ J ш(х> x» u)dx'
120 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВ ПЕНИЯ [ГЛ II Если точка В находится на оптимальной траектории, то J о(т, х°, u0)dT = V0(t + s, х (/ + «)) Отсюда V„{t, x)< J (о(т, х, u)dt + V0(t+s, x(/ + s))< < $ <о(т, х, u)dx + V(t+s, x(t + s)). Это неравенство, согласно предположению, имеет место для любого s^O При s-=0 правая часть его принимает наименьшее возможное значение, поэтому производная по s, вычисленная в точке & = 0, должна быть неотрицательной Следовательно, io(/, х, „) + -^ + (4£)*f (/. *• u)>0. (8 30) Из определения функции Ляпунова Va(t, х) также dVjdt = —©(/, х°, и0), откуда ю«, х», Uo) + ^-0 + (^)*f(/, х», u0) = 0. (8 31) Отсюда вытекает, что оптимальное управление доставляет функции H(t, х, u)=co(/, x, u) + ^- + (^-)"f(/, x, u) (8 32) наименьшее возможное значение, равное нулю Пусть функция u0(t, x) и Vu доставляют минимум функции H(t,'x, и) Исключим с ее помощью величину и0(/, х) из равенства (8 31) Тогда получим уравнение в частных производных, которое называется часто уравнением Беллмана Если функция V(t, x) дважды непрерывно дифференцируема и является внутренней точкой множества U, то условие минимума функции H(t, х, и) можно записать в виде равенств ^-//(/, х, и)=0, /=1,2, ... г (833) По южнм \j~dVjdxj. /=1,2, , п. Дифференцируя (8 31) по xf н испотьзуя (8 33), находим к + 1$. + <ах = 0. (8.34)
§ 81 понятие отимАПЬности 121 Обозначая <о= /0(/, х, и) и полагая А,0= 1, найдем, что величины %,, /=»1, 2, , п, и компоненты вектора Xj, / = 0, 1, .. , п, будут связаны системой Гамильтона */-л7' */—£,• /==0, 1( '"' (835) причем хв(/)=^(о(<, х°, u0)dt. о Итак: подход к отысканию условий оптимальности, предложенный Беллманом, приводит к тем же соотношениям, что и вариационное исчисление Однако в основе всех рассуждений лежит условие минимума функции одного переменного на границе области ее задания Покажем теперь тот случай, когда использованный выше принцип оптимальности не является правомерным. Рассмотрим функционал J (У) 2т /2Т ч! = а2$ (y-smtydt + (l ydt) Требуется найти минимум этого функционала в классе непрерывных функций, заданных при /£( — оо, -f-oo) Ясно, 4TO«/ = sin< доставляет наименьшее возможное значение функционалу J (у). Положим Л = (0, 0), В = (к, 0), С = (2л, 0). Тогда Jac{y) = ^\ (у-sin if dt+({ ydt}. При y — s,\nt будет J Bc (sin /) = 4, в то время как при у = 0 имеем /дс(0) = а2л/2 Следовательно, при достаточно малом а будет JBc(0)<JBc(s™t) Это и означает, что принцип оптимальности в данном случае оказывается не имеющим места.
122 ОПТИМАЧЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [п II § 9. Экстремум функции многих переменных Г Пусть функция f(xlt ..., хп), принимающая вещественные значения, задана при любых вещественных значениях своих аргументов Будем считать эту функцию в дальнейшем непрерывно дифференцируемой при всех конечных значениях х = \xlt , х„\ Определение 9 1 Точку х0 будем называть точкой строгого минимума, если можно указать такое число г > О, что при всех х, удовлетворяющих неравенству || х—х,||<е, (9 1) будет /(х„)</(х) при хфхй (9 2) Здесь || z || в Определение 92 Будем говорить, что в точке х0 функция /(х) принимает наименьшее возможное значение, если неравенство (9 2) имеет место при любом выборе х Точку х„ в этом случае называют оптимальной, a f 0 = f {х0)-—оптимальным значением функции /(х) Пусть в n-мерном пространстве €п задана точка, движущаяся с постоянной по величине скоростью igi = „„ S(«!=l, s=l. .. , п. (93) В начальный момент * = /„, предположим, она находится в точке х, не являющейся оптимальной для функции f(x) Поставим вопрос о том, в каком направлении при движении точки из х функция /(х) возрастает (убывает) с наибольшей скоростью Известно, что такое направление определяется направлением градиента функции /(х), вычисленного в точке х = х, т е вектора H£u a,} Действительно, если направление луча, выходящего из точки х, определить вектором L = {/,, ..., /„}, то уравнение этого луча можно представить в виде *,=*, + ','. s=l,2, , n, />0 (94) Скорость возрастания функции f (х) вдоль луча в точке х определяется формулой
§9] 9KCTPFMy\! ФУНКЦИИ MIIOI ИХ ПЕРЕЧРНИЫХ 123 Ясно, что правая часть (9 5) имеет наибольшее значение при /,00 = _£*' (9 6) /!(#)' формула (9 6) дает выражение компонент единичного вектора, направленного по градиенту функции /(х) Очевидно, что направление, в котором функция f(x) при движении из точки х имеет наибольшую скорость убывания, обратно направлению вектора (9 6) Это свойство градиента /(х) положено в основу ряда методов численного отыскания точек, в которых /(х) имеет минимум. Поюжим в системе (9 3) us — — ls (x), тогда получим а/(») {grad/(x)b . (97) Hgrad /(х) || /£№: Теорема 9 1 Пусть 1) функция f(x) задана при х££„, вещественна и непрерывно дифференцируема по своим аргументам, 2) grad/(x) обращается в нуль лишь в единственной точке, являющейся оптимальной точкой этой функции Кроме того, ||grad/(x)||>a>0 при ||х|| — + оо Тогда любая интегральная кривая xs = xs{t, \, , х„), s=l, 2 л, (9 8) системы (9 7) такая, что xs — xs при / = 0, обладает свойством xs—*xls0) при возрастании t, причем х0 = {л-[°\ . , лг^01}—оптимальная точка функции /(х) Решение х (/) = х0 асимптотически устойчиво в целом при возрастании t Доказательство Предположим, что точка х„ найдена Покажем тогда, что для каждого е > 0 и точки х можно указать такое Т(е, х), что при t~^*T(г, х) будет ||х(/, х)-х0||<е, (9 9) где х(/, х) — интегральная кривая системы (9 7), удовпетворяю- щая условию х(0, х) = х Рассмотрим функцию V(x) = /(x) — f (xa) Так как х, является оптимальной точкой, т е f(x0X/(x) при ух£ЕП и V(x0) = 0, функция V{x) поюжнтепыю определенная Продифференцируем
124 0ПТН\1\1ЬНЫЕ СИСТЕМЫ УПРАВТЕНПЯ [Г'1 !| ее в силу системы (9 7), тогда получим Т—*"№,'*/"—№<*Ь WW) В силу того, что grad/(x) обращается в нуль лишь в единственной оптимальной точке х„, имеем выполнение условий теоремы об асимптотической устойчивости Это означает, что по любому е>0 существует б(е)>0 такое, что при ||х—х0|| < 6(e) будет ||х(/, х) — х01| < е для всех />0, ,д ^ ||х(Л х) — \о\\-у0 при *-»-оо Возьмем любое х Для интегральной кривой х(/, х) возможны два случая либо существует такое Г(х), что ||х(Г(х), х)-х0||<б, либо такого Т(х) не существует В первом случае ясно, что ||х(/. х) — Хо|| <е при yt>T(x) Пусть такого Т не существует (второй случай) Тогда \\х((, х)-х0||>б, и в силу предположения теоремы существует такое а, чю ||grad/(x(/, х))||>а Из (9 10) получаем неравенство dV/dt < — а при всех />0 (9 12) Следовательно, V{x(t, x))^V(x)—at Последнее неравенство показывает V(x) на интегральной кривой (9 7) неограниченно убывает, что невозможно Полученное противоречие показывает, что упомянутое выше число Т(х) существует Теорема доказана Замечание Пусть дана система алгебраических уравнений р,(х)=0 / = 1, 2, .. , л (9 13) Требуется найти решение этой системы Положим /(х) = 2 Р) и найдем минимум функций f (Я), решая систему дифференциальных уравнений (9 7) Пример 91 Рассмотрим функцию одного аргумента / (х) Пусть оптимальное значение функция принимает в точке хп, и при этом других минимумов, а также максимумов не существует Тогда любая интегральная кривая уравнения dx/dt = — df(x)/dx (9 14)
§ 9) SKXH'KMJM ФУНКЦИИ МНОГИХ ПЕРЕМЕННЫХ 125 стремится к х0 лишь в том случае, если df(x)/dx обращается в нучь только в точке *0 В противном сл>чае интегральные кривые уравнения (9 14) будут примыкать к каким-либо стационарным точкам функции fix), являющимся точками покоя уравнения Рассмотрим такую систему dxldt = у, dyldt = — df (x)/dx, (9 15) все точки покоя которой распознаются на оси х Легко видеть, что система (9 15) имеет интеграл вида уг (/) + 2/(х(/)) = с. Возьмем точку (х, у) в i ачестве начальной, причем у £ 0 На интегральной кривой (x(t), (/(/)) во все время движения имеет место равенство {,*(/) +2/(*(/))=£» +2/(*) (9 16) Еспи найдем точку /„ такую, чтобы y2(ta) было максимальным значением функции у-(1), то точка x(tn) является оптимальной для функции f (х) Зна чит, при таком подходе к отысканию оптимального значения стационарные точки функции /(s) не являются помехой при вычислениях Этот алгоритм непрерывной минимизации можно распространить на отыскание оптимапьнмх точек функций многих переменных 2° Обратимся теперь к рассмотрению проблемы минимизации функции многих переменных при наличии ограничений Рассмотрим ограничения вида M*i. • .*»)-0. /=1. 2, . , /. (9 17) П^сть х = {л;1, , х„) — некоторая точка, удовлетворяющая (19 17) Поставим вопрос в каком направлении при движении из точки х~. совместимом с ограничениями (9 17), заданная функция /0(v,, ...х„) имеет наиботьшую скорость возрастания^ Дтя этого рассмотрим систему дифференциальных уравнений 75*=-".. Ё «*=1. s==1. 2- • ". О 13) интегральная кривая х(/,х) которой удовлетворяет условию х(0, х) = х и для которой при любом t~^0 выполнены ограничения (9 17) Дифференцируя эти ограничения в силу системы (9 18), получим £'-£|Ч_0, (-1,2,...,. (9,9, Равенства (9 19) означают, что вектор и = {и1, , «„} ортого- начен ко всему подпространству L, натянутому на векторы 6rad/,, , grad/, Следовательно, вектор и принадлежит ортогональному дополнению к этому пространству Как известно, любой вектор, например grad/0, можно, и притом единственным
126 ОПТИМАЛЬНЫ!-: СИСТЕМЫ УПРАВЛРНИЯ [П 1| способом, представить в виде суммы grad/0 = gradj0 + a, (9 20) где a£L, gradL/0 _|_ L (знаком J_ обозначаем ортогональность к подпространству L, т е ко всем векторам из этого подпространства) Наша задача состоит в выборе и так, чтобы скорость возрастания /(х(/, х)) была наибольшей, т е dfjdt имело наибольшее значение Следовательно, в силу (9 20) d/0Atf = (gradJ0.U), откуда с учетом (9 18) получаем требуемое gradL/0 llgradjol (9 21) Наибольшая скорость убывания функции /0(х) при движении точки из х будет в направлении и=—^djtq) 921, llgradj0(x)|| Найдем фактическое представление gradLf0 Имеем а= 2 tVgrad//. следовательно, gradL/0 (х) = grad /0- £ n.grad /,. (9 22) ы\ ' ' Числа ц,, ..., ц, определяются из условия ортогональности вектора (9.22) к векторам grad fj. Отсюда получаем систему / алгебраических уравнений для определения щ, ., ц, (grad /0, grad /,) = 2 |1, (grad /,, grad /,•), i = 1, 2, , / (9 23) Можно считать, что векторы grad f/t /=1, 2, . , /, линейно независимы в точке х, ибо в противном случае из них можно бо!ло бы выбрать независимую систему Из системы (9 23) можно найти величины ц„ ... \it Ясно также, что они являются функциями переменных xlt ..., х„ Теорема 92 Пусть 1) функция /0(х) имеет оптимальное значение в некоторой точке х0 = {х\т, , *},•"} при условии /у(х) —0, /=1, . , /, 2) вектор gradL/„(x) обращается в нуль
§ 10) ОПТИМАЛЬНОЕ ДЬМПФИРОВАИИК ПГРСХОДИЫХ ПРОЦЕССОВ 127 при условии (9 17) лишь в оптимальной точке Кроме того, llgradj,, (х) || > а при \\х\\-* -\- оо Тогда любая интегральная кривая x(t, x) системы (9 18) при управлении (9 2 Г), где х удовлетворяет ограничениям (9 17), при любом />0 удовлетворяет (9 17) и обладает свойством ||х(/, 5)-х,|| —0 при /—+ оо Решение x(t) = xg асимптотически устойчиво по Ляпунову при возрастании t Доказательство этого факта осуществляется точно так же, как и в теореме 9 1 Система (9 7) и система (9 18) при управлении (9 2Г) не имеют решения х(/) = х0 в точном смысле Эта точка скорее является точкой неединственности, которая ведет себя как асимптотически устойчивое по Ляпунову положение равновесия при возрастании времени Так как движение происходит с постоянной по ветчине скоростью 2 "f=l. T0 интегральные кривые примыкают к этой точке при возрастании времени в течение конечного промежутка времени В этом смыспе и надо понимать асимптотическую устойчивость Если в сиаеме (9 7) положить в правой части {grad/(x)}(„ "*- llgrad/JI-M ' то точка х = х„ становится нупсвым решением, асимптотически устойчивым в целом по Ляпунову При этом геометрия поведения траектории не меняется Меняется лишь динамика движения изображающей точки по траекториям, и каждая интегратьиая кривая будет примыкать при t-— + oo к точке х = х0 § 10. Оптимальное демпфирование переходных процессов 1° Рассмотрим управляемую систему d\s/dt = fs(xlt ,x„,ult ,u„t) (101) П>С1Ь задана начальная точка х° и момент /0 Тогда каждому управлению u£G (G — некоторое множество, например, к>сочн>- непрерывных вектор-функций) отвечает движение х-=х(/, и, х°, *„), (10 2) проходящее через точку х° при / = /0 Пусть S—некоторая поверхность в пространстве переменных t, х0 . , хп, задаваемая
128 ОПТИММЬПЫЕ СИСТЕМЫ ЛПРАВТЕИНЯ [ГЛ ц уравнением S(i,xlt . ,х„) = 0 (10 3) Задача управления пусть состоит в выборе u£G так, чтобы в некоторый момент ^ интегральная кривая (10 2) системы (10 1) достигла поверхности S (10 3) и при этом управления («lt ., иг) и фазовые координаты х\, . , х„ удовлетворяли ограничениям Vj(xlt . ,x„,ult . , кг,/)<0, / = 1,2 k (104) (Vj—могут быть, в частности, функционалами) Но хотя мы имеем некоторый процесс (уравнения движения) и условия его протекания (ограничения, начатьное и конечное состояния), задача выбора управляющих параметров процесса может не иметь о позначного решения Рассмотрим еще функцию V(t, хи . , х„), которая определяет в каком-либо смысле расстояние от перехоа- иого процесса (движущейся точки (10 2)) до желаемого его конечного состояния (поверхность 5). Пусть роль системы управления сводится к тому, чтобы это расстояние уменьшать Тогда естественным становится понятие об оптимальном управлении по отношению к демпфированию функции V Определение 10 1 Управление и" = {"?, , и°г) называется оптимальным по отношению к демпфированию функции V, ее пи эта функция V убывает вдогь траектории x(l, uu) = x°(0, соответствующей этому управлению, наибольшим образом Вычислим значение функции V на движении (10 2) и найдем полную производную по / от полученной функции Будем иметь £-£+t£/.-»«.«.«> оо!) Оптимальное управление по отношению к демпфированию ф\нкшш V необходимо доставляет наименьшее возможное отрицательное значение функции W (t, x, и) среди всех допустимых чправпеннй (управпеннй, которые переводят точку х° на поверхность 5 и при этом удовлетворяют ограничениям (10 4)) Пример 101 Рассмотрим линейную систему f£=Xfl""+i>>«/. s=i" •"• <iog) Пудеч считать элементы матрицы A = ^as;\ постоянными вещественными ■тепами, a B — \bSJ\—либо вещественными постоянными, либо функциями Предположим, что при u = {«t, , «г} = 0 положение равновесия х = 0 асимптотически устойчиво по Ляпунову Тогда существует почожителык»
§ 10) ОПТИМАЛЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 129 определенная квадратичная форма V, удовлетворяющая j равнению (grad V. А\) = — х*. (10 7) и притом единственная Будем считать, что функция V определяет расстояние интегральной кри вой системы (106) до точки х = {*,, ,хп\=0 Построим управление и оптимальное к демпфированию функции V, т е управление (и,, , иг) необходимо выбрать так, чтобы функция V убывала наибольшим образом вдоль траскюрии системы (10 6) Предположим, что (и,, , иг) удовлетворяют условию |и/|<1. / = 1, 2, ., г. (10 8) В этом случае функция W = —х2 + (grad V, flu) (10 9) принимает наименьшее возможное значение при "/ = —sign (В*. grad V), /=1.2 г. (10 10) Подставляя (10 10) в систему (10 6), получим оптимальную авюматиче скую систему управления по отношению к демпфированию функции V (г х) Правые части системы оказываются разрывными, и поверхности их разрыва опродстяются уравнениями £|^, = £>,л:, = 0. /=1.2 г (10 12) s= I * s= I В системе (10 11) возникает, вообще говоря пепродолжимость движений через поверхности разрыва (10 12) В физических системах за счет инерционности происходят малые вибрации около поверхности разрыва Пример 10 2 Рассмотрим движение точки в фазовой пространстве с постоянной по величине и управляемой по направлению скоростью 2Ь=«,. $>* = !. «=1. -. • л (Ю13) Положим V(x)=y S '» <10 I4) Управление, оптимальное но отношению к демпфированию функции V, определяется путем нахождения наименьшего возможного значения функции w=JLwUs (Ю15) 5 1353
130 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЧСИИЯ [ГЧ II Отсюда (10 IG) Г «=1 Покажем, что при управлении (10 16) движущаяся точка из любой заданном точки x={a-j, . ., Хп) попадает в начало координат Систе\ а (10 13) при управчепии (10 16) имеет вид di~ f-R— УЖ' Умножая se уравнение системы (10 17) на xs и суммируя по s, получим • $* Интегрирзя j равнение (10 18"), найдем г = —/4- /•„ Спедователыю, движущаяся точка попадает а начало координат в момент Легко показать, что / является наименьшим возможным временем, за ко торое движущаяся точка может из точки попасть в начало координат Таким образом, в данном случае управление и0, оптнма ibitoe no отпоие пню к демпфированию функции У, япляетсн одновременно оптнмалын.м по быстродействию Определение 10 2 Управление и = {«,, , и,} называется оптимальным по быстродействию, если среди управлений, персво дящих начальную точку х на поверхность (в частности, начаю координат), оно доставляет времени перехода T = tx-t0=ldx наименьшее возможное значение Теорема 101 Пусть 1) управление и0 = {//?,. , и0,} является оптимальным по отношению к демпфированию функции V(t, x), 2) функция V(t, x) вещественна, непрерывна и поюжи- пгельна при веек t, xs, s=l, , п, за исключением V(/,x) = 0 при 5(/,jf,, ,л'„) = 0 (на поверхности), 3) функция V((,x) непрерывно дифференцируема вдоль движения системы (10 1) при
§ 10J ОПТНЧАЛЫЮР ДЕМПФИРОВАНИЕ Ш.РКХОДНЫХ ПРОЦЕССОВ 131 любом управлении u£G, причем dV/dl =— 1 при управлении u°— onrnu \ta гьно и в смысле демпфирования функции V(t, х) Тогда управление и° и соответствующее ему движение \й(1) = = x(t, и0, х°, /0) будут оптимальными по быстродействию Доказательство Покажем сначала, что интегральная кривая системы (10 1) при управлении u = u° достигает поверхности S Иначе говоря, управаение и0 переводит систему из состояния х° на поверхность S за время /, По условию теоремы вдоль движения x°(t) имеет место равенство dV/dt =—1 Интегрируя его по /, найдем V(t, х{1)) = V((0, х°) + /0 — / Так как функция V(t, x) не принимает отрицательных значений и тотько на поверхности S обращается в нуль, то существует такой момент /, = t0 + V(t0, х°), что х°(/,) = х(/„ и0, х°, t0)£S Пусть время T = t1 — t0 = V(x°, t„) будет не оптимальным по быстродействию Тогда существует управ1ение u£G, переводящее точку х° на поверхность S за время T* — t*—(Л, причем Т" <Т Так как управление и°—оптимальное по отношению к демпфированию функции V(l, x), то для любого другого управления й и соответствующего ему движения x(t) = x(t, х°, /0, й) будет dV/dt=—1+а(/), где а(t)^0—функция, заданная при Интегрируя это равенство, найдем -V(t0, х-) = _(/;_/,)+ J о (/) Л, откуда Г»—7 = I a(/)rf/>0, что противоречит предположению Теорема доказана Замечание При управлении (10 16) вдоль соответствующего ему движения (пример 10 2) будет иметь место равенство dV/dl =—1 Как вытекает из теоремы, данное управление оптимально по быстродействию Будем считать, что исходная система линейно зависит от управления и имеет вид t£ = M*i. • . *п. 0 + LM*i. •• .*». 0«/ (Ю19) Предположим, что функция V(t, x), о которой идет речь в предыдущей теореме, существует Пусть также управления ии .. , ип
132 ОПТИЧЧЧЬНЫЕ CIIC1LMI.1 1ПРАВППШЯ [ГЛ 11 входящие в систему (10 19), подчинены ограничениям К|<1, / = 1, 2 г (10 19') Полную производную функции V(t,\) в силу системы (10 19) можно представить в форме dV dV , A dV ( , А A dV , ,1Л ОЛ T^dT + La^' + L"'!^6*' (1020> S=l i=] S-l Правая часть (10 20) достигает своего наименьшего значения при «ie,= -sign(£|£b,,) (10 21) Так как наименьшее значение правой части (10 20) равно —1 в случае оптимальности по быстродействию, то, подставляя (10 21) в (10 20), будем иметь уравнение в частных производных !г+££ь-£|££».<|--' <>°22> Формула (10 21) решает проблему синтеза (управление представляет собой функцию от кооряннат и времени), оптимальную по быстродействию В общем случае, когда u£G, где G имеет более сложную природу, задача построения оптимального по быстродействию ^правтения сводится к отысканию наименьшею возможного значения линейной формы (10 20) в классе функций u£G Уравнение (10 22) можно рассматривать как уравнение для определения функции V(t, x) со свойствами 1) V(t, х) непрерывна и положительна при всех / и xs, sa исключением V(t, x) = 0 при S(t, л,, . , хы) — 0 (граничное условие), 2) V(t, x) непрерывно дифференцируема по своим аргументам Отметим при этом, что частные производные функции V(/,x) являются, вообще говоря, разрывными, и поэтому решение \р?п пения (10 22) еще более затруднительно В связи с этим поставим следующие задачи 1) рассмотреть вопросы существования и единственности вышеупомяну!ой ф\пк- цпи V(t, x) в задачах управления, 2) провести исследования уравнения (10 22) в частных производных, 3) исслецовать систему дифференциачьных уравнений на поверхностях разрыва, т е
§ 10] ОПТИМАЧЫЮЕ ДЕМПФНРОВМ1ИС ПЕРЕХОДНЫХ ПРОЦЕССОВ 133 2Э Вместо фрикции V(t, x) можно взять некоторый функцио нат, определенный на движениях и управлениях, входящих в систему (10 1) Рассмотрим самый простейший функционал такого типа П\сть V (t, х) — функция, обладающая теми же свой ствами, что и ранее, и пусть функция /0(х, u, t) обладает теми же свойствами, что и правые части системы (10 1) Управление и (О и соответствующее ему движение (10 2) при фиксированном времени t определяют значение функционала L = V(t,x(t, u)) + J/0(x, u, x)dx (10 23) Зададимся целью отыскать такое \прав пение, чтобы вдоль соответствующего ему движения скорость убывания функционала (10 23) являлась наибольшей в точке (х°, /0) Найдем полную производную функционала (10 23) при t = t0 £!,.., = /.<*•. ". '.J + t^Mx*. u, /.) + £ (10 24) П}сть наименьшее возможное значение правая часть (10 24) принимает при umin(x°, /0) Потожим u0(x, /) = umill(x, /) Будем считать, что система (10 1) опредепяет движение х°(0 = х(/, х\ /„) Положим U« (/) = 110 (X» (/), О, и пусть и°(() явтяется допустимым управлением Это управление и соотве!ств\ющее ему движение хи(/) будем называть оптичаль ныч по отношению к демпфированию функционала L Оказы вается, что в каждой точке оптиматьной кривой функционал L имеет наибольшую скорость убывания Действительно, пусть / > 10—некоторый момент времени и х — соответствующая ему точка интегральной кривой х°(/) Возьмем произвольное управ ленне u(t)£G при l>t и оценим скорость изменения функционала в точке (х, Г) при этом управаении dL | dV . A dV t .- -, , . ,- т._ >-^ + t^-/-(x.«-.0 + /.(?.u.,7) Это неравенство показывает, что скорость убывания функционала L в каждой точке оптимальной кривой явлнекя наибольшей.
134 ОПТИМАЛЬНЫЕ СИСТГМЫ 1ПРАВЛ(-ННЯ [ГЛ II Рассмотрим теперь связь систем управ пения, оптимальных в смысле демпфирования и в смысле интегрального функционала Обозначим через хх то фазовое состояние на поверхности 5, которое достигается объектом управления (10.1) в момент t1'^t0 при некотором фиксированном u £ G, т е S((v x[l), ,х'п1)) = 0 Предположим, что управление u(t) и соответствующее ему движение (10 2) с концами х' и х1, заданные при (£[(„, /,], характеризуются значением некоторого функционала У (u, х') = р(/,. x'H-jMx, и. t)dt (10 25) Определение 103 Управление и* и соответствующее ему движение х*(() называются оптимальными по отношению к функ- ционагу J, если неравенство У (и, х")>У(и*. х0) (10 26) имеет место при любом выборе допустимого управления u g G Теорема 10 2 Управчение и° = {и?, , и°г), оптимальное по отношению к демпфированию функционала L (10 23), где V (I, х)— = р (/,, х1) на многообразии S, доставляет функционалу J (10 25) наименьшее возможное значение среди всех управлений, переводя- щи v точку х" в некоторую точку х1 £ S, если это управление и0 (/) и соответствующее ему движение х° (t) удовлетворяют уравнению % + ±%f' + f-° (1°27) Доказательство Так как и0 является оптимальным управлением в смысле демпфирования функционала L (10 23) и удовлетворяет уравнению (10 27), то можно записать £ + /.(*. "°. /)=infc(4r+f«) = 0 (1028) или W (/, х, u") = inf W (t, x, u) ■= —^-, (10 29) W('. x. u) = £■££-/, + /. (Ю30) Вычислим значение функционала J (10 25) при управлении u°(0 и соответствующем ему движении Для этого интегрируем равенство (10 27) в пределах от /° до 1[—того момента времени,
§ 10] ОПТИМАПЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 135 когда интегральная кривая попадает на поверхность S при управлении и°(/) У{П, x°Ui°))-K(/0,x°)+ $/o(x, u, x)dx = 0, откуда J(u°) = p(/?, x°(/•))+ J /о(х, u„ T)dT = K(/„ х») (10 31) Предположим, что управление и (/)—допустимое и доставляет функционалу J меньшее значение, чем управление и°(/), т е /(u)</(u°) Тогда в силу (10 28) или (10 29) для этого управления будем иметь dV/dt+fa(x, й, /)>а(0, (10 32) где а(1) — неотрицательная функция _ Интегрируя последнее неравенство в пределах от /„ до (1 — момента времени, когда x(/lt x°, t0, u)£S, получим p(Tlt xl)-V(^,x0) + 5/0(x, u, x)dT>5'a(T)dT, откуда _ J(u) —У(и°)>0, что противоречит выбору управления и(/) Это противоречие и доказывает утверждение теоремы Следствие Рассмотрим систему (10 19) при ограничениях: на управления (10 19') Пусть f(x, u, t) = f0(x, t) В этом случае управление, оптимальное по отношению к демпфированию функционала L (10 23), определяется формулой (10 21), и уравнение (10 27) примет вид Tr + t^'--t|t*«^|+'.fc "=° С033» Отсюда стедует найти ф>нкцию V(t, x), удовлетворяющую условию V(t, x) = p(t, x) на поверхности S 3° Обратимся теперь к методу множите пей Лагранжа, а затем перейдем к выводу принципа максимума Л С Понтрягина Этот принцип является необходимым условием оптимальности П^сть задана оптимальная система x = f(x, u), (10.34)
136 ОПТИММЬНЫЕ СИСТЕМЫ УПРАВТРНИЯ [ГЛ 11 где х = (г,, . , л:„), и = (н,, .. , иг) Будем считать, что правые части системы (10 34) заданы при u£Uc:Er, х££„, вещественны и непрерывны по отношению к совокупности всех переменных, а также непрерывно дифференцируемы по компонентам вектора х Определение 104 Вещественная кусочно-непрерывная векторная функция u(t) называется допустимым управ гением, если 1) и(/)££/, t£[l0, /,], 2) u(t) имеет левосторонние и правосто ронние пределы в точках разрыва, 3) функция u (t) непрерывна на концах промежутка [10, /,] и принимает в точках разрыва значение, равное пределу слева Пусть задано начальное состояние хи и конечное состояние х1 управтяемой системы Определение 10 5 Допустимое управчение ии(/), переводящее систему из начаъьного состояния в конечное за промежуток времени [/„, /,], называется оптимальным по отношению к функционалу •/ = (/„('. х, u)dt, (10 35) если среди всех таких допустимых управлений оно доставляет (10 35) наименьшее возможное значение При этом начальный момент t0 и конечный момент /, могут быть как фиксированными, так и нет Во всяком случае начальный момент можно считать фиксированным, так как замена независимой переменной I на t+c, где с — вещественная постоянная, не меняет вида управляемой системы и множества допустимых управлений Будем предполагать, что функция /0 обедает теми же свойствами, что и компоненты вектора f в системе (10 34) Предпоюжим, чго существует функция V(l, х), заданная при *€[/о. М. *££„, вещественная, непрерывная и непрерывно дпф ференцнруемая относительно t и компонент вектора х и такая, что V(/1( x1) = 0 Положим z = V(t, х)+ $/,(/, x, u)dt (10 36) Обозначим через IV полную производную функции г вдоль интегральной кривой системы (10 34) i!i = U7 = -^- + (grady, f(/, x, u)) + /. (1037) Обозначим через u°(/, x) те значения вектора и, при которых функция W(l, х, и) принимает наименьшие возможные значения W(t, х, u°l/, x))= \ntW(t, x, u). (10 38)
§ 10] ОПТИМАЛЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 137 Предпоюжим далее, что W(t, х, uu(/, х))==0 (10 39) Будем считать, что система (10 34) при > прав пении u = u»(/, х) (10 40) переходит из заданного начальною состояния х° в заданное конечное состояние х1 Обозначим через х°(0 соответствующее этому управлению решение системы (10 34), удовлетворяющее х"(/)|Гж,о = х». и через u"(t) — значение управления и°(/, х) на движении х°(0 Предположим далее, что и°(/, х) явпяется непрерывно дифференцируемой вектор функцией относительно компонент вектора х, так как точка множества U является внутренней, то из условий (10 38), (10 39) имеем dW (t, x u» (/ х)) _ dW Л dip dak _n dXj ~ dxf + 2- duk dxf ~ U (10 41) Здесь при дифференцировании слева по \у остальные компоненты вектора х считаются параметрами, не зависящими от лу- И? ПО 41) имеем dW/dX/ =0, иначе Соотношение (10 42) может быть переписано в форме *(£) + ££ 3№° <"«> В формулах (10 42) и (10 43) считается, что функция V((, x) 1важды непрерывно дифференцируема по своим ар1уменгам Положим ак/ах/ = х/(о при х=\«(0 Тогаа (10 43) можно записать в виде kj + tx'%; + wr0 (1044) П\сть *„ = /„ и Я.„ = 0, а также # =ИУ/(/. х, u) (I0 45)
138 0ПТПМАЧЫ1ЫЕ СИСТЕМЫ УПРАВЛЕНИЯ (ГЛ И В этом случае будем иметь Xj = дН/дХ,, if = — dHldXj (10 46) Система (10 46) представляет собой каноническую систему дифференциальных уравнений Из предыдущих рассуждений вытекает, что ей удовлетворяют функции х = х°(0, u = u°(0. h = -&r ПР" х=х°(0. ' i (10 47) *о=1. ««(/) = J/о (т. х, u)dx Рассмотрим теперь функцию Н((, x°(l), u, l(t)) Эта функция при и = и0 (0 достигает своего наименьшего возможного значения ( ' х ( " Действительно, W(t, х»(0, и)=дУ(1,д?1П) + НЦ, х«(0. k(t), и). Так как имеет место (10 39), то inf W = W(t, xe (0. и°((,*9Ш=0, стедовательно, inf Я(/, ХМО.МО. u)--^!iO>. Таким образом, установлена следующая Теорема 103 Если 1) существует дважды непрерывно дифференцируемая функция V{t, х), заданная при t £[tn, /,], х££„ и V(llt xl) = 0, 2) существует непрерывно дифференцируемая функция и°(/, х) такая, что u°(t, х)—внутренняя точка U и inf W(t, х, u) = W(t, х°(/), и°(/, х° (/)))ез 0, 3) система (10 34) при управлении u = u°(/, x) переходит из начального состояния х° в конечное состояние х1, то существуют оптимальное управление u°(t) и оптимальное движение х°(1), а также функции Я,(/), / = 0, 1, ..., п, такие, что они удовлетворяют канонической системе дифференциальных уравнений (10 46), причем функция H(t,x((), u,X(/)) принимает при и = и0 (/) наименьшее возможное значение 'х * " , т е Н (t, х" (0. * (0, "") = >nf H {t, х° ((), I, и). (10 48)
§ 10| 0ПТНМА1ЫЮЕ ЛЬМПФИРОВЛИИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 139 Замечание 1 Рассмотрим функционал J = P(xl)+[f0{t,x,u)dt (10 49) и предположим, что конечное состояние х1 располагается на гладком многообразии £,(х') = 0, /=1, ,k (10 50) Если в предыдущей теореме условие К(/,, х») = 0 заменить условием V(llt х1) = Я(х1) и g/(x1) = 0, / = 1, ,k, (10 51) то утверждение теоремы останется в силе Однако теперь для определения функций ХД/), /= 1, , п, и функции jc/C). /=1. , п имеется, вообще говоря, всего лишь n + k краевых условий, а именно задано начальное состояние, в котором оказывается система (10 34) при t = t0 и задано k условий для конечного состояния (10 50) Покажем, что недостающие краевые ^счо- вия можно определить из (10 51) Условие (10 51) закчючается в том, что функция V при t — tx должна обращаться в заданную функцию Р(\1) на многообразии (10 50) Пусть х1 — некоторая точка, _\доваетворяющая (10 50) и условию V(t1,x1) = P(xl) Так как уравнения (10 50) определяют гладкое многообразие размерности (п—k), то, по определению, векторы (gradg,), /'—I, , k, должны быть линейно независимыми Обозначим через а = (о1, , ап) какой-либо вектор, ортогональный одновременно всем векторам grad^, / = 1, ,k Рассмотрим та пег векторную функцию х = х(е) такую, что g/(x(e)) = 0, /=1, .,*, х(0) = х« и ||р=0 = а Тогда будем иметь V(tlt х(е)) = Р(х(е)) Дифференцируя последнее равенство по ь и полагая е = 0, найдем (grad V (tlt xl), a) = (grad P(х«). а), (gradg,(x»), a)=0, /-1, ,k Так как вектор а может принимать произвольные значения в пространстве, ортогональном векторам gradg/( то последние равенства одновременно могут выполняться лишь в том и только в том случае, когда вектор grad V(tlt x1) — grad P(xl) будет содержаться в пространстве, натянутом на векторы gradg/( /'= 1, . • ,k Следовательно, существуют постоянные/!,.. , 1к такие,
140 ОПТИМАЛЬНЫ! CHCTFMM Я1СЛНЛ1 НИЯ [ГЛ II что gradV = gradP + %ljgradgf (10 52) Так как Xj(t) = dV/dXj при х = х°(/), то из (10 52) будем иметь MU-^L/,^. -I.- ,n (10 53) Условия (10 53) называются условиями трансверсальности Эти условия вносят добавочные неизвестные переменные /,, . , 1к Таким образом, искомых величин становится теперь 2n-\-k, a именно АУ), МО " lh s= •• . "• /=1. • >k Для определения этих вепичин имеются также 2/;-l& краевых условии задано начатьное состояние, условие (10 50) и условие (10 53) Пример 10 3 rijcib заданы к=РЦ)х-\ (?U)u + F(/), (1054) J=^ |A*(/)x-)-B*(Ou dt ЬС*х' (10 55) Л*х + /;,=0 /=! * (10 56) Требуется пантн оптимальное по отношению к функционалу (10 55) управ лепие и0 (/), переводящее систему (10 54) из заданного состояния х = х° при t = tn на многообразие (10 56) при условии, что управления стеснены ограни |М/|«£1,/ = 1 , г (1057) Далее будем предполагать, что элементы матриц Р, Q и компоненты вскторои F, А, В являются вещественными кусочно н<прерывными функциями, задан пыми при t£\ln, tx], компоненты векторов С и А/ а также bj будем считать вещественными числами Естественно предполагать, что векторы А/ линейно независимы между собой Положим V(f,x) = k*{t)x + VU) г = 1/-г$ |А»(/)х+В»(/)и|Л (1058) г= W = \\* + )*Р+ А*| х+ф+ X*F+ |Я*<? -f- B*l u (10 59) Функция (10 59) достигает наименьшего возможного значения при условии (10 57) в точке «/(/) = -sign|X*Q + B*|/. /=1. ,«■ (10 60) Здесь /- индекс при скобке—означает ; компоненту вектора, указанного в скобке
§ 101 оптпммьнор ii чпфнровмшр переходных проигесов 141 Выберем теперь функцию <р и вектор X так, чтобы функция (10 59) обращаюсь в нуль при условии (10 60) Тогда получим к* 1 к*Р-{ А» = 0, (10 GI) Ф + ^'F — 2 |Ь*<?+В*|у-0 (10G2) Из замечания 1 вытекает, что компоненты вектора fc, должны удовлетворять уоювню трансверсальности В данном случае оно имеет вид M'i) = C4-2; '/А/ (Ю63) Условия (10 63) позволяют определить с помощью (10 61) вектор X При этом он б\дет линейно зависеть от величин /,, , 1к Равенства (10 60) дадут тогда управления зависящие от постоянных /,, , /д, и эти управления будут доставлять функционалу (10 55) наименьшее вошожное значение Если подставить управташе (10 60) в систему (10 54) и проишегрнровать ее с начальным условием х = х° при t=t0, то получим искомое оптимальное движение х° (/) Эго движение будет зависеть по преж нему от постоянных /j, , lk. Подставляя найденное движение в (10 56), найдем * уравнений для определения постоянных /,, , lk Получаемые таким обратом уравнения дтя вечичин /,, , 1к moi ут быть разрешены с любой наперед заданной степенью точности Предыдущая теорема и замечание к ней носят достаточный характер В вечем в рассмотрение вектор у = (хи, xlt .. , хп), где л'0= \ /о (т, х, u) dt Тогда этот вектор будет удов!егворять системе уравнений dy/dt = F(t, У, и), (10 64) где Fit, У, и) = [/„(/, х, и), /,(*, х, и), ,/и(Лх, и)] Предпоюжнм, чго существует допустимое управ!ение u=^u(/), перево1ящее систему (10 34) из начального состояния х° в конечное состояние х' за промежуток времени [*„, /,] Тогда это управпение будет пеоеводить систему (10 64) из начатьного состояния у" в конечное состояние у1 за это же время Рассмотрим уравнение в частных производных 7F + ZM*. У, u(0)|£ = 0 (10 65) Построим решение этого уравнения V (Л У)--='>'. (У — У1]) »Р» t = t»
142 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВ'П-НИЯ [ГЛ II где А,1 —некоторый вещественный постоянный вектор Обозначим через У = У(*.Ч) (Ю66) общее решение системы (10 64) с условием у (/lt r\) = у1 + Л. гДе г|—произвольный ради>с-вектор, соединяющий точки у1 и у и имеющий достаточно малую длину Решение, соответствующее управлению u (/), получающееся из (10.66) при ц = 0, будем обозначать далее через у(/), так что У(>„) = У°. a y(f,) = y» Разрешим равенство (10 66) относительно компонент вектора т) Тогда получим Ч = 6(ЛУ) (Ю67) Компоненты векторной функции (10 67) представляют собой первые интегралы системы (10 64), причем они дают полную систему первых интегралов для (10 64) Из предыдущего вытекает, что *('„ Л + У1) = Ч Рассмотрим функцию V = (»,[y(iulV,y))-y>}) (10 68) Так как функция (10 68) является функцией первых интегралов системы (10 64), то она обязательно удовлетворяет системе в частных производных (10 65) Положим в (10 68) / = /,, у = Л4 у1 Тогда имеем V (tlt тц-у1) = = (А,1, т)), откуда У С. У) = (>■'. (У- У1]) Последнее равенство выполняется во всяком случае для всех точек у, расположенных в сфере с центром у1 достаточно малого радиуса Таким образом, формула (10 68) дает искомое решение уравнения (10 65), во всяком случае в некоторой достаточно малой трубке с осью у=-у(0 Именно, функция (10 68) задана при *€[*o.*i] и Ну — У(0||<°\ где б—достаточно малая положительная постоянная Если управление u = u(/) доопределить с сохранением непрерывности на несколько более широкий промежуток [t'0, t[], то формула (10 68) б\дет определять искомую функцию также на этом более широком промежутке Положим Kj^dV/dyj при у--у(/) (10 69)
<j 10) ОПИШМЬИОК i.\ МИФ IHOBAHHK IIKPL40 1HUX ril'OUVTCOB ИЗ Тогяа из (1069) следует, что k(t) = Xl при t = tlt гдеЛ,-=(Я.0> , Хп) Продифференцируем формааьно соотношение (10 69) по t Поаставим функцию (10 68) в (10 65), продифференцируем полученное тождество по j/y, переставим затем порядок дифференцирования и негожим у = у(0 Тогда пол>чим так как dV/di/s = \s при у = у(/) Сравнивая последнее и прекюспедпее равенства, находим %-=-±01','-!;;'-°"п к. i=o ,. (.ото) Положим Я= 2У/«.у.и(0) Легко заметить, что системы (10 64) и (10 70) могут быть записаны в форме Гамильтона dyjdt = дН/дКг. d\sldt = — dHldys< s = 0, . , n (10 71) Покажем теперь, что компоненты векторов у(/), h(t) и управления и(0 действительно связаны меж чу собой системой Гамшь- тона (10 71) Предыдущий вывод сотого факта остается справедливым лишь дтя того случая, когда функция V имеет вторые непрерывные частные производные по всем аргументам Обозначим через е, единичный орт декартовой системы координат в пространстве переменных у Подставим функцию (10 68) в уравнение (10 65) и положим у = у(т), гдеу(т) есть решение системы (10 64) с начальным условием у(т) = у(1) + е/у/ при/ = т. Проинтегрируем полученное тождество в пределах от / до tl вдоль интегральной кривой у = у(т) Тогда получим Кр^ЧХМт.УМ, и<т))*^>]л~0 (1072)
144 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [ГЛ || К левой части (10 72) добавим и вычтем выражение S 2 Ki*) fs^.yiV, u(x))dx. Тогда получим Положим V^V-i.hG^v-yiW) (JO 73) Тогда (10 73) примет вид i*(y,<*)-y,(0)-MT>y,<T)|dT + t t U=o + |£x,/,dT = 0, (Ю74) откуда далее имеем -[V(l, У(0 + ед//)-Хе/|/у] + + $[(*., (у(т) — у(т)))—(Х, у(т)) + (Х.?(т, у. u))]dx = 0. Продифференцируем по г/, и положим у, = 0 Полечим Продифференцируем последнее равенство по t !№ 'гду, ' Здесь используется тот факт, что ^У/^У/ = еу ПР" т = ' Таким образом, соотношение (10 70) выведено без дополнительных предположений на правые части системы (10 64) Покажем теперь, что сети управление u (t) является оптимальным, то существует такой постоянный вектор Я,1, что будет выполнено основное неравенство принципа максимума. Я(У10. 1ЦО,ОД<Я(у(0.й,Ь(0)
§ 10) ОПТИМАПЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 145 при любом u£U, где МО — вектор, удовлетворяющий начальному условию К — Х1 при t = tx Доказательству этого утверждения предпошлем подробное рассмотрение необходимого условия оптимальности Вейершграсса Для этого предположим, что выполнены следующие условия а) функции fs(t, х, u), s = 0, 1, . , п, заданы при х££„, u£(Jc:Err вещественны, непрерывны и непрерывно дифференцируемы по компонентам векторов х = (*„ ...,*«), u = («lf ..,»,), б) матрица А— \ BB*dt неособая, где матрица В~V_1Q, здесь У—фундаментальная матрица для линейной системы dx/dt = Px с начальным условием Y(ta) = E, при этом Н*Ь Ни} при х=х0(/)> u=uU(0, в) оптимальное управление и0 (О располагается внутри множества U при l£[t0,t,] Иначе, если u (t) — некоторая кусочно- непрерывная функция, заданная при l£[t,„ /,], то управаенне u(/, ь) = u°(/) -(-fu(i) будет при любом достаточно малом е принимать значения из множества U Теорема 104 Если и0 (/)—оптимальное управление и \" (/) — соответствующее ему оптимальное движение, то при выполнении условий а), б), в) 1) существует функция V(l,y), удовлетворяющая уравнению (10 65) при u = u°(0 и граничному условию VVU y) = 0i', (У-У1)). (10 75) 2) функция W (l, у, u) = -jr + 2dM'> У. u) j~ имеет при у= =y°(/) и u —u°(/) наименьшее возможное значение, равное нулю Справедливо неравенство W(l,f(i), un(/))=^U/(/, y"(t).u) (10 76) при u£U, или иначе. при u = ue (О, У = У°(0 « H(t, у" (О. и0 (/))<//(/, у°(/).и) при u£U, где //= 2 Vy<U, у, и(/)). (10 77) (10 78)
146 ОПТИМАЧЬНЫЕ C1ICTFMI.I УПРАВ 1ГМ11Я |ГЛ || При этом функции ).((), у°(/), и(/) связаны между собой системой Гамильтона (10 71) Доказательство Выше было показано, что функция V, упомянутая в первом утверждении теоремы, существует Остается показать, что постоянный вектор А,1 можно выбрать так, чтоб>1 было выполнено также и второе утверждение этой теорем01 Покажем, что такой вектор X1 существует Построим семейство управлений u(t, e) так, чтобы было u(/.0)=-u"(0 и ^гЧ=0 = «(О, где и(/) — некоторая к\сочно непрерывная функция, заданная на промежутке [t0, /J, ортогональная на нем к столбцам матрицы В* $Bu(0d/=0 (10 79) Основным требованием к семейству \правпенип u(t, e), будет, однако, являться требование, заключающееся в том, чтобы .движение x(t, e), соответствующее этому управлению, перехолило из начальной точки х° в конечную х1 за время [/„, /,] Существование такого семейства управлений будет установлено ниже Будем далее через у(1, е) обозначать решение системы (10.64), соответствующее этому \прав!енпю Тогда будем иметь \W{t, y(t, e), u(/, B))dt = V(tlt y(/|f B))-V(t„, yu) = '' f = (*■'. [y(tt. р)-У1]) = = ^S!U"(/,e),u(/,e))-/0(/, x°(0, u°(t))]dt (Ю 80) Левая часть (10 80) обращается в нуль при е = 0 Так как можно выбрать Яо>0, то при е = 0 имеем минимум Следова телыю, производная, вычисленная по е при е = 0, обратится в .нуль Отсюда имеем $[£*+(£• i)]*-J(S-i)"-°- («>■«) так как ( . У ■ " ) = 0| что счедует из (10 65) Выберем вектор л.1 так, чтобы было {fl^y'l'dl-O. (10.82)
§ 10] ОПТИМАЛЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 147 Иначе говоря, требуется, чтобы вектор (6W/ди)* был ортогонален столбцам матрицы В* Предположим, что вектор V выбран из условия (10 82) Тогда полагая - = dw (t, у», u°) попучим из (10 81) Отсюда имеем ' =0 Следовательно, u = u°(/)— стационарная точка функции W (t, y°, и) Покажем, что в этой точке функция W принимает наименьшее возможное значение Выберем постоянный вектор и' £ И и точку /' £ [/„, /,], в которой управление ии(/) непрерывно Построим управление и'(/, е) так, чтобы u'(t, е) = и' при t£[t', tl + e], и' (/, е) -и0(t), и так, чтобы движение х'(/, е) переводило систему из начального положения х" в конечное х1 за промежуток [/„, /,] Ниже будет показано, что такое семейство управлении существует Заметим, что по своему определению это семейство управлений и соответствующие им семейства решений определены лишь при е>0 Решение системы (10 64), отвечающее этому управлению, будем обозначать через у'(*> е) Имеем $W(/, y'(t, e), u'(t, e))d/ = = Mt/o«.x'(/, t), u'(/. e)) -/,(/, xe(0. u°V))]dt (10 83) Выберем Я.„^0 Правая часть (10 83) обращается в нуль при е = 0 и не убывает при возрастающем е Следовательно, производная правой части (10 83) по е, вычисленная при е = 0, будет неотрицательна Отсюда имеем W(t, y'(t, в), u'(/, t))dt^0 при e=0 (10 84)
148 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [ГЛ Ц Подсчитаем производную в левой части (10 84) Имеем \Wdt =\W(t, у'(I, e), u'(t, e)dt + I. 'о + \W(t, y'(t, e), u')dt + J W(t, y'(t, e), u'(l, z))dt. Дифференцируя последнее, находим W (f, у {У), u')-W(l', y°(t'), u°(/'))>0 (10 85) Неравенство (10 85) имеет место, так как dW/dy = 0 и dW/du=0 при y = y°(0. u = u°(0 Вводя в (10 85) функцию Я, найдем также Я (у0, ии)<Я(у°, и) при и£0 Чтобы завершить доказательство, заметим, что по непрерывности, устремляя /' к точке разрыва и°(0. можно получить неравенство (10 85) и для точек разрыва и°(/) Замечание 1 В ходе доказательства использована возможность построения семейства управлений u(t, e), переводящего систему из заданного начального состояния х° в заданное конечное х1 за время [ta, *,] При этом u(/, e) = u°(0 при е = 0 и -^ = й(0 при е = 0, где \ Budt—0 Покажем, что такое семейство существует Положим u(/, e) = u0(O+B*c + eu(O, гае с =с(е) —искомый вектор, зависящий от е, который надлежит выбрать так, чтобы удовлетворить всем перечисленным выше требованиям Полагая в системе (10 34) u = u(f, e), х = х(/, е), умножим обе части на У-1 (0 и проинтегрируем по промежутку [/„, /J, считая, что движение переходит из начального состояния х" в конечное х1 Тогда получим У-Ч^х» —x»=.jK-»[f(/, x(t, e), u(/. е)) — Рх{1, г)] dl (1086) Будем рассматривать систему (10 86) как систему, определяющую неявную функцию с=с(е) Система (10 86) имеет решение е = 0, с = 0 Найдем матрицу Якоби правых частей (1086) по
£ 101 ОПТИМАЧЬНОЕ ДЕМПФИРОВАН!!! III 1'1ХОЛМЫЧ rif'OIII ССОВ 149 переменным сх, , с„ и вычистим ее при е -0, с=0 так как df/dy=P при е = 0, с=0 Таким образом, якобиан правых частей функции (10 86) по переменным с\, .., с„ отличен от нуля, следовательно, сущест вует векторная функция с=с(е), удовлетворяющая (10 86) Простыми рассуждениями далее уетанавтваем, что dc/de — 0 при р = 0 и что найденное управление обладает требуемыми свойствами Замечание 2 При доказательстве теоремы вектор V- был * d\V(t, у0, и») . , - выбран так, чтобы вектор —v gi' —'-, /=1, , г, был ортогонален столбцам матрицы В* Покажем, что такой выбор вектора к1 возможен с точностью до мультиптикативной постоянной Положим к = (к1г .... A.J Тогда ™ = XodA + l*Q (Ш87) Из системы (10 71) видно, что вектор I. будет удовлетворять } равнениям 1 = —Р*Х-Ьв(*&у. (10 88) Умножая обе части (10 88) на К*(О и интегрируя в пределах от t до /„ находим Y*(i,)l(t,)-Y*(l)i(l)-§Y*P*ldl = -§Y*(p*X+h(j;y)dt, огк>да находим k(t)=Y*~l (t)) •U,)l(t1) + K§ V~* (t)Y*{T)(^JdT (1089) Поставляя (10 89) в (10 87), находим S = ^| + ^(^)y-40Q-i>,)[^-^0V'MT)(^pxjQ.
150 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ |П Ц Транспонируя последнее выражение, умножая слева на матрицу В и интегрируя в пределах от t0 до tlt найдем |flfl*d/yMM^,f^j|e(^)* + jy*",(Oy*(T)(^)*dr]d/ = 0 (10 90) Равенство (10 90) определяет единственным образом вектор Т?, еети константа Х0 задана Будем считать Хп > 0 При Х0 = 0 получаем A,l = 0, V (t, у) = 0, и утверждение теоремы становится несодержательным Замечание 3 При доказательстве теоремы использовалось семейство управлений Вейерштрасса и'(*. е) Покажем, что такое семейство существует. Будем это семейство искать в форме u'(t, е) = Я*с + ф[и' — В»с — u°]-f-u°(0, где ф—характеристическая функция промежутка [I', V + е)* \ 1 при /£[/', i' + г), ф \0 при *€[/', Г + е) Вектор с будем выбирать так, чтобы решение х' ((, е) системы (10 34), соответствующее управлению и'(/, е), переводило спето му из начатьного положения хи в конечное х1 за время [t0, /,] Умножим систему (10 34) на Y'1 и проинтегрируем в пределах [tu, /,] Тогда получим r-1U1)x1-xu = JK-1[f(/, x'(/, e), u'(t, e,)) — Px'(t, e)]d/ = = Jr-1[f(/, x'(/, e), u° + B*c) — Px'(t, t)]dt + -r I Y~lmt,x' (t, г), и') - i(t,x' (t, г), u"(t) + B*c)]dt (10 91) Уравнение (10 91) можно рассматривать как уравнение для определения неявной функции с —с(е) Ясно, что система (10 91) имеет решение с=0 при е = 0 Вычислим матрицу Я.<оби правых частей (10 91) по переменным
Л 10] ОПТИМАЛЬНОЕ ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ Ш'ОЦ! CCOB 151 cv » сп ПРН с = 0. е = 0 Имеем || ^ V"1 [f (/, х', и° + В«с) —Ях']Л + + J Y-*[t(t, х'(/, e), u')-i(t,x'(t, e), u°(0 |-B*c)]d/ -j"-'[S2+£'-'l]«+ I 'f'y-i И С х'(/' е)' ц,) а* at(/. х'(/. e), u°(0 + A*c) дх _ "*" J r L <зх "л ах "л _M(/.''(/.e).a;'W+^)fl.]<f<=,jflfi<d/. Последняя матрица по сделанному выше предположению является неособой, поэтому существует вектор-функция с = с(е), удовтетворяющая всем требованиям При этом с(е) -<• 0 при е — 0 Перейдем теперь к изучению возможности ослабления ограничительных условий а), б), в) Рассмотрим управление u=u(/, f) и отвечающее ему решение y=y(t, г) системы (10 64), где и(/, ь)= =и" (0 при t£[Q, 0 + е) и u(/, e) = u при t £ [0, 0 + е), здесь 0 — точка ннтервааа [t0, lt], являющаяся точкой непрерывности и', и —постоянный вектор, принадлежащий U Вычислим функции V(t, у(t, е)) и W(t,y(t, e), u(/, ь)) Тогда б>дем иметь W(t, у (I, t), и (Л е)) = 0 при /£ (0, 0 + е) и любом достаточно малом е Последнее обстоятетьство является следствием того, что векторная функция у(/, е) является непрерывной функцией по отношению к е в точке е = 0 При этом у(/, е)->-у0(/) при е. — 0 Следовательно, существует е0 такое, что при е < е0 функция У(/, е) будет принимать значения, принадлежащие области задания функции V(t, у) Исходя из последнего равенства, имеем d 0 + е $*'('. У (Л е), u(/, t))dt= \ W(l, y(t, e).u)d/ = =V('i. у(/, B))-V(tu, y°) Учитывая, что V(t„, у°) = 0, a V(tx, y) = (k\ [у—у1]), находим в+е \ W{t, y(/, е), a)dl=(k\ [у(/„ e)-y'J) (10 92)
152 0ПТИМА1Ы1ЫЕ CHCTFMW УПРАВЛЕНИЯ [г 1 И Обозначим через к век гор, касательный к траектории конца вектора у(/,, е) в точке е = 0 к = |у(/1, е) Из формулы (10 92) будем иметь W(Q, y° (6), и) = (л.\ к) (10 93) Заметим, что (10 93) получается из (10 92) путем дифференцирования no e и вычисления результата при е = 0 Так как W{t, у, и)=^. + Н (/, у, и) и так как W(t, у°(0, и°(О)н=0, то из (10 93) также получим Я(0, у°(0), й)-Я(0, увф), и°(0)) = (л», к) (10 9 J) Пользуясь формулой (10 94), найдем вектор к Обозначим через Z матрицу фундаментальной системы реше ний для линейной системы У = Ру, (10 95) где P=J — \ при у = у°(/), ц = и°(0, причем Z(ia) = C, пе £ — единичная матрица размерности /г+1 Тогда решение второй группы уравнении системы (10 71) может быть представлено в форме ).(0 = (2*(/))-'Z»(^l)^l=Z*(/l, О*-1, где Z(/„ t)=Z((l)Z~4t) Из (10 94) имеем /7(0, у"(в), й)-#(0, у°(0), и"(0)) = = *.•(«)) [ПО, у"(0), й) — ПО, y°(G), и°(в)] = ->.'•£(/,. 0)ff(0, у"(0), u)-f(G, y°(0), и°(в))]=Ь'*к Так как X1 является произвольным вещественным вектором, то имеем k=Z(/,, O)[f(0, yu(0), й) —1(0, у°(в), и°(в)] (10 96) П^сть теперь 9, < 0г < <Н„—точки интервала [tn, /,], в ко торых ug (t) непрерывно, и пусть т,, , тга — произвольные положительные числа, и1, , ит —постоянные векторы из мно жества U Рассмотрим управление u = u(t, tlt , гт) и соот веювующее ему авижение у=-у(/, е^ ., гт), опредетяемое системой (10 64), где u(/, e,. ..e.)-^U,i° ПР" 'ё"1°.-в/+«/). , „-j0 при /€[0/, ву + ьу)
§ 10) ОПТИМЛЛЬНОЕ ДЕМПФИРОВАНИЕ ПКРНХОДНЫХ ПРОЦЕССОВ 153 Если положительные величины ег, , ет достаточно малы, то приведенные выше формулы определяют кусочно-непрерывную функцию, являющуюся допустимым управлением Как и выше, будем иметь ^\V(t, y(t, elt , е„), u(/, е„ , ej) dt = -=Z f W(t,y(t,elt , Bm),Z,)dt=(k\[y(t,et, .^)-у1]). <=' of Положим Ef^X/e Тогда, дифференцируя последнее равенство по е и полагая е = 0, найчем k=^y(/„ Ц, , em) = X t,k„ (10 97) где k, = Z(/„ в/ХЦО,, у"(в,), й,)— f(в7, у" (в,), и"(в,))] В предыдущей теореме было показано, что при выполнении условий а), б), в) существует вектор Я,1 такой, что будет (Я,1, к)^0 при любом выборе вектора к по формуле (10 96) Вывот самой формулы предполагает лишь непрерывную диф- ференцируемость функций /„ s = 0, 1, , я, по компонентам вектора х Покажем, что при выполнении только этого условия также существует вектор Я.1, для которого будет Я (8, у°(0), й) — Н(д, у0 (6), u°(G))>0 при Q£[t0, /,], u£U Установление эюго утверждения и приводит к доказательству принципа максимума дтя данного случая Предположим, что вектор —е0, е0 = (1, 0, ,0) можно представить в форме —e0 = zIT/'</. H предположим, что среди векторов k1( , km имеется т. линейно независимых Иначе говоря, предположим, что вектор —е0 лежит внутри выпуклого конуса, натянутого на совокупность векторов (10 96), Покажем тогда, что обязательно будет существовать управпе- ние u = u(/, e,, , еот) доставляющее функционалу У (и) меньшее значение, чем J (u°).
154 ОПТИМАЧЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ [ГЛ II Будем считать, что такое управление существует Тогда ему соответствует движение у = у(/, ги , гт), у = у° при t = t0, ys=y\, s = l, , п, при t = ti Умножая тогда (10 64) на матрицу Z(tlt t) и интегрируя в пределах от t0 до tx, получим y(tt. е„ . , eJ—Zit,, t0)y° = \Zitx, t)[i(t,y(t, elf , ej, u(/, 8l eJ)-"Py]rf/ '• (10 98) Полагая в (10 98) e, = e2= . .=e/a = 0, найдем соотношение для u°(0. У°(0- 1!3 которого, учитывая (10 98), получим У(<1. е„ , гя)—у1 = = ]z{tt, t)[(f(t,y(t, е), и(/, е))- -4t, y°(t),»0(t)))-P(y(t,z)-y°(t))]dt. (1099) Положим в (10 99) У(<1, «1. .... О—У1 = <£*/!</• (10 100) / = i Уравнение (10 99) при условии (10 100) обязательно имеет решение е ^= 0, ьх = е2 = . . = ет = 0 Вычислим матрицу Якоби правых частей системы (10 99) по переменным е,, , ет при eI = e2= =em = 0 Легко заметить, что столбцами матрицы Якоби будут векторы kf, j — l, . , т Следовательно, ранг этой матрицы будет (т+1) Поэтому уравнения (10 99), (10 100) будут иметь решение в/= 8,(6) при достаточно малом е ^ 0 Причем е/(е) = т/е + 0(е), /= 1, . , т Здесь 0(f) — величина порядка малости выше чем е При таких величинах е., ести е достаточно маю, управаение u(t, e,, , гт) будет допустимым, будет переводить систему из начального состояния х° в конечное х', и будет доставлять функционал J (и) значение У (и0) — е, что невозможно, так как J (и0) -оптимальное значение функционала У (и) Это показывает, что вектор (—е0) не может лежать внутри упомянутого конуса; следовательно, он лежит либо на его поверхности, либо вне его А тогда должна существовать разделяющая гиперплоскость (л.1, (у—у1)) —0 такая, что будет (X.1, к)>0 и (—k1, e0X0, где к определяется равенством (10 96) Это и устанавливает существование искомого вектора К1
§ 101 OIIT1IMA IbHOF ДЕМПФИРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 155 4° Перейдем теперь к изучению процессов управления возникающих при рассмотрении конфликтных ситуаций Пусть задана система дифференциальных уравнений x = f(/. х, u„ u2), (10 101) где х—фазовый вектор системы, и, и и2 — управления, f(/,x, u,, u2) — векторная функция Будем считать, что размерность векторов х—п, и, — г,, и2 — гг Предположим, что заданы начальное и конечное состояния си- сюмы х = х° при / = /,„ х^=х' при t=-tx, где /.^^—фиксированные ЧИСЛЭ Будем считать, что управления Uj и иг обладают такими свойствами, что на движениях системы (10 101) и этих управлс- ннях возможно определить функционал J «./(и,, u2) (10 102) Требуется найти такие управления и", и", для которых будет min max (J (u„ иг))=та\ min (У (и^ и2)) = У(и{, и°) (10 103) u,eU,uteU, и^иг и,'U, Злесь U1, U2— некоторые множества допустимых управлений Заметим, что при определении управлений \х\ и и" иногда используются дополнительные ограничения на допустимые управления и, и и2 Эти дополнительные ограничения могут описываться как аналитически, так и с помощью различных требований общего характера Например, управления и, и и2 должны быть такими, чтобы существовали решения системы (10 101), переводящие систему из начального состояния в конечное, или чтобы была устойчивость какого-либо движения и т д В литературе по теории дифференциальных игр управления и, и и2 называют иногда стратегиями игроков Тогда фазовый вектор х будет описывать их совместное состояние Совокчпносгь дв\х стратегий (u,, u„) называется ситуацией Ситуация (uj, u"), при которой имеет место (10 103), называется ситуацией равно весия Стратегии uj, u? называются равновесными или оптимальными Функционал (10 102) называют ценой игры, а его значение в ситуации равновесия—значением игры Перейдем к изложению способов разыскания достаточных и необходимых условий существования ситуаций равновесия, а также способов их приближенного построения Пусть задана Функция двух аргументов хУ(х, у), принимающая вещественные значения при х£Х, у £У, зафиксируем элемент х и найдем множество таких элементов {у} — Yx, для которых »F(x, y;= max4r(x, у) = Ф(х). уб У
156 ОтИМАЧЬНЫЕ CIICTI МЫ УПРАВЛЕНИЯ [п ц Пандем далее такие элементы {х£Х\, чтобы было ф(х)^гшпф(х) Тогда будем иметь ср (х) = min max Ч^х, у) Из этого опредеаения вытекает, что для любой точки (х, у), где Ъ€.УХ' будет гК(х, у)<Чг(х, у) Аналогично, если maxmm4f(x, у) = Ч;(х, у), то будет Ч'(х, у)<ЧЧх, у) Из этих соотношений вытекает, что при тштачЧ'(х, у) --maxminH' (х, у) = г1г(хи, у0) (10 104) будет чПх„ у)<Т(х„, Уо)<Чг(х, у„) (10 105) Заметим, что неравенство (10 105) является достаточным условием для выполнения (10 104) Действитетьно, min4r(x, у)<Ч'(х, уХта\Ч'(х, у), * € X у е 1' огк>да имеем mm max Ч'(х, yj^min^fx, у), maxminHMx, y)<: min max xIf(x, у) уеУ «ex xe,\- )6C При выполнении (10 105) б\дет minmaxxK(x, y)<f(x,, y0), а также maxmin4'(x, у) ^ Ч (х|)% у„), отк>да имеем, чш при выполнении (10 105) обязательно будет иметь место условие (10 104) В приведенных выше расс\ждениях предполагается, что соответствующие экстремальные значения функции достигаются Теорема 105 Пусть 1) существует непрерывно дифференцируемая функции V = V(t, x), заданнич при 1£[1„ /,], х £ £„, l'(/„ xJ-0,
§ 101 011ТНМЛЧЫ10К ДЕМПФИРОВАНИЕ ПРИХОДНЫХ ПРОЦЕССОВ 157 2) управления \\\{t, x), u°(f, x) удовлетворяют условиям Wit, х, u„ u4)^W(t, x, u1,', u«)^W(t, x, u°, u,) (10 106) и переводит систему (10 101) из начапьного состояния в конечное, где W=-^+(gra(\V, \((, х, ulf u2)) + /„(/, x, u„ ut) (10 107) \\r/(t, x, и', uj) = 0, u,6L/„ ut£U. Тогда и? и и0, являются оптимальными стратегиями по отношению к функционалу У-{/„(*, x, u,, o,)dt Действптетьно, н\сгь и, - и, (/, х)££/, обладает тем свойгг- вом, что при \прав1енип (и,, и") система (10 101) переходит пз начального состояния в конечное Обозначим решение системы (10 101), соответствующее этим управлениям, х(/, и„ и!!) Левая часть неравенства (10 106) становится тогда известной функцией времени Инге1рируяее в преде iax от /„ до /,, найдем $/„(/, х, u, uj) dl ^ V((0, x°) (10 108) Если управление (и,0, и„) переводит систему (10 101) из начального состояния в конечное, то аналогично пз (10 106) будем иметь V(l0, x°)>$/„(/, х, uj, ut)dt ПО 100) Пз равенства (10 107) убеждаемся, ито при управтенпн (и", и") имеет место соотношение V(tu, xu) = $ /о С х- "?■ u°i)dt Из последнего равенства и неравенств (10 108) и (10 109) имеем J (и?, и2)<.У(и;'. и'ХЛи,, и\) Это показывает, что стратегии (uj, u") являются оптимальными ло отношению к функционалу J (ult u,) Предположим теперь, что функция V((, x) дважды непрерывно дифференцируема, и пусть также и°(/, х) и u°2(t, x) непрерывно дифференцируемы, тогда, дифференцируя по компонентам вектора х
158 0ПТИМАТЫ1ЫЕ СИСТКМЫ УПРАВЛЕНИЯ 1ГЛ ц равенство (10 107), находим dxj - dxj + fa duu ' dxj + fe duti' dxj — U- Так как выполняется соотношение (10 106), то будем иметь dW/dul{ = 0, « = 1, .. , г„ d\V/duik = 0, ft=l, . , rf, при u, = uj, u2 = u!J Отсюда имеем dW/dv, = 0 (10 ПО) Положим ~k, = dujdxj при х = х°(0, где х°(0—движение системы (10 101), соответствующее управлению (uj, u") Тогда из (10 ПО) получим d~'i , V а *Ы'.»'(0. »?■"".) , dUit. x°(/), u;. uj) _п . , (10 111) Положим Тогда система (10 101) и уравнения (10 111) мог^т быть записаны в форме канонических уравнений х, = dH/dkj, iJ = — dH/dxi, / = 0, , л (10 112) Подставим в неравенство (10 106) векторную функцию x°(t) Тогда это неравенство может быть переписано в форме ~ + H(t, x«(0. u„ uS)>^- + (//(/, х»(0, < uj)> ^•^ + Я(/, хв(/), uj, ut), откуда имеем #(/, х»(0. "i. и;)>Я(/, х°(0, uj, u°)>#(/, х°(0, u», ut), что означает = //(/, х" (0, и», и») (10 113) Отсюда вытекает следующая георема
^ 10] ОГППМЛ 1Ы.ОЕ ДРМПФНРОВАНИЕ ПЕРЕХОДНЫХ ПРОЦЕССОВ 159 Теорема 106 Если выполнены усювия теоремы 10 5 и функция V(l, х) яв1ястсч дважды непрерывно дифференцируемой и'о своим аргументам, а векторные функции u\(t, х), uj(/, x) непрерывно дифференцируемы, то uj, u\ явгяются оптимальными стратегиями по отношению к функционалу (10 102) и, кроме того, существуют функции Я, (/ = 0, , п), которые связаны с оптимальными стратегиями и движением x°(t), соответствующим им канонической системой (10 112) При этом функции Н удовлетворяет условию (10 113) Замечание 3 Если задано начальное состояние х = х° при t = t0 ii конечное состояние располагается на многообразии g/(x') = 0, /=1 k, (10 114) х = х1 при / = /,, и если J (ult u2) = Я (х1)+$/„(', x, u„ u,)d/, (10 115) то теоремы 10 5 и 10 6 остаются в силе при условии, что соотношение V(ll, x2) = 0 заменяется соотношением К(/„ х1)-Я(х1) (10 116) Разумеется, что (10 116) имеет место на многообразии (10 114) Для определения решений канонических уравнений, вообще говоря, при k < n не будет хватать краевых условий Дополнительные условия определяются с помощью условий трансверсачь- ности и из (10 114) Будем считать для определенности векторы gradgy ничейно независимыми Тогда, как было показано ранее, из (10 116) при условии (10 114) вытекает gradV(/„ x1)==g--adP(x1)+2//grad^., (10 117) где /,, , Ik — некоторые вещественные постоянные Иначе из (10 117) имеем MM = ^+i^, s-l. ,n (.0 118) Условие (10 118) совместно с начальным условием х = х° при * = /„ и условием (10 114) дают потную совокупность краевых условии, необходимых для нахождения решении канонических сравнений
160 ОПТИМАЛЬНЫЕ СИСТЕМЫ УПРАВЛЕНИЯ | ГЛ || Пример 10 4 Пусть задана система х = Р (/) х+ Q (/) и, + /? (/) щ + F (/), (10 119) У = С (А'х + B'ut + Sjuj)dt + C*ult (10 120) A]xl + bt = 0, /=1. ... k Возьмем V (I, х) = л*х + ф(/) Будем считать, что элементы матриц Р, Q, R а также компоненты векторов А, В,, В, и F являются вещественными кусочно- непрерывными функциями, заданными при / £ I/,, 19\ Векторы Ау, / = 1, , *, Г будем считать вещественными, a b/. j = 1, , k — вещественные числа Предположим далее, что векторы А/ линейно независимы. Положим Z = V(t, x)+^F0clt, Fa = A*x + B*ul+ Btut Тогда имеем Z=W =V + F0= (k* + X*P+A*)x + {X'Q + B*x)u, + a*R + Bt)Ut + \*F+v. Пусть управления и, и и, стеснены ограничениями |«,(l|<J, <,= !, . . г„ |«./.|<l. /, = 1. .... г, Тогда «u =-s|gn^*Q + B*i)«1. (10 121) u°(l=sign(X*fl + B*) £j, «i = l, ru 1г=1, ,\ r2 При управлениях (10 121) будет иметь место соотношение *«. х. u,,ti!)>V</. x, u?. u?)^U7«, x, u?, u() (10 122) Выберем теперь вектор X и функцию ф так, чтобы W(t, x, uj, и°) = п Тогда будем иметь (А* + Х*Р-М*)=0, (10 123) Ф- 2 |(A*Q + flT)l.l + 2 \(M+Bl) ',1 = 0 (10 124) (, = 1 <,= ! При выполнениях (10 123) и (10 124) управления (10 121) доставляют функционалу (10 120) значение У (и?, и*) так что имеет место У (и,, и?) Ss J (и?, и?) 5» J (и?. и4) Тем самым uj, uj—оптимальные стратегии Эти стратегии зависят от * про невольных постоянных /|, , /ft, значения которых можно определить из условий Л/х, + в/ = 0, /=1 *.
Глава 1П АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ §11. Синтез оптимального управления в линейных системах с бесконечным временем существования П\сть задана система п дифференциальных уравнений вида Будем считать, что функции psi(t), i = l, ... п и qsi(t), i' = l, .. г, s=l, ..,n, заданы при г5э0, вещественны, ограничены и непрерывны Будем далее пользоваться векторной записью системы (11 1) dx/dt = P(t)x + Q(t)u, (112) где х — п мерный вектор (xlt , л:,,), и —r-мерный вектор (ы„ ,иг), Р и Q — матрицы порядка соответственно пхп и пхг Предположим, что система (11 2) описывает процесс регулирования в некоторой физической системе, так что функции и,, , иг являются управлениями, а функции хи , хп—фазовыми координатами системы Предположим, что задан функционал J = \w*dt, (113) где W2 — квадратичная форма ветчин л„ хг, . , ха, «,, ы„, . ., и, вида W2 = { 2 { а1кх,хк + 2 Д 2 *„</"/ +f 2 , W/ (• • 4) Правую часть (114) можно записать в векторно-матрнчной форме, а именно 117 • = хМх -|- x*Bu + u*B*x -f u*Cu, где А, В, С—матрицы соответствующих размерностей, причем звездочка означает операцию транспонирования. Будем считать,
162 ЛНЛЧИТНЧЕСКЛЯ ТЕОРИЯ ОПТИМА1Ы1ЫХ РЕГУТЯ10ГОВ 11J1 И) что все коэффициенты квадратичной формы (11 4) заданы при /^0, вещественны, ограничены и непрерывны Заметим, что в векторно-матричной записи квадратичной формы (114) считается всегда, что матрицы Л и С симметричны Сделаем предположение, существенное для дальнейшего, а именно будем считать, что квадратичная форма u*Cu является положительно определенной функцией переменных Иначе говоря, будем считать, что существует число а>0 такое, что u*CuS* ^и2м/ при всех t >0. Определение 111 Управления «„ .. , и, называются допустимыми, если выполнены условия 1) ",= !>,, (О*/. / = 1. . , г, (115) где т,;—функции, заданные при t^O, вещественные, ограниченные и непрерывные, 2) каждое решение системы (11 1), удовлетворяющее начальному условию х = х0 при t — t0, удовлетворяет неравенству || х ||«:, || х. || «-'.«<-'.) (116) при I ^ /0 S* 0, где сх и ct —положительные постоянные, зависящие, вообще говоря, от функций niji(t), / = 1, . ,/■,1 = 1,. , п, а Если в систему (11 1) подставить допустимые \праваения, то она превратится в систему обыкновенных линейных однородных дифференциальных уравнений, нулевое решение которой будет асимптотически устойчиво по Ляпунову, причем равномерно по г0^0 Заметим, что допустимые управления можно определить векторным равенством и (г, x) = M(t)x, что следует из (115) Выберем некоторый начальный вектор х„ и некоторое допустимое управление и(/, х) Тогда функционал (11 3) можно записать в форме У(х„ u) = ]w*dt о В силу (11 6) величина J (x0, и) конечная на любом допустимом управлении Определение 112 Допустимое управление u0 = M0(t)x называется оптимальным по отношению к функционалу (11 3) при
§ 11] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЧСННЯ 163 фиксированном х0, если среди веек допустимых ynpaeienuu u(t, x) = — M(t)\ оно доставляет величине J (x0, и) наименьшее возможное значение Перейдем теперь к отысканию условий существования оптимального управления и построению методов его вычисления Лемма 111 Есги и(/, х)=_М(/)х есть допустимое управление, то управление u(t, x)-\-&u{t, x) также будет допустимым при достаточно малом |е|, где u{t, x) — N(t)x Здесь N (I)—матрица порядка гхп, все элементы которой заданы при t Ss 0, вещественны, ограничены и непрерывны, а е—вещественное число Доказательство С целью использования в дальнейшем некоторых резуаьтатов теории устойчивости движения изложим доказательство этой леммы несколько подробнее Положим W = t^lk{t)xiXk, (117) где B(ft(/) заданы при /^0, вещественны, ограничены, непрерывны и таковы, что существуют два положительных числа р\ и 62, удовлетворяющие неравенствам -Р1||х||*<1Г<-р1||х||» (118) Пусть задана произвольная система линейных дифференциальных уравнений х = Р(/)х, относительно которой известно, что она имеет асимптотически устойчивое нулевое решение, причем каждое ее решение удовлетворяет неравенствам вида (116) Тогда функция V = \[~W]dx (119) может быть представлена в форме V = ^а.-м, (1110) где alk, k=l, ..,/г, заданы при t^O, вещественны, непрерывны, ограничены и таковы, что существуют два положительных числа а, и аг, удовлетворяющие неравенствам aJIxH^V^aJxH* (И 11) Ясно, что функции V и W будут связаны между собой соотношением dV/dt = W, (11 12)
164 ЛНЛЧИТИЧЕСКЛЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ III или S=l L<=1 J Полная производная в уравнении (11 12) вычисляется вдоль интегральных кривых рассматриваемой линейной системы и, следовательно, имеет вид левой части равенства (11 13) Заметим, что справедливо также и обратное утверждение, а именно если существуют две функции вида V и W (11 10) и (11.7), удовлетворяющие неравенствам (11 11) и (11 8) и связанные между собой уравнением (11 13), то всякое решение рассматриваемой системы удовлетворяет неравенству вида (11 6). Итак, пусть матрица Р имеет вид P(t) = P(t) + Q(l)M(t). Так как управление u(/, \) = M(t)x допустимо, то для выбранной функции (11 7) можно построить при помощи (11 9) функцию У, удовлетворяющую неравенствам (И 11) Рассмотрим далее полную производную функции V, вычисленную в силу системы (11 1) при u = M{t)x-rtN(t)x Тогда ^=^ + E^p(/)x + QW^Wx + E<2(')W(/)x],, где индекс s означает, что берется s-я компонента вектора, стоящего в скобках Из соотношения (11 12) имеем dVjdt=W + \Vt, (11 14) где lFi = eZ5;tQw;V(/)xb (" 15> Из формул (11 15) и (11 14) следует, что е всегда можно выбрать столь малым по модулю, что будет выполнено неравенство -PJIxll'^W + n^-MxIl», где р„ р3—положительные постоянные При таких е функции V и W удовлетворяют приведенному выше утверждению Значит, при таких е выполнено неравенство (11 6) для любого решения системы (11 2) при и = [М (/) -|- eN (t)] x,
§ 11| СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 1Ь5 и, следовательно, это управление является доп>стимым Лемма 11 1 доказана Теорема 11 1 Для существования оптимального управления tin = М0 (0 х для системы (11 2) при любом выборе начального вектора х0 необходимо и достаточно, чтобы уравнение £ + eQC-1Q*e + e[P-QC-lB*] + [P*—BC-lQ*)e- — А + ВС~1В' = 0 (11 16) имею вещественное, непрерывное, ограниченное решение, заданное при t~^0 в виде такой симметричной матрицы Q(t) порядка пхп, чтобы управчение и = С-Ч<Э*Э — В*]х (11 17) было допустимым При этом матрица M0(t) в оптимальном управлении определяется формулой MAt)=C->[Q*e-B*] Доказательство Необходимость Пусть и0 == M0(i)x есть управление для системы (11 2), оптимальное по отношению к функционалу (11 3) при любом выборе начального вектора х0. Положим F„ = $ U72(T, x, u0)dx (11 18) Векторная функция х, стоящая под интегралом в (11 18), является решением системы (11 2) при управпеиии и = и0 Функция V0, как следует из предыдущего, будет квадратичной формой Поэтому ее можно представить в виде Va = — x*Q(t)x, где Q(t)— некоторая симметричная вещественная матрица, опре- депенная единственным образом Действительно, обозначим через Y„(t) такую фундаментальную систему решений для системы (11 2) при управлении u = u0, что Y0(0) = E Тогда любое решение системы (11 2) с начальным условием х = х„ при t=0 запишется так х(0= *"„(/) х0 Подставляя это выражение решения в (11 18), находим -х0*У;(/)в(0У.(0х.- = $х0*[У0МУи-1 Y*0BMaY0-\Y;M;B*Y0-\Y;AraCM0Y0]x0dT (11 19)
166 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ |Ц Так как (11 19) имеет место при любом начальном векторе х0| то при любом /^0 справедливо равенство - у;е (о y0 = J y; [а ь вм0 + м;в* + м;см0] y0 dx, откуда в(/> = —(У;)-1! J Yl [л + вм0+м;в* + м;см0] Y0dx y~x (11 20) Из (11 20) вытекает, что матрица 0(/) определяется по матрице М0(() единственным образом Покажем теперь, что матрица 0(/) удовпетворяет уравнению (11 16) С этой целью воспользуемся условием оптимальности управления и„=Мо(Ох Чтобы вывести это условие оптимальности, рассмотрим допустимое управление вида u = u0 + eW(0x, где N (/) — произвольная, но фиксированная, вещественная, ограниченная, непрерывная матрица, заданная при *>0 Зафикси руем некоторое начальное условие х„^=0 Тогда из оптимальности управтения и„ при любом начальном условии вытекает, что функция J [х„, u0-j-e/V (/) х] имеет наименьшее значение при е = 0 Следовательно, выполнено равенство dj/de = 0 при е = 0 (И 21) Обозначим через х = х(/, е) решение системы (112) при u = u0 — eN (i)x и начатьном условии х = х„ при/ = 0 и положим %, = дх'де при е = 0 Дифференцируя систему (11 2) при упомянутом управлении вдоль такого решения по параметру е и полагая е = 0, находим что векторная ф\нкция | удовпетворяет системе уравнений d&dt = Pa\+QNx (1122) и начальному условию | = 0 при / = 0 Последнее имеет место в силу того, что нача тыюе условие х„ фиксировано и не зависит от f В системе (11 22) через Р0 обозначена матрица Pa = P+QM0 Векторная функция х, входящая в сиаем\ (11 22), есть введенное выше решение системы (11 2) при u = ti0 с начатьным условием х0
§11] СИИТЦЗ 0ПТНМА1ЫЮГ0 У11РАВЛП1ИЯ 167 Из системы (11 22) находим 6 = y.(0SlV(T)Q(T)l(T)dT, (11 23) о где 1 = Nx — r-мерный вектор, принимающий наперед заданные значения в любой фиксированный момент / Это обстоятельство имеет место потому, что вектор х (t) не является нулевым при любом /6 [0, +оо) Следовательно, каждая компонента вектора 1, являющаяся скалярным произведением соответствующей строки матрицы N на этот вектор, может принимать наперед заданные значения в любой фиксированный момент t за счет выбора упомянутой строки матрицы Перейдем теперь к преобразованию равенства (11 21) Дифференцируя под знаком интеграла по е и полагая е = 0, находим J{iMx + 6*fiu0 + [VM,*+l*]fl*x + [6»Ai;+l']Cu4d/=0. (11 24) о Равенство (11 24) может быть переписано в форме ]{1*[А + вм0-\ м;в* + м;см»)х + 1*[в* ьсм0]х}<*/ = о. Используя (11 23) и меняя порядок интегрирования, находим ]\*\Q*(Yl)-1]Yt0[A + BM0 + M;B* + MtCMB]xdx + B*x + + CAfnxJ<« = 0. (11 25) Из свойств вектора 1 вытекает, что (11 25) имеет место тогда и только тогда, когда справедливо равенство Q*(Y*t)-i]Yl[A + BM0 + M;B*-\-M*oCMu]xdT + [B* + CMo]x = 0. (11 26) Заменим в равенстве (11 26) под знаком интеграла векторную функцию х по формуле x — Y0(t)xn Вынесем постоянный вектор х„ из-под знака интеграла и затем вновь заменим его выражением Y^(t)x Тогда (11 26) примет вид Q*Qx = [CM0 + B*]x. (1I27)
168 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ III В равенстве (11 27) матрица 0(0 определяется выражением (11 20) Условие (11 27) есть необходимое условие оптимальности, так как оно определяет необходимый вид оптимального управления и„ uo = C->[Q*0—B']x Так как управление и0 является оптимальным для любого начального вектора х0, то, следовательно, (11 27) имеет место при любом х. А тогда необходимо должно иметь место равенство Q*6 = CM0 + B*, откуда M0 = C-l(Q*e-fi*). (1128) Матрица 0(0, определяемая (11 20), задана при /^0, непрерывна и ограничена (см доказательство леммы) Остается показать, что она является решением уравнения (11 16), а это проверяется непосредственно путем подстановки (11 20) в уравнение (11 16) с учетом равенства (11 28) Достаточность Пусть существует вещественное решение 0(0 уравнения (11 16), заданное при t^0, ограниченное и непрерывное, такое, что управление u0(x, t) = M0(l)x, где M0 = C-l(Q*d — B*), является допустимым Тогда система (112) имеет оптимальное по отношению к функционалу (11 3) управление при любом выборе начального условия х0, и это оптимальное управление определяется формулой u0 = M0(0x Действительно, введем в рассмотрение функцию V0 = $ir*(x, х, ut)dx. (11 29) Из предыдущего вытекает, что Уо=_х»Э(0х Оптимальность управления и0 = М0х означает следующее' зафиксируем некоторое начальное условие х0, тогда при любом допустимом управлении ut^u0 будет J{*0, "„)<«/(х0. "i).
§11] СИНТЕЗ ОПТПМАЧЬНОГО УПРАВЛЕНИЯ 169 Последнее неравенство можно написать также в форме У0(х„ 0)<j>*(', х, \xjdt. (11 30) о Интегрирование в неравенстве (11 30) осуществляется вдоль интегральной кривой системы (11 2), исходящей в момент / = 0 из точки х0 при управлении ut Пусть управление и0 не является оптимальным при данном х0 Тогда существует другое допустимое управление и,, такое, что У0(хп> 0)>$Г2(/, х, Ul)d/. (11 81) о При достаточно мачых /^0 в силу непрерывности также будет иметь место неравенство К (х (0, 0 > ] W* (т, х, ux) dr. (11 32) Рассмотрим функцию 2(0 = V0(x(0, 0 — ]w2(i, х, ujdt. (11 33) Из допустимости управления ц, и ограниченности матрицы в(/) вытекает, что г(/) —0 при t—ь + оо Вычислим = — [(Ях + Quo)*0x 4- x*e\Px+Qu0\+x>'™x\ + W*(t, x, ut) (И 34) Из представлений (11 29) и (11 33) следует, что г==0 при i^ss u0 Из равенства u0 = /W„x вытекает, что функция г имеет при Uj = u0 наименьшее возможное значение, следовательно, при щ^Ёи0 будет z8^0 Тогда из (11 31) и (11 33) следует, что г(f)>z(0) > 0, а это противоречит утверждению, что z(t)—>-0 при t—* + oo Отсюда вытекает, что управление и0 является оптимальным для фиксированного х0 Ввиду произвольности вектора х0 можно считать управление u„ = Af0(i)x оптимальным для любого выбора начальных устовий. Отметим, что из доказательства также следует, что если их—допустимое и ut^un, то J (Хо, U0) < У (Х0, Ul)
170 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ 111 при х0¥=0 Действительно, если г(0) = 0, то существует момент Г, для которого z(/)>0, а тогда z(/)>0 и следовательно, z(/)^z(/)>0, чго невозможно по предыдущему Определение 11 3 Непрерывная векторная функция и(/), заданная при t^O, называется допустимой для х0, если интегральная кривая системы (11 2) х=--х(0 при u = u(0, x(0) = xo обладает свойством х —► 0 при I —» оо и интеграл JU72(x, х(т), и(т))Л (11 35) о сходится Определение 114 Допустимое в смысле определения 11 3 управ lenue u0(t) называется оптимальным, если оно доставляет наименьшее значение функционалу (11 35) среди всех таких допустимых управлений Замечание 1 Если существует ограниченное, непрерывное, заданное при t^O решение 6(0 уравнения (11 16), такое, что управление u„(/) = C-'(Q*6-B»)x явтяется допустимым в смысле определения 11 1, то существует оптимальное управление в смысле определения 11 4, задаваемое формулой u0(t) = C-1(Q*3 — B*)Y„K„ (11 36) Это утверждение является непосредственным следствием рассуждения, приведенного в доказательстве достаточности теоремы 11 1 А именно, здесь следует ввести в рассмотрение функцию z{t) и убедиться, что г(1)^0 на любом дощстимом в сммсте определения 11 3 управлении и, далее, что z(t)—-0 при t —* со для всех_ таких управлений Неравенства z(/);ss г(0) > 0 inn г(0^2(0>0 будут противоречить этом> свойству, сети пред лоюжить, что управление (11 36) не оптимально всмыстеопре деаення 11 4 Теорема 112 Уравнение (11 16) тогда и тогько тогда имеет вещественное, непрерывное, ограниченное решение 0(0. заданное при / ^ 0 и такое, что управление u„ = C-1[Q*0(O— B*]x является допустимым в смысле определения 11 I, когда существует совокупность п линейно независимых векторов х0,, ..., хоп, обладающих следующими свойствами 1) система (112) имеет оптимальное в смысле определения 11 4 управление u0J(l) для начального условия хи/ (/ = !,. , п).
§ 11] СННТЬЗ 0ПТИМЛ1Ы1010 УПРАВ1ЕНИЯ 171 2) управление u(x, t) = M(t)x, где M(t) — U (t)[D(t)]~l, допустимо в смысле onредегения 11 1. Здесь U(/)—матрица, у'-й столбец которой есть вектор u0/(t); D (t) — матрица, /-м столбцом которой является решение уравнения (11 2) х/ = х0/ при управлении u = u0/(/) с начатьным условием ху = хоу при / = О Доказательство Необходимость условия настоящей теоремы вытекает из замечания 1 к теореме 11 1 Остановимся на доказательстве достаточности, для чего построим функцию у0 = $У*(т, х(т), Z)dT, (11 37) где х(/) —решение системы (112) при управлении и = и(х, /) с начальным условием х = х0 при t = О Возьмем некоторое допустимое в смысле определения 11 1 управление u(x, t) и покажем, что при хафО обязательно будет /(х0, и)>У(х0, и), и Фи Иначе говоря, покажем, что и(х, t) оптимально в смысле определения 11 2 для любого х0 Тогда из доказательства необходимости теоремы 11 1 следует, что требуемое решение уравнения (11 16) существует, причем это решение будет совпадать с матрицей квадратичной формы (11 37), взятой с обратным знаком Итак, требуется установить, что и(х,() является оптнмать- ным управлением в смысле определения 11 2 для любого началь ного вектора х„ Возьмем некоторое допустимое управление и (х, /) и зафиксируем начальное значение вектора х0=^0 Построим функцию г(1) z{l)^Vn{x(0, /) — J W2(т, х(т), u)dx, dz/dt = 0 при u=u(x, О Следовательно, как вытекает из доказательства достаточности теоремы 111, теорема будет установлена, если показать, что u(x, t) доставляет функции dz/dt наименьшее возможное значение по сравнению с другими допустимыми управтениями u(x, t) Ф\нк- цня dz/dt принимает свое наименьшее значение по сравнению с другими допустимыми управ тениями и (х,/). Функция г (t) принимает свое наименьшее значение при umi„ = C-I[Q*e — В*\х, (1138)
172 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ |wi III где [—6]—матрица квадратичной формы (11 37), ибо (11 38) есть необходимое условие минимума z(t) как функции переменных и,, . , и, Выражение (1138) действительно дает наименьшее возможное значение функции z(t), так как квадратичная форма u*Cu положительно определена, и, следовательно, выполнено достаточное условие минимума Таким образом, остается показать, что u(x, 0 = umi» С этой целью воспользуемся необходимыми условиями, которые получаются из факта оптимальности управления u0/(i) При выполнении условий теоремы 11 2 для каждого начального значения хоу- можно указать семейство управлений Uj = u0J(t) + eVj(t,e), допустимых в смысле определения 11 3 при любом достаточно малом |е| Эти управления обладают тем свойством, что решения системы (11 2) хД/, е) при таких |е| удовлетворяют неравенству || х,(/,е) || <«-*', (1139) где а, Ь—-положительные константы, не зависящие от е Здесь подраз\мевается, что \}{t, e) = x0/ при /== О, а векторные функции Vj(t, е) при е = 0 принимают любые наперед заданные значения и являются непрерывными по t и е функциями, заданными при /^0 и |е|^е0 и непрерывно дифференцируемые по е Б^дем далее через Vj(t) обозначать векторные функции V/(t, 0) Установим справедливость приведенного утверждения Для этого рассмотрим систему дифференциальных уравнений (11 2) при и = Л1(/)х, где M(t) определяется формулой M(t) = U(t)[D(t)]-\ Путем непосредственного вычисления можно установить, что решение хД/) этой системы с начальным условием хД£) = х0/ при t — 0 совпадает с решением системы x = P(0x + Q(0uey(0 (1140) при том же начальном условии, тес решением х0Д0 системы (11 40) Рассмотрим систему уравнений \ = [P+QM]\ + tQN(t)x, (1141) где N (t) — произвольная, непрерывная, ограниченная матрица, заданная при /5*0 Обозначим решение уравнения (1141) сна чальным >повием х„у при / = 0 через хД/, е) Ясно, что хД/, е) = = хД/) при е = 0 П)С1ь У (0 —такая фундаментальная система \
§ П] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 173 решений для системы (11 41) при е = 0, что К(0) = £. Тогда х, (/, е) = х, (0 + гУ (/) J У"1 (т) Q (т) N (т) х, (т, е) dx (11 42) о Так как Л1(/)х/(0 = и0/(/), то из системы (11 41) и (11 42) получим dx/dt = Px+Q[uol(t) + tVt(t, в)], (11 43) где V; (/, е) = MY (О J У"1 (т) Q (т) ЛГ (т) Х/ (т, е) dx -J- + eiVx, (/) + еЛГУ (/) J У"» (т) Q (т) N (т) Х/ (т, е) dr. о Следовательно, У/ (/) = M (t) Y (0 $У-1 (т) Q (т) N (х) х, (т) dr. о Оставим пока в стороне доказательство того, что вектор V}(i) принимаег произвольные значения при надлежащем выборе матрицы N, и будем это предполагать Тогда из доказательства необходимости теоремы 11 1 немедленно вытекает, что оптимальное управление u0j(t) и соответствующая ему оптимальная траектория xf(t) необходимо удовлетворяют равенству Cuey(04Q'e-fl*]x/(0. (П44) где 0(0 определяется из соотношения (11 20), в котором У0, М0 заменены соответственно на Y (/), M(t) Пзсть задан произвольный начальный вектор х0, и пусть £|. • . in—его координаты в базисе, определяемом векторами "о/. /в 1. •• •. «I так что х0 = 2 xo/lj- Тогда векторная функция х(0=2 ЪМО /=| будет непременно являться решением системы (11 41) при е = 0 с"начальным условием х0 Отсюда, в частности, следует, что 2 ио; (О I, = 2 Л4 (/) х;(0 lj = М (0 х (/) = и (/, х).
174 ЛНА1ИТИЧЕСКАЯ ТЕОРИЯ ОПТНМА ТЬНЫХ РЕГУЛЯТОРОВ [п III Умножая теперь обе части (11 44) на |; и суммируя по / от 1 до п, находим n^x) = C-l[Q*e(0-B1x = umill Это равенство полностью_ доказывает теорему 112, ибо из него следует, что уравнение и(/, х) оптимально в смысле определения 11 2 При доказательстве теоремы 11 2 было испотьзовано утверждение о том, что векторы Vj(t) могут принимать наперед за чанные произвольные значения Покажем это Вектор Vj (/) = MY (/) J Y-1 (т) Q (т) N (т) х, (т) dx + Nx, (/) о может быть сделан произвольным лишь за счет выбора матрицы N (t) Обозначим через V (t) матрицу, столбцами которой являются векторы Vf(t) Эта матрица удовлетворяет уравнению V(t) = M(t)Y(t)lY-l(x)Q(T)N(T)D(T)dT + N(t)D(t), о откуда имеем N(t) = V(t)D-1(t)-\M(t)Y(t)\Y-1(x)Q(T)N(T)D(T)dT\D-l(t) Для вывода необходимого условия оптимальности достаточно использовать лишь такие векторы УЛО, которые удовлетворяют равенству V,(t) = Q при t^T, где Т — любое фиксированное положительное число Последнее уравнение определяет матрицу N (/) при любом выборе таких векторов V,(t), причем эта матрица оказывается непрерывной и ограниченной, заданной при t ^ О, что устанавливается с помощью метода последовательных прибти- женпй Следствие Из теоремы 112 вытекает, что построение оптимального управления и„(х, 0 = М,(/)х, если оно существует, можно всегда выполнить следующим образом Надо выбрать систему начальных условий х0/ (например, единичные векторы), построить din ник оптимальные управления в смысле определения 11 4 и оптимальные траектории Тогда матрица Mu(t) совпадает с М (i) (см теорему 11 2) Если оптимальные управления и оптимальные траектории в смысле определения 11 4 построены приближенно, но оказалось, что управление u (x, t) — M(i)x является допустимым, то оно
^ 11| синтез оптимального управления 175 б> дет сколь угодно близко к оптимальному управлению, если управления и0/(/) и соответствующие траектории Х/(0 достаточно близки к оптимальным В теореме 11 1 указывается конструкция оптимального управления с помощью матрицы 6(0, являющейся решением уравнения (11 16) Дадим способ последовательных приближений, обеспечивающий нахождение матрицы 6(0 с любой наперед заданной степенью точности Пусть W2(t,\, и)—положительно определенная квадратичная форма величин хх, .. , х„, ult , ur и пусть существует по крайней мере одно допустимое управление в смысле определения 11 1 Упомянутый способ последовательных приближений состоит в следующем Возьмем допустимое управление u,(x, t) = Mt(t)x и рассмотрим линейную систему дифференциальных уравнений dP + Q>(P hQM,) + (P* + M;Q*)e,- — [A + BMi + MXB' + MlCM^^O. (1145) Система (11 45) имеет единственное вещественное и непрерывное решение в, (О, заданное при />0 и ограниченное Оставляя пока в сюроне доказательство этого утверждения, положим u,(x, t) = M2(t)x, где ЛМО-С"1 (О [Q* (0 ©i (0-Я'(0J (И 4G) Тогда оказывается, что и2(х, t) будет обязательно допустимым управлением в смысле определения 11 1 Заменяя в системе (11 45) Л/, на УИ„ получим систему дифференциальных уравнений, имеющих единственное вещественное и непрерывное решение &г (/), заданное при t^O и ограниченное Аналогичным образом далее построим две последовательности в, (0, 6,(0, в5(0. • , и,(х, /), и,(х./), и3(х, 0 где uk+t (х, 0 = Mk+l(t)x—допустимое управление при любом k^?0, a Mk+l{l)=C-lU)[Q*(t)etU)-B*{t)], к =1,2, . Матрица 0Л(О есть единственное непрерывное и вещественное решение системы (1145), заданное при /psO и ограниченное. Разумеется, в (II 45) следует заменить /И,(0 "a Mk{t).
176 АНА1ИТИЧЕСКЛЯ ТР0РИЯ ОПТИЧ\ 1ЫШХ РЕГУПИТОРОВ [ГЛ III Теорема 11 3 Если a) W2(/, х, и) — положительно определенная форма относительно х,, ., х,„ и,, , иг, б) их (х, t) — = /Их (0 х—допустимое управление в смысле определения 11 1, то 1) для системы (112) существует управление и0 (t, х) = М„ (t) x, оптимальное по отношению к функционалу (113) для любого начального вектора х„, 2) последовательность 0, (/), 02(О. • сходится равномерно на каждом конечном промежутке [О, Т] к вещественной непрерывной и ограниченной матрице 0 (0, заданной при fs*0 и являющейся решением уравнения (11 16), 3) последовательность ut(x, *)■ иг(х- 0» сходится к оптимальному управлению и0 (х, 0 = /И0 (/) х (равномерно в каждой ограниченной области изменения величин xlt , х„, /) Доказательство Разобьем доказательство теоремы на несколько частей. 1 Покажем сначала, что уравнение (11 45) имеет единственное вещественное, непрерывное, ограниченное решение 0, (/), заданное при /^0 и любом выборе матрицы Mx(t) такой, что j правление ut (x, t) — МЛ (/) х является допустимым в смысле определения 11 1 Рассмотрим квадратичную форму V1(%,t) = lw2(x,x,ul)dx (П47) Из доказательства леммы вытекает, что матрица этой квадра тичной формы будет непрерывной и ограниченной при всех t^O Положим у,(х, /) = —х*01(Ох Дифференцируя (11 47) в силу системы (11 2) при u = u,(x, /), найдем — (A + BMl + MtB' + M'lCMl)\ x-0 (1148) Ввиду того, что в (11 48) х можно считать произвольным вектором, заключаем, что матрица квадратичной формы (11 47), взятая с обратным знаком, обязательно является решением уравнения (11 45) Таким образом, уравнение (11 45) имеет ограниченное решение 0Х(/), заданное при t^O Оно единственно, так как если бы существовало два решения, то их разность удовлетво ряла бы уравнению •^- + 0i(P-r QMJ + lF + MlQ^e^O (11 49)
§11) СИНТ11 ОПТИМАЛЬНОЮ ЛПРЛВТКННЯ 177 Пусть GJ/) з^О —ограниченное решение уравнения (11 49). Рассмотрим квадратичную форму xJ0t(/)x на решениях системы (11 2) при u = Ui(x,/) Найдется такой момент Та такой начальный вектор х„, что будет xJ9, (0 х0 Ф 0 Полная производя квадратичной формы V = — х*0,(/)х в силу системы (11 2) при u = u1(x, t) удовлетворяет соотношению dV/dt а0, откуда V(\(t), t) = K(x0, Т)Ф О Последнее равенство противоречит тому, что V(x(l),t)—*0 при t—«- + 0O, ибо 6,(/) ограничено, а решения системы (11 2) в силу допустимости управления и, удовлетворяют неравенствам (11 6) Таким образом, существование и единственность решения системы (11 45) установлены Установим здесь же формулу, полезную для дальнейшего Пусть uft(x, t) = Mk(t)\—допустимое управление Обозначим через Yk(i) фундаментальную систему решений для уравнений (11 2) при u = uft с начальным условием Yk(0) = E Матрица (см (11 20)) eK(t)=-(Yt(t))-1x X И К; (т) [А + ВМк+М*кВ* + М*кСМк] Yk(т) dx\ (Yk(t))-1 (11 50) будет ограниченным решением уравнения (11 45), если Мх заменить на Мк 2 Пусть 0,(0 — ограниченное решение системы (11 45), тогда управление u„(x, t) = M,(l)x, где Al,(/)=C-l[Q*(0el(0-fi*(0]. будет допустимым в смысле определения 11 1 Рассмотрим квадратичную форму Vi (xlt t) = — x*0l (0 x, определенную согласно (11 47) Эта квадратичная форма является положительно определенной, а полная производная, вычисленная от нее в силу системы (11 2) при u = u,(x, /), совпадает с — U72(/,x, uj Рассмотрим функцию Z1(/,x,u) = 5 + U7i4/'x,l0' (1151)
178 ЛНМИТИЧРСКЛЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РРГУЛЯТ01'ОВ [ГЛ III где dVjdl — потная производная, вычисленная в силу системы (11 2) при u = u(x, /) = Af (/)x Из сказанного выше вытекает, что 2,(/, х, и,) = 0 (1152) функция (11 51), как легко проверить, достигает своего наименьшего значения, как функция переменных «,, . , и, при u = u2 (x, 0 Следовательно, Z,(/, х, u2(x, 0X0 (11 53) Таким образом, производная dVjdt в силу системы (11 2) при и —us(x,/) выражается, согласно (1151), следующим образом dVxldt=*— W* + Zl(t, x, u2 (x, t)) (11 54) В силу (11 53) правая часть (11 54) есть отрицательно определенная функция переменных хи , хп, ы,, . .,ыг А тогда из доказательства леммы вытекает, что все решения системы (112) при рассматриваемом управлении удовлетворяют условию (11 6) Следовательно, иг —/Мг(/)х явтяется допустимым управтеиием Заметим счедующее" Если матрица 0А определяется равенством (11 50), то управление ц, + 1(х, /) = Af» + I(/)x будет обязательно допустимым при Mk+1(t) = C->(t)[Q*(t)Qk(t)-B*(t)] (11 55) 3 Последовательность 6,(/), 0г(/), .. равномерно ограни чена Действительно, введем в рассмотрение квадратичные формы Vk{\, /) = — x»0ft(Ox, fe = l,_2, .. Ясно, что V„(x, /)>0 при х££„, к=\, 2, .. Пусть 1^0—любой конечный момент времени, а у —некоторый фиксированный вектор Построим интегральные кривые системы (11 2) \k(t) и хА + ,(/) соответственно для управлений ил(х, /) и иА+, (х, I) с начатьным условием xft = xft + l—x при t—~t Тогда V„(k,~l) = \w-(tt хк, u„)dT, I
§ 11| СИНТЕЗ ОПТИМЛЧЬНОГО УПРАВ1ЕНИЯ 179 В ciny части 2 доказательства теоремы имеет место уравнение J- Vk (х* (0. О -}- W1 (/, х4+1 (/), иЛ+1) = 2» (Л хА+1 (/), ик+1), причем Zft(/, xft+1(0. u*+i)<0 Для О0 Интегрируя последнее равенство в пределах от /до -foo, получаем -Ук (х, 0 = - J W* (т, хА+1 (т), uA + l) dx + J Zk (т, хЛ + 1 (т), иЛ+1) dx. откуда V»(x, /)>Jll7*(T, хл+1(х), uft+1)dx Следовательно, Kft(x, 7)>УЛ+1(х, Г) Из этого неравенства вытекает, что построенные последовательные приближения монотонно улучшают управление Если обозначить через Я.(/) наибольшее собственное число матрицы [—0Х(О]. то окажется, что V„(x, 0 < Mlx 11*^^1 Это показывает, что собственные числа матрицы Qk(t) ограничены в совокупности Из их симметричности вытекает тогда, что все элементы матриц 0lt .., 0ft ограничены в совокупности Этим же свойством будут обладать матрицы M1(t), ., Мк((), . . 4 Управления u, (x, t), u2(x, /), .. обладают тем свойством, что равномерно по k интегральные кривые системы (11.2) при u = uA(x,/) удовлетворяют неравенствам Oi II х01| с-°*"-'о> < ||х(01| <Ч|хп || е-*>"-'.> (И 56) при t^io^0, где a,-, ft,- — положительные постоянные, не зависящие от к Действительно, ввиду равномерной ограниченности матриц ЛГ„ Мг, ... функции W-Ц, х, uA) удовлетворяют неравенствам с || х |р < U72 (t, х, ик) < а || х ||2, (11 57) Из того же свойства матриц Мк вытекает, что коэффициенты линейной системы (11 2) при u = uA(x, /) ограничены равномерно по отношению к k при /^0, откуда следует, что решения этой системы будут удовлетворять неравенству ||х(/)||>о||х0||е-""-'«» при />/„>0 (1158) где а, р — потожптетьиые постоянные, не зависящие от k, a х. = х(/„)
180 АНАЛИТИЧЕСКАЯ ТЕОРИИ ОПТИМАЛЬНЫХ РЕ1УЛЯТОРОВ (ГЛ III Из равенства Мхо. t<,) = ^W*(t, х, u„)dt и неравенств (II 57), (11 58) находим, что У*(х.. /.)>М|хв||». где ц.0 >0 — постоянная. Отсюда вытекает, что наименьшее собственное число матрицы [— Qk (t)] не становится меньше числа р. Итак, квадратичная форма Vk удовлетворяет неравенствам а||х||»<У*(х. 0<Ь||х||2 (1159) Из (11.57) и (11.59) следует неравенство (11 56) 5 При выполнении условий теоремы существует оптимальное управление u0(x, t) = Mt(t)x н ограниченное решение уравнения (11 16), причем AM/)=c-»(0[Q*(0e(0-fl*(0]. Действительно, из равномерной ограниченности матриц Mlt Мг, ... и матриц в,(/), 0,(/), ... вытекает, что dQk/dt ограничена на каждом конечном промежутке [0, Т] равномерно по к. Значит, последовательность матриц Qx(t), 02(О. ... удовлетворяет условию теоремы Арцелла Поэтому существует такая подпоследовательность последовательности 0„ 02, .. , которая будет равномерно сходиться к матрице 0(0 на промежутке [0, Т] Этой же подпоследовательностью матрица 0(/) определяется при всех *>0. При помощи той же подпоследовательности и формулы (11 55) определяется подпоследовательность последовательности MltM2 сходящаяся к матрице М0(1). Переходя к пределу в этой подпоследовательности, из формулы (11 55) находим M.U)-C-l[Q*e(t) — &]. (1160) Заменим далее в уравнении (11 45) уИ, на Мк, 0, на ®к и перейдем к пределу в упомянутых подпоследовательностях, предварительно проинтегрировав полученное выражение в пределах от 0 до /. После перехода к пределу продифференцируем полученное выражение. Тогда найдем !§=[А+вм0+м;в*+М1СМ1))-[в(Р+(1м0)+{р*+м;с1*)в]. (11 61) Подставляя в это выражение значение матрицы М0 из (11 60), получим, что 0(/) удовлетворяет уравнению (11.16), ибо левая
§ 11| СИНТЕЗ ОПТИМАЛЬНОГО УПРАВПЕНИЯ 181 часть (И 61) будет совпадать с левой частью уравнения (11 16) А тогда по теореме 11 1 управление (11 60) является оптимальным в смысле определения 11 2 при любом выборе начальных условий 6 Последовательность 0lt 02, ... сходится Действительно, в силу компактности этой последовательности любая ее бесконечная подпоследовательность будет содержать другую подпоследовательность, сходящуюся к некоторой матрице 0(/) Из (11 55) будет вытекать тогда, что соответствующая подпоследовательность последовательности Mt, Мг, . б\дет сходиться к матрице М„ При этом матрицы М0 и 0 будут связаны между собой равенством (11 60) и, кроме того, они будут удовлетворять уравнению (11 16) Следовательно, управление и = М0х будет оптимальным в смысле определения 11 2 В силу единственности такого управления будет 0 — 0, Ма = М0 Таким образом, любая бесконечная подпоследовательность последовательности 0,, 02, содержит подпоследовательность, сходящуюся к 0 А тогда последовательность 0,, 0„, должна сама быть сходящейся и должна сходиться к 0(/) равномерно на каждом конечном промежутке [0, Т] Действительно, п>сть это не так Тогда можно указать е > 0, при котором существует последовательность точек /„ , /,• и п основательность матриц 0*,, 0*8, . такая, чтобудет ||0*.(/;)— — © (ij) ll^£ Но в этом случае из последовательности 0*,, 0#„ .. нельзя выбрать подпоследовательность, сходящуюся равномерно к матрице 0 (/) на промежутке [0, Т], что противоречит преды- д\щему Из (11 55) вытекает также, чго последовательность матриц Mlf Мг, . будет сходиться равномерно к матрице М0(1) на каждом конечном промежутке [0, Т] И, значит, последователь ность управлений u^x, t), и2(х, t), . сходится к оптимальному управлению u„(x, t) = M0(t)x Теорема 11 3 доказана Следствие 1 Каково бы ни было допустимое управление ut(/, x)=Mi(t) x, играющее роль начального приближения, матрица 0 (t) не изменится ввиду единственности оптимального управления Следовательно, от начального приближения зависит гишь быстрота сходимости последовательных приближений Следствие 2 Если матрицы Р, Q, А, В, С, М — посто янные и и, = М,х—допустимое управление, то матрица 0(/), а следовательно, и матрица Мп (t) являются постоянными, и потому матрица 0 есть вещественное решение системы алгебраических уравнений QQC-iQ*Q-te[P— QC-*B*] + [P*— SC-»Q*]«-.4-HflC-'fl* = 0 (11 62)
182 АНАЛИТИЧЕСКИ ТЕОРИЯ ОПТИМЧ 1Ы1ЫХ РПУЛЯТОРОВ (п III Действительно, каждое приближение 0ft является постоянной матрицей Следовательно, предел последовательности 0,, 02, .. постоянен Из теоремы 11 3 вытекает метод поспедователоных приближений для вычисления искомого решения системы (11 62) Система уравнений ek(P + QMk) + (P' + MiQ*)6k—[А + ВМк+ М*кВ*+ M&Mk] = 0, (11 63) где Mk = C-1[Q*ek.l — В*], (1164) последовательно определяет матрицы 0,, 02, . ., сходящиеся к исходному предел) Уравнения (11 63) получаются из уравнения (11 45) заменой /И, на Мк и 0, на 0Л при условии, что ищется постоянное решение Сходимость такого метода последовательных приближений дтя отыскания решения уравнения (11 62) установлена в доказательстве теоремы 11 3 § 12. Нелинейный случай Предположим, что правые части системы %{ = fAt.x» ..*„."! «,). s=l,. ,и, (12 1) являются однозначными аналитическими функциями относительно величии xlt , х„, н,, , иг в окрестности точки *!= . =х„ = 0, и1 = ...=ыг = 0 и обращаются в этой точке в нуль Б у тем считать, что ф)нкции \s разлагаются в ряаы коэффициенты которых являются вещественными, непрерывными, однозначными, ограниченными функциями, заданными при (^0 Кроме того, будем предполагать, что ряды сходятся равномерно по отношению к /^0 Наряду с системой нелинейных )равнений рассмотрим систем) первого приближения, которую запишем, как
§ 12] Ml ШНЕЙНЫЙ СЛУЧАЙ 183 и ранее, в векторно-матричной форме dx,dt^P(t)* + Q(t)u (12 2) Предположим, что зааан функционал J= lw(t, x, u)dl, (12 3) о где W (I, х, и) есть аналитическая функция, и W = V Wm, (12 4) где U/m есть однородные формы степени m относительно х,, ... , х,„ и„ , ыг с вещественными, однозначными, ограниченными и непрерывными коэффициентами, являющимися функциями от /, заданными при />0 При этом будем считать, что W2 имеет вид U^=xM(0x + x*B(/)u + u*fi*(0x + u*C(/)u Матрицы A(i), B(t), С (t) обладают теми же свойствами, что и в § 11 Предположим, наконец, что ряд (12 4) сходится равномерно по t^O в некоторой фиксированной окрестности точки лг, = ... =х„ = 0, «,= . =нг = 0 Определение 12 1 Управление и = (и,, , иг) называется допустимым, если оно имеет вид u = J>\ (12 5) где и1((, х) = УИ(/)х является допустимым управление» для уравнения (12 2) в смысле определения 11 1, um явчяются однородными формами степени т относительно xlt , х„ Коэффициенты япих форм есть вещественные, однозначные, непрерывные, ограниченные вектор функции, заданные при /^Ои такие, что ряд (12 5) сходится равномерно по отношению к /^0 в некоторой фиксированной окрестности точки х1=хг—.. =хп = 0 Определение 122 Допустимое управление и„ (I, х) называется оптимальным относительно \„ по отношению к функционер гу (12 3), если при любом выборе допустимого управления и (t, x) оказывается выполненным неравенство У(и„. х0)<У(и, х„), где У (и, х„) есть значение функционаю (12 3), вычисленного на интегральной кривой x — \{t, х„), проходящей через точку хи при
184 АНАЛИТИЧЕСКАЯ ТЕОРИИ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ til t=0 и являющейся решением исходной системы уравнений при управлении u(t, x). Лемма 12 1 Если и (Л х)—допустимое управление и и(/, х)— некоторое управление, являющееся однозначной аналитической функцией, разлагающейся в ряд вида (12 5), то управление и = и(/, х) + еи(/, х) будет также допустимым при любом достаточно малом е. Доказательство Согласно предположению, и представляется в виде ряда и= 2 "". гДе u1==M(t)x Следовательно, управление u(f, х) + ей(/, х) =[M(t) + e.M (t)]x+ ... является допустимым, так как, согласно доказательству леммы 111, управление ul = [M(/) + eM(/)]x будет допустимым для системы (12 2) в смысле определения 12 1. Теорема 12 1 Если существует вещественная, ограниченная непрерывная, симметричная матрица 0(/), заданная при г ^ О, являющаяся решением уравнения (11 16) и такая, что управление u = C"1(Q*Q — В*)х будет допустимым для системы (12 2) в смысле определения 111, то существует управление и0(/, х), являющееся оптимальным управлением в смысле определения 11 2 для исходной системы по отношению к функционалу (12 3) при любом выборе начального вектора х0 из некоторой достаточно малой окрестности точки х-0 Доказательство Введем некоторые соотношения, которым должно удовлетворять оптимальное управление u0(t, х) С этой целью рассмотрим для любого начального вектора х„ и начального момента /0>0 функцию Vo('o. х„)= J WV' х. "<.)<"• (126) Разумеется, что вектор х„ располагается в некоторой достаточно матой окрестности точки х —0 Функция х, стоящая под интегралом в правой части (12 6), есть решение исходной нелинейной системы при управлении u = u0(/, x), проходящее через
§ 12} НЕЛИНЕЙНЫЙ СЛУЧАЙ 185 точку х0 при t = tn, так что х = х(/, х0, /0). (12 7) Как следует из теоремы Ляпунова, векторная функция (12 7) является однозначной аналитической по отношению к jc10, . , л„„ Разложение этой функции по степеням х, х„0 начинается с членов, линейных относительно последних Отсюда и из характера затухания решения (12 7) немедленно вытекает, что функция У0 (/, х) будет однозначной, аналитической относительно *,, . , х„ Дифференцируя обе части (12 6) вдоль интегральной кривой (12 7), найдем 5+ZgM'.*»- ..*..«г «»+ + W(t,xl дг„, и» и?)-О (12 8) Рассмотрим функцию Z — Z(t, x, и), определенную равенством 2=^° + Е д£ •/,('. х, u) + W(t, х, и). (12 9) Из (12 8) вытекает, что функция (12 9) тождественно обращается в нуль при u = u0(/, x) Оказывается, что это значение функции Z есть наименьшее возможное, если ее рассматривать как функцию переменных мх, .., иг Действительно, п\сть это не так Тогда по крайней мере одна из частных производных «<'•'•">, /-!,.... г, ди/ ' ' ' ' ' не обращается тождественно в нуль, ибо квадратичная форма v^ у> У7(<. х. u0) 2- jL ди.ди/ *Pj положительно определена при всех х, расположенных в достаточно малой окрестности точки х = 0 Управление u(/, x) = u0(t,x)+zfu будет допустимым В нем — ' *' "о) есть вектор с компонентами dZlduj во всяком случае для всех достаточно малых по модулю е. При таких допустимых управлениях Z{t,x, uo + e|f)<0 (12 10) при е=^=0.
18b ан\читичкск\я тюния оитмммьмых ppryimoi'Oii [i i ut Интегрируя почленно равенство (12 9), найдем У„(0, х0)= J w(t. x, u0 + e ^jdt- J Zdt (12 11) Из (12 10) и (12 11) находим V.(0. xe)> J w(t, x, u0 + e-g)d/ (12 12) Полагая в (12 G) /« = 0 и используя (12 12), получаем J(x0, u0)>y(x0, u„ + eg), что невозможно в силу оптимальности управления и0(/, х) Таким образом, функция (12 9) при \x = ua(t, х) имеет наименьшее возможное значение Следовательно, az(/.^.u.)=0i /=1> Г) (1213) т е оптимальное управление u„(t, x) и функция V0((, x), определяемая равенством (12 б), обязательно удовлетворяют условиям (12 8) п (12 13) Эти условия образуют систему для отыскания оптимального управ пения Дальнейший ход доказательства теоремы состоит в фактическом построении рядов, определяющих функцию Vn и управление и0, в доказательстве сходимости этих рядов и в доказательстве того, что найденное таким путем и0(*, х) является оптимальным управлением Будем искать функцию V0 и управление и0 в виде рядов 1/0= 2 Vm, u0= 2 и". (12 14) где Ura и V'" есть однородные формы степени т относительно Xj, ..., хп с коэффициентами, подлежащими определению, при этом Ul = Ai(/)x, V* = — \*H(t)\ (12 13) Подставляя ряды (12 14) в систему (12 8), (12 13) и приравнивая саева и справа члены одинакового измерения, для определения коэффициентов форм V* и U1 найдем следующую систему уравнений ^ + jl^[P(t)x + Q(t)U']s + W"-(t, х, U4 = 0, (12 16) и1=С-' [Q*HU)-B*]x
§ 12J НЕ1ИНСЙ11ЫЙ СЛУЧАЙ 187 Индекс s за скобкой означает, что берется s я компонента вектора, стоящего в скобках Система (12 16) служит для опре- детення форм (12 15) Производя подстановку (12 15) в (12 16), найдем, что матрица И (/) удовтетворяет тому же самому уравнению, что к 0(0 Следовательно, в качестве Н (t) можно взять 0(0 Тогда M(/) = C-1[Q*0 — В*] Положим P°(t) = P(t) + Q(t)M(t) Уравнения для определения форм Vm+1 и Vя при т > 1 можно записать в следующем виде ^ + i^"<Ox].-L«-« = 0, (12 17) U" = P" (12 18) Функции Rm+1 и Рт являются однородными формами относительно л-,, . , а„ соответственно степени т+ 1 м т с известными коэффициентами При этом коэффициенты Rm + 1 определены, когда известны формы U1, . , Um_1, V", , Vm, коэффициенты Рт определены, когда известны формы V1, , Vm+l, II1, , U'"-1 Таким образом, если форма R"+1 определена, то из уравнения (12 17) находится форма Vm+1, а затем из уравнения (12 18) — форма U"1 Предположим, что форма R'n+1 определена Тогда уравнение (12 17) имеет единственное решение в виде формы стрпеии т-\-1 с вещественными, непрерывными и ограниченными коэффициентами, заданными при t^O Действительно, положим Vm+1U„ x0)= S —Rm+1dt (12 19) Интегрирование в (12 19) ведется вдоль интегральной кривой системы х = Р°(/)х, (12 20) проходящей при t = t0 через точку х0 Такая интегральная кривая системы (12 20) удовлетворяет неравенству ||х(/)||<а||х0||е-Ь1'-'.» (12 21) при t^t0 Испотьэ}я (12 21), найдем оценку |^'п + 1^о. *о)К S "illх01Г+,с'-'"'+ чм/-/.)ш,
188 AHA ШТНЧЕСКАИ 1 КОРНЯ ОПТИМАЛЬНЫХ HI ГУЛ5.Т0Р0В [l 1 III откуда получаем, что \Vm+l(t0, хп)|<а:||х0|Г+Ч Ветчины a, b, я,, аг в этих выражениях являются положите тьными постоянными Форма U" будет иметь также вещественные, непрерывные и ограниченные коэффициенты, заданные при 1^0 Итак, при Н = &(1) ряды (12 14) определяются единственным образом Покажем теперь, что ряды (12 14) сходятся и что фхнкцня и0, определяемая ими, дает исходное оптимальное управление, функция же Vo(0, x0) дает наименьшее возможное значение функционала (12 3) У (х0, и0) Дтя доказатетьства сходимости рядов (12 14) введем в рассмотрение функции Я,, , л„, удовлетворяющие уравнениям Ф— ±Ъ-%' -■ («»> Рассмотрим теперь систему уравнений, связывающую функции v,, , х,„ ы,, , иг. Хи , Яп Эта система включает в себя исходные дифференциальные уравнения, систему (12 13) и систему (12 22) Б>дем далее обозначать ее символом (*•) Систему (-г) можно рассматривать как систему, пол\ченн\ю из исходных уравнений, уравнения (12 8) и системы (12 13) путем дифференцирования уравнения (12 8) по переменным а-„ . , х„ с последующим введением обозначений Ks = dV0/dxs Действительно, £[^+i &'■"•"■ ■х-и'- ••"я+ + W (/, А",, , Х„, li\, , II?) ~ dt dxs fa} dxh \ dxs J lk~i dxs fax dxk dxs ~*~ Последнее слагаемое в этом равенстве обращается в нуть в сичу (12 13) при u —u0 Поэтому по-пчающиеся выражения в точности совпадают с системой (12 22), если положить -5И* <1224> и заметить, что первые дез слагаемых здесь образуют полною -
§ 12] НЕЛИНЕЙНЫЙ СЛУЧАЙ 189 производную функции Я,,, вычисленную вдоль интегральной кривой исходной системы при управлении u = u0 Перейдем к анализу системы (12 23). Пользуясь уравнениями (12 13), исключим из исходной системы и уравнений (12 22) переменные и„ ..., иг Полученную таким образом систему для переменных хи ..., хп, Xlt ..., Х„ будем обозначать символом (#»). Наряду с системой (*•*) будем рассматривать систему линейных уравнений, образующих первое приближение для уравнений системы (**) x = P(0x + Q(0C-'(0[JQ*(0A-fi»(0x|, ™- = -P*(t)A + 2A(t)x + 2B{()C-*(t) [lQ«(0A-5»(0x] . (12 25) ГА Здесь Л есть вектор I . 1 Знак звездочка, как обычно, означает транспонирование. Непосредственным вычислением можно проверить, что система (12 25) имеет семейство решений, зависящих от произвольных постоянных A.-J, ..., х%, представимое в виде х(0-У(Ох.. (122б) Л(0 = 26(0х(0 к ' Здесь Y (t) есть фундаментальная система решений для системы -§-=Я°(/)х, (12 27) где, как и выше P°(() = P(t)+Q(t)C-4t)[Q*(t)®(t)-B*(t)] Из свойств системы (12 27) вытекает, что семейство решении (12 26) при *>£0>0 удовлетворяет неравенствам II х || < в К || е-» «'-'•> || Л ||< а, || х„ || е-» «-'•>. Таким образом, система (12 25) имеет по крайней мере п поло- жительных характеристичных чисел Обозначим их через ц„ ..., ji„. Тогда из первого метода Ляпунова *) вытекает, что система (12 24) имеет семейство решений, зависящих от п произвольных постоян- *) Считаем, чго система (12 25)— правильная.
190 AHAIIITHHFCKAfl ТЕОРИЯ ОПТИЧ МЫ1ЫХ РЕ1У1ИТОРОВ [ll III пых с,, . , с,,, представнмое в форме рядов х(о =2 *а-+ + 2т _ ^т' "»(/)£;■ - С" '=| ' ' • (12 28) Л(0= 2V/+ 2 _ Мт' ",«(/)с;п> . с;«е < = ' (12 29) где х,-, \- представляют собой решения системы (12 25), соответствующие характеристичному числу ц,, *'=1, , п Известно, что ряды (12 28) можно разрешить относительно с,, . , с„ и затем исключить эти величины из рядов (12 29) В рез>льтате таких преобразований получим ряды Л. = 2 Л», (12 30) где Л" представляет собой однородную форму степени т относительно величин хи хп При этом Л» = 2в(0х Подставляя ряд (12 30) в уравнения (12 13), найдем, что функция и„, определяемая ими, будет представляться в форме ряда (12 14) С помощью этой функции можно из уравнения (12 8) найти V0 Далее можно установить, что ряды, служащие для определения функции Xs и — dVjdxs, совпадают А тогда в силу того, что (12 30) представляют собой однозначные аналитические функции переменных хи .., хп, будет иметь место сходимость рядов (12 14) Таким образом, ряды (12 14) представляют собой отнозначные анатитические функции переменных а,, , хп, определенные в некоторой достаточно малой окрестности точки Остается показать, что управпеиие и0, определяемое рядом (12 14), является оптимальным П)сть это не так Тогда существует такое допустимое управление й (/, х), что будет V„(0, х0)>У(х0, й) (12 31) Из неравенства (12 31) вытекает, что для всех достаточно малых />0 будет иметь место также неравенство £(/)>0, где l(l) = Va{t, х(/))-$ W(x, х(т), й(т, x(T)))dx Здесь х(/) —решение исходной системы при управлении и с начальным условием х = х„ при *=0
§ 12| МЕ 1ИНЕЙ1ШЙ СПУЧАЙ 191 Легко видеть, что полная производная функции t,(t) совпадает с функцией Z(t, х, й) #-2(/,х,й). следовательно, будет иметь место неравенство -3->0 при />0, т е функция l(t) неубывающая Следовательно, |(/)>1(0)>0 (1232) при всех />0 _ С другой стороны, ввиду того что и—допустимое управление, обязательно будет выполнено неравенство || х (01| <а || хв || е-» «'-'•) Из этого неравенства вытекает, что V„(/, х(/))—--0 J W(t, x, uJdtj-^-o Следовательно, Это обстоятечьство противоречит неравенству (12 32) Таьим образом, сделанное выше предположение неверно, и потому управление u0(t, х) является оптимальным Следствие 1 Если исходные уравнения стационарны, коэффициенты разложения функции W в ряды не зависят от времени и матрица 0 также постоянна, то оптима хьное управление и„ не зависит явным образом от переменной t и функция V0 также не зависит от времени Это утверждение вытекает из подробного рассмотрения построения рядов (12 14) В данном случае коэффициенты форм V™ можно определить единственным образом как решение системы линейных алгебраических уравнений, получающихся из уравнения (12 17), если пренебречь частной производной по времени и приравнять коэффициенты при членах одного измерения Таким образом, ряды (12 14) почучаются не зависящими от t Схоап- мость их установлена в любом случае Поэтому управление и0 ч функция V0 не зависят от времени
192 АНМИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУТЯТОРОВ [ГЛ 111 Следствие 2 Ест матрица Q(l) и вес функции времени, входящие в исходную систему уравнений и в разложение W, являются периодическими с одним и тем же периодом, то оптимальное управление и0 и функцию V„ можно разложить в сходящиеся ряды относите гьно х1 , хп, коэффициенты которых будут являться периодическими функциями того же периода Доказательство этого утверждения вытекает из того, что при сделанных предположениях решение уравнения (12 17), являющееся формой степени /n-f-1 с ограниченными коэффициентами, обязательно будет периодическим по t при любом т^г 1 Это утверждение справедливо, так как коэффициенты исходной формы V"141 будут удовлетворять линейной системе дифференциальных уравнений с периодическими коэффициентами и периодическим свободным членом Собственные колебания в данной системе неограниченно возрастают Поэтому отсутствует явление резонанса, и система имеет единственное стационарное движение, которое является периодическим Заметим, что приведенная теорема позволяет строить оптимальное управление лишь в том случае, когда известна матрица в(0 Дадим далее способ непосредственного построения оптимального управления, основанный на методе последовательного прибтижения и не связанный с предварительным построением матрицы Q(t) Пусть задано некоторое допустимое управление и(Л х)= 2 Vm> где Ul = M(/)x Построим функцию У|('о. хо)= 5 W(t, х, u)dt (12 33) Интегрирование в правой части (12 33) ведется вдоль интегральной кривой х = х(*, х„, /0) исходной системы при управлении и(/, х), причем считается, что х = х0 при t = t0 Функция (12 33) однозначна относительно х10, . , х„0 в некоторой окрестности начала координат Действительно, функция Vl(t, x) является решением уравнения в частных производных 1Г + £ j£fs{t' х> "<'• х» + ^<'. х' "('• х)) = °- (1234) Это уравнение имеет единственное формальное решение, пред- ставимое в виде ряда ^=2 У?, (12 35) ш =2
§ 12] НЕЛИНЕЙНЫЙ СЛУЧАЙ 1У J где V? есть однородная форма степени т относительно xlt ...,xa с вещественными, непрерывными, ограниченными коэффициентами, заданными при t^O Сходимость ряда (12 35) вытекает из применения первого метода Ляпунова к системе уравнений dxldt = F(t, х, u(/, x)), dV/dt = —W(t, x, u(/, x)) (1 36) Система (12 36) имеет семейство решений, зависящих от п произвольных постоянных, представимое в форме рядов Ляпунова Исключая эти постоянные, приходим к выражению функции через хх, , хп Полученный сходящийся рят необходимо совпадает с (12 35) Построим управление и,(/, х) из условия, что функция ut(/, x) доставляет функции Z,(f. *. „) = -^+£!£/,(/, *. u)+W(t, х, и)(12 37) наименьшее возможное значение Если и, (/, х) есть допустимое управление, то можно построить по нему функцию V2(/, х) так же, как была построена Vl((, x) по управлению и(/, х) Дальше строится функция ut(t, x) как функция, доставляющая наименьшее возможное значение функции, Zt(t, x, u) = ^i + £ ^lAt, x, u) + W(t, x, u) Если игЦ, х) оказывается допустимым управлением, то можно построить функцию V3 и т д Теорема 12 2. Если квадратичная форма Уг является положительно определенной по отношению к переменным ,*,, ...,х„ ы„ ., иг и существует по крайней мере одно допустимое управление и{(, х), то построение последовательностей и,(/, х), и2(/, х), ... v Vt(t, x), Кг(/, х), ... всегда оказывается возможным, при этом u„(l, x)—+Un(t, х), Vk(t, *)—►^п('' x), где u0(/, х) есть оптимальное управление, aV0(О, х„)—оптимальное значение функционала J (хв, и0) Ук(0, x0) = J(xn, u„). Доказательство Каждое управ leinte, получающееся в ходе построения поспечоватетьпых приближений, можно представить в виде "*(', x)= S u'feS (12.38)
194 ЛИЛ'ИПНЧКСКЛИ II ОРНЯ ОПТИМАЛЬНЫХ РЕГУПЯТ0Р0В [ГЛ 111 где Vl(t, x) = Mk(t)x при этом легко видеть, что матрица Мк(() определяется формулой MA(0 = c-M0[Q*(0«*(0-fi*(0] (12 39) Зчссь вА(/) —матрица квадратичной формы, являющаяся первой формой в разложении функции Vk(t), взятой с обратным знаком, так что v*(0-= 22У8', <124°) где V% = — х*6*х Для коэффициентов форм Vf 1егко построить линейные дифференциальные уравнения Из предыдущего параграфа вытекает, чго матрицы Мк(() сходятся и управления Mk(t)x являются допустимыми, следовательно, буаут сходиться коэффициенты форм \"и к непрерывным ограниченным функциям, заданным при t^O. Таким образом, существуют формы V? такие, что Vf—*V$ Поюлим V0(t, x)= 2 V™ (12 41) и М<, х)= 2иу, (12 42) где UJ1 ccib предел формы Щ' при к—* оо U'0" lim UJ' Легко видеть, что ряды (12 41) и (12 42) являются решениями системы (12 8), (12 13) Следовательно, как было показано выше в предыдущей теореме, они сходятся И потому и„(/, х) яваяется оптимальным управлением и V„(0, x„)~J(x„, u„) Следствие Если управление (и,, , и г) входите исходную систему линейно и есш формы W'" не зависши от их, , иг при ш > 2, то построение последовательных приближений осуществляется другим способом Действительно, Vk(t, x) = C-1[-Q-^-B*x]. еде -—f- есть вектор I
§ 12J НКПИКЕЙНЫЙ СЛУЧАЙ 195 Заметим, что построение iik(t, x) также легко осуществляется, если формы Wm(m>2) лишь линейно зависят от «,, .... иг Оптимальное среди всех допустимых управлений обладает одним замечательным свойством Предположим, что исходная система уравнений имеет вид dx/dt=F(x, u) (12 43) и что оптимальное управление ue(x) определено для всех значений вектора х Определение 123 Множество всех точек х0, обладающих свойством х(/. xJj-^O, где x(t, x0) есть решение уравнения (12 43) при управлении u = u(x), называется областью притяжения положения равновесия х = 0 при управлении и(х) Теорема 123 Область притяжения положения равновесия х =- 0 при оптимальном управлении и0 (х) является более широкой, чем при любом другом допустимом управлении, ее пи выполнено условие ir>a[||x||« + ||ii||«]Kl-H|F||» Доказательство Предположим, что и(х) есть некоторое допустимое управление * р1''-<х)|. (12 44) * /1 + HFII» Интегральные кривые системы (12 44) совпадают с интегральными кривыми системы (12 43) при u = u(x) Отличие этих кривых состоит точько в различной параметризации Действительно, система (12 44) переходит в систему (12 43) при замене ds = = d/i/т+рт» Интегральные кривые системы (12 44) определены для всех значений s от — оо до +оо Введем в рассмотрение функцию V(x,)- J W(x, u(x))d/. (12 45) о Функция (12 45) может быть представлена в виде
196 ЛИЛПИП1Ч1 CKAil II 01Ч1Я Oil I НМЛ 1Ы1МХ РЕГУТЯ 10P0B (ГЛ in В формупе (12 4G) ншегрпроваипе ведется по интегратьной KpiiBoii системы (12 44), а в формуле (12 45) — по иптеграпьным кривым системы (12 43) Предположим, что х есть граничная точка области притяжения, которую обозначим через А (и) Известно, что функция V(xn), определяемая (12 45), (12 46), обладает свойством К—-> + оо, х„(ЕЛ(и) Предположим, что точка х явтяется граничной точкой Л (и,) и содержится внутри некоторой области притяжения Л (и) Тогд<1 можно выбрать столь малую окрестность этой точки, что при || х — х01| < р_будет V (х„) < М < j- оо Так как х является граничной точкой области притяжения Л(и„), то в этой же окрестности точки х найдется такая х„, что будет выполнено неравенство V0 (х0) > М Из условия оптимальности управления и„ следует, что V0(x„)< V(x.) Последнее неравенство противоречит выбору числа р, согласно которому должно бы гь V (х0)< уИ Отсюда вытекает справедливость теоремы Итак, точка х, являющаяся граничной для области притяжения, соответствующей оптимальному управлению, не может находиться внутри никакой области притяжения, соответствую щей какому-либо допустимому управлению При доказательстве теоремы 12 3 был использован факт неограниченного возрастания функции V при приближении к границе области притяжения Коротко этот факт может быть установлен следующим образом Выберем число е столь малым, чтобы сфера || х || ^ е целиком содержалась внутри области А (и) Возьмем столь малое б > 0, чтобы все интегральные кривые системы (12 44), начинающиеся в области ||х„|Кб, оставатпсь при s^O в области || х || < е Пусть х есть граничная точка области А (и), т е такая, в сколь угодно малой окрестности которой начинаются как траектории, неограниченно приближающиеся к х = 0, так и траектории, никогда не попадающие в сферу ||х||<е, а х,, *«. > хт — последовательность точек, обладающих свойством хт ——>х, хтеЛ (u), m = l, 2, .. Обозначим через s,„ момент первого пересечения интет ральноп кривой системы (12 44)х = х (s, хт) с поверхностью сферы ||х||< б Последовательность slt . ., s,„ обладает тем свойством, что sm >■ + оо В противном случае она должна содержать подпоследовательность, ограниченную числом Т Но в силу ннтс-
§ 13) СИСТЕМА С ОГРЛНИЧРИИЫМ Ш'ЦЧН'ВЧ 197 грапьнои непрерывности все интегральные кривые, начинающиеся в достаточно малой окрестности х, остаются в сколь угодно малой окрестности интегральной кривой x(s, x) при |s|<r Тогда эта интегральная кривая заходит в б окресгносп, точки х - О и, следовательно, неограниченно приближается к х-=0 Легко видеть, что теми же свойствами дочжны обладать все интегральные кривые, начинающиеся в достаточно малой окрестности точки х, что приходит в противоречие с ее свойствами как ючмт, принадлежащей границе области пришжения Итак, обязательно должно быть s,„ >-+оо Из формулы (12 46) нахочим Отсюда выiекает, что V(xm) >■ -\- оо § 13 Система с ограниченным временем Пусть задана система линеннпх дифференты 1ьных уравнений п-ю порядка dx/dt=A(t)x + B{t)u + \{t), /€[0, Т) (13 1) Элементы матриц Л, В и компоненты век юра f (/) явчяются вещественными, непрерывными функциями, заданными при *€[0, Т] Матрица Л имеет размерность пхп, матрица В — размерность пхг, х и f имеют размерноеiи л и и — размерность г. Пусть задан функционач т J = ^[х*Л1(0х \-2x"Bl{t)u+uirCit)u ! х АДО + о + u*Cl(t)]dt 1^(Г)в0х(Г) '-х (f)q)tf, (13 2) где Л,, £,, С, 0О — матрицы соответствующих размерностей и Аа, с\, ф0 — векторы соответствующих размерностей Будем считать эчеченгм упомянутых матриц и компоненты соответствующих векторов вещественными, непрерывными, заданными на [0, Т] Элементы матрицы 0О и компоненты (р„ будем считать постоянными Прсчположим да чес, что Л,, С, 0О — симметричные матрицы, причем квадратичная форма и*Си является пою жигельно опредсченной, иначе говоря, существует постоянная с > 0 такая, что cu*u<u*Cu, /е[0, Т]
198 ЛН\'1ИТИЧЕСК\И ТЕОРИИ 01П11МЧЛЫ1ЫХ РЬГУЛЯТОРОВ [ГЛ 111 Определение 13 1 Управление и будем называть допустимым, если оно представимо в форме u = M(0x + N(0, (13 3) где M(t)—матрица, имеющая г строк, п столбцов, H(t)—вектор размерности г, причем элементы матрицы М и компоненты вектора N (<)—вещественные, непрерывные функции, заданные на [О, Т\ Определение 132 Допусти мое управление и0 — М0 (t) х + 4- N„(0 называется оптимальным по отношению к функционалу (13 2), если оно достав гчепг этому функционалу наименьшее возможное значение на любом движении х = х(/, х0), х =х0 при / = 0, иначе говоря, если и—какое-либо допустимое управ чение и и0 оптимально, то У(хр, и0)^У(х0, и) при любом х0 Пусть V(x, 0 = *»е(0х + х*«р(0 + Ф(0. (134) где 0(0— симметричная матрица размерности п, <р(/) — вектор размерности п, tj>(/)— скалярная функция Будем считать, что элементы матрицы 0, компоненты <р и функция i|) заданы при '€[0, Т), вещественны и непрерывно дифференцируемы Подынтегральное выражение, входящее в функционал У, для краткости обозначим /0(х, и. 0 Будем искать управление в системе (13 1), оптимальное по отношению к демпфированию функционала V+\ t^di Такое управление, как известно, до 1жно доставлять наименьшее значение производной этого функционала по времени вдоль движений системы (13 1) V + ft = x*A*ex + x"&x ! х*0Лх-Ьи*/3*6х + Ч>+1*0х-|- + x*QBu + x*ef-\-(Ax + Bu + f)*<p + x*-q + f0=-W (13 5) После преобразования функция IV имеет виа U7 = х* (А*в + вЛ + в)х + х*(2вВи + 20f + A*<p + q>)-Ь Оптимальное управление по отношению к демпфированию функционала, приведенного выше, определяется из уравнений 4^=0, /-1. .. . г, "(136) где Щ- = (2x*QB)f + («f' В), + (2х*Я,)у +2 {Cu)/+(c:)j.
§ 13] СИСТЕМА С ОГРАНИЧЕННЫМ BI'KMFIIUM 199 Уравнения (13 6) явтяются линейными относительно и,, .., иг с отличным от нуля определителем Поэтому решение данной системы можно представить в форме u0 = yW0x+N0 (13 7) При этом получим Me=—C-1(B*Q + B*), (13 8) N„ = — -^С-Чф'ДН Cf)» (139) Для того чтобы решение (13 7) было опгимапьным в смысле функционала (13 2), необходимо матрицу 0(/), вектор (р(() и функцию i|)(/) выбрать так, чтобы было ИР = 0 (13 10) при управлении (13 7) и V(x, О = х*0ох + х*фо при t = T (13 11) Найдем уравнения для матрицы 0, вектора ф и функции гр из условия (13 10) Подставляя (13 7) в выражение функции W и используя уравнение (13 10), нлйдем \Р^х*(А*в + 9А + в)х-\ х»[20В(Мох4-Мо) + 20т + Л»ф+ф]-Ь +(x,MJ-:-N;)BVp hf*9 + ^ + xM,x + 2x»Bl(M0x bN„) + +(x«Ai; + К) С (М0х -|- N0) + х»Лг + (х*М'0 + n;)C, Посае преобразования этого выражения имеем W ^x*(A*e + SA + Q \-2вВМ0 + А1 + 2В1Мв + М;рМ0)х Ь + x»(20BNo f20f 1-Л*ф-!-Ф+М^В»ср-! 2flIN„ + Af;CNe + +A,+>w;cl)-i-N;cM,x + N;fl*4)-i 1*ф i ф-i nsC/Vo-i-n;^ Используя (13 10), найдем А*в + еА + &+2ЭВМ0 + 41 + 2В1М* + М1СМ0 = 0, (13 12) 2eBN,+ 2ef + H«q) + «P I М1В^-\-2В^в |- + 2MJCN0 b A,+ A1JC, = 0, (13 13) ЛГ;в> + {*Ф | •»|) + NJCN0 + NJC,=0 (13 14) Условие (13 11) даег начальные данные, необходимые для решения уравнений (13 12), (13 13) н (13 14) 0 = 0О, ф = ф0, г|) = 0 при / = 7\
200 АНАЛИТИЧЕСКИ ТЕОРИЯ ОПТИМАЛЬНЫХ Р| ГУ1ЯТОРОВ [ГЛ III Испотьзуя (13 8) и (13 9), уравнения (13 12) —(13 14) можно записать в явной форме л*в + в a i-e—26ВС-1 (B*e+BD + Al—2B1c-1 (в*е+вя+ + (вВ + В1)С-1(В*в-\-В*) = 0, (13 15) —евс-1 (ф*в+с;)*+20f+л*ф+ф—(в в + bj с-1 д*ф— — В^-* (ф*В + Q\y-r(QB + Вх) С-1 (ф*В + CD* -| А,— —(вВ + В1)С-^С1=0, (13 16) —5-(В*ф-|-С1)*С-1В«ч»Н f4 + ^-L + х(В*ф-^С1)*С-1(ф*б-гСГ)*— -^-(В'ф + С^'С-^С^О (13 17) Уравнение (13 15) можно представить в форме e + e(A — BC-lBl) + (A* — BtC-lB*)e— —вВС-1В'в + А1 — В1С-1В* = 0, (13 18) 0 = ео при t = T. (13 19) Теорема 13 1 Для того чтобы существовало оптимальное управление в системе (13 1) в смысле функционала (13 2), необхо димо и достаточно, чтобы уравнение (13 18) с начальным уело вием (13 19) имело решение, непрерывное при t £ [О, Т], при этом оптимальное управление представимо в форме (13 7), где вектор ф(/) удовлетворяет уравнению (13 16) с начальным условием ф = ф„ при t = T Система (13 18) при начальном условии (13 19) всегда имеет решение, вещественное и непрерывно дифференцируемое, заданное в некоторой окрестности точки t = Г Условие теоремы состоит в том, чтобы это решение можно было продолжить на весь промежуток [О, Т] Доказательство П^сть уравнение (13 18) имеет решение с начальным условием (13 19), заданное в [О, Т], вещественное II непрерывное Обозначим его 0(/) Подставим 6(/) в уравнение (13 16) Тогда для определения вектора ф получаем линейную систему дифференциальных уравнений Эта система всегда имеет решение, заданное при 1£ [0, Т] Подставляя найденный вектор Ф(/) в (13 17), найдем i|j(f) с начальным условием г|э(Г) = 0 Определим с помощью G(/), <p(l), ^(0 функцию V (х, /) и управление (13 7) Тогда управчение (13 7) является оптимальным по отношению к демпфированию функционала V+^f0d.T о На этом управлении V+fa=W=0, следовательно, это управление является оптимальным по огношению к функционалу (13 2)
§ 131 CHC1LMA С ОГРАНИЧЕННЫМ ВРЕМЕНЕМ 201 Оптимальное значение дается формулой J(\B, uo) = x;0(O)xo + x^(O)H-\j;(O) Если оптимальное управление в системе (13 1) по отношению к функционалу (13 2) существует, то с помощью него можно определить функцию V(x. /) = $/e(x, u0> T)dT + x*(T)Qox(T) + x*(T)t(0 (13 20) Легко видеть, что функция (13 20) является квадратичной формой относительно х1г . , хп, представимой в виде V(x, /) = х«Э(/)х + х«ф(О + *(0. (13 21) где матрица 0, вектор <р и функция г}; удовлетворяют системе (13 12) — (13 14) Будем считать, что в этой системе матрица Ми и вектор N„ определяют управление u0 = yW0x-J-N0, оптимальное по отношению к J, с>ществование которого только что было предположено Остается показать, что матрица М0 и вектор N0 необходимо выражаются формулами (13 8), (13 9) Всаед за этим, применяя (13 8) и (13 9), найдем, что 0(/) будет решением системы (13 18) с начальным условием (13 19), заданным при /£[0,Г] Итак, для полного доказательства остается устано вить, что (13 8), (13 9) выражают необходимые условия оптимальности функционала Общий вид таких человип приведен в гл III Так же, как и в § 11, можно показать, что эти усао- вия представимы в форме (13 8), (13 9) Теорема доказана Поставим вопрос об отыскании матрицы 0(/) как решения уравнения (13 18) и об условиях, достаточных для существования решения системы (13 18) при условии (13 19) на всем промежутке [0, Т] Теорема 132 Если квадратичная форма х*[Л,(0 М*ев-г-е0И]х является положительно определенной, то непрерывное решение системы (13 18) при условии (13 19) существует на etc t npjve жутке [0, Т] Доказательство Для отыскания этого решения можно предложить слец>ющий метод последовательных приближений Возьмем управление u.^Al.tOx + N.CO, где A41(i)—заданная матрица, N,(/) — заданный вектор Заменим в системе (13 12) —(13 14) матрицу М0 на Mlt вектор N„ на Ni Найдем решение 0,, <р„ ф, полученной системы линейных
202 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ lit уравнений с начальными условиями 0,(Г) = во, ф(Т) = ф0, Ф(Г) = 0 Это решение существует, и оно непрерывно на [0, Т] С помощью 0, и (р, по формулам (13 8), (13 9) определим матрицу Мг и вектор N, путем замены в (13 8) и (13 9) 0 на G, и Ф на ф, После этого с полученным управлением u. = Af,(0x+Nt(0 поступим точно так же, как пси, В результате этого процесса получим последовательность управлений ux, uit u3, ... и последовательности квадратичных форм К,, Уг »k=*Mk(t)x+Nk{t), (13 22) ^ = х'в4(0х + х*Фк(0 + **(0 (13 23) Покажем, что в* (0 — 6(0. Ф*(0 — Ф(0. **(0 —Ф(0. где 0(0, ф(0> ^(0 удовлетворяют системе (13 15) — (13 17) с начальными условиями 0(7,) = 0О, ф(Г)=ф0, ф(Т") = 0, откуда будет следовать, что ил—»-и0 при k—Н-оо, где и0 есть оптимальное управление Из характера построения последовательностей ил и Vk вытекает, что Vk(x, 0=S/„(x. u*. т)йт + х»(Г)0ох(Г) + х«(Г)фо (13 24) Построим с помощью функции Vk функцию Wk{\, и, 0 Wk = 4T+fA*, u, 0 (13 25) В равенстве (13 25) производная от функции Vk берется вдоль интегральных кривых системы (13 1) при каком-либо допустимом управлении и Управление uft+, выбирается как управление, которое доставляет Wk наименьшее возможное значение Заметим, что в равенстве (13 24) через х обозначено решение системы (13 1) при управлении и = ил Из (13 24) находим ^- + /„ = 0 при u = uA Следовательно, при и = ил+1 ^ + /о<0. (13 26) так как ил+1 доставляет функции Wk наименьшее возможное
§ 131 C11CTFMA С ОГРАНИЧЕННЫМ ВРЕМЕНЕМ 203 значение Проинтегрируем (13 26) от / до Т и получим т Vk(x, ()-Vk(x(T), Г) —S/,(x, uk+l, x)dx^0 (13 27) Из (13 27) имеем Vk(x, t)>Vk+l(x, t), так как V„(x{T), Г) = х*(Г)0„х(Г) + х*<го Итак, последовательность квадратичных форм V\, V2, ... монотонно убывает При выполнении условия рассматриваемой теоремы функционал J ограничен снизу при любом выборе допустимых управлений Значит, последовательность квадратичных форм также будет ограничена снизу, и поэтому элементы матриц Qk, компоненты векторов фй и функции г|А ограничены в совокупности при /6[0, Т] Следовательно, такими же будут компоненты векторов Nk и элементы матриц А1к Ввиду этого коэффициенты линейной системы (13 12) —(13 14), в которой следует заменить М0 на Мк, N0 на Nft, ограничены в совокупности По тогда решения этой системы 6} дут равностепенно непрерывны как функции <€[0, Т] Отсюда следует, что последовательность матриц Qk содержит сходящуюся последовательность Более того, любая бесконечная последовательность этой последовательности матриц будет содержать в себе схоцящуюся подпоследовательность Это же утверждение относится к векторам <pft и фуи кцням у\\ Заменим в системе (13 12) —(13 14) Л!0 на Мк, N0 на Nk Перейдем в полученной системе к пределу по упомянутой выше подпоследовательности Тогда получим уравнения (13 15)—(13 17) Таким образом, пределы упомянутых подпоследовательностей являются решениями этих уравнений с начальными данными в(Г) = 0о, ф(Т) = ф0, $(Т) = 0 Ввиду единствсниссти такого решения далее оказывается, что любая сходящаяся подпоследо вательность будет сходиться к одному и тому же преде ту Это возможно тогда и только тогда, когда сами последовательности 0*. Фа. ^а сходятся Указанная сходимость будет равномерной, и предельные функции будут являться непрерывно-дифференцируемыми, заданными на [0, Т] Это и показывает, что (13 18) имеет непрерывное решение с начальными условиями (13 19) на [0, Т] Построение оптимального управления сводится, таким образом, к отысканию решений системы (13 18) Оптимальное управление можно построить также, не прибегая к решению уравнения (13 18), если известны оптимальные программные управления Определение 13 3 Непрерывная вектор-функция и,(/) называется оптимальным программным управ гение и по отношению к функционалу J в точке х„, если она доставляет функционалу
204 aiiaihihmlckau погни оптимлчьиых i-FiyiMTOPOB 1гл in J наименьшее возможное лначение среди всех непрерывных ыкшорных функций и (I), заданных при t £[0, Т], так что J (x0, и,) <: J (х0, и) для данного х0 Теорема 133 Оптимальное управ генис и0 = Ма\ -f N0 можно построить при помощи /г+1 оптимальных программных управ гений и,(/), t=l, , n-f-1, соответствующих точкам xj", t'=l, . , //-[-I, находящимся в общем положении, что означает линейную независимость векторов g, = xj°» —хУ\ i=2, . , л + 1 (13 28) Доказательс1ВО Обозначим через U (t) матрицу, столбцами которой являются векторы и((/)— u,(/), i — 2, , n-j-1, а через X (/) — матрицу, столбцами которой являются векторы X[(t)—х,(/), 1=2, , п-f-l, где х,-(/)—движение, определяемое системой (13 1) при управлении и,(/) и начальном условии х/0> Положим, х(/) = х(0) при / = 0, M0=U(t)X-1(t) и N0 = u,(/) — -t/(/)X4(0x, Покажем, что управление u0 = Afox+N0 является оптимальным Действительно, так как управление ut(t) является оптимальным программным управлением, то оно и соответствующее ему движение х,(0 удовлетворяют следующему необходимому условию Существуют функции Хи{1), , Xnl(t) такие, что они связаны с функциями х,- и и, уравнениями 4t'-%rr (,329) #"£. 03 30) ^ = 0, I -1, . н J-1. /=1. . г, s-=l, ,n, (1331) » -/. I £>•»**< Ss -(Ах I Вч I f), П\сть X,,-— вектор с компонентами Хи, . , л„,- Обозначим через Л Mjipimj, столбцами которой являются векторы X,—X, Попожпм в(0 = уЛХ-»(0. ф(0 = ^(0-Л(0Х-М0х,(0 С помощью матрицы в(/) и вектора ср(/) построим функцию rj)(/) как решение уравнения (13 17), ip(7) = 0 Введем в рассмотрение квадратичную форму 1/0(х, О^х'ЫОх г-х'ЧЧО + ЧЧО. (13 32)
§ 13] ciictem\ с 01РЛМПЧ1Ш1ЫМ iiiMMiiiFM 205 С помощью уравнений (13 12), (13 13), (13 14) можно пока зать, что управление ип = Л10х |-N0 доставляет фчнкцнп V0-\-f0 наименьшее возможное значение, равное нулю^ и является, следовательно, оптпма 1ыи.1м по отношению к функционалу J Доказанная теорема решает проблему синтеза оптимального управления на основе построения нескольких программных управлений В этой теореме и в § 11 такая проблема решена для конкретных задач Требуется найти другие важные случаи, когда такая проблема разрешима Особое внимание следует обратить на синтез управлений, оптимальных по быстродействию Перейдем к рассмотрению нелинейных систем дифференциальных уравнений Пусть задана система dx/dt = Ax + B\i\-\(x, u, t) (1333) и функционал т J=p(x(T))+^[f0(x, u, /)+А(х, u, l))dt (13 34) о Предположим, что функции р, h и компоненты вектора f являются о (позначными аналитическими функциями xlt , х„, и,, . , иг в окрестности точки *,= . — хп = и1 — . ~иг = 0 и разлагаются а ряды, сходящиеся равномерно при /€[0, Т], в некоторой фиксированной окрестности упомянутой точки, с непрерывными вещественными коэффициентами, зависящими от / Будем считать, что разложение компонент вектора f по *,, ... , х„, н„ , иг начинается с членов второго порядка, а у функции h—с лрегьего порядка, функция р не содержит сво бодного члена, а совокупность членов первого и второго измс рений в функции р приставляется в форме x*<p0-f х*90х Матрицы А п В и функция /л обладают темп же свойствами, что и ранее. Определение 134 Управwnue u — и(х, I) называется допустимым, если компоненты вектора и(х, /) явчяются одно значныии аналитическими функциями хг, , хп в окрестности а\= =хп — 0, разшгаются по степеням xlt , хп в ряды, не содержащие свободных членов и имеющие непрерывные вещест венные коэффициенты при t£[0, T] Эти коэффициенты тако вы, что упонянутыс ряды равнонерно сходятся в некоторой фик сированной окрестности точки хх— = хп = 0 Определение 135 Допусти мое управление u0 (x, t) наш вается оптимальным, если для любого х0 управление и0 доставляет функционалу (13 34) наименьшее возможное значение Точка х„ расположена в некоторой достаточно малой окрестности точки л-1= =лг„ = 0 Теорема 134 Ее ш существует непрерывное решение у рае нения (13 18) с начачьным условием (13 19) при t£[0, T], то
206 ЛНАЧИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ III для системы (13 33) существует оптимальное управление по отношению к функционалу (13 34) Доказательство Возьмем функцию V (х, /) = х'<г + х»вх + S Ф. (х, 0. (13 35) т = 3 которая является однозначной и аналитической в некоторой окрестности х, = .. = х„=0 Коэффициенты ряда (1335) будем считать вещественными, непрерывными и такими, что ряд (13 35) сходится равномерно в указанной области Через <р,л обозначены однородные формы степени т относительно х„ , хп Найдем управление U„ оптимальное по отношению к демпфированию функционала V+\(f, + h)dT о Это управление доставляет функции наименьшее возможное значение, где g,—s-я компонента вектора правой части системы (13 33) Следовательно, это оптимальное управление будет удовлетворять системе уравнений dW/duj = 0, /=1 г, (13 36) так как в достаточно малой окрестности xt= ... = х„ —и1= .. ...=и, =0 наименьшее возможное значение IP является минимумом. Решение системы (13 36) будет яваяться допустимым управлением Обозначим его через U0 = Mox+ 2 U<m,(x, 0 (13 37) т=2 Для того чтобы управление (13 37) было оптимальным по отношению к функционалу (13 34), достаточно выбрать коэффициенты в (13 35) таким образом, чтобы при управлении (13 37) было выполнено равенство W = — dV/dt, V (х (Т), Т) = р (х (Т)) (13 38) Подставляя (13 37) в (13 38) и приравнивая слева и справа формы одинаковой степени, найдем последовательности систем дифференциальных уравнений для определения коэффициентов (13 37) При этом оказывается, что в(/) и <р(0 удовлетворяют
13] СИСТЕМА С ОГРАНИЧЕННЫМ ВНЕЧ1НЕМ 207 системе (13 15;—(13 17) с начальными условиями 0(Г)=0О, <р(Г) = ф0 Матрти М0 определяется по прежнему уравнением (13 8) Остальные коэффнциешы функции V определяклея единственным образом как решения линейных систем дифференциальных уравнении Предположим, что решения всех таких линейных систем найдены Тогда возникает вопрос о сходимости рядов (13 37) Покажем, что эти ряаы сходятся Введем в рассмотрение функции Jt,=dV/d«lf ..,ln-=dV/dxa Дифференцируя (13 38) по xlt , х„ и учитывая (13 36), найдем, что функции \ Хп удовлетворяют системе ^=-Ц' $==1 » <1зз9> Система (13 33) может быть записана в форме ЧГ = Щ' s=l "■ W=2b*4. + f, + h' (13 40) Теперь уравнения (13 36) определяют ыи ..., и, как функции 2л +1 переменных *,, ..., хп, Хр ..., Я.„, t. С помощью этих функций ы, =«,(«„ ...,*„, A.lt . ., К, 0. / = 1 а. (13 41) исключим управпения «t, . , иг из правых частей систем (13 39), (13 40) Полученная вновь система ^«£.(v. хп, к., .... а„. /), * ьЛ 1* " (13 42) ~-=fs(xi хп, ли .... л„, t), s=l я, имеет семейство решений, зависящее от п произвольных постоянных и нредставимое в форме рядов *,= 2 >,#+..., '■' (13 43) *,=-2*.о+... Это семейство строится следующим образом Рассматриваем линейное приближение системы (13 42) Для него строим п.
208 АНАЛИТИЧЕСКАЯ ТЕОРИЯ ОПТИМАЛЬНЫХ РЕГУЛЯТОРОВ [ГЛ. Щ решений с начальными данными х = х<°» при / = 0, >. = 20ох(Т) + фо при / = 7\ Затем берем линейную комбинацию этих решений с произвольными коэффициентами с,, . ., сп Обозначим полученные комбинации через Я.'1', x<», s—l п Семейство решений системы (13 42), зависящее от п произвольных постоянных, строим в виде xs=2xSffll, Х5=|]аГ\ s = 1 n, (13 44) где xim} и Цт) — однородные формы относительно сх с„ Исходную систему п решений можно выбрать так, чтобы сх, .... с„ были начальными данными, т е компонентами вектора х<0» Коэффициенты форм xjm> и Xf* будут удовлетворять линейным дифференциальным уравнениям Эти уравнения последовательно интегрируются со специальным выбором начальных условий Если <?!, •••,£„ достаточно малы, то ряды (13 44) будут сходиться равномерно при t £ [0, Т] Матрица (xsl), s=l п, 1 = 1, . ..., п, имеет отличный от нуля определитель, ибо решения, входящие в нее, линейно независимы Поэтому величины си .., с„ можно исключить из равенств (13 44) В результате получим Я, = М*1. ., *». 0. s=l, ...я (13 45) Функции (13 45) однозначные аналитические в окрестности *!= =л:п = 0 и разлагаются в равномерно сходящиеся ряды по степеням хи , хп при / £ [0, Т] Подставляя функции (13 45) в (13 41), найдем и, = «}«(*„ .. ,хп, 0. /=1, ...,/■ (13 46) С помощью функций л-j, ..., Я„ можно построить функцию г V(x, 0 = 5(/о + Л)^т + р(х(Т)) (1347) Интегрирование в формуле (13 47) осуществляется при управ лении (13 46) Функция V является однозначной и аналитической и разлагается в равномерно сходящийся ряд Легко показать, что функции (13 46) и (13 47) совпадают с рядами, построенными выше Поэтому ряды (13 47) сходятся и дают оптимальное управ ление для сгстемы (13 33) по отношению к функционалу (13 34) Оптимальное управление (13 37) можно разыскивать с помощью следующего метода последовательных приближений Пусть
§ 13] СИСТЕМА С ОГРАНИЧЕННЫМ ВРЕМЕНЕМ 209 Uj(x, /) —некоторое допустимое управление Построим функцию Vi(x. О т Vi(x. 0=S(/e + A)^ + p(x(7-)) (1348) Интегрирование (13 48) ведется при управлении U= U,(x, t) Построим управление U2(x, t) как управление, оптимальное по отношению к демпфированию функционала V,(x, t)+\{ft + h)dT о С полученным управлением Ua(x, /) поступим тл< же, как с U, В результате найдем последовательности {Uk(x, t)\ и {Vk(x, /)} (13 49) Теорема 135 Если выполнены условия теоремы 112, то построение последовательности Uft(x, /) возможно При этом каждый член этой последовательности — допустимое управление и Uft(x, t)—»-U0(x, /) при k—*- + оо, где U0(x, t) — оптимальное управление системы (13 33) по отношению к функционалу (13 34) Доказательство осуществляется следующим образом Сначпта устанавливается ограниченность в совокупности коэффициентов рядов иЛ при членах одинаковых измерений, затем \станавти- вается их равностепенная непрерывность Вследствие этого из последовательности Vk можно выбрать сходящуюся подностедовл- тельность При этом оказывается, что всякая сходящаяся под последовательность сходится к одному и тому же преде ту Этот предел обозначим U0(x, /) Затем устанавливается сходимость Vk(x, /)_-jV(x, t) Оказывается, что управлением, оптимальным по отношению к демпфированию функции V+ J (f0 + h)dx, будет U0 При этом W = —dV/dt на управлении 110, следовательно, 1)0 оптимально по отношению к (13 34)
Глава IV ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ § 14 Линейная независимость скалярных и векторных функций Рассмотрим совокупность вещественных функций В, (/), ... .... Bn(t), заданных и непрерывных при l£[t0, fj Определение 14 1 Будем говорить, что функции Bl(t), . ..., Bn(t) линейно независимы на промежутке [t'0, /,']<=[/„ tt], если из условия 2ММ0 = ° при t £[t'0, t[], где си ..., са — вещественные постоянные, вытекает, что с, = 0, s = \ п. Обозначим через В(t) векторную функцию В(/) = [В,(0. • • •» Bn(t)] и через A (t'0, t'x)—матрицу А (/,, К) = J B (0 в* kt)dt, где В* есть матрица-строка, получаемая из матрицы-столбца В транспонированием Теорема 14 1 Для того чтобы вещественные непрерывные функции В,(/), .. , Bn(t), заданные при t £[/„, /t], были линейно независимы в промежутке [tt, t[], необходимо и достаточно, чтобы A(t'0, t[) была положительно определенной Доказательство Необходимость Пусть функции £,(/), .... В„(/) линейно независимы на промежутке [t'0, t't) Покажем, что матрица A (t'e, t[) будет положительно определенной. Действительно A (t'0, t[) имеет неотрицательные собственные числа, так как квадратичная форма, порождаемая этой матрицей, принимает лишь неотрицательные значения при любом выборе независимых переменных си ..., сп Именно, с*А(Г0, /;)c=$[c*B(/)]*df>0. Предположим теперь, что среди собственных чисел А (/,, t't) имеется хотя бы одно нулевое Тогда обязательно существует вещееiвенный ненулевой вектор с, отвечающий этому собственному числу и являющийся собственным вектором A (t0, t[) Тогда
§ 14] линкАнля нкзлвисимость функций 211 будем иметь А (С0, i[) c = 0 Умножая это равенство спева на с*, получим далее J[c*B(/)]2d/ = 0 Из свойства непрерывности функций Bt (/), , Ва (/) вытекает тогда, что 2c,fi,(0 = 0 "Р11 *€[С t[) Но тогда из условия линейной независимости функций В,(/), , Вп(1) должно вытекать с, = 0, s=l, , n В то же время вектор с был выбран ненулевым Полученное противоречие показывает, что все собственные числа матрицы А (С0, t[) положительны, следовательно, эта матрица определенно положительна Достаточность Пусть известно, что A (t'0, t[) положительно определенная Покажем тогда, что функции /^(О. .., B„(t) линейно независимы в промежутке [t'0, i[] Пусть это не так И пусть именно существует ненулевой вектор с такой, что с*В(/)«=0 при t £[t't, t[] Тогда также должно быть $[с»В(ОР<М-сМ(/;, /.')с-0 Наряду с этим равенством из положительной определенности матрицы A(t'e, t[) вытекает c*A(t'„, /,')с>лса, где А. >0, — наименьшее собственное число матрицы А Следовательно, с = 0, что противоречит предыдущему предположению Таким образом, полученное противоречие показывает, что функции Bt(t), ... . , B„(t) будут непременно линейно независимыми в промежутке [/,', t[) Теорема 142 Для того чтобы вещественные непрерывные функции ВХЦ), , Bn(t), заданные при t^[t„, tt], были линейно независимыми в промежутке [/,, /(], необходимо и достаточно, чтобы существовали точки т,, ,т„, расположенные в промежутке С^о. 'хЗ» такие, что постоянные векторы В,= В(тх), s==l п образуют в п мерном векторном пространстве базис Доказательство Необходимость. Пусть Bt(/),. , u„(t) линейно независимы в промежутке [t'9, ([) Покажем тогда, что в этом промежутке существуют точки xlt , т„ такие, что векторы В, = В(т,), s=l, , n, линейно независимы и, следовательно, образую! базис в £„, где Е„ — векторное я-мерное пространство Для того чтобы векторы Bt, , В„ образовывали
212 ПРОБЛРЧЛ СИМТГЗА УПРАВЛЕНИИ [ГЛ IV базис, как известно, необходимо и достаточно, чтобы определитель матрицы, стопбцами которой являются эти векторы, был отличен от нуля Рассмотрим на промежутке [С0, /[] счетное, всюду плотное множество точек т Обозначим точки этого множества через т,, т7, . , т„, Если среди векторов В (xs), s = 1, 2, ., имеется п линейно независимых, то необходимость условия доказана Предположим, что это не так Именно, пусть существует лишь k < п линейно независимых Не ограничивая общности, можно считать, что такими векторами явтяются Bx, ,Ък, В/ = В(т/) Тогда существует ненулевой вектор с такой, что Bj c = 0, s=l, ,к Так как любой вектор By,/ > ft, является линейной комбинацией векторов Bj, , ВА, то обязательно будет By =0 для любого / Дапее из непрерывности функций B1(l), , B„(t) и всюду плотности множества точек т,, т2, , т,„ . на промежутке [t'„, t[] будет также иметь место равенство B*(/)c = 0, t £ [t'0, /J] T e функции В1((), ., B„{t) оказываются линейно зависимыми в промежутке [t'B, t[] Это противоречие показывает, что выше сделанное предположение k < п несправедливо, и, следовательно, среди векторов By, /=1, 2, , имеется ровно п линейно независимых Этим полностью доказана необходимость условия Достаточность Пусть в промежутке [t'0, t[] существуют точки Tj, .. , т„ такие, что векторы B, = B(tJ, s=l, , n, образуют базис Покажем тогда, что функции Bj(/), .. , В„(<) ли непно независимы в промежутке [t'0, t[] П^сть это не так Тогда существует ненулевой вектор с такой, что В*(<) с=0, t €[('„, t[] Положим в этом равенстве / = т,, s= 1, , п, тогда будем иметь также В*с = 0, s=l, , n Ввиду того, что матрица коэффициентов этой системы имеет по \словию определитель, отличный от нупя, то эта система имеет единственное решение с = 0 Следовательно, по определению функции B^t), , Bn(t) явчяются тпнейно независимыми Рассмотрим теперь векторные функции Bt (I), . ,В„(/) размерности г b,(t)={B,tV)\. /=1. •./-. Пусть они заданы при I £ [/„, /J, вещественны и непрерывны 1ам Определение 14 2 Векторные функции В,(/), , В„(0 называются линейно независимыми в промежутке [t'0, /|]с[?0, Jx], если из условия 2 csBslt) — 0 следует cs = 0, s= 1, . , n Введем в рассмотрение матрицу В, строки которой явтяются векторными ф\нкциямп В, (/), ,В„(/) Следовательно, матри ца В имеет п строк и г столбцов
§ 14] линейччи ннзлвисимопь функций 213 Определим Maipnuy A (t'0, /,'). как и выше, соотношением Л (С t[)= ] B(t)B*(t)dt, где B*(t) — матрица, транспонированная по отношению к B{t) Аналогично теоремам 14 1 и 14 2 могут быть доказаны теоремы, содержащие необходимые и достаточные условия линейной независимости векторных функций в,(0. -,в„(0 Теорема 14 3 Для того чтобы векторные функции В,(/), . В„(/), заданные при t £ [t0, /J, вещественные и непрерывные были независимы в промежутке [t'0, t[]c:[t0, /,], необходимо и достаточно, чтобы матрица А (1'0, t[) была положительно определенной Теорема 14 4 Для того чтобы векторные функции Bt (/), ,В„(/), заданные при t£[t0, *,], вещественные и непрерывные были линейно независимы в промежутке [t'0, ^]<=[/0, /,], необходимо и достаточно, чтобы в этом промежутке [t'0, t[] существовали точки т„ , хп такие, что среди столбцов матриц B(xt), s= 1, , п, имелось в точности п линейно независимых Рассмотрим далее матрицу G, имеющую п строк и г столбцов, элементы которой заданы при/£[/„, *,], вещественны и являются функциями ограниченной вариации Рассмотрим матрицу Н (t'0, t[) = ] [dG] В* Теорема 14 5 Для того чтобы векторные функции Вх (I), . , В„(/), заданные, вещественные и непрерывные при t£[t0, f,], были линейно независимыми при l£[t'0, t[]c:[t0, /J, необходимо и достаточно, чтобы существоват матрица G, элементы которой вещественны, заданы при t €[(„, /,] и являются функциями ограниченной вариации, для которой матрица И ((„, ([) будет иметь определитель, отличный от нугя Доказательство Необходимость Обозначим через В+ (/) матрицу, элементы которой совпадают с элементами матрицы B(t) в тех точках, где они неотрицательны и равны нулю в остальных точках Через В~ (t) обозначим матрицу, элементы которой совпадают с элементами матрицы — B(t) в тех точках, гче они неотрицатетьны и в остальных точках обращаются в нуль Ясно, что B(t) = B+(t)—B-(t) Положим G=J B+df — J В~ dt Из вида этой матрицы вытекает, что элементы ее заданы в промежутке [/„, /J и явтяготся функциями ограниченной вариации, так как представ1яются в виде разности двух неубывающих
214 ПР0Б11 МЛ СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV функции Легко видеть, что при таком выборе матрицы G матрица H(t't, t[) совпадает с матрицей A (i'B, t[) А тогда из линей- нон независимости векторных функций Bj (t), ,B„(/) в промежутке [t't, l[] вытекает, что матрица Н (С0, t[) имеет отличный от нуля определитель Достаточность Предположим, что матрица Н(С0, t[) неособая Покажем, что тогда векторные функции В,^), . , Вп(/) линейно независимы на промежутке [С0, t[] Пусть существует вектор с такой, что В*с — 0 Домножая обе части спева на матрицу [dG] и интегрируя в пределах от t'9 до t[, находим Н(t'0> t[)x хс = 0 Следовательно, с = 0, откуда вытекает, что векторные функции Bt(/), ,B„(/) линейно независимы Замечание П\сть /,, , 1т—совокупность каких-либо однородных аддитивных операций над векторными функциями Именно, /, 2 с,В,(/) = 2 с,1,[Ъ,(1)] Из теоремы 14 5 вытекает, что для линейной независимости векторных фчнкцнй Bj (/), ...,В„(/) в промежутке [t'0, t[] необходимо н достаточно, чтобы существовала совокупность /,, , 1т однородных, аддитивных операции над векторными функциями в промежутке [С0, 1[] таких, чю ранг малицы линейной системы V cslj[us(t)]=Q, j— l,. , m, в точности равен п Пример 14 1 Расе ютрим функции В, = 1, Bi = tl, B„ = t"-1 По- кпжеч, что эти функции линейно независимы на чюбоч промежутке вещест пенной оси Пусть т—точка промежутка [t'0, ([] Положим /i[B,1-B,(t)... . //[B,]= dtJ'_l' Тогда матрица системы 2 С*'/1М. /=•. ."». будет иеособой. И, следова- тельно, эти функции будут линейно независимыми в промежутке [ (0. l[] Пример 142 Рассмотрим функции Й, (/), , В„ (0. являющиеся компонентами вектора ept Q.i-деЯ—вещественн<1 ялхя постоянная матрица и Q — постоянный вектор (л-чернын) Покажем, что эти функции линейно нев.шисимы в любом интервале веще ственной оси тогда и только тогда, когда векторы Q, PQ, , P"-IQобразуют базис Применим те же операции, что и в примере I Тогда получим систему уравнений с*Р''ерЩ=*0, / = 0, ,л-1 Или Y*fyQ = 0. / = 0, , я— 1, где у* = с*еРт Отсюда видно что для линей ной независимости функций Si (/), , В„ (/) в любом промежутке веществен ной оси необходимо и достаточно, чтобы векторы Q, PQ, P«-'Q образовы вали базис Пример 14 3 П>еть задано дифференциальное > равнение
§ 14] ЛНШ-ЙЯАЯ HhЗАВИСИМОСТЬ ФУИККЧЙ 215 Будем считать, что коэффициенты этого уравнения заданы при /£|/0> 'il- ue- щественны и непрерывны Пусть б, (/), , £„(/) есть вещественные непрерывные решения этого уравнения Если в некоторой точке т£[<„. 'il матрица s£" (т), s=l, , я, / = 0, . , п—1 неособая, то функции 5, (/), , Вп (/) будут линейно независимыми в любом промежутке, содержащем точку т Для случая дифференциальных уравнений справедливо и ботсе сильное \тверждение функции Bj (/), , Вп (t) будут линейно независимыми и в любом промежутке [ t'0, t[], не содержащем т Действительно, обозначим черезУ(/) определитель матрицы В?* (/) Тогда будет иметь место соотношение — = —!\V, откуда И, следовательно, если V (т) j= О, то и У (О также ?М) при f£|'o. /,] Пример 144 Пусть задана система дифференциальных уравнений у = Р(/)у, где у = (уи ,(/„)—вектор, Р—матрица порядка пхп с вещесг венными непрерывными элементами, заданными при /£[/0, t{\ Пусть векторные функции В^/), . , В„(/) есть решения этой системы Сели в некоторой точке т матрица Y (т) нсособая, то векторные функции Bj (/), . .,В„(<) линейно независимы в любом промежутке [ t'0, t[] a [t0, t\) Здесь через Y (I) обозначена матрица, столбцами которой явтяются векторные функции В,(О, .В„(0 Обозначим через Д определитель матрицы У (I) Тогда имеем Д = рД, где Р=2 Р*Л{)> р„—диагональные элементы матрицы Р Из последнего уравнения находим t Д(0 = Д(т)ет откуда и вытекает утверждение о линейной независимости векторных функций Bi(0. ••.В„(<) в любом промежутке [ i'0, <[]с[/п. 'tL если Д(т)^0 Остановимся теперь на задаче представления векторной функции произвольного вида через заданные линейно независимые. Пусть Bj(0, , ВП (0 — заданные векторные функции на промежутке [О, Т], и пусть векторная функция и является элементом пространства L2 [О, Т] векторных функций, суммируемых с квадратом \u2dt<.oo Будем считать теперь также, что Теорема 146 Если векторные функции Bl(t) В„(/) линейно независимы на промежутке [О, Т], иначе говоря, ес- ш матрица Л (О, Т) = J BB*d/ — нсособая, то имеет место
21Ь ПРОБ II МЛ СИНТЕЗА УПРАВЛЕНИИ [ГЛ IV представление u=ij5/y + v, (14 1) где с„ .... с„ — постоянные величины, v£L2 [О, Т] и т $fl;vd/ = 0, / = 1, .. ,п, (14 2) о и притом представление (14 1) единственно Здесь через В* обозначена матрица, столбцы которой —векторные функции В,(<), .. ,В„(0. TdK чт0 усчовия (14 2) мог>г быть записаны в форме т $ Bv d/ = О о Перейдем к доказательству Помножим (14 1) слева на В и проинтегрируем в пределах [О, Т] Тогда получим т ^Budt = A(0, T) с, (14 3) откуда с=/1-1(0» Г)$ Budt, и, следовательно, из (14 1) имеем т u = 6M-»(0, T)lBudt-r\ (14 4) о Покажем, что (14 4) дает единственное представление векторной функции и Предположим, что имеем два представления u = .fi*c-|-v и и -= 8*с, -f- v, Вычитая почленно, домножая затем на матрицу В слева и интегрируя по t в пределах [О, Т], найдем Л (0, Т)(с—с,) = 0, следовательно, c = Cj и, следовательно, v = v,, что и требовалось доказать Замечание Если матрица А (О, Т) является особой, го представление (14 1) остается в силе, однако уже не будет един ственности Действительно, обозначим через S матрицу, образованною из А (О, Т) и состоящую из всех линейно независимых строк этой матрицы Обозначим через h вектор, образованный компо нентамн вектора ] Budt с теми номерами, которые соответствуют
§ 14] ЛИНРЙИАЯ IIF3ABHCIIM0C1I> ФУНКЦИЙ 217 строкам, входящим в S Тогда будем иметь h = Sc (14 5) Будем искать решение (14 5) в форме c = 5*v + c, (14 6) где с—вектор, обладающий cboiictbom Sc = 0 Подставляя (14 6) в (14 5), найдем h = SS*y, откуда имеем c = S*(SS*)"1-h + c (14 7) Подставляя (14 7) в (14 1), находим u = B*(SS*)_1h-f-v + vT где т v ■= В*с. Легко видеть, что } В\ dt = 0. Это обстоятельство и создаст неоднозначность представления (14 1) в случае, когда матрица А (0, Т) особая. Выше были указаны примеры линейно независимых систем функций Поставим вопрос о пополнении линейно независимых систем функций Пусть задано линейное дифференциальное уравнение *<'<• Ь/>, (0 *"-"+•--+Р.. (О * = 0. (14 8) Обозначим через x1(t), . , x„(t) линейно независимую систему решений уравнения (14 8) Требуется построить функции хп+1, • • i хп+к таким образом, чтобы функции хи , хп+к были линейно независимы между собой Обозначим через 1(х) выражение /(*) = *'»> \-Pl(t)x<"-»+...+Pn(t)x и рассмотрим линейное дифференциальное уравнение li*,(x)+Q1(t)itk-"(x) + ... + Qk(t)l(x) = 0 (14 9) Легко видеть, что уравнению (14 9) удовлетворяют функции хи . , хп Так как уравнение (14 9) имеет порядок п + к, то можно также построить его решение хп+1, ..., хп+к с начальными условиями *„ + . Со) = *«+! Со) = • • • = *?«" Со) = 0, Л£\ (/.) = 1. jfSVV' С) = 47,"° (*.) = ... = дгЛЙ*-1 (*.) = 0, хп+к (/„) = х;1+4 (/0) = .. = о*-" (/„) --= о, *&+**-" ('.) = !
218 Ш'ОБ 1КМЛ CIIIITI ЗА УПРАВЛЕНИЯ [ ГЛ IV Легко видеть, что вронскиан расширенной системы функций *i. . х»+к будет отличен от нуля, следовательно, xlt . , xn+k будут линейно независимыми Если этот алгоритм повторить при k^l, то можно получить нужное количество линейно независимых функций § 15. Синтез линейных управлений Пусть задана линейная управляемая система, описываемая системой дифференциальных уравнений вида x = P(/)x + Q(0u + F(0, (15 1) где х, u, F—векторы, причем х —вектор фазового состояния системы имеет размерность п, вектор и — размерность г, a P(t), Q (/) — матрицы соответственно размерностей пхл, лхл Будем считать, что элементы матриц Р и Q и компоненты п-мерной векторной функции F (() заданы при / > 0, вещественны, непрерывны и ограничены Пусть требуется линейную управляемую систему с помощью управления и перевести из любого фазового состояния х„ при / = 0 в конечное состояние х=гО при t = T Возникает вопрос при ьаких условиях существует управление u = u(/, x), (15 2) разрешающее выше постав ленную задачу? И, если такое управление существует, возникает вопрос об его аналитическом представлении Перейдем к решению поставленных задач Обозначим через Y (/) матрицу линейно независимых решений однородной системы уравнений х = Р(/)х и будем считать, что У(0) = £, где Е—единичная матрица Положим далее В(() = = y-»(OQ(0 и г A{t, T)=\B{t)B*{i)dt Предположим сначала, что для фиксированного начального состояния х = х0 можно указать управление u = u(0 (15 3) такое, что сиаема (15 1) при управлении (15 3) будет иметь решение х = х(/), (15 4) обладающее свойством х —х0 при ( = 0 п х = 0 при t — T Подставляя (15 3), (15 4) в (15 1) и умножая обе части слева на
§ 15| спина лишйных упнлнл! кий 219 матрицу У-1, поручим после интегрирования в пределах or О до Т т г J Y-*xdt = lY-4P(t)x + Q(t)u + F(t)]dt (15 5) о о Интегрируя саева по частям и используя матричное соотношение £y-*—y->p. находим из (15 5) т т —x,»$Bu<tt-|-$ Y~l?dt (15 6) о о Систему (15 6) можно теперь рассматривать как систему интегральных уравнений, служащую для определения и(/) Будем искать решение этой системы в виде u = B*c + v, (15 7) где с — постоянный вектор, a v(l) — векторная функция, удовлетворяющая условию Естественно, что также требуется, чтобы компоненты В были вещественными функциями, суммируемыми с квадратом Подставляя (15 7) в (15 6) и учитывая (15 8), находим т —х0= 4(0, Т)с+ Jv-'Fd/ (15 9) о что матрица А(0,Т) неособая с = -Л-1(0, T) x0+$K->Fd/ Будем считать, что матрица А(0,Т) неособая Тогда из (15 9) найдем (15 10) Если уравнение (15 1) после подстановки в него (15 3), (15 4) и умножения слева на матрицу К1 проинтегрировать в пределах от / до Г, то будем иметь -К-'(Ох(0 = Л(/. Г)с i !(/), где т т 1(1) ~$Bvdt+ Jv-'Fd/.
220 ПРОБ1FMA СИМ 11 ЗА УПРАВЛЕНИЯ [ГЛ IV Из этого соотношения имеем далее, с одной стороны, с = -л-ч/, Л [У-1 (Ох(0 + 6(0] (1б ") и, с другой стороны, потьзуясь (15 10), найдем x(t) = Y(t)^A(t, Т) Л-МО, T)(x0 + \Y-*Fdt\ -S(o} (15 12) Искиочая вектор с из (15 7), найдем также u = M(/)x + N(/). (16 13) где M(t)~—B*A-x(t,T)Y-\ N (/)=- v — B*A-1{t, T)\ Теорема 15 1 Если векторные функции, являющиеся столбцами матрицы В*, линейно независимы в любом промежутке [t, T], t >0, то существует семейство управлений (15 13), зависящее от произвольной векторной функции, удовлетворяющей условию (15 8), об падающее тем свойством, что любое решение системы (15 1) х —х(/) при управ гении (15 13) будет обладать свойством х = х0 при / = 0 и х = 0 при t = T, где х0—произвольное начальное фазовое состояние Доказательство Если подставить (15 13) в (15 1), то поаучим линейную систему дифференциальных уравнений dxdt = (P \-QM)x + Qti + F (15 14) Непосредственной подстановкой (15 12) в (15 14) убеждаемся, чго векторная функция (15 12) явтяется решением сисгемы (15 14) Это решение при / = 0 принимает начальное состояние х = х„. Из формулы (15 12) следует также, что х = 0 при t = Т Этим георома доказана полностью rivcrb теперь требуется построить управление u = u(f, x) такое, при котором система (15 1) переходит из любого начального состояния х = х0 при * = 0 в конечное состояние х = 0 при / -+ + 00 Будем искать управ пение, обладающее таким свойством, в следующем виде u = e-«(B*c + v), (15 15) где k — некоторая положительная постоянная, с — постоянный вектор, v — векторная функция с компонентами, суммируемыми с квадратом на каждом конечном интервале и такая, что J e-*' Bvdt^O Подставляя (15 15) в (15 1), домиожая слева на У -1 п интегрируя затем очна раз в пределах от 0 до оо, а другой раз
§ 15| CHI1IF3 1ИНЕЙНЫХ УПРАВЛЕНИЙ 221 в пределах от / до -| оо, как и выше, найдем с = _Л-1(А,0, +оо) х.+ S Y~*Fdt , (15 16) = -Л-'(А, /, +оо)[К-М0х(0 + Ч(0]. (15 17) х(/)=У(/){л(Л, /, +оо) Л-1 (ft. О, +оо)Гх0+ J Y~*Fdt\ - -ч(о}. (15 18) где т)(/)в J B\e~ktdt + $ y-»Fd/ Исключая вектор с из (15 15), найдем далее ц(/) = -г"ВМ-'(й, /, +00)7-4/), v(t) = e-"(w-B'A-4k,t, +оо)Ч). (15 19) Теорема 15 2 Если матрица Л (ft, /, +оо)= } е~м ВВ*dl неособая при t~^0, то существует семейство управлений (15 19), зависящее от векторной функции v, такое, что любое решение х = х(0 системы (15 1) при управлении (15 19) обладает свойством х(/)—>-0 при /—> + оо Доказательство Если подставить управление (15 19) в систему (15 1), то получится система линейных дифференциальных уравнений dx'd/ = [P+Qu]x + Qv + F (15 20) Непосредственной проверкой можно убедиться, что векторная функция (15 18) удовлетворяет системе (15 20), а также удовлетворяет начальному условию х = х0 при / = 0 Это решение, как следует из формулы (15 18), будет обладать свойством х—»0 при t—* + oo Замечание 1 При доказательстве теоремы используются два допопнительных условия, а именно, требуется чтобы J y_1Fd/ был сходящимся и число ft>0 можно бы to выбрать таким образом, что {j e~ktBB*dt также сходился Это последнее предположение всегда выполняется, так как элементы матриц У и У-1 могут возрастать не быстрее экспоненты
222 !!ГОЫПМ\ СИНТКЗА УПР\ВЛЫ1НЯ [ГЛ IV Именно, \\У\\<ае*, ||V'-'||<afP(, что в свою 0 1ередь вытекает из ограниченности элементов матрицы P(t) В предыдущем изложении управляемая система (15 1) из начального состояния х0 переводилась в конечное состояние х = 0 за время [О, Т] Однако в ряде случаев могут задаваться некоторые промежуточные состояния управляемой системы Напри* мер, пусть требуется построить такое движение системы (15.1) х х(/), которое будет удоваетворять на промежутке [О, Т] граничным успозияы S/x(//) = H/, / = 0, 1, .. , А; (15 21) 'о ~0. lk=^T Здесь Sj — постоянные матрицы порядка tijXn, Ну—постоянные векторы размерности пу, числа /0, /,, ., th могут быть заданы или некоторые из них могут подлежать определению Систему граничных условий (15 21) можно записать в форме интеграла Стилтьеса т $[dS(#)]x(tf) = H, (15 22) о где S, вообще говоря,— произвотьная вещественная матрица, элементы которой есть функции ограниченной вариации на промежутке [О, Т] и Н —постоянный вектор Будем, как и выше, семейство }правтений представлять в форме u = B*c + v (15 23) Подставляя (15 23) в (15 1), домножая затем на У-1 слева и интегрируя по t в пределах [t, Щ, получаем * о У-> (fl) х (0) —У"1 (0 х (0 = А (/, fl)c+ J Bvdt + J У-»Р dt (15 24) Умножим обе части (15 24) слева на матрицу У (О), и полученный результат подставим в (15 22) Тогда находим г т J [dS ($)] У (»)/!(/,#) сН S[dS(0)]r(#)r-40x(0 I- -f-$[rfS(fl)]y(tf) Jfivdf + JK-'Fd/ =H. (15 25)
§ 15) сини j лишйных уиглнтнний 223 Положим в (15 25) f=--0 Тогда (15 25) перейдет в равенство 5с+ох0 = Н0, (15 26) где 5 и а—постоянные матрицы, Н0 —постоянный вектор, т S=[[dS{0)]YtQ)A(0,Q), т o=$[dS(0)]K({)). Рассмотрим теперь следующие задачи а) Требуется найти условия, при которых при любом выборе начального состояния х0 существует управление, удовлетворяющее (15 22) б) Найти начальное состояние и управление, при которых система (15 1) имеет решение, удовлетворяющее (15 22) в) Найти начальное состояние, при котором система (15.1) имеет решение, удовлетворяющее (15 22) При этом управление яваяется заданной, но произвольной функцией Теорема 153 1) Если строки матрицы S независимы, то задача а) разрешима, 2) если строки матрицы а независимы, то задача в) разрешима, 3) если ранг матрицы {S, о\ совпадает с рангом матрицы {S, а, Н0}, то разрешима задача б) Здесь считается, что матрица {S, а) погучается из S приписыванием столбцов матрицы о, и соответственно матрица {S, а, Н„} по- лучаепияиз {S,a) путем приписывания дополните пьного столбца Н„ Замечание 2 Если строки матрицы 5 зависимы, то, вообще говоря, задача а) неразрешима, так как ранг матрицы S может оказаться отличным от ранга матрицы {S, (ах0—Н0)} Замечание 3 Если строки матрицы о зависимы, то вообще говоря, может не существовать решения задачи в), так как ранг матрицы а может оказаться отличным от ранга матрицы {a, (Sc-H0)} Замечание 4 Условие 3) теоремы 15 3 является необходимым и достаточным для разрешимости задачи б). Перейдем к доказательству теоремы 15 3 Будем искать решение системы (15 26) в задаче а) в форме c = S'v + c, (16 27) где вектор с содержи 1ся в ортогональном дополнении подпро- ст£анства, натянутого на строки матрицы 5 Иначе говоря, Sc-^0 Подставтяя (15 27) в (15 26), получим SS'y \ ох„ = Н„. (15,28)
224 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [гЛ IV Матрица SS* — неособая Отсюда из (15 28) найдем Y = [SS«]-»[H, —ох,] (15 29) и, следовательно, из (15 29) и (15 27) получаем c=S»[SS»]-1[H0-ax0] + c (15 30) Подставляя (15 30) в (15 23), найдем требуемое семейство управлений Любое решение системы (15 1), определяемое семейством (15 23), (15 30), будет обязательно удовлетворять граничным условиям (15 22) Выше было использовано утверждение, что матрица SS* ие- особая Покажем это Пусть эта матрица особая Тогда она имеет по крайней мере одно нулевое собственное число Этому собственному числу отвечает ненулевой собственный вектор у, так что имеем SS*y = 0. Домножая это равенство на у*, получаем y*SS*y — (S*y)3. Следовательно, S"y = 0, а это значит, что строки матрицы S линейно зависимы, что противоречит предположению теоремы Этим утверждение 1) теоремы доказано полностью. В случае задачи в) будем искать начальное условие х0 в форме х0 = о^ + х, (15 31) где х удовлетворяет условию ортогональности ох = 0. Полставтяя (15 31) в (15 26), получим 1 = [0(х»]-»[Но-5с] (15 32) Из (15 31) и (15 32) окончатечьно находим x0 = o»[aa»]-1[H0 — Sc] + x (15 33) Легко проверить, что любое решение системы (15.1) с начальным условием (15 33) будет удовлетворять граничным условиям (15 22) Этим утверждение 2) теоремы 15.3 доказано полностью. При доказательстве третьего утверждения теоремы 15.3 без ограничения общности можно считать, что строки матрицы {5, а} линейно независимы. Тогда решение системы (15.26) будем искать в форме c = S"5 + c, (15.34) x0 = u*6-fx, (Гт 35) Здесь вектор с, х ортогонален матрице {S, а}. Именно, Sc-f ох=0. Подставляя (15.34), (15 35) в (15 26), найдем [6S«4-oa»]b = rle. (15 36)
§ 151 синтез линейных управлений 225 Матрица системы (15 36) неособая Отсюда имеем 6 = [SSM-aa*]-1H0 Непосредственным вычиспением можно показать, что любое решение системы (15 1) при управлении, определяемом формулами (15 23), (15 34), (15 36), и начальном условии, определяемом формулами (15 35), (15 36), будет удовлетворять граничному условию (15 22) Этим теорема 15 3 доказана полностью Дадим теперь представление управлений для задачи а) в синтезированной форме С этой целью исключим вектор с из (15 23) и (15 25) Тогда получим u = M(0 x+N(0, (15 37) где М (0 = - В* Г J [dS (0)] Y (#) A (t, 0)1 ' J [dS (О)] Y (в) У-» (/), '•|"$[dS(d)]r(OM(*, 0)1 'х |"$£vd/ + $K-»Fd/]"]J Если в предыдущих рассмотрениях при переходе из произвольного начального состояния в состояние х = 0 за время [О, Т] управление имело неограниченное значение коэффициентов лишь при i = T, то в случае задачи (15 21), (15 22) управление (15 37) будет иметь неограниченное значение в точках tj, в которых заданы граничные условия для движения системы (15 1) Однако само движение такой системы при управлении (15 37) будет определяться начальным состоянием однозначно и будет представлено непрерывно дифференцируемой векторной функцией Теорема 154 Если матрица S является квадратной и неособой, то система (15 1) при управлении (15 37) будет иметь непрерывно дифференцируемое решение, удовлетворяюире условию (15 22) Доказательство Из (15 26) находим c = S-1[H0—ax0] (15 38) Полагаем в (15 24) /=0, заменяем О на / и исключаем вектор с, пользуясь (15 38) Тогда получим х(0 = У(0[Е —Л(0, 05-1о]х0 + + К(ОМ(0. t)S~4l0 + UBv + Y-l¥)dt\ (15 39) N(/) = V + B»| J[dS(d)]r(OM Г [dS (*)]/(*) ■) Г Л (0, 05-1H0 + J(Bv + r-IF)d/1
226 Ш'СВ-.ЕМЧ CIi"TE3A 1ПРАВ1ЕНИЯ |n i\ Непосредственной псдстаг<овкоп (15 39) в (15 1) убеждаемся, u-c (15 39)является непрерывно дифференцируемым решением спермы (15 1) при хправчении (15 37), и кроме того, из хода построения вытекает, что (15 39) \довтетворяет гра"нчпым \стовиям (15 22), что и требовалось доказать Рассмотрим теперь нсскотько подробнее задачу в) С одной стороны, задача может рассматриваться как краевая задача для чиненных дифференциальных уравнений С др>гой стороны, задача в) может рассматриваться как задача интерполирования Действитетьно, рассмотрим множество Q0 п всех вещественных непрерывных, векторных ф\нкций |(0. заданных на промежутке [О, Т] П>сть -ребуется найти начальные условия для системы (15 1) таким образом, чтобы соответствующее этим начальным условиям решение х = х(0 удовлетворяло тем же граничным условиям вида (15 21), (15 22), что и наперед заданная функция КО И!'аче говоря, требуется, чтобы было 5Дх(/,•)-£(/,)] = 0, / = 0, , k (1540) in и в бстее общем ст\чае |[dS(tf)][x(fl,-s(fl)]=0 (15 41) Решение х(/) системы (15 1), удовлетворяющее (15 41), будем называть интерполирующим для функции КО Теорема 155 Ёсш а — квадратная неособая матрица, то капдои векторной функции КО отвечает при заданной управлении и един~твеннач интерпо шрующая функция х(/), удовлетворяющая системе (15 1) и усювию (15 41) Есш матрица а пря- моугочьная и имеет шнейно независимые строки, то каждой векторной функции с (О отвечает для фиксированного управления и семейство интерпошрующих векторных функций \(t), удовлетворяющих системе (15 1) и условию (15 41) Доказательство П\сть о—квадратная неособая матрица Тогда из (15 26) имеем х0 = о-1[Н0—5с] (15 42) Полагая е (15 24) / = 0 и заменяя it- на t, пользуясь (15 42), исключаем вектор X;, Тогда получим x(0 = K(/)icrl[H0—Sc] + A(0,i)c±^(Bv-rY->F)dt\ (15 43) Ф\нкиия (15 43) удовлетворяет системе (15 1) при управлении (15 23) и явтяется единственным решением этой системы, удовлетворяющим условию (15 22). Пусть КО, принадлежащее Q0, п.
§ 15] сииtft пинкпных управжннй 227 есть векторная функция, удовлетворяющая (15 22) Тогда функция [х(0 —э(0] удовлетворяет (15 41) Следовательно, х(0 является интерполирующей функцией для £(/) Пусть теперь матрица о— прямоугольная, и строки ее линейно независимы Тогда решение будет иметь вид xn = a[ao*]-1[H0 —5c] f х, где х— вектор, удовлетворяющий условию ортогональности Полагая в (15 24) t = 0 и заменяя ■& на t, найдем x(t) = Y(t){o[oo*]-l[H0-Sc)+x\ + + А(0, t) c+^(Bv+V-^F)dt (1544) о Формула (15 44) дает нам решение системы (15 I) при управлении (15 23) удовлетворяющее условию (15 22) Таким образом, (15 44) является семейством интерполирующих векторных функций для любой функции i(0€Qo г], удовлетворяющей условию (15 22) Заметим, что (15 44) зависит от произвольного вектора х, ортогонального строкам матрицы о, что и требовалось доказать Рассмотрим различные частные случаи применения теоремы 15 5 С этой целью рассмотрим линейные дифференциальные уравнения порядка п x«»» + p,v««-1»+ +p„x = qu + f, (15 45) где р,, , ра, q, f — вещественные, непрерывные, ограниченные функции, заданные при / X) Обозначим через A', (t), , xn (t) совокупность линейно независимых решении однородного уравнения, получаемого из (15 45) при q = 0, f = 0 Рассмотрим далее совокупность всех непрерывных функций £(/)GQo г\, заданных на [0, Т] Пусть требуется найти начальное условие для уравнения (15 45) таким образом, чтобы (15 45) имело решение x = x(t), удовлетворяющее условиям xV,) = lUj) = i,. /=1, .. , п, (15 46) где /,, , /„—некоторые различные точки промежутка [0, 7'] Известно, что общее решение уравнения (15 45) имеет вид JC=|v/f/(')n $ИЧЛ T)[qu+f)dT (15 47) Будем называть (15 47) ишперг опционным многочйеном для функции £(/), если выполняется (15 46) Введем в рассмотрение
228 определитепь D(tlt , //> = ПРОБ1ЕМА СИНТЕЗА УПРАВ1ЕНИЯ мм. ;:!; ;\ппГ Ыи), *.&) *«(М| к(*„). *.«'«). ...,xnVn)\ [Г Л IV (15 48) Из теоремы 15 5 вытекает, что если определитель (15 48) отличен от н^ля, то для любой функции |«) имеется единственный интерполяционный многочлен (15 47) Этот интерполяционный многочлен может быть представлен в различных формах Для того чтобы получить из (15 47) интерполяционный многочлен типа Лагранжа, введем в рассмотрение линейно независимые решения lj(t) однородной системы (15 45) по формулам I,- щ^- -p-j (1о4У) Тогда интерполяционный многочлен типа Лагранжа для функции l(t) будет иметь вид *(0=|j/,(0 6,+ sV(', x)(^+/)dx, (15 50) |y = gy- J Г (/у, t)(<7U+/)dx Действительно, полагая t = tj в формуле (15 50), найдем из М*/) *• 'Л*/) = 0< s=^/> чт0 *('/) = £/> с одной стороны, и, с другой стороны, (15 50) является решением системы (15 45) Таким образом, установлена Теорема 15 6 Если определитель (15 48) отличен от нуля, то для любой функции % £ Cf0 rj существует единственный интерполяционный многочлен типа Лагранжа, представимый в форме (15 50) Перейдем теперь к построению интерполяционного многочлена типа Ньютона С этой целью введем в рассмотрение оператор сдвига т Именно, если gj, £2, , £„—числовая последовательность, то т(£*) = |А+1, так что ift+i = T*(|1) Обозначим далее через Л —разностный оператор Д = т— 1 Тогда будем иметь А(У = 1л+1— h Далее имеем Д* = [т— 1]*= У, т*-'(— 1)'4, и,
§ 15] СмНТЕЧ ЛИНЕЙНЫХ УПРАВЛЕНИЙ 22У следовательно Последнее соотношение определяет k-ю разность Из этой формулы вытекает, что для заданных чисел £„ . , £я можно образовать все разности до порядка п— 1 включительно Выразим степень оператора сдвига через разностный оператор Тогда получим т* = (1 + Д)*=|;с(д' Интерполяционный многочлен типа Лагранжа (15.50) можно записать в форме х = 2 '* W T*_I (l"i> + J W «• т) <?" + /) dT (15 51) Исключая из (15 51) степени оператора сдвига, получим х = 2 '* (0 *2 С*-'А' (6.) + ( w (t, т) (9и -И) dx Меняя порядок суммирования, найдем x = *|Jt/(0A/(6i) + S^(<. -*)(?"+/Мт, (15 52) где «'/(0= 2 ci-W* Теорема 157 Есги определитель (15 48) отличен от нуля, то для любой функции £(/)€Qo. ri существует единственный интерполяционный многочлен (15 52) типа Ньютона Возникает вопрос, при каких условиях определитель (15 48) отличен от нуля Теорема 158 Существует по гожительное число е>0 такое, что если tu tt, .., tn—различные точки промежутка [t, t + г], *€[0, Т], то определитель (15 48) отличен от нуля Доказательство Пусть теорема 15 8 не имеет места Тогда можно указать по крайней мере одно число / такое, что для лю&ого е > 0, сколь угодно малого, найдутся различные точки /j, t2, , t„ промежутка [/, l + г] такие, что определитель (15 48) обращается в нуль Покажем, что это предположение
230 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV противоречит линейной независимости функций хх(/) x„(t) на промежутке [0, Т] Разложим вторую строку этого определителя в ряд Тейлора по степеням (г—tfx до членов второго порядка малости относительно tt — tt Третью строку разложим в ряд Тейлора по степеням tt—tx до членов третьего порядка малости и т д Разложим п-ю строку определителя в ряд по степеням t„ — tt до членов п-го порядка малости Затем вычтем из всех строк первую строку В полученном определителе k-ю строк> поделим на tk — in и вычтем вторую строку из последующих Действуя таким образом далее, получим определитель, сколь угодно мало отличающийся от определителя Вронского Wron(Xj, • • . хп) — »(tl)...x<T»(tl) (15 53) Следовательно, определитель (15 48) может обращаться в нуль при достаточно малом е лишь в том случае, когда определитель (15 53) обращается в нуль Последнее невозможно, следовательно, указанное в теореме положительное число е существует Следствие Если узлы интерполяции tu .., tn выбраны с достаточно малым шагом, то построение интерполяционного полинома для любой функции 5(0€Qo. п всегда возможно В другом частном случае применения теоремы 15 5, а именно, при построении интерполяционного многочлена типа Эрмита условия разрешимости задачи выполняются не всегда, если даже узлы интерполяции сколь угодно близки Обозначим через С*0, т\ совокупность вещественных k раз непрерывно дифференцируемых функций \(t), заданных на промежутке [0, Т] Пусть tlt . , /,—различные точки этого промежутка, и пусть в точке ts заданы значения производных [£(/,)](**/), /=1, 2, ..., /, порядков ks/, s = l, . „I, так что число ktf может принимать значения из ряда чисел (0, 1, . . , п—\) Будем считать, что 2 Ь = л Требуется построить интерполяционный многочлен x{t) вида (15 47), для которого [*(/,)]<*'/> =[5(*,)]<*«/>. s=l '• / = 1. •• ./. <1554> Если задача (15 54) разрешима, то построенный полином будем называть типа Эрмита Рассмотрим определитель D,(/, tt), строки которого образуют векторы [*| (/,)](**/\ •» [•*„(**)](**/*• /=1, ., /„ s = l, ., / Заменим в строке, определяемой индексами s, ksj, этот вектор на хД/), xt(t), ..., xn(t) Полу-
§ 16J СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 231 ченный таким образом определитель разделим на Dy и результат обозначим через /**/(/) (15 55) Легко видеть, что функции (15 55) являются линейными комбинациями величин jcj (t) x„ (t) с постоянными коэффициентами Положим '. i _ г * = 2 2 /*•/(/)[£ (',)](*">+) * «. т) (<?«+/) л, где, как и выше, через Г обозначена функция l(i)-^W(t,x)(qu + f)dx (15 56) Если определитель D, отличен от нуля, то формула (15 56) дает интерполяционный многочлен типа Эрмита. Из теоремы 15 б вытекает, что существуют случаи, когда определитель Dt ни при каком выборе величин *„ ..., t„ не будет отличным от нуля. § 16. Синтез управлений в квазилинейных системах и системах стабилизации Пусть управляемая система описывается с помощью системы дифференциальных уравнений x = P(t)x + Q(t)u + F(t) + \iG(t, х, u, \i) (16 1) Будем считать, что элементы матриц Р и Q, а также компоненты вектора F заданы при />0, вещественны, непрерывны и ограничены, причем матрицы Р, Q имеют размерности пхп, яхг, а векторы F (t), и — размерности п, г соответственно. Будем считать, что компоненты векторной функции G (/, х, и, ц,) заданы при />0, х££„, и£Ег, |ц|0„ где Е„, Ег—п- и r-мерные евклидовы пространства, ц.—вещественный параметр, Hi—некоторая положительная величина. Будем считать, что компоненты вектора G непрерывны и непрерывно дифференци- §уемы по компонентам векторов х, и и параметра \i Пусть !—некоторая ограниченная область фазового пространства £„. Предположим, что требуется управляемую систему перевести из любого начального состояния x0£Q в конечное состояние х = 0 за время [О, Т] При решении этой задачи, как и в случае линейных управляемых систем, возникают вопросы отыскания условий существования управлений u = u(/, x), разрешающих поставленную задачу, а также отыскания аналитического представления таких управлений
232 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV Теорема 16 1 Если векторные функции, являющиеся столбцами матрицы В*, линейно независимы в любом промежутке [t, T], то существует семейство управлений и-u(/, х, ц, v), |,11< ц0, ||v||<o.f где ц.„ и v0—достаточно малые положительные постоянные, и где v—непрерывная векторная функция, удовлетворяющая условию т $Bvrf/ = 0 Каждое из этих управлений переводит систему (16 1) из начального состояния х = х0при 1=0, x0£Q в конечное состояние х = 0 при ( = Т Доказательство Напомним, что матрица В определяется через фундаментальную систему решений Y однородной линейной системы x=P(t)x, Г0=£ (16 2) по формуле B=Y~'Q Будем искать управление в форме u = B*c (-V (16 3) Подставим (16 3) в (16 1), умножим обе части на матрицу К"1 и проинтегрируем в пределах от 0 до Г Тогда получим г -х0=Л<0, T)c+\Y-l[F + nG}dt (164) о Если после умножения (16 1) на Y~l проинтегрировать в пределах от t до Т, то получим также 7 Т — x(t) = Y{t)A(t, T)c + $Bvd/ + $y-l(F + fiG)d* (165) Обозначим через с0 то значение вектора с, которое получается из (16 4) при ц. = 0 Вычислим теперь якобиан l&j 4=j ПР" с = с" и »г==0- Из формулы (16 5) легко видеть, что этот якобиан совпадает с определителем матрицы —Y(t)A(i,T) Так как векторные функции, образующие столбцы матрицы В*, линейно независимы в любом промежутке [/, Т], то существует обратная функция с = с(/, х, (а, v) (16 6)
§ 16) СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 233 при любом достаточно малом |ц|<р.0 и любой непрерывной функции v, удовлетворяющей условию ||v|Ku0, ц„, vn~доста точно малые положительные постоянные Подставляя (16 6) в (16 3), найдем u = u(<, x, p., v) Покажем, чго при построенном управлении любое решение системы (16 1), начинающееся в точке x0£Q, будет обладать свойством х = 0 при t = T Действительно, это решение будет совпадать с тем, которое имеет система (16 1) при управлении (16 3), в котором вектор выбирается как решение системы (16 4) Легко видеть, что реше ния уравнения (16 1) при таком выборе управления (16 3) будет обладать свойством х = х„ при / = 0 и х= 0 при t = Т, что следует, в частности, из (16 5) Следовательно, построенное семейство управлений (16 2) обладает требуемым свойством Замечание Векторная ф>нкция v может быть и разрывной Однако требуется, чтобы ее компоненты были суммируемы с квадратом на промежутке [О, Т] Рассмотрим теперь управляемую систему в режиме стабилизации Пусть именно задана система дифференциальных уравнений вида x = P(0x+Q(0u + H(/, x, u), (167) где Р и Q имеют те же свойства, что и в системе (16 1) Функция Н имеет те же свойства, что и G в системе (16 1) и, кроме того, требуется, чтобы 1|Н||<т[||х||-г-||"11],+а. (16 8) где у и а — некоторые положительные постоянные Будем считать, что неравенство (16 8) выполняется в доста точно малой окрестности точки х = 0, и = 0 Предположим, что управление u = u(/, х) (16 9) требуется выбрать так, чтобы система (16.7) при управлении (16 9) имела решение х = х(/), удовлетворяющее условию х = х0 при t =0 и х = 0 при / = Г при любом выборе вектора начального состояния х0 из достаточно малой окрестности конечного состояния х = 0 Теорема 16 2 Если столбцы матрицы B* = Q*(Y~1)* линейно независимы, то существует семейство управлений u = u(/, х, v), (16.10) II v |К Va, || x |K e. ^e Va и г—достаточно ма те положительные постоянные Каждое решение системы (16 1), начинающееся при * = 0 в области ||х|Ке, при управлении (16 10) будет достигать в момент t = Г конечного положения х = 0
234 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV Доказательство Сделаем в системе (16 7)_замену_иско- мых функций и управлений по формулам х = цх, и=-ци, где fi—некоторый малый параметр Тогда получим систему квазилинейных уравнений вида (16 1) при условии, 4ToF(f) = 0 Применяя далее теорему 16 1, где в качестве области Q берется некоторая окрестность положения х = 0, придем к построению указанного семейства управлений Если в системе (16.1) положить u=B*c + v и затем ввести обозначения сх = *„.,.! с„=хм, то для переменных л„+л получим систему уравнений Т = 0, к = \ п (16 11) Объединяя систему (16 1) с системой (16 11), получим систему обыкновенных дифференциальных уравнений, для которой задача построения управления, переводящего систему из положения х0 в положение х = 0, за время [О, Т], превращается в обычную краевую задачу с разделенными граничными условиями. В связи с этим особое значение имеет теория существования и единственности решений краевых задач для обыкновенных дифференциальных уравнений Далее приводится развитие метода прогонки для решения таких задач Пусть задана система п обыкновенных дифференциальных уравнений %f = f,(t,xl дг„), s-1 п. (1612) Предположим, что существует решение xt=xt(t), /6[0, Т], s=l п, (16 13) удовлетворяющее краевым условиям «P/(*i(0) *„(0)) = 0, / = !,..., к, (16 14) */(xt(T) *„(Г)) = 0, 1=1 п-к. (16 15) Требуется дать способ построения решения (16 13) системы (16 12), удовлетворяющее краевым условиям (16 14) и (16 15). Рассмотрим уравнение в частных производных W+LiS^f^0- (16 16) Построим решения уравнения (16 16) £«=£;(', хи ...х„) = 0, 1=1 к, (16 17) П/=Ч/('. *i. •••.*») = 0. /=1 «-*. (1618)
§ 16] СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 235 удовлетворяющие начальным условиям 6/(0, *,, . , х.) = ф,(х1 *„), » = 1, . , ft, (16 19) 4j(T, xx, . ., *„) = ♦,(*, х„), /=1, . ., n-k (16 20) Решение (16 13) с помощью этих функций можно отыскивать различными способами I. Найдем решение xlt xt, ..., хп системы уравнений Ы7"'*» *-> = 0' / = 1'-- •*• (1621) +у(ДС„ -.., *.)=0, /=1, .. , tl-k Чтобы найти решение (16 13), надо проинтегрировать систему (16 12) в обратном направлении по времени при условии xt(T) = xs, s = 1, . , п II Найдем решение xlt ., хп системы уравнений Ф/(*1. • . х„) = 0, i=l, , ft, (\roo) 4/(0, *х. .... *„) = <), /=1, . , п—ft {10Zji' Для того чтобы построить решение (16 13), надо проинтегрировать систему (16 12) при начальных условиях xs {0) = xs, s = 1, , п III Так как решение (16 13) удовлетворяет условиям (16 14) и (16 15), то необходимо имеют место следующие равенства 6,0,*,.. ,*) = 0, ,-!,. „ft, *]/('■ *i, • ., *„) = 0, i = \,. , n—ft x ' Равенства (16 23) имеют место вдоль любой интегральной кривой, удовлетворяющей (16 14) и (16 15) Следовательно, искомое решение (16 13) можно отыскать из них, не обращаясь к интегрированию системы (16 12) Воспользуемся равенствами (16 23) дтя построения вычислительного алгоритма, позволяющего определить с наперед заданной точностью решение (16 13) системы (16 12) в том случае, когда краевые условия линейны и система (16 12) является квазилинейной Пусть /. С *i. . *«) = 2 Psi (0 х{ +- q, (0 + Ms (t, xlt . , хп), Ф/ -= 53 «.-Л 4 bh *, = 2 */гх. + р>
236 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV Тогда уравнения (16 12) и краевые условия (16.14) и (16 15) можно записать в векторно-чатричной форме *-P(0x+Q(0i-|iO(/,x). (1624) л0х(г) + в0=о, г0х(Т) + д0=о, где х есть вектор (хи . ., х„), Q (/) и G(/, x) —векторные функции своих аргументов, В0, А0— постоянные векторы, P(t), А0, Г0—матрицы соответствующих размерностей Имея в виду получить интегральные уравнения, которым будет удовлетворять непременно решение (16 13), будем теперь рассматривать векторную функцию G(/, x) лишь как функцию времени, считая, что она вычислена на интересующем нас решении (16 13) Легко видеть, что в рассматриваемом случае решения (16 17) и (16 18) уравнения (16 16) будут линейными функциями, а именно, 3 = Л(0х + В(0, Н = Г(/)х+А(0, S = (llt . , Е»), Н = (Л11 ., п»-»). причем матрица A (t) и вектор В (/) удовлетворяют системе урав нений d^ + AP = 0, (16 25) § + ЛО' = 0 (16 26; при начальных условиях А{0) = А0 (16 27, В(0) = В0 (16 28; Аналогично матрица Г(/) и вектор А (О удовлетворяют системе ^- + Г7> = 0, (16 29) f- + rQ'=0 (16 30) при начальных условиях Г(0) = Г0, (16 31) Д(0) = Дв. (16 32) Здесь Q' = Q(0 + jiG(/, x(t))
§ 16] СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 237 Интегрируя уравнение (16 26) при начальном условии (16 28), найдем B(0 = B1(/)-JiS>l(T)G(T, x(x))dx, о B1(/) = B0-S^(T)Q(x)dT о Аналогично А (О = At (/) - ц S Г (т) G (т, х (т)) dx, A1(/)=A0-Sr(T)Q(T)dx т Из (16 23) имеем А (0 х + В (0 = 0, (16 33) Г(0х + Д(/) = 0. (16 34) Умножая (16 33) на A*(t), a (16 34)—соответственно на V(t) и затем складывая почленно и умножая слева на матрицу С(0 —(ЛМ + ГТ)-1, получим искомое интегральное уравнение x(t)=x0(() + \ilAl(t,T)G(x,x(x))dx + lilA3(t,x)G(x,x(i))dxf (16 35) где x0(0=-C(0(B1(0 + Ai(0). At(t, x) = C(t)A*(t)A(x), A2(t, х) = С(0Г«(/)Г(х) Обозначим через Y~l(t) фундаментальную систему решений линейных уравнений § + />х = 0, (16 36) У-»(0)=£, где Е—единичная матрица. Тогда A(t) = A9Y-*(t), r(t) = T0Y(T)Y-l(t) и А* (/) А (/) + Г* (О Г (0 = (К-» (/))• [л;А + У (Т) Г.Т.К (Г)] К-> (Г), откуда вытекает, что для того, чтобы существовало решение интегрального уравнения (16 35), необходимо и достаточно, чтобы
238 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV постоянная матрица, стоящая в квадратных скобках, была иеособой Теорема 163 Пусть 1) правые части системы дифференциальных уравнений заданы при t £[0, Т], ||х—х0||</- вещест- вгнны, непрерывны и функции Gs (t, x) удовлетворяют условию Липшица по (хи .... х„), 2) матрица AlA0-\-Y*{T)T*aTQY(Г) — неособач Тогда существует fx0 > 0 такое, что интегральнее уравнение (16 35) будет иметь единственное решение, удовчетворяющее условию ||х(0-хв(0!|<«И. Ы<И. Здесь г, т — положительные постоянные и II х (0-х. (О II = |/ 2 (*,-*.•)* Доказательство Обозначим через k(x) интегральный оператор, входящий в уравнение (16 35) Тогда это уравнение можно записать в форме x = x0 + pJ:(x) (16 37) Построим носпедовательность векторных функций х„ = х0 + ЦЙ(х„_1), п=\, 2, .. Обычным способом убеждаемся, что существует такое число, что при | \i | < р.0 будет ||х„—x0||^m|[i | < г, и, следовательно, по? строение всех приближений оказывается возможным Далее, как при доказательстве сходимости в теореме Пикара, с помощью условия Липшица убеждаемся, что ряд Xe-Их, —х0)+. .+(х„—х„_х)+ .. сходится абсолютно и равномерно к решению \(t) интегрального уравнения (16 35), которое обязательно будет удовлетворять исходным дифференциальным уравнениям и краевым условиям На возможность построения последовательных приближений для квазилинейных систем с линейными краевыми условиями мне указал академик В В Новожилов Пусть задана система дифференциальных уравнений dx,/d/-=/,(/, xv , x„), s = l, , n, (1638) и пусть на промежутке t£[Q, T] система (16 38) имеет решение х5=л5(0, s=l, 2, ., п, (16 39)
§ 16) СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 239 удовлетворяющее краевым условиям Ф,(х(*в), х(^) х(/А+1)) = 0, 1=1 п. (16 40) где /g = 0, tk+1 = T, te<tl<...<lk+l, и гдех(/) = (л:1, .. , х„) Требуется дать способ отыскания решения (16 39) системы (16 38), удовлетворяющего условию (16 40) Перейдем к решению поставленной задачи Пусть решение (16 39) найдено х = х(0 Положим х,(0 = *('/ + «/). / = 1. 2, .. , k+l (16 41) Легко видеть, что векторные функции (16 41) будут удовлетворять уравнениям dxJ/dt = F/(t, Xj), (16 42) где F,(/, xj) = af(tf + aj, х,) Векторная функция F имеет компоненты fs (t, x), являющиеся правыми частями системы (16 38). Кроме того, векторные функции (16 41) удовлетворяют начальным условиям х/(0) = х(//), /=1, 2 А + 1 (16 43) Итак, если система (16 38) имеет решение (16 39), удовлетворяющее условию (16 40), то необходимо система (16 38), (16 42) из n(k + 2) уравнений будет иметь решение (16.39), (16 41), причем это решение будет удовлетворять краевым условиям Ф,(х(0), х,(0) xft+1(0)) = 0, t=l, 2 n (16 44) Обратимся теперь к выбору постоянных величин ах, ..,аА+1 Выберем эти величины так, чтобы в заданный момент были выполнены соотношения х(7) = х,<7), /=1, ... k+l (16 45) Для того чтобы имело место (16 45), саедует положить а,— *=*(t — tj)lt При таком выборе величин о^ для систем уравнений (16 38), (16 42) на промежутке [0, t] возникает краевая задача с разделенными краевыми условиями (16 44)—(16 45) Следовательно, на этом промежутке можно будет применить развитую выше теорию Однако можно действовать и непосредственно, а именно рассмотреть уравнение в частных производных T+tfe'.+tg^'./-0- (1646>
240 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV где /,. — компоненты векторов Ff и xs—компоненты векторов х^. Построим п решений уравнения (16 46) £, = £,('. х, xlf ... хк+1) (16 47) с начальными условиями £,(0, х, xv .. , **+,) = Ф/(*. х1г .... *л+1) (16 48) На искомом решении функции (16 47) будут удовлетворять уравнениям £,('. х> *» •••. *a+i) = 0 (16 49) Для того чтобы найти искомое решение в точке t, достаточно в равенствах (16 49) положить t=t и воспользоваться условиями (16 45) Тогда уравнения (16 49) позволят определить векторную функцию x(t) Если считать теперь величину /£(0, Г) произвольной, то приведенная выше процедура позволяет определить решение (16 39) системы (16 38) без дальнейшего интегрирования Рассмотрим теперь несколько подробнее случай квазилинейных систем с линейными неразделенными краевыми условиями Итак, пусть краевые условия (16 40) имеют вид 2 Л/ох(//) + Во = 0. (16 50) Здесь А/а представляют собой вещественные квадратные матрицы с постоянными элементами и В0—вектор с постоянными вещественными компонентами Пусть исходная система (16 38), записанная в векторной форме, имеет вид dx/dt=P(t)x + Q(t) + iiF(tt х) (16 51) Тогда система уравнений (16 42) будет иметь вид dxy/d/ = />y(Ox/ + Q,(0 + |iF/(f, xy), (16 52) P/W^ajPVj + a/), Q/(0 = a/l(</ + «/0, Vf(l, x/)=a/F(^ + a/, x,) Предположим, что решение (16 39) найдено Тогда с помощью атого решения можно вычислить векторные функции F и F/. Положим R(0 = F(*, x(0), (16 53) R,(t)=F/(t, х(0), / = 1 А + 1 Здесь х/(/) —векторные функции, определяемые формулой (16 41). Если в системе (16 51) и (16 52) нелинейные члены заменить по формуле (16 53), то получим нелинейные уравнения, которым
§ 16] СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 241 будут удовлетворять функции (16 39) и (16 41) Уравнение (16 46), составленное для этих линейных систем, будет иметь решение (16 47), линейное относительно компонент векторов xi> > xa+i Обозначим через S вектор, компонентами которого являются упомянутые функции £,- Тогда 2= 2 А,(1)х,+ Ъ(() (16 54) Матрицы Aj(t) и вектор В(/) удовлетворяют линейной системе дифференциальных уравнений а-£- + А,Р, = 0, (16 55) ^ + £ 4,(0, + ^,)= 0 (16 56) /=о В формулах (16 54)—(16 56) x0(/)=x(0, P0{t) = P{t), Q. (0=Q(0. Rn(0 = R(0. Матрицы Aj(t) и вектор В (0 удовлетворяют начальным условиям Л/(0) = Л/,„ В(0) = Во Обозначим через У"1 (О фундаментальную систему решений для системы уравнений l + Px^C, (16 57) y-i(0) = £, где Е—единичная матрица Тогда матрицы Aj(t) можно представить следующей формулой Л,(0 = Л,/(/,)K-i (*, + «,*). / = °. l * + !• О658) Интегрируя уравнение (16 56), найдем B(0 = B„-S 2 AfWQfWdx-v l 2 A,(T)R,(x)dx (16 59) 0 '=° 0 '=° Из (16 49) имеем, что искомое решение удовлетворяет системе уравнений 2л/(0х/+в(о = о. 0660)
ПРОБЛЕМА СИНТЕЗЧ УПРАВ1ЕНЛЯ Положим в (16 60) t = t Испопьзуя далее соотношение (16 45), найдем из (16 60) [*2Л,(0]-х(7)=-В(7) (16 61) Предположим, что матрица 2 ^/'(0 — неособая Обозначим обратно ную ей через С (0 н тогда из (16 61) имеем *(0 = С(/) Д ) ^(T)Qy(T)dx-B0 +fiC(0 2 )A/(x)R/(x)dT (16 62) Заменим в выражении (16 62) функции Ry(x) их выражениями через функции ?f и введем в /-м слагаемом нов>ю переменною интегрирования Тогда формула (16 62) примет вид х (7) = х° (7) + ц S J ^ (7, 0) F (9, х (9)) dQ, (16 63) где Л, (7, 6) = С(7)Л/0Г(//)У-1(9). » х° (0 = 2 ) А/ (/, 9) Q (9) сШ —С (/) В0 (16 64) Уравнение (16 63) можно рассматривать теперь как интеграть- ное уравнение, служащее для определения векторной функции (16 39), так как величина / в уравнении (16 63) может теперь считаться независимой переменной 16[0, T] Заметим, что векторная функция х°(/), определяемая уравнением (16 64), б\дет давать решение поставпенной задачи при ц = 0 Обозначим через Д'(х) интегральный оператор, входящий в правую часть (16 63) Тогда уравнение (16 63) может быть представлено в форме х(О=х°(0Ч-|*/С(х) (16 65) Положим xN(t) = x'(t) + \iK(xN-1), N=l,2,... Оказывается, что при широких предположениях относите 1ьно правых частей исходной системы дифференциальны \ уравнений
§ 16] СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 243 последовательные приближения х°, х1, . равномерно сходятся к решению (16 39) системы (16 38), удовлетворяющему краевым условиям (16 50) А именно, имеет место Теорема 16 4 Пусть 1) правые части системы уравнений (16 57) заданы при t£[0, Т], ||х»(0-х||<г, вещественны, непрерывны там и удовлетворяют усювиям Липшица по х, 2) матрица 2Лл>^^/)— неособая Тогда существует положительное чист |х0 такое, что при любом р., |ц|<(х0, система (16 51) имеет непрерывное решение (16 39), удовлетворяющее краевым условиям (16 50) При этом решение будет единственным Доказательство Из условий непрерывности вытекает, чю ||x" — х^Кцт, (N = 1, 2, ..), если ц0 выбрано так, чтобы было \i0-ml<Cr, где тх и г—положительные константы Далее из условий Липшица будем иметь ||х»-х"-Ч1<цта||х»-'-х"-'|| Здесь N = 2, 3, ... Если величина \i0 к тому же выбрана так, чтобы было ivn,<l, то ряд х» + (х1—х°) + (х2 — х*)+... будет сходиться равномерно и абсолютно при /(Е[0, Т]к непрерывному решению (16 39) системы (16 51) Это решение непременно будет удовлетворять краевым условиям (1660) Установление теоремы единственности для такого решения производится стандартным образом В предыдущих рассмотрениях обсуждался общий случай, когда матрица Л (/) = 2 A,(t) (16 66) была неособой Уравнение (16 61) можно переписать в следующем виде Л(0х(0 = В1 + цВ„ (1667)
244 ПРОБЛЕМА СИНТЕЗА УПРАВ1ЕНИЯ [ ГЛ IV (16 68) (16 69) Итак, пусть матрица (16 66) особая Тогда, как будет показано ниже, ранг этой матрицы не зависит от / Обозначим его через k Теорема 165 Система (16 51) при |х = 0 имеет непрерывное решение, удовлетворяющее условию (16 50), тогда и только тогда, когда любой постоянный вектор Л, удовлетворяющий соотношению ЛМ = 0, будет удовлетворять также условию A*Bj = 0, где B^Bo+S \Ai0Y(tj)Y-H^)(X(x)dx / = о0 Доказательство При выполнении условий теоремы раш матрицы A(t) и ранг расширенной матрицы, получающейся из A(t) путем приписывания п+\ го столбца, равного Bt(/), будут совпадать А тогда линейная система уравнений, получающаяся из (16 67) при fx = 0, будет иметь решение, зависящее or n — k произвольных постоянных Итак, покажем, что ранги упомянутых матриц совпадают при выполнении условий теоремы Мат рица A(t), определяемая (16 66), может быть представлена также в форме Л (t) = 2 AjaY it,) Y-* (t) = AY-* (t) Так как матрица У-1 (/) —неособая, то ранг матрицы A (i) будет совпадать с рангом постоянной матрицы А Пусть Л—некоторый
§ 16] СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 245 постоянный вектор, такой, что ЛМ = 0 Тогда непременно будет Л» Л (0 = 0 Вычислим скалярное произведение вектора А на В,(0 Тогда будем иметь А'ВДО-АЧ Д$Лу,К(*у)У-Чт)0(т)Л-Вв| = = А' Д J A„Y (tj) Г"1 (т) Q (т) dx - A»Bt Покажем теперь, что обязательно будет иметь место равенство A*BX (/) = — А*Вг Действительно, А* 2 J AJ0Y (/,) У-1 (т) Q (т) dx = AM S Г"1 (т) Q (т) dx = О /= о о о Итак, при условии теоремы из ЛМ(0 = 0 вытекает Л*В, (0 = 0, что и означает совпадение рангов матрицы А (/) и расширенной матрицы Если матрица (16 66) имеет ранг к, то обязательно существует п—k линейно независимых векторов Л;, удовлетворяющих условию Л*Л(0 = 0 Предположим, что условие теоремы 16 5 выполнено и что существует решение системы (16 51), удовлетворяющее краевым условиям (16 50) Подставляя это решение в уравнение (16 67), получим систему тождеств Умножая слева полученные тождества на Л*, получим Л;В8(х) = 0, t = l, , п—k П670) Итак, если система (16 51) имеет решение, удовлетворяющее условиям (16 50), то это решение необходимо удовлетворяет уравнениям (16 67) и (16 70) Преобразуем уравнения (16 70), имея в виду, что A,* 2 J V(/,)y-4T)F(T, x(T))dx = = Л,М $ У-'(т) F (т, х (т)) dT-ЛГ 2 J A/0Y </,) У"'(т) F (т, х (т)) dx = = - Л; 2 ) A/0r (t/} У"1 (т) F (т, х (т)) dx
246 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ {ГЛ. IV Из этого вытекает, что уравнения (16 70) можно представить в форме *+• '/ Л?2 \AjoYit.) y-«(T)F(x, x(x))dT = 0, t = l, ...,n-k 1=0 о (16 71) Обозначим через х°=х°(/, с„ . ., с„_А) решение уравнений (16 67) при |А = 0 Подставим эти функции в подынтегральные выражения, входящие в (16 71) Полученные в результате этого функции произвольных постоянных с„ .., c„_fc обозначим через *+! '/ ft(Ci. с ce.ik)=A;/Sej4y,y(<y)y-i(T)F(T.x(T))dT (16 72) Теорема 166 Пусть. 1) выполнены условия теоремы 16 1; 2) существуют вещественные постоянные с1)0, c2i0, ..., с„_Л>0) удовлетворяющие уравнениям g, = 0, t' = l, 2, ., л —£, (16 73) м такие, что якобиан функций gu . ., g„_ft no переменным с,, .. , c„_ft отличен от нуля в этой точке Тогда существует положительное число \i0 такое, что при любом ц, |цКц„ будет существовать непрерывное решение системы (16 51), удовлетворяющее краевым условиям (16 50) Это непрерывное решение может быть полечено как предел последовательных приближений, указанных ниже Обозначим через х°(/) то решение системы (16 67) при р. = 0, которое соответствует величинам сь 0, сг, 0, , f„_ft, « Определим далее решение системы /ЦОх^ВДО + цВЛх") (16 74) Это решение будет зависеть от n—k произвольных постоянных х1 = х»(Л си .... с„_А) (16 75) Выберем произвольные постоянные си сг, . сп_к таким образом, чтобы функции (16 75) удовлетворяли уравнениям (16 71) Решение уравнений (16 74), соответствующее этим значениям произвольных постоянных, будем обозначать через х1 (/) Действуя таким образом далее, можно определить N-e приближение как решение уравнения Л(/)хЛ/ = В1(0 + цВа(хЛ'-1)> (16 76) удовлетворяющее соотношениям, получающимся из (16 71) при подстановке туда вместо х функции xN
§ 16) СИНТЕЗ УПРАВЛЕНИЙ В СИСТЕМАХ СТАБИЛИЗАЦИИ 247 Указанный способ построения последовательных приближений позволяет однозначно определить векторные функции xN (N = 1, 2, ...)» если иметь в виду, что произвольные постоянные ct, с2, ...,c„_ft на каждом шаге определяются как решения уравнения вида (16 73), расположенные в малой окрестности точки си 0, си 0, , c„_ft, 0 При доказательстве сходимости этих последовательных приближений используется факт дифферен- цируемости правых частей системы (16 51) Будем предполагать, что правые части системы (16 51), заданные при t£[0, T], ||х°(/)—х||<г вещественны, непрерывны и непрерывно дифференцируемы, где г, как и ранее, — некоторая положительная постоянная, и х°(/) —решение уравнений (16 67) при (i = 0, соответствующее выбранным значениям произвольных постоянных Ci.o. ci,o. •••• Cn-k. о Обозначим через с вектор размерности п—k, компонентами которого являются произвольные постоянные си с„ ..., c„_ft. Тогда из уравнений (16 76) можно найти х» (t) = Н; (О ВХ (0 + ^Я, (0 Ва (х"-Ч + Я, (t) с", (16 77) где Hl(t), H2(t), Я3(/)—матрицы, определяемые при решении уравнений (16 76) Подставляя функцию xN (t) в равенство (16 71), получим, что постоянный вектор cN удовлетворяет уравнениям Bl(H1(t)Hl(t) + ^H2(t)B2(xN-l) + H3(t)cN) = 0 (i=l n-k). (16 78) Система (16 78) имеет решение с0 при ц. = 0 Якобиан функций в точке с0 отличен от нуля Поэтому существует непрерывно дифференцируемая функция сл,(ц), удовлетворяющая системе (16 78) и такая, что ciV(ji) = c° при ц = 0 Оценим величину Цх^—х^_1|| Из (16 77) будем иметь || х"—х""11| < т, || с"—с""11| + mt\i || х"~*—х""« ||. Записывая равенства (16 78) для номера N — 1 и почленно вычитая их из (16.78), а затем применяя формулу конечных приращений, также найдем Цс"-с"-Ч|<т,ц||х"-«-х"-»||. Отсюда вытекает, что у х"_х*-11| ^ рщ || х"-*-х"-» [|. Можно показать, что положительное число ц„ можно выбрать так, чтобы при любых |цКц0 величины m,(t'= 1, 2, 3, 4) были
248 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV положительными постоянными, не зависящими от р., и построение всех последовательных приближений оказалось возможным Если щ, к тому же выбрать так, чтобы (V"« < 1. то последовательные приближения х°, х1, . , х^, ... будут равномерно сходиться при t £ [О, Т] к непрерывному решению системы (16 51), удовлетворяющему условиям (16 50) Если в условии (16 50) положить £ = 0, А00 = Е, А10 = — Е и J30 = 0, где Е — единичная матрица, то получим так называемые периодические краевые условия х(0) = х(7") Для такого рода условии способ построения интегральных уравнений в одном частном случае был указан А М Ляпуновым в работе [21] В работе [5] для периодических краевых условий было построено нелинейное интегральное уравнение, которое позволило дать способ построения периодических решений и найти условия их существования Теоремы, приведенные в настоящей работе, можно рассматривать как распространение упомянутых результатов и результатов работы [24] на общий случай краевых условий (16 50) § 17 Построение импульсных и релейно-импульсных управлений в линейной системе Пусть задана линейная управляемая система x = P(/)x + Q(/)u + F(0, (17 1) где х — л-мерный фазовый вектор, и — л-мерный вектор управле ния Будем считать, что элементы матриц Р и Q и компоненты вектора F заданы при />0, вещественны, непрерывны и ограничены Управление и (/) будем называть импульсным на промежутке [0, Г], если этот промежуток подразделяется точками /0 = 0, t„ t2, , tk на частичные промежутки [ij, lj^), в которых векторная функция и (0 сохраняет постоянное значение му При этом при четных значениях переменных / w/ = 0 Импульсное управление и (/) будем называть также релейно импульсным, если компоненты векторов ыу могут принимать лишь значения 0, ± 1 Обозначим, как и выше, через В матрицу B = Y~1Q, где Y — матрица фундаментальной системы решений для системы однородных уравнений х = Я(/)х (17 2) Пусть требуется с помощью импульсного управления из любого начального состояния х-=х0 при / — 0 перевести систему в конечное фазовое состояние х = 0 при t = T
§ 17] ПОСТРОЕНИЕ ИМПУТЬСМЫХ УПРАВЛЕНИЙ 249 Теорема 17 1 Если векторные функции, являющиеся столб цами матрицы B*(t), линейно независимы в промежутке [О, Т], то существует семейство импульсных управлений, переводящее систему из начальной точки х = х0 в конечное состояние х = 0 за время [О, Т] Доказательство Для простоты рассуждений будем считать, что в управляемой системе (17 1) управлением — скалярная функция, иначе говоря, г=\ Тогда условие теоремы будет состоять в том, что компоненты вектора В (/) являются линейно независимыми функциями на промежутке [О, Т] Тогда, как вытекает из § 14, необходимо существуют точки tlt t2, . , t„ £ [О, Т] такие, что векторы Bf = B(/f), s— 1, 2, ., п линейно независимы. Выберем далее величины Tt > 0, т4 > 0, ... так, чтобы промежутки [tj, t,-\-TJ) не перекрывались при /= 1, , п, и положим u = uf при г € [tf, '/ + т/) В остальных точках промежутка [О, Т] положим и = 0 Здесь ы„ ., и„ — постоянные числа Таким образом, построенное управление будет импульсным Покажем, что величины ии ,,ип можно выбрать так, что решение системы (17 1), начинающееся в произвольной точке х0 при / = 0, будет попадать в точку х = 0 при t = T Предположим, что такое управление построено Тогда, подставляя его в (17 1) и затем домножая обе части на Y~l и интегрируя в пределах от 0 до Т, найдем Т п Г*/ + Т/ Т _xe-Jy-1Fd/ = 2 J В(ОЛй/ (173) о '-'L tj J Легко видеть, что уравнение (17 3) имеет решение, если положить т х0 = — $V-lFd/ и «, = 0 Далее якобиан правых частей по переменным ы, и„ совпадает с определителем матрицы, столбцами которой являются векторы J B(t)dt Определитель этой матрицы отличен от нуля при достаточно малых положительных величинах т1( тг, .. , т„, так как этот опредечитель будет отличаться иа величины более высокого порядка малости от определителя, составленного из векторов В„
ПР0Б1ЕМА СИНТ13А УИРАВ1ЕННЯ помноженного на произведение tj т2 т„ Ибо J b(t)dt = r,B,+ J [B(0-By]rf/ (17 4) Интеграл, стоящий в правой части (17 4), имеет порядок малости выше чем \j в силу непрерывности вектора В(/) Таким образом, система (17 3) определяет при всех достаточно малых т, > 0, . , т„ > 0 величины ы,, , ип, которые и дают возможность построить импульсное зправаенне Обозначим далее через V любое импульсное управление, заданное на промежутке [О, Т], обладающее тем свойством, что т JfiVd/=0 (175) Если обозначить построенное выше управление через и0, то семейство импульсных управлений, решающее задачу перехода, будет задаваться формулой u = u0-)-V, что и требовалось доказать Если управление можно выбрать только из класса релейно- импульсных, то задача перехода из начального состояния в заданное конечное, вообще говоря, разрешима не для всех начальных состояний Теорема 172 Если векторные функции, являющиеся столбцами матрицы В*, шнейно независимы на промежутке [О, Т], то при F = 0 можно указать такое положите хьное число Н, что при ||х0||<# будет существовать ре пейно импульсное управление, переводящее систему из начального поюжения х = х0 при t = 0 в конечное положение х = 0 при t = Т Доказательство Как и выше, будем предполагать, что в системе (17 1) управление и является скалярной величиной Тогда, как и в теореме 17 1, получим = 2 7+т/ J В (/) Л и, (17 6) Будем считать в системе (17 6) величины Uj некоторыми параметрами, не обращающимися в нуль Система (17 6) имеет решение при т^ = 0, х0 = 0 Якобиан правых частей по переменным т„ . , т„, вычисленный в точке т, — 0, , тл = 0, совпадает с определителем матрицы, составленной из векторов В,, / = 1, .,л, помноженным на произведение величин uJt следовательно, якобиан правых частей (17 6) отличен от нуля Отсюда система (17 6) имеет единственное решение при любом выборе параметров Uj
§ 17) ПОСТРОЕНИИ НМШЛЬСНЫЧ Ч1°\В1ПП1Й 251 Выберем теперь Uj так, чтобы бьпо Uj — ~1 Если ||х0|| достаточно мала, то величины т1( , т„ сколь угодно малы Поэтому промежутки [tj, /у+Ту) перекрываться не будут, и, следовательно, построенное релейно-имп\льсное управ пение будет решать задачу перехода Замечание 1 Если при к = 0 но поженив равновесия в системе (17 1) при F„ = 0 оказывается асимптотически устойчивым по Ляпунову, то с помощью релейно-импульсного управления при выполнении условий теоремы 17 2 можно за конечное время перейти из любого начального состояния х = х„ в конечное состояние х = 0 Замечание 2 Если векторные функции, явпяющиеся столбцами матрицы В*, линейно зависимы на промежутке [0, Т], то не может существовать импульсное управление, переводящее систему из любого начального состояния х = х„ в конечное состояние х = 0 за время [0, Т] Действительно, пусть это не так Тогда импульсное управление можно представить также в форме т u = fi*c + V, где $BVd/=0 Подставляя это управление в (17 1), домножая на У-1 слева и интегрируя в предеаах от 0 до Т, найдем т А(0, Т)с = — х0 — 5* -lFdt (177) При любом выборе вектора х0 эта линейная система неразрешима, так как матрица А — особая В теореме 17 2 было установлено, что при релейном характере управления систему (17 1) можно перевести, вообще говоря, лишь из некоторой окрестности обпасти начальных состояний х0 в конечное состояние х = 0 за время [0, Т] Это обстоятельство возникает, как следует из теоремы 17 1, не из характера дискретности управления, а из того, что управления стеснены ограничениями по величине Изучим влияние ограничений несколько подробнее Предположим, что управление и£С, где U — некоторое множество, содержащее точку и=0 в качестве внутренней Определение 17 1 Будем говорить, что начальное состояние х„ принадлежит области управляемости R„, если существует число Т > 0 и суммируемая с квадратом функция и (t) такие, что система (17 1) переходит из нача1ьного состояния х0 в конечное состояние х = 0 за время (0, Т] под действием управления и = и (/) € U.
252 ПРОБПЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV Естественно, что время перехода Т может быть различным для различных начальных состояний х0£/?0 Аналогично можно ввести понятие области управляемости, отнесенное к произвольному начальному моменту t0, а именно через Rto будем обозначать совокупность всех состояний х0, для которых можно указать управление, переводящее в конечное состояние х = 0 за время [^0, t0 + T] Это управление будем также считать суммируемой с квадратом функцией на промежутке [/„, tn + T] и, кроме того, u£U Для стационарных систем RU = R0 Теорема 173 Если существует некоторая достаточно малая окрестность точки х = 0, ||х||<6, содержащаяся в R0, и систе ма (17 1) стационарна, то область управляемости R0 является открытым и связным множеством Доказательство Пусть х0 £ Ro Тогда существует управ ление u = u(/), для которого будет иметь место равенство = SK-i[Qu+F]d/ (17 8 Следовательно, для любого начального состояния х0 при этом же управлении будем иметь г Y-i(T)x(T) — xn=^Y->(Qu + F)dt = — xe (17 9) Если ||х0—х„|| < е, то будет ||х(7)||<||У(Г)|| е Положим е = 6/|| У (Г) || Тогда все движения системы (17 1), начинающиеся в е-окрестности состояния х0, оказываются в момент Т в 6-ок рестности состояния х = 0 Следовательно, существует число 7, такое, что система (17 1) может быть переведена из состояния х(Г) в положение х = 0 за время [Т, Т + TJ с помощью некоторого управления щ(() Таким образом, с помощью управления иг (/) система (17 1) может быть переведена из состояния х„ в состояние х = 0 за время [О, Г + Т,], причем ju(0, /6 [О, Г), Тем самым показано, что х0£/?0 Значит, R0—открытое множество Связность этого множества вытекает из того, что из любых двух точек х0£#0, х0 £ R0 в конечное время система (17 12 может быть переведена в точку х = 0 Следовательно, точки х„ и х0 могут быть соединены интегральными кривыми, соединяющими их с положением х = 0 При этом упомянутые интегральные кривые
§ 17) ПОСТРОЕНИЕ ИМПУЛЬСНЫХ УПРАВЛЕНИЙ 253 принадлежат множеству /?0 и являются абсолютно непрерывными Таким образом, теорема 17 3 установлена Рассмотрим теперь случай, когда U есть совокупность векторных функций, удовлетворяющих ограничению т $u2d/<a2 (17 10) Теорема 17 4 Если управления стеснены ограничениями (17 10), то область управляемости R„ определяется неравенством х*Л"1(0, +oo) x<a2, причем считается, что векторные функции, стоящие в столбцах матрицы В*, линейно независимы на каком-либо конечном промежутке, и F = 0 Доказательство Будем представлять управление в форме г u=B*c + V, \BVdt = 0 (17 11) Если управление (17 11) переводит систему (17 1)из начального состояния х„ в положение х = 0, то будем иметь —х„ = Л(0, Г)-с, (17 12) и, следовательно, управление (17 11) примет вид u = -BM-1(0, 7) x0 + V (17 13) Подставляя (17 13) в (17 10), найдем г х;Л_1(0, Т)х^а? — ^V*dt (17 14) Неравенство (17 14) определяет наиболее широкую область при т J V2d/ = 0 Обозначим через R (0, Т) эллипсоид, определенный неравенством хМ-^О, Т) х<аг Покажем, что R (0, 7) включается в R (0, 7J, если 7\ > 7. Действительно, если управление (17 11) переводит систему (17 1) из начального состояния х0 в положение х = 0 за время [0, 7], то, полагая на промежутке I £ [7, 7,]и = 0, получим, что про-
254 ПРОБЛЕМА СИМТЬЗА УИРЛВПЕНИЯ [1Л IV должениое таким образом управление будет переводить систему (17 1) из положения х0 в положение х = 0 также за время [0, 7',] Следовательно, из х„€/?(0, Т) вытекает, что х0£/?(0, Г,) Так как /?(0, Т) принадлежит при любом Т -*оо множеству хМ~1(0, +оо)х<1а2, то это множество, таким образом, и совпадаете областью управляемости R0 Замечание 1 Если в системе (17 1) F=^0, то множество R(0, Т) будет представлять собой эллипсоид при любом достаточно большом Т с центром в точке г S(7) = -$r-iFd; Объединение всех таких эллипсоидов и будет давать область управляемости R0, и, следовательно, вид этой области может оказаться весьма сложным Замечание 2 Предположим, что управления в системе (17 1) являются кусочно-непрерывными и что U является некоторым многогранником пространства Ег Тогда отыскание области управляемости является довольно сложной проблемой, не решенной до настоящего времени даже в случае, когда все входящие в систему (17 1) функции являются постоянными и U представляет собой r-мерный куб с центром в точке и = О § 18 Релейно-импульсные управления в квазилинейных системах и системах стабилизации Пус1ь управтяемая система описывается дифференциальными уравнениями вида х= P(t)x + Q(t)u + F(t) + \i G((, x, u, ц) (18 1) Предположим, что элементы матриц Р, Q и компоненты вектора F заданы при (^О, вещественны, непрерывны и ограничены Будем считать также, что компоненты вектора G заданы при /^0, х£Е„, и £ £г, ||-i|<|A|. вещественны, непрерывны и непрерывно дифференцируемы относительно компонент векторов х и и Обозначим, как и ранее, через Y (t) фундамента пьную систему решений для системы тинейных уравнений х = Я(0х, Y(0) = E (182) Положим далее B = Y~lQ Пусть Q —некоторая ограниченная область фазового пространства Еп Требуется систему (18 1) из любой точки этой об пасти перевести с помощью импульсного управления за время [0, Т] в конечное состояние х = 0
§ 18] PE1FRH0 ИМЛУЛЬСНЫС 1ПРЛВ1ЕИИЯ 255 Теорема 18 1 Если векторные функции, явшющиеся столбцами матрицы В*, шнейно независимы в промежутке [О, Т], то можно указать положительное число ц0 такое, что при любом значении вещественного параметра (д., |ц|<ц0, будет существовать семейство импульсных, управлений, переводящих систему (18 1) из любого начального положения x„£Q в конечное положение х = О за время [О, Т] Доказательство Не ограничивая общности рассуждений, можно считать управление u(t) в системе (18 1) скапярным Тогда из условия теоремы 18 1 вытекает, что компоненты вектора В являются линейно независимыми функциями в промежутке [О, Т] А тогда можно указать в этом промежутке точки *,, /а, , /„ такие, что векторы В^ = В(/5), s=\, 2, , п, будут образовывать в н-мерном пространстве базис, и потому определитель матрицы, столбцами которой являются эти векторы, будет отличен от нуля Предположим, что задача построения импульсного управления решена Именно, пусть существуют достаточно малые положительные числа т,, . , т„ и вещественные числа «,, , ип такие, что управаение «(0. решающее задачу перехода, имеет вид и —иj при * € [^/. */ + т/ ^ остальных же точках промежутка [0, Т] ы = 0 Так как величины т,, , т„ достаточно малы, то эти формулы определяют импульсное управление и однозначно Подставив это управление в систему (18 1), домно- жпв обе части слева на матрицу К-1 и проинтегрировав затем в пределах от 0 до Т, будем иметь п Г ',-», 1 Т Т -х„=2| J *(t)dt иЛ + $У-* Fdt + v^Y-tGdt (183) Покажем теперь, что система (18 3) имеет решение при ы = 0. Действительно, эта система при и = 0 будет иметь вид т т x0+Jv-1Fd/ + n5r-lG(/, х, 0, \x)dt = 0. (18 4) Легко видеть, что якобиан левой часть (18 4), вычисленный относительно компонент вектора х0 при ц = 0, равен 1 Уравнение (18 4) при р. = 0 имеет решение х0 = —- j У-1 ?dt, следовательно, существует такое число и2 > 0, что при | ц | < р., уравнение (18 4) будет иметь решение Следовательно, при таких значениях ц уравнение (18 3) также имеет решение Вычислимтеперь якобиан правой части (18 3) относительно переменных и,, ...,«„ Этот якобиан при р.«=0 будет совпадать с
256 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV опредечителем матрицы, столбцами которой являются векторы $ В (О Л, s=I п Определитель этой матрицы при достаточно малых положительных величинах xlt . , т„ обязательно будет отличен от нуля, как это было показано в предыдущем параграфе Таким образом, система (18 3) будет иметь решение при любом выборе параметра \л, | (х | < ц3 Возьмем далее произвольное импульсное управление V, обладающее свойством т lB\dt = 0 Если построенное выше управление обозначить через u0(V), то семейство импульсных управлений, решающих поставленную задачу, будет иметь вид u = u0 + V (185) Если импульсное управление подчинить условию ||V||<V0, где V0—фиксированная положительная константа, то можно будет указать число \it) = m'm{\il, \хг, р.э} такое, что при всех |ц|<|х„ управление (18 5) будет давать решение поставленной задачи Следует заметить, что при таком выборе управления и0 область Q оказывается достаточно малой окрестностью точки 7 х0 = —\ Y'1 Fdt, а чтобы получить управление, переводящее о систему (18 1) из любой точки х0 наперед заданной ограничен ной области Q, достаточно заметить, что система (18 3) при ^ = 0 имеет решение, построенное в предыдущем параграфе для линейного случая Этим утверждение теоремы доказано пол- ностыо^ Теорема 182 Если векторные функции, являющиеся столбцами матрицы В*, линейно независимы на промежутке [0, Т] и если в системе (18 1) F = 0, то существуют Л> 0 и ц0> 0 такие, что система (18 1) может быть переведена из любого начального положения || х01| ^ h при любом \ \i | < ц0 в конечное положение х = 0 с помощью релейно-импульсного управления за время [О, Т] Доказательство Будем считать, что управление и в системе (18 1) является скалярной функцией Тогда можно указать точки /j, /„ . , /„ в промежутке [0, Т] такие, что векторы B, = B(/S) будут линейно независимы Пусть т,, . ..,т„ —
К 181 I'l ЛЕЙНО-ИМПУЛЬСНЫЕ УПРАВЛЕНИЯ 257 достаточно малые положительные величины Положим u = ufnpn t£[tt> */ + т/)> /— К • п В остальных точках промежутка [О, Т] положим «=0 Считаем далее, что т1( , т„ таковы, что промежутки [t/t tj + T/) не перекрываются Величины иу считаем параметрами, принимающими только два значения ±1 Если с помощью такого релей но-импульсного управления система (18 1) может быть переведена из начального положения х0 в конечное положение х = 0 за время [О, Т], то необходимо будет выполняться уравнение п Г 's+xs "I T -х»=£ J B(/)d/ и, +ЛГ-'СЛ (18 6) * = ! L <f I 0 Система (18 6) имеет решение х0 = 0 при ц = 0, т^ = 0, s=l, , n Якобиан правых частей (18 6) по отношению к переменным т1? , т„, вычисленный при ц = 0, с точностью до знака совпадает с определителем матрицы, столбцами которой явтяются векторы Bit s = l, ., п, и, следовательно, отличен от нуля Из этого следует, что система (18 6) имеет решение при ||х0||<Л, |ц|<ц.(1, где h и щ — некоторые положительные постоянные Остается теперь распорядиться выбором знаков параметра так, чтобы решения (18 6), а именно т,, ., т„, были неотрицательны Этот выбор можно осуществить, например, следующим образом Так как векторы В,, s = l, , п, линейно независимы, то любой начальный вектор х„ можно разложить по этим векторам как по базису хо = £ в* е*. (18 7) s = l где Qs, s=l, , n — некоторые вещественные числа Положим us~ — sign9^ Тогда (18 7) может быть представлено в форме -х„ = £в, т,0 us Здесь tj0 будут уже, вообще говоря, положительными числами и будут представлять собой главную часть величин t,, , т„, рассматриваемых как функции параметра \и Замечание Результат, аналогичный тому, который сформулирован в предыдущей теореме, имеет место для системы в режиме стабилизации Именно, пусть x = P(0x+Q(0u + H(/, х, и), (188)
258 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV где Н(/, х, и)—векторная функция, заданная при/>0, *€Еп, и £ Ег, вещественная, непрерывная и непрерывно дифференцируемая относительно компонент векторов х и и Будем считать также, что ||Н||<с [||х|| + ||и ||]2 Система (18 6) примет в этом случае вид л Г 's*Ts \ Т ~xo = Z 5 В(/)<И и, +$У-»-НЛ (189) <=i L ts Jo Если предположить, что dH/dxs = 0, s = l, .... n, при х = 0, что соответствует тому случаю, что все члены, линейные относительно х, уже выделены, то получим, что система (18 9) имеет решение при х0 = 0, т,=0, s = 1, .., п Якобиан же правых частей системы (18 9) относительно величин т„ . , т„ при х = 0, и т, = 0, s = 1, , л, будет отличен от нуля Поэтому система (18 9) при достаточно малом ||х0|| будет разрешима, и, следовательно, путем выбора знаков величин и, можно построить релейно-импульсное управление, переводящее систему (18 8) из любого начального положения х0, ||х0||<А, в конечное положение х = 0 за время [О, Т] Рассмотрим вновь систему в режиме стабилизации и предположим, что управление стеснено некоторыми ограничениями u^U, где U — некоторое множество, содержащее точку и = 0 Определение 18 1 Начальное состояние х0€£„ и началь ный момент t0 > О будем называть точкой области управляемости R, если существует управление u = u(/)> t £[/„, t0 + T], ne реводящее управляемую систему из положения х = х0 при t — tu в положение х = 0 при / = /0 + Т Теорема 183 Если существует достаточно малая окрестность точки х = 0, || х || < б, принадлежащая любому сечению t множества R, то множество R открыто и связно Здесь под сечением множества R понимается совокупность всех точек (х0, t„) с фиксированным значением t0 Доказательство Пусть (х0, /„) — некоторая точка мно жества R Тогда существует управление u = u(/), заданное при *€[*oi ^о + Т1]. переводящее управляемую систему из состоя ния х0 в положение х = 0 В силу теоремы об интегральной не прерывности любое движение, начинающееся в точке (х0, /0), при этом же управлении переходит в точку х При этом ||х||<6, если только {||х0—x||-f- |f0 — /0|} < е Далее, так как б—окпест- ность точки х = 0 принадлежит любому /„-сечению множества^?, то существует управление, переводящее систему из точки х в положение х = 0 при t^[t„ + T, t0 + T + Tx)
§ 18] РЕЛВИНО-ИМПУЛЬСНЫЕ УПРАВЛЕНИЯ 259 Отсюда вытекает, что точка (х0, /0) будет непременно при надлежать множеству R, и, следовательно, R является откры тым множеством Далее, любые две точки множества R могут быть свяваны между собой абсолютно непрерывной кривой, целиком принадлежащей множеству R Действительно, из любых двух точек этого множества (х0, /„), (х„,70) можно подходящим выбором управлений попасть на полуось х = 0, / > 0, и, следовательно, эти две точки могут быть соединены дугами интегральных кривых, по которым совершается переход на полуось и отрезком полуоси Таким образом, множество R является открытым и связным Замечание 1 Если уравнения движения являются стационарными, то область управляемости представляет собой ци линдр, содержащий ось х = 0, t£(—сю, +оо) В этом случае ограничения t0 > 0 в определении области управляемости можно опустить и, следовательно, можно рассматривать область управ ляемости не в пространстве х, t, а в пространстве фазовых со стояний Е„ Замечание 2 Построение границ области управляемости для нелинейных систем является еще не решенной проблемой Если ограничения, стесняющие управления, смягчаются, то область управляемости, вообще говоря, расширяется Зависимость границ области управляемости от параметров входящих в ограничения, еще не изучена Ниже приводится интересный пример из области самолетовождения, в котором область управляемости самолетом была расширена за счет увеличения границ, стесняющих управление 7 октября 1916 г военный летчик русской авиации Константин Константинович Арцеулов сделал выдающийся вклад в развитие самолетовождения До этого момента около 20 лет авиаторов всего мира преследовал призрак смертельной опасности срыва самолета в штопор Применение авиации в военных действиях в Первую мировую войну привело к гибели многих летчиков из-за этого явления Солдаты фронтовики неоднократно наблюдали, как самолет как бы останавливался в воздухе, медленно заваливался на крыло и начинал вращаться вокруг своей оси, которая в свою очередь описывала вращательное движение около некоторого направления Стремительно приближаясь к земле, само леты разбивались, несмотря на все старания пилотов вывести их из такого опасного режима полета До 7 X 1916 г ни одному из пилотов не удалось вывести самолет из штопора и лишь К К Арцеулов решил эту трудную проблему самолетовождения Рассмотрим подробнее это событие Рассматривая самолет как твердое тело, выведем уравнения его движения Пусть
260 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ |ГЛ IV О — некоторая неподвижная точка пространства, начало неподвижной системы координат О£0т)0£0, оси которой направлены на неподвижные звезды Твердое тело можно представить как систему материальных точек Пусть R,-—радиус-вектор относительно О 1-й точки этой системы Обозначим через G центр масс твердого тела, тогда будем иметь R;=R0 + р,-, где Rn — радиус-вектор точки G, р,-—радиус-вектор i-й точки относительно центра масс G Обозначая через F,- совокупность всех сил, действующих на j-ю точку материальной системы, найдем m/R/ = F„ (18 10) где т, — масса, отнесенная к i-й точке Суммируя уравнение (18 10) по /, найаем далее mR0 = F (18 11) Домножая каждое из уравнений (18 10) векторно на р,- и суммируя по I, найдем далее ^2(т/Р/Хр,) = М, (18 12) где F — равнодействующая всех сил, приложенных к твердому телу, М —сумма моментов этих сил, вычисленных относительно центра масс тела Вектор р,- сохраняет постоянную величину Поэтом} р,- = <охр,, где ю — угловая скорость тела Отсюда уравнение (18 12; примет вид ^2(т,Р,х(а>хр,)) = М Раскрывая двойное векторное произведение, найдем р,-х(<охр,) = (£р?— р.рГ) о, Таким образом, уравнение (18 12) может быть записано в форме |-(вш) = М ,'18 13) Здесь Е—единичная матрица, 9—тензор инерции, р*—транспо нированный вектор р, Таким образом, уравнение (18 11) преа ставляет собой уравнение сил, уравнение (18 13) —уравнение моментов Дтя того чтобы провести подробную запись этих уравнений, введем в рассмотрение системы координат Рассмотрим непот внжную систему координат 0x!t]£, в которой ось 0,| направлена на север, ось 0,г) — вертикачьно вверх и ось Oj£ — на восток по касательной к параллели Точка О, находится на поверхности Земли на уровне моря
§ 18] РЕЛЕЙНО ИМПУЛЬСНЫЕ УПРАВЛЕНИЯ 261 Рассмотрим также связанную систему координат Gxyz, в которой ось Gx направлена по оси самолета к носу, Gy — в плоскости симметрии и ось Gz к правому крылу Обозначив далее через Gx1y1z1 поточную или скоростную систему координат Ось Gxt направаена по вектору скорости V = R0, Gyx — перпендикулярно Gy, в плоскости симметрии и Cz, —в сторону правого крыла Введем в рассмотрение углы, дающие связь между этими системами координат Повернем систему 0,£т]£ вокруг оси 0,1] на угол т|) Затем полученную систему— вокруг нового положения оси 0,£ на угол в и затем вокруг вновь полученного положения оси ОД на угол у Полученная система имеет оси, паралаельные осям Gxyz Угол г|) называется углом рыскания, \гол 8—\глом тангажа, а угол у—углом крена Если такие же повороты совершать на \глы ф, 8, v, получая в результате систему с осями, параллельными поточной системе Gx1ylz1, этот угол <р называется курсовым углом, 8—угол траектории и v—воздушный угол крена При этом считается, что все вращения осуществляются в положительном направлении, т е против часовой стрелки, если смотреть с положительного направления той оси, вокрхг которой идет вращение Далее, если спроектировать ось G*, на плоскость симметрии Gxy, то получим два угла \гол межд\ этой проекцией и осью Gx обозначим а и угол между этой проекцией и GXj обозначим р\ а—угол атаки, р—угол скольжения Запишем уравнение сил (18 11) в проекциях на поточную систему координат, считая, что вектор F складывается из силы тяги, силы веса и аэродинамической силы Мы получим шУ = Т cos a cos (5 — X,— gsinB,, (1814) mVr, = Г sin a + У,—gcos8cosv, (18 15) ml/</l = _7,cosasinfi + Z1 + gcos0sinv (18 16) Здесь через Г обозначена величина силы тяги, g—величина силы веса, X,—лобовое сопротивление, Yt—подъемная сила, Zt—боковая сила, qt и гх — проекции угловой скорости ©,, с которой вращается система Gx^y^ в пространстве Спроектируем теперь уравнение моментов на связанные оси и получим Ap + (C-B)qr-Ixy(q-pr) = Mx, (18 17) Bq + (A—C)pr — Ixy(p + qr) = My, (18 18) Cr + (B-A)pq-Ixv{p*-q*) = M, (18 19) Здесь А, В, С — моменты инерции соответственно относи тельно осей х, у, г, 1ху—смешанный момент инерции, Мх, Му, Мг—проекции момента М на оси связанной системы, р, q, r — проекции угловой скорости системы Gxyz в пространстве на эти
2()2 HPOG IK\I\ CIIHTF3A ЯИ'ШИШЯ [ГЛ IV оси Найдем теперь уравнение движения цешра масс в системе координат О^цЕ, | = Vcos0 соэф {-и-., i) = l/sinO, ч = — Vcos 0 sin ср И и- Зтесь через u6 и «; обозначены состав 1лющне скорости ветра Дадим вид проекции аэродинамической силы и проекций моментов Из аэродинамики самопета известно, что Xl = ^pV-S Сх,. Мх = М1+урК\<И,Дн-)-у(.1/-М<Дэ, Y, = j9V-S Cj,. My^Nt + ^pVWAv Z, = -i- pV*SC2l, УИг = ^ + уРК7.2Дв Здесь через Д„ Д, Дв обозначены упы отклонения рулей направления, элеронов, высоты Перейдем к анализу уравнений движения (18 14)—(18 19) Рассмотрим упрощенное уравнение (18 14) Если считап> что движение самолета происходит по вертнкати вниз, то будем иметь mV = T + g-±pV*SCSl (18 20) Будем считать в этом уравнении Сх, постоянной ветчиной и 5, как выше, площатью крыльев Из уравнения (18 20) вытекает, что скорость V будет возрастать и ее предетьное значение iip.i постоянной тяге Т будет иметь вид v У Pscx, Следовательно, предельное значение скорости тем больше, чем больше тяга Управпяющие моменты, приложенные к самолег\, возникающие от откпонения рулей направтения, эаеронов и высоты, пропорционачьны квадрату скорости и поэтому б\д>т тем больше, чем ботьше сила тяги Дтя тоге чтобы расширить обпасть управляемости, надо, следоватетьно, \величпвать ско рость сближения самолета с поверхностью Зсмт, что и было предпринято К К Арцеуловым Обозначим через //„ высоту, на которой происходит срыв самолета в штопор, через Т0—максимальную ситу тяги Тогда
§ 19] CHIITt3 ЧИННЙНЫХ ИНВАРИАНТНЫХ УПРАВПЕНИЙ 263 максимальная скорость определится формулами и«- У pSCx, ' и, с ледова re тыю, минимальное время столкновения с землей равно (0-Hn/Vn Задача выхода из штопора может быть сфор мулирована теперь как затача управления \ именно, найти управление рулями высоты, направления и элеронов так, чтобы за время [0, /,] сааолет пз положения т| = #0 перевести в поло жение г) = #,, причем /, < /0 Разумеется, что эта задача имеет решение не при всех значениях //„, так как моменты, возникающие от рулевых органов, будут ограничены, и поэтом\ для каждого типа самолета имеется свое значение Н0, после кото рого могут существовать режимы движения, в которых столкнове ние с поверхностью Земли предотвратить невозможно § 19. Синтез линейных инвариантных управлений Предположим, что чиненная управляемая система описывается системой дифференциальных уравнений х = Я(/) x+Q(Ou + /?</) v, (19 1) где х, и и у — векторы размерностей л, г и k, a P(t), Q(t), R(t) — матрицы размерностей пхп, пхг и nxk соответственно Будем считать, что элементы матриц Р, Q, R заааны при t^O, вещественны, непрерывны и ограничены Пусть да iee x £ £„ — вектор фазовых состояний, и € Ег—вектор управлений и у^Ек— постоянный вектор Предположим, что в процессе управления системой (19 1) измеряются компоненты векторной функции z(0 = />1(0x + Q1(0" + /?,(0v, (192) где Pi(t), Q,(0. #i (/)—матрицы с известными элементами, являю щимися вещественными функциями, заданными при /^0, непрерывными и ограниченными Будем считать, что матрицы Ри Qlt /?, имеют размерности соответственно Ixn, Ixr, Ixk Требуется построить управление u = u(/, x,z), (19 3) переводящее управляемую систему из любого начального фазового состояния х0 в момент / = 0 в конечное состояние х = 0 в момент t = T При этом требуется, чтобы управление (19 3) обладало упомянутым свойством при любом выборе компонент вектора v. само же, однако, от этого вектора явно не зависело Из этой постановки зааачи вытекают два вопроса, а именно, при
264 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV каких условиях существует такое управление и как найти аналитическое представление для таких управлений Перейдем к решению первого вопроса Если существует какое- либо управление, переводящее систему (19 I) из начального положения х0 в конечное положение х = 0 за время [О, Т], то его можно представить в форме u = fi*c+V, (19 4) где B = Y~1Q и V —вектор, удовлетворяющий условию ортогональности J BVd/ = 0. Здесь Y — фундаментальная система решений для системы уравнений х=Рх (19 5) с начальным условием У=£ при / = 0 Подставляя (19 4) в (19 1) и затем домножая на Y~l слева и интегрируя по t в пределах от 0 до Т, после некоторых преобразований найдем — Y-l-x-*A(l, Лс-f ф(/, ГН P(t, 7>v. (19.6) т т т где A(t, Т)=\ВВ*<И, q>(/, Т) = \вУ<И и р(/, Г)=«$ У"1/?*» Будем считать, что столбцы матрицы В* являются линейно независимыми векторными функциями в любом промежутке [О, Т] Тогла чз (19 6) найдем c^-A-^ [у-'х + ф + pv] (197) Подставляя (19 7) в (19 4), найдем u = Mx + N, (198) где М = — B*A-*Y-\ N = V —5М"1(ф + ру) Подставляя (19 8) в (19 1), получим систему уравнений x = /J0x + Qu0 + /?0v, (19 9) где P0 = P + QM, u0 = V — ЯМ-»ф, /?„ = # — SM-'p Обозначим через Кл фундаментальную систему решений для системы х = Я„х (19 10) с начальным условием К0 = £ при / = 0 Домножая (19 9) на VV слева и интегрируя в пределах от 0 до /. получим х = У0х0 + Ул\ 80u0dl + Y0lYelR0dt v, (19 И)
§ 19] СИНТЬЗ ЛИНЕЙНЫХ ИНВАРИАНТНЫХ УПРАВПЕШ1Й 265 где B0 = Y^lQ Исключим вектор х из (19 8) с помощью (19 11). Тогда получим u-=-BM-»K-'yox0-|5M-»y-1F0J Y?R0dt l-BM-J у- L 0 ! — В*A~*Y-*Y,\ B0uadt + \~ В*А-**? (19 12) о Пользуясь (19 И) и (19 12), исключим фазовый вектор х и вектор управлений и из (19 2) Тогда поучим z = [PiY, — Q1B*A-*Y-iY(,] x0 + + {piYolY?lRodt-Q1[B*A-iY-*Y^Y^R0dt + B*A->p\+Rx\y + + PlY(t^B0u0dt-Ql flM-»y-»y,jB,u,d/ —V+BM-^l. (19 13) о L о J Пользуясь теперь (19 11) и (19 13), исключим произвольные постоянные векторы х0 и v из (19 12) Тогда получим u = (ix + vz + x, (19 14) где матрицы ц и v выбраны так, чтобы после умножения (19 11) на \i и (19 13) на v и почленного вычитания полученных результатов из (19 12) получилась формула (19 14) Таким образом, х=— BM-iy->y„$B0und/ f-V —В*у4-»ф —iiV.j B0undt — о о -v{piye$fleu,d/-QI ВМ-'У-»/,, jB,upd/ —V + flM-4q> * о I о Обозначим через Л,, Аг, А3 матрицы, стоящие при векторе х0 в формулах (19 11), (19 12) и (19 13), через В„ В4, В8 — матрицы, стоящие в этих же формулах при векторе у Тогда будем иметь A^Mi + v^,. Ba = n.B,-fvBs (19 15) Теорема 19 1 Если векторные функции, образующие сто 1бцы натрицы В*, линейно независи мы в любом промежутке [t, T] и если векторы, образующие строки матриц Аг (соответственно BJ, распо гагаются в подпространствах, натянутых на векторы, являющиеся строками матриц Alt A3 (соответственно В,, В,), то управление (19 3) существует и дается формулой (19 14) Следовательно, управление (19 14) переводит систему (19 1) из }■
266 ПРОБЛКМА СИНТГЗА УПРАВаЕНИЯ [ГЛ IV любого состояния х0 при 1 = 0 в конечное состояние х = 0 при i--=T при любом выборе вектора у Доказательство Формула (19 11) дает решение системы (19 1) при управлении (19 8) и потому обладает свойством х = х0 при /=0 и х = 0 при t = T при любом выборе вектора у Формула (19 12) дает значение управления (19 8) на решении {19 11), и потому, если подставить (19 11) и (19 12) в (19 1), ю получим тождество Далее это тождество будем обозначать через (19 15) Проделаем над тождеством (19 15) следующие пре образования Умножим (19 11) на Q\i, (19 13) на Qv и вычтем почленно из (19 15) полученные результаты Тогда находим х— Q (цх + vz) = Рх + Qx -l Ry, или x = Px+Q ((.ix + vz-f x) + Ry Отсюда видно, что (19 11) является также решением системы (19 1) при управлении (19 14) При этом это решение начинается в точке х = х0 при !=0и попадает в точку х = 0 при t = T Это обстоятельство завершает доказательство теоремы Рассмотрим теперь общий случай А именно, пусть заданы система x = Px + Qu + R\ (19 16) и система z = P,x + Q1u + tflf, (19 17) где матрицы Р, Q, R, Plt Qlt /?j имеют те же свойства, что и в системе (19 1), (19 2) И пусть, кроме того, векторная функ ция f является произвольной непрерывной векторной функцией, заданной при / > 0, вещественной и ограниченной Пусть f имеет размерность k Требуется построить управление u = u(/, х, z), (19 18) переводящее систему (19 16) из любого начального состояния в конечное состояние х„ за время [О, Т] при любом выборе функций f При построении управления (19 18) естественным образом используется наряду с измеряемыми величинами, являющимися компонентами вектора г, также текущее значение компонент вектора фазового состояния х и элементы матриц Р, Q, R, Р,, Qt, /?, Поэтому естественно считать, что векторная функция Ri^-% в процессе движения также является известной в текущий момент t Будем считать, что значения этой функции во все моменты, предшествующие /. могут быть использованы для фор мирования управления (19 18) Пусть существует управление.
§ 19) СИНТЕЗ ЛИНЕЙНЫХ ИНВАРИАНТНЫХ УПРАВЛЕНИЙ 267 переводящее систему (19 16) из начального состояния х0 в конечное состояние х = 0 за время [О, Т] Тогда это управление можно представить в форме u = fi*c + V, (1919) г где векторная функция V удовлетворяет условию §BVdf=-0. о Домножая (19 16) на матрицу V"1 слева и интегрируя по / в пределах от t до Т, находим г / — Y-*x = A(t, T)c + \B\dt + y — Jy-»Jd/, (1920) I 0 т где через у обозначен неизвестный постоянный вектор V = j Y-1%dt. Из (19 20) и (19 19) имеем с = — A-1 K-»x + SflVd/-$y-4<ft I (19 21) u = M1x+N„ (19 22) где M1 = — B*A~1Y-\ N1 = Nl—B*A~1y и N„ = V — B*A~1X х jfiVd/ — Jy-1!^ Подставляя (1922) в (1916), находим x = P0x + QN1 + 6, (19 23) где Pt = P-jrQM1 Пусть Y'u означает фундаментальную систему решений для системы уравнений х = Р0х Применяя к (19 23) формулу Коши, находим х = У„х0-У05у-,(т)(?(т)в»(х)Л-1(х, T)dx y + + Уо J У.(т) Q (т) N,(T)rfT + K0 J Y?{x)l(r)dr (19 24) о о Из (19 22) и (19 24) имеем палее и = Л11У0х(1- - М, К„ j Vj'WQW Я» 1т) Л"1 (т, DdT-t-BM-' y '-u,(/).
268 ПРОБЛЕМА CIIHTF3A УПРАВЛЕНИИ [ГЛ IV Предположим теперь, что существует матрица а, элементы которой заданы при /^0, вещественны, непрерывны и ограничены, обладающая тем свойством, что aRt = R Тогда, умножая (19 17) на матрицу а слева и используя (19 24) и (19 25), находим <хг=--0(Р1Уо+<21МУо)хо- - о-Р, {У„ $ Y? (т) Q (т) В* (т) А-1 (т, Т)dx + + Q, М,К0$КГ(т)(3(т)В*(ЯЛ-Чт, 7VT + BM-1 }v + zt. (19 26) Теорема192 Пусть I) векторные функции, являющиеся столбцами матрицы В*, линейно независимы в любом промежутке [t, T], 2) существует матрица а такая, что oR^ = R, 3) векторы, стоящие в строках матриц при х„ (соответственно у) в формуле (19 25), являются линейными комбинациями строк соответствующих матриц, стоящих при х0 и у в формулах (19 24) и (19 26) Тогда существует управление (19 18), и оно представимо в форме и = |л,х -f vtcx + х, (19 27) Доказательство Если в (19 16) подставить (19 24) и (19 25), то получаем тождество Если домножить теперь (19 24) па |х„ (19 26) на v,a и затем на матрицу Q слева и вычесть полученный результат почленно из упомянутого выше тождества, го полечим, что (19 24) удовлетворяет также уравнению (19 16) при управлении (19 27) При этом из вида (19 24) можно заключить, что х = х„ при / = 0 и х—*0 при t—-Т при любом выборе векторной функции f Здесь ц, и vt—те матрицы, которые выражают линейную зависимость, упомянутую в пункте 3) теоремы 19 2 Этим теорема доказана полностью § 20. Построение инвариантных управлений в квазилинейных системах и нелинейных системах в режиме стабилизации Предположим, что управляемая система описывается квазилинейной системой дифференциальных уравнений х = РхЧ Qu + Ry + \iG(t, х, u, v) (20 1) Будем считать, что элементы матриц Р, Q, R заданы при / > 0, вещественны, непрерывны и ограничены Векторная функция G
§ 20| ПОСТРОЕНИЕ УПРАВЛЕНИЙ В РЕЖИМЕ СТАБИЛИЗАЦИИ 269 задана при х^£„, u£Er у£Ек, t^O, вещественна, непрерывна и непрерывно дифференцируема по компонентам векторов х, и, у, где х — вектор фазового состояния системы, и—вектор управлений и v—произвольный постоянный вектор П\сть в процессе управаення системой (20 1) измеряются компоненты вектора z = P,x + Q1u-|-/?1Y + |iG1(/, х, и, и) (20 2) Будем считать, что элементы матриц Plt Qlt /?, и компоненты вектора Gt обтадают свойствами, аналогичными перечисленным выше для матриц Р, Q, R и компонент вектора G Будем считать, что вектор z имеет размерность k Параметр ц, входящий в (20 1) и (20 2), считаем малым Требуется найти управление u = u(/, х, z, ц), (20 3) переводящее систему (20 1) из любого начального состояния х<, £ Q„ в конечное состояние х = 0 за время [0, Т] при любом выборе вектора v€^*> где Qn и Qk—ограниченные области соответственно в Еп и Ек При этом требуется, чтобы управление (20 3) не зависело от компонент вектора у явным образом Пусть существует управление, переводящее систему (20.1) из начального состояния х0 в конечное состояние х — 0 за время [0, Т] Тогда это управление можно представить в форме u = fi*c + V, (204) где г JfiVd/ = 0 о Здесь матрица В, как и ранее, определяется формулой B = Y~lQ и V —фундаментальная система решений для линейной системы х=/>х (20 5) с начальным условием Y = E при t=0 Будем далее считать, что векторная функция V непрерывна и V£Qr, где Qr—ограниченная обаасть пространства Ег Подставляя (20 4) в (20 1) и затем домножая на У'1 слева и интегрируя в пределах от 0 до 7\ находим Г ( — х0 = Л(0, T)c+^Y~1Rdl у + 11^у-1ОШ, (206) о где через A(t, T), как и ранее, обозначена матрица J BB'dt. Будем считать, что матрица Л(0, 7)—неособая
270 11РОБЧЕМЛ СИНТЕЗА УПРАВЛЕНИЯ ЦЛ IV CucieMa (20 6) при ц = 0 имеет решение с = — Л-ЧО, Т) (x0 + \y-lRd( у) Далее якобиан правых частей уравнений (20 6), вычисленный по отношению к компонентам вектора с при ". = 0, совпадаете определителем матрицы /1(0, Т) и, следовательно, отличен от нуля Отсюда вытекает, что система (20 6) определяет неявную векторную функцию с -=с(х0, |д., v. V) (20 7) Управчение (20 4) при условии (20 7) будет определять при заданном х0 движение системы (20 1), заданное на промежутке [0, Т] при достаточно малых ц Это движение в силу (20 6) обязательно будет обладать свойством х—*0 при t—-T. Обозначим это движение через х=х(*. х„, V, И) (20 8) Подставляя (20 8), (20 4) и (20 7) в (20 2), получим также z = z(/, x0, v, ц) (20 9) Теорема 20 1 Если векторные функции, являющиеся столбцами матрицы В*, линейно независимы и если якобиан правых частей (20 8), (20 9) по отношению к компонентам векторов х0 и у отличен от нуля при ц = 0, то существует управление (20 3), переводящее систему (20 1) из любого начального состояния x0€Q„ в конечное состояние х — 0 за время [0, Т] при любом выборе вектора у g QA и вектора V £ Q Доказательство Подставим (20 8), (20 4) и (20 7) в (20 1) Тогда получим тождество Далее из уравнений (20 8) и (20 9) выразим векторы у и х0 х0 = х„(/, х, z, ц), y = y(t,x,z,p) (20 10) Пользуясь (20 10), исключим величины х0 и у из (20 7) Тогда это управление примет вид (20 8), и упомянутое выше тождество будет связывать (20 8) и (20 3) Следовательно, (20 8) будет являться решением системы (20 1) при управлении (20 3) Этим теорема доказана полностью Замечание Так как якобиан функций (20 8), (20 3) по компонентам векторов хи и у при ц = 0 совпадает с аналогичным якобианом дня системы (20 1) при р. = 0, то теорема 20 1 может быть сформутирована следующим образом Е( ни проблема построения инвариантных управлений разрешима для линейной системы, то оно также разрешима для квазилинейной системы (20 1).
§21] СИНТЕЗ ЛИНЕЙНЫХ УПРАВЛЕНИЙ С ПОСЧЕДЕЙСТВИЕМ 271 § 21. Синтез линейных управлений с последействием Пусть задана система дифференциальных уравнений x = P(t)x + Q(t)u + 1(t) (211) Будем считать, что элементы матриц Р и Q и компоненты вектора f заданы при t^O, вещественны, непрерывны и ограничены Пусть требуется построить управление u = u(/, x(t — т)) (212) и начальную функцию х = ф (213) при t £ [0, т], так, чтобы система (21 1) имела при начальной функции (21 3) и управлении (21 2) решение x = x(t, x0), обладающее свойством х = х0, при / = 0, х = 0 при / = Г (21.4) Здесь т—запаздывание, Т > т > 0 Если подставить управление (21 2) в систему (21 1), то получим систему дифференциальных уравнений с запаздывающим аргументом Для того чтобы построить решение такой системы, необходимо задать начальную функцию (21 3). Тогда решение системы (21 1) на следующем промежутке / £ [*, 2т] будет определяться как решение системы уравнений x = P(*)x+Q(Ou(f,«p(/-T)) + f(0 с начальным условием х = <р(т) при / = т Действуя аналогичным образом, можно построить решение системы (21 1) при управлении (21 2) на любом интервале [kx, (fc-f-l)T], A = 2, 3, 4, . и, следовательно, построить решение системы (21 1) при управлении (21 2) на всем промежутке [О, Т] Если существует управление, переводящее систему (21 1) из любого начального состояния х,, в положение х = 0 за время [О, Т], то его можно представить в форме u = S»c + V, (215) где векторная функция V удовлетворяет условию \в\м=о о Матрица В определяется соотношением В = Y'1 Q Здесь У—фундаментальная система решений системы линейных уравнений х = Рх с начальным условием Y = E при t = 0.
272 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV Подставляя (21 5) в (21 1) и домножая затем слева на У-\ а затем интегрируя по t один раз в пределах [О, Т], другой раз в пределах [/, Т], находим т — х, = А(0,Т)с+$У-ЧМ, (216) т т — У-1х = Л(/,Г)с+$ВУЛ + $К-'!^ (21 7) т Здесь A (t, T) есть матрица $ BB'dt Из (21 6) и (21 7) имеем далее т x = YA{t,T)A-x(Q,T)x0 — Y\B\dt (218) Заметим, что формула (21 8) дает решение системы (21 1) при управлении (21 5), причем это решение обладает свойством (21 4). Заменим в (21 7) / на / —т и исключим затем с помощью (21 7) постоянный вектор с из управления (21 5) Тогда получим u = Mx(t — x) + N, (219) где М = — B*(l)A-Ht — т, 7)У-»(^ —т), N = V — B*(t)A-*(t — T,T)\ J B\dt+ J y-ifdfl. Теорема 21 1 Если векторные функции, являющиеся столбцами матрицы В*, линейно независимы на любом промежутке [t, Т], I £ [0. Т — т], то существуют начальная функция (213) и управление (21 2) такие, что система (211) будет переходить из любого начального состояния х = х0 в конечное состояние х —0 за время [0, Т] При этом начальная функция определяется формулой (21 8), управление— (21 9) Доказательство Теорема 21 1 будет доказана, если установить, что система (21 1) при управлении (21 9) и начальной функции (21 8) будет иметь решение, обладающее свойством (21 4) Из (21 7) имеем г г х = — YA(t,T)c—yJfiVd/ — У$К-»!Л (21 10) Ест подставить в систему (21 1) управление (21 5) и векторную функцию (21 10), то получим тождество Если теперь в этом
§ 21] СИНТЕЗ 1ИНЕЙ11ЫХ УПРАВЧЕНИЙ С ПОСЛЕДЕЙСТВИЕМ 273 тождестве исключить величину с, входящую в управтение (21 5), выразив ее из (21 10) после замены t на t — т, то получим вновь тождество, которое будет связывать векторную функцию (21 10) и управление (21 9) Если теперь постоянный вектор с исключить из (21 10), используя (21 6), то получим векторную функцию (21 8) Таким образом, полученное тождество будет связывать векторную функцию (21 8) и управление (21 9) Из этого можно заключить, что (21 8) есть решение системы (21 1) при управлении (21 9) По способу построения это решение обладает свойством (21 4), откуда вытекает доказательство теоремы Рассмотрим теперь тот случай, когда измеряется не весь фазовый вектор х(/), а лишь некоторые линейные комбинации его компонент, вычисленные, вообще говоря, в различные моменты времени В общем случае такие измерения можно представить в форме о z=$[d/?(/,0)]x(H<>). (21П) где /?(/, д)—матрица размерности пхп, элементы которой есть функции ограниченной вариации относительно Ф£[—т, 0] и непрерывные функции по t, заданные при />0 Элементы матрицы R(t, ■&) будем считать вещественными и Ограниченными Обозначим через Я матрицу о Я- J [dR(t, b)]Y(t + #)A(t + u, T) (21 12) Здесь, как и выше, интегрирование ведется по ■& в пределах [—т, 0], и интеграл понимается в смысле Стилтьеса Теорема 21 2 Если векторные функции, стоящие в столбцах матрицы В*, линейно независимы на промежутке [0, Т] и матрица Н —неособая при /£[т, Г], то система (21 I) из любого начального состояния х = х0 может быть переведена в конечное состояние х = 0 за время [0, Т] с помощью начальной функции (21 3), определяемой формулой (21 8) и управления и=--Л?, $ [rf/?(/,fl)]x(/+#) + N, Доказательство Заменим в (21 10) t на t + ■& и подставим в (21 11), тогда получим о т z = — He— J [dR(l, i>)\Y(t-r$) J (BV + Y-lf)dt (21 13)
274 ПРОБЛЕМА СИНТЬЗА УПРАВЛЕНИЯ | ГЛ IV Из (21 13) и (21 5) имеем U = M1z + N1, (21 14) где Л1, = — В*Н~\ о г N1 = V—В*Н~1 J [dR(l, fl)]K(/ + fl) J (BV + Y~4)dt Покажем теперь, что система (21 1) при управлении (21 14) и начальной функции (21 3), определяемой формулой (21 8), будет иметь решение, обладающее свойством (21 4) Действительно, если подставить (21 10) и (21 5) в систему (21 1), то получим тождество Если в этом тождестве исключить с, входящее в управление и, с помощью (21.13), а вектор с, входящий в (21 10), с помощью (21 6), тогда получим, что (24 8) будет решением системы (21 1) при управлении (21 14) Далее решение (21 8) обладает свойством (2*1 4) Таким образом, теорема доказана полностью Пусть измеряется величина Б = Я (Ох(0 (2116) Возникает вопрос, при каких условиях можно указать начальную функцию (21 3) и управление, построенное лишь с помощью измерений (21 15), так, чтобы система (21 1) при этой начальной функции и управлении имела решение, обладающее свойством (21 4) Ответ на этот вопрос можно дать с помощью теоремы 21 3 Положим $ = R(t)Y(t)A(t,T) (2116) Теорема 21 3 Если векторные функции, стоящие в столбцах матрицы В*, линейно независимы на промежутке [0, Т] и если существует число Т > т > 0 такое, что столбцы матрицы р* линейно независимы на любом промежутке [t — т, t], то можно указать начальную функцию (21 3) и управление u=2A1/x(/-t/(/)) + N такие, что система (21 1) будет иметь решение, обладающее свойством (21 4) Доказательство Так как матрица Л(0, Т) неособая, то решение (21 8) существует, и потому его можно будет взять в качестве начальной функции (21 3) Из линейной независимости столбцов матрицы р на промежутке [t—т, t] вытекает существование точек этого промежутка t — Xj(t), /= 1, 2, . ., п, таких,
§ 21] СИНТЕЗ ЧИНКЙННХ УПРАВЛЕНИЙ С П0СПЕЧЫ1С1ВИЕМ 275 что среди строк матриц (i(/—т,-(/)) имеются и тииейно независимых при любом t Здесь тД/) можно считать непрерывными функциями от t, удовлетворяющими ограничениям 0< Ту(/)<т Из линейной независимости вытекает тогда, что матрица Р(0=|р,(^^)Р(^-т/) будет неособой Заменим в (21 15) t на t—xf(t) и аналогичную замену проведем в (21 10) и исключим загем из полученных соотношений вектор х Домножая слева полученное равенство на Р*(/ —Т/(/)) и суммируя затем по / от 1 до п, найдем JjP* (<-*,('» St'—*/(')) = п f =-pc-2H'-V')) * ('-*/(')) ^ ('-*/('>) $ (BV-Y-4)dt (21 17) Из (21 17) найдем постоянный вектор с и затем исключим его из управления (21 5) Тогда получим управление u = S MfX(t—t;(/))+N (2118) Остается установить, что при управлении (21 18) и начальной функции (21 3), определяемой равенством (21 8), система (21 1) будет иметь решение, обладающее свойством (21 4) Доказательство этого факта осуществляется тем же способом, что и в теореме 21 2, так как управление (21 18) может быть записано также через интеграл Стилтьеса Рассмотрим один пример применения развитой выше теории к задаче распределения капиталовложений по отраслям Пусть имеется п отраслей, количественная характеристика которых определяется на текущий момент t величинами x1(t), . , x„(t) Если обозначить через us(t) скорость прироста капиталовюже- ний в отрасль s, отнесенную к моменту /, и если через bs(t) обозначить коэффициент, характеризующий прирост отрасти s на единицу капитала, тогда получим уравнения развития отраслей dxjdt =bsus, s=l, . ., п (21 19) Будем считать, что выделение капиталовтожений в каждую из отраслей в текущий момент / осуществляется из общего количества 2'МО-« (О (2120)
276 ПРОБЛЕМА CIIHTF3* УПРАВЧЬНИЯ |ГЛ IV Есш обозначить объем капиталовложений к моменту t во все отрасли через x(t), то будем иметь х = иЦ) (21 21) П>сть задано начальное состояние отраслей xs = xs0 при / = /„ и конечное состояние отраслей xs = xsl при / = /„-t r,s=l, , п Здесь /„ — начальный момент периода планирования, Г —период, на который планируется распределение капиталоваожений Требуется распределить капиталовложение таким образом, чтобы все отрясли, развиваясь из начального состояния, достигли к концу планируемого периода заданных уровней Перейдем к решению поставленной задачи Будем искать функции н, в виде ", = &Л + У«. s = 1- . "• <21 22> где J btVsdt=Q Подставляя (2122) в (21 19) и интегрируя в пределах от t0 до t0 + T, а также в пределах от t до t0+T, найдем b\dt xsl-xs(()- j bsVsdl <„ + Г [ b\dt (21 23) (21 24) Подставляя (21 23) и (21 24) в (21 22), найдем us = *'<**[-*«>> + v„ (21 25) ( bldi + 1/, (21 26) Обозначим через и0(() величину ,'t(**j,~x*o)=uB. (21 27) s*
§ 21) СИНТЕЗ ЛИНЕЙНЫХ УПРАВЛЕНИЙ С ПОСЛЕДЕЙСТВИЕМ 277 Если выделение капиталовложений осуществляется в соответствии с найденным законом (21 25), то цель, поставленная перед планом развития отраслей, может быть достигнута При этом суммарные капиталовложения, необходимые и достаточные для такого развития, определяются формулой t„ + T х,—jc0= J u0dt. (21 28) Формула (21 28) получится после подстановки (21 27) в (21 21) и последующего интегрирования по промежутку [/„, t0-{-T] Заметим, что выделения капиталовложений на самом деле могут осуществляться не по закону (21 27), а по закону u(t) Обозначим тогда V = «(0 — "о Для того чтобы цель развития была осуществима, необходимо, чтобы суммарные капиталовложения определялись формулой (21 28) Следовательно, обязательно должно быть J Vdt=0 Рассмотрим теперь значения функций VS Эти функции должны удовлетворять при любом плане распределения, решающем основную задачу развития, следующим усло- t,+ T виям 1) J bsVs = 0, 2) функции (21 25) принимают неотрица- t, тельные значения, это означает, что каждая из отраслей имеет тенденцию лишь к возрастанию Vs^—t'l,'1T~Xs0 , 3) Из усло- С b\dt вий (21 20) и (21 27) получим %VS = V и J Vdt = 0 Если в выражении (21 25) функции Vs выбраны при соблюдении этих трех условий, то эти выражения дают план распределения капиталовложений по всем отраслям При выполнении этого плана все отрасли достигнут к концу периода планирования заданных состояний развития Формулы (21 26) дают распределение капиталовложений по отраслям в зависимости от текущих состояний этих отраслей Заметим, что на текущий момент t состояние отраслей известно, вообще говоря, вследствие запаздывания обработки информации, лишь с некоторым запаздыванием т Если в (21 26) заменить / на /—т и затем, пользуясь этими выражениями, исключить величины с, из (21 22), то
278 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV получим окончательно t„ + T x*i-xsV-r)- I bsVsdt ut(t) = b,(t) ,,+T '~T + V,V) (21 29) В соответствии с этим планом распределения капитальных вложений развитие отраслей будет определяться уравнениями 10 + Т "si—xs(I—t)— [ bsVsdl xs{t) = b\(t) <o+r '-1 + b,(t)VtV) (2130) \ bUt Формулы (21 29) дают план распределения, и формулы (21 30) дают уравнения развития отраслей в зависимости от известного состояния отраслей на момент t— т В первоначальный период развития t £[t0, t0 + i] планирование капиталовложений должно осуществляться по формулам (21 23) Выше были найдены всевозможные планы распределения капиталовложений, обеспечивающие выполнение основной цели развития отраслей Было показано также, что таких планов существует целое множество, зависящее от всевозможного выбора функций V,, . , V„, стесненных ограничениями 1), 2), 3) Далее из множества вариантов этих планов с помощью выбора функций Vlt , Vn можно выбирать план, наилучший в том или ином смысле Вопросы построения оптимальных управлений по отношению к тем или иным критериям будут рассмотрены ниже Здесь укажем на возможность выбора функций V,, , V„ таким образом, чтобы обеспечить решение задачи развития отраслей при условии» когда задаются также количественные уровни развития внутри промежутка планирования Предположим, что задана последовательность чисел tx > /0, <г>*г. •• . '/+1 > ti, 'r+i = *o + 7\ и пусть заданы состояния отраслей *.<</) = **/. s=l, . , ft, /=1, , / (21 31) Разумеется, что условия развития отраслей (21 31) можно реализовать, вообще говоря, путем выбора функций V,, ..., V„ Предположим, что функции Vs, s = l, , ft, кусочно-постоянны Подставим (21 22) в (21 19) и проинтегрируем полученные
§ 22] М1РЛВЛ1 НИЯ С ЗАПАЗДЫВАНИЯМИ В НЬЛИНЬЙНЫХ СИСИ МАХ 274 выражения по I в пределах [tj, tf+l] Тогда будем иметь £,/+!-£„•- '$ b-dt cs-> 'J bsVsdt, s=l, ,k (2132) Отсюда 5,/+|-lf/- J b\dtixtl-xtJ J «rfA V, = * ;— (21 33) ) ^' Если значения функций V, в (21 29) выбрать в соответствии с функцией (21 33), то пол>чим план распределения капиталовложений, обеспечивающих выполнение условий (21 31) § 22. Построение управлений с запаздываниями в нелинейных системах Рассмотрим сначала квазилинейную систему x = P(Ox+Q(/)u + f(0 + p.G(x, /, u) (22 1) Будем считать, что компоненты векторной функции G заданы при /33*0, и££г, х££„, вещественны, непрерывны и имеют непрерывные производные относительно компонент векторов и и х Матрицы Р, Q и вектор / будем предполагать обладающими юми же свойствами, что и в § 21 Предположим, что требуется найти условия, при которых существуют управление u = u(/, х(/—т)) (22 2) и начальная функция х = Ф(0 (22 3) при / £[0, т] такие, что система (22 1) имеет решение х=х(*. х0), обладающее свойством х = х0 при 1=0, х = 0 при /=Г. (22 4) Если управление (22 2) и начальная функция (22 3) существуют, то возникает естественный вопрос о флктическом отыскании векторной функции и(/, х{/—т)) и ф(/) Теорема 22 1 Если выполнены условия теоремы 21 2, то существуют управление (22 2) и начальная функция (22 3) такие, что система (22 1) при управлении (22 2) и начальной функции (22 3) будет иметь решение, обладающее свойством (22 4).
280 проб и ч\ сишьзл уш'ав и имя |гл iy Доказательство Будем искать управление в форме u = fl*c hV, (22 5) В- Y~1Q, г\с Y — фундаментальная система решений для системы уравнений х = Рх, вскторпяя функция V удовтегворяет ус ловию ортогональности г J BVd/ = 0 о Подставим управтение (22 5) в систему (22 1), затем домножнм эту систему на матрицу Y'1 стева и проинтегрируем один раз в пределах от 0 до Т, а другой— от / до Т Тогда получим т -х„ = Л(0, Т)с+]у-*(\ + у&)<и, (22 G) о т г -Y-*x = A(t, r)c + JsVd/ + 5r-1(f \-\iG)dt (22 7) Предположим теперь, что начатьное состояние х0 и векторная функция V, входящая в управление (22 5), удовлетворяют условиям xn£Qn, V £ Qr, где Q„ и Qr — ограниченные области пространств Е„ (соответственно Ег) Якобиан правых частей (22 6), вычистенный относительно компонент вектора с при и = 0, сов падает с определителем матрицы А (0, Т), следовательно, система (22 6) определяет неявную функцию с = с(х0, ц) (22 8) при x„€Q„, |ц,|<ц.0, где |.in —некоторая положительная посто янная Пользуясь (22 8), вектор с можно исключить из (22 7) Тогда из (22 7) можно определить векторную функцию х = х(<, х„, l-i), (22 9) и эта векторная функция будет обладать свойством (22 4) Дока зательство существования функции (22 9) можно провеет мето дом последовательных прибаижений, применяя этот метод к интегральному уравнению (22 7) Далее при достаточно малых ц. формулу (22 9) можно обратить, а именно, выразить вектор х0 через входящие в формулу (22 9) параметры х0 = 1(Л х(0, (а) (22 10) Обращение формулы (22 9) оказывается возможным, так как яко биан правой част, вычисленный относительно компонент по х0 при
§ 22) УПРАВЛЕНИЯ С ЗАПАЗДЫВАНИЯМИ В НЕЛИНЕЙНЫХ СИСТЕМАХ 281 р,=0, совпадает с определителем матрицы Y(t)A{t, Т) А~х (О, Т) и, следовательно, отличен от нуля при / £ [О, Т] Заменим в (22 10) t на t — т и затем исключим вектор х0, пользуясь (22 10), из (22 8), а затем исключим, пользуясь (22 8), вектор с в управлении (22 5) Тогда получим a = B*(t)c(l(t-T, x(f-x), |i), |i) + V-u(/, х(/-т)) (22 II) Если в систему (22 1) подставить управление (22 5) и исключить затем с помощью (22 8) вектор с, то получим систему уравнений, которой будет тождественно удовлетворять функция (22 9) Если в получающемся тождестве вектор х0, входящий в управление и, заменить на функцию | после замены в ней t на /—т, то получим, что (22 9) является также решением системы (22 1) при управлении (22 11) Естественно, что начальной функцией будет при этом <р = х(/, х0, |х). *€[0, т] Так как (22 9) удовлетворяет свойству (22 4), то этим теорему 22 1 можно считать доказанной полностью Предположим теперь, что измеряются компоненты вектора z, и пусть эти измерения определяются формулами о о z= [[dR(t, Ф)] х (* + <>)+ |i S [<W?, (*, <>)] Gt (*+<►, x(f-t-G), u), (22 12) будем считать, что элементы матриц R (t, d) и /?t (t, ft) являются непрерывными функциями относительно t, заданными при />0, и функциями ограниченной вариации относительно Ъ, заданными при 0£[— т, 0] Интегрирование в формуле (22 12) понимается в смысле Стилтьеса и производится по параметру fl Теорема 22 2 Если выполнены условия теоремы 21 2, то существуют управление u = u(t, z, |i) (22 13) и начальная функция х = ф(0. '€{0. т] (22 14) такие, что система (22 1) при управлении (22 13) и начальной функции (22 14) имеет решение, обладающее свойством (22 4) Доказательство При доказательстве теоремы 22 2 будем предполагать, что компоненты векторной функции Gj непрерывно дифференцируемы относительно компонент вектора х и что в остальном обладают теми же свойствами, что и компоненты векторной функции G Подставим (22 9) в (22 12) Якобиан правых частей в полученной формуле, вычисленный относительно компо нент вектора х0 при ц = 0, отличен от нуля, так как уело вия теоремы 21 2 выполнены Следовательно, можно выразить
282 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV вектор х0 из (22 12) и (22 9) по формуле х0 = т,(/, z, и) (22 IS) Пользуясь (22 15), исключим вектор х0 в (22 8) и затем исключим вектор с, пользуясь (22 8), из управления (22 5). Тогда получим и = В*с(т)(/, z, p.), n) + V=u(/, z, ц) (22 16) Покажем, что система (22 1) при управлении (22 16) и начальной функции ф = х(/, х0), /€[0, Т], полученной из (22 9), имеет решение, обладающее свойством (22 4) Действительно, подставляя (22 9), (22 5) и (22 8) в систему (22 1), получим тождество Заменим в этом тождестве вектор х0, входящий в управление и, по формуле (22 15) Тогда получим, что (22.9) есть решение системы (22 1) при управлении (22 15) Так как (22.9) обладает свойством (22 4), то теорему 22 2 можно считать доказанной полностью В данном и предыдущих параграфах производилось построение семейств управлений, зависящих от векторной функции V, которая удовлетворяет условию т \B\dt = 0, B = Y-*Q (22 17) Дадим способы аналитического представления векторных функций, ортогональных строкам матрицы В С этой целью введем в рассмотрение пространство Цо т\ векторных функций и, сум мируемых с квадратом г Ju2d/<-f-oo о Пусть векторные функции ul( u2, .. образуют базис этого пространства в том смысле, что всевозможные линейные комбинации этих функций с вещественными постоянными коэффициентами, взятыми в конечном числе, образуют в L[2o, т) всюду плотное множество функций Каждую из функций базиса можно представить в форме и/ = В*с, + \/ Определим вектор с; из условия ортогональности векторной функции Vf строкам матрицы В. Тогда получим т С/ = Л-»(0. Т) 5 Btijdt,
§ 22] УПРАВЛЕНИЯ С ЗАПАЗДЫВАНИЯМИ В НЕЛИНЕЙНЫХ СИСТЕМАХ 283 где, как и выше, г Л (О, Т) = \ВВ*(И о Здесь, разумеется, предполагается, что векторные функции, стоящие в столбцах матрицы В", линейно независимы на промежутке [О, Т] При таком выборе векторов су функции г Vy = u/—ВМ-»(0, T)\Bujdt 1-1, 2, ... о представляют собой базис в пространстве векторных функций V, ортогональных строкам матрицы В Линейные комбинации этих функций с вещественными постоянными коэффициентами, взятыми в конечном числе, будут образовывать всюду плотное множество в упомянутом пространстве векторных функций V Предположим теперь, что задано дифференциальное уравнение #Kt + Piit)*—»+ + P„x = Ot (22 18) где Я,(0. •••• Л|(0 — вещественные, п раз непрерывно дифференцируемые и ограниченные функции, заданные при i^O П^сть требуется найти аналитическое представление функций V, обладающих свойством )JxVd/=0, где х—(п—1) раз о непрерывно дифференцируемое решение уравнения (22 18), под xV понимается вектор с компонентами, равными произведениям соответствующих компонент х и V Пусть <р—некоторая п раз непрерывно дифференцируемая функция Умножая уравнение (22 18) на функцию <р и затем интегрируя в пределах от 0 до Т, получим $<pL(x)d<=0, (22 19) о где L(x) представляет собой левую часть (22 18) Интегрируя (22 19) по частям, найдем Г „_| J хС (ф) dt + 2 {<P(ft) (0) А„ Н- Ф<*> (Т) Вк\ = 0, (22 20) Е(ф) = (-1)"ф'»» + (-1)п-1(Я1ф)("-1Ч- • +Л,Ф = 0 Выберем функцию ф так, чтобы было ф(*1(0) = ф<*>(Г) = 0, А = 0, 1, , п— 1. (2221)
284 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ |у Тогда из (22 20) получим т JxVd/ = 0, где V = L(q>) о Из условия (22 21) найдем q> = /«(7' —/)»♦, где Ъ£С{о.п (22 22) В (22 22) ч|> является произвольной п раз непрерывно дифференцируемой функцией на [0, Т] Таким образом, любая функция V=L(t»(T— 0"i|>) (22 23) будет ортогональна функции х, удовлетворяющей уравнению (22 18) Ее пи положить Vy = L(/"+/(r — 0"), / = 0, 1, 2, .... то получим совокупность функций, конечные линейные комбинации которых будут всюду плотны среди всех функций, удовлетворяющих \словию т J xv л=о, \еЦо.Т] Рассмотрим теперь систему линейных дифференциальных уравнений x = Px + Qu (2224) Предположим, что матрица Р и вектор Q являются постоянными и такими, что векторы Q, PQ, . , /><«-i>Q (22 25) линейно независимы Требуется дать аналитическое представление функциям V, обладающим свойством т $fiVd/ = 0, u=e-piQ о Из условия независимости векторов (22 25) имеем PnQ = \ilPn-1Q + \iiP"-2Q + . +jx„Q (22 26) Умножим равенство (22 26) слева на матрицу e~pt Тогда получим (_1)-(в-«)(-)а = ^(_1)»-1(в-«)и-1)0 + + М— 1)—»(e-w)<"-,)Q+...+l*«e-|,'Q (22 27)
§ 22] УПРАВЛЕНИЯ С ЗАПАЗДЫВАНИЯМИ В НЕЛИНЕЙНЫХ СИСТЕМАХ 285 Умножим (22 27) на п раз непрерывно дифференцируемую функцию ф и проинтегрируем в пределах от 0 до Г Тогда получим т [ <pL, dt = 0, (22 28) о где L,= [(-l)"^")'"'-JgM-1)- '(«-"Г-^О. Интегрируя в (22 28) по частям, найдем г „_, J SV dt + 2 {ф<*' (0)А4 + Ф<*> (Г) В,} = 0, (22 29) где V = L,(<p), Lt (<p) = ф<''>_^1ф(«-х)_ # t # _Цпф (22 30) Положим ф(*'(0) = ф<*>(7,) = 0, А = 0, . ., л—1. Тогда будем иметь Ф = *»(Т — 0"Ч>. где я|з € Cfo. г- Таким образом, функции Vf = Lt(t"+'(T-ty), /=0.I, будут давать базис в пространстве функций V, удовлетворяющих условию т \B\di=0, / = 0, 1, ... о Только что приведенные примеры аналитического представления векторных функций, ортогональных строкам матрицы В, позволяют предложить прямые методы построения оптимальных в том или ином смысле управлений Предположим, что задана линейная система (21 1) И п>сть требуется построить управление и, переводящее ее из любого начального положения х0 в конечное положение х = 0 за время [0, Т], причем так, чтобы это управление доставляло некоторому функционалу J — J (u, x) наименьшее возможное значение Если считать, что" векторные функции, стоящие в столбцах матрицы В*, линейно независимы на промежутке [0, Г], то искомое управление будет иметь вид u = B*c + V, (22 31)
286 ПРОБЛЕМА СННТРЗА УПРАВЧК1ШЧ (ГЛ IV где с определяется соотношением с = —Л-1 (О, Т) х0 и V удовлетворяет условию ортогонапьности }B\dt = Q Будем искать V в виде V = % V,.a, (22 32) Подставляя (22 32) в (22 31) и затем (22 31) в (21 1), полу- чим решение (21 1), с помощью которого можно вычислить функционал У = У(и, х) Выберем величины а,, , аи так, чтобы этот функционал принимал наименьшее возможное значение Эта задача является задачей отыскания экстремума функции многих переменных Ее решение дает, вообще говоря, приближенное решение задачи построения оптимального управления Величины ay будут зависеть от вектора с нелинейным образом и, следовательно, исключение этого вектора из управления приведет к тому, что оптимальная система будет уже являться нелинейной Перейдем к вывод> необходимых условий оптимальности и оты еканию с помощью их оптимальных законов управления Положим г J = \fAt> x. u)dt (22 33) Пусть требуется найти управление и = В*с + V, (22 34) переводящее управляемою систему (21 1) из любого положения х0 в положение х = 0 за время [О, Т] и доставляющее функцио налу (22 33) наименьшее возможное значение Будем считать, что подынтегральная функция в (22 33) непрерывна и непрерывно дифференцируема по отношению к компонентам векторов u, x задана при t > О, и £ Еп х££„ и вещественна Пусть V0 — то значение векторной ф\нкцип V, при котором функционал (22 33) принимает наименьшее возможное значение Будем считать V„ кусочно-непрерывной вещественной векторной функцией, ортогональной строкам вектора В Тогда положим V-= Vn-|-eV в (22 34) где $BVd/ = 0 о Подставляя (22 34) в (22 1), а затем вычисляя функционал {22 33), найдем /(и0, х°)<У(и, х), где через и° обозначено значение (22 34) при е = 0, через х°
4} 22J viii'ah и иия с }апа)Д1)1влниями в HF'imiFrii'hix систкмлх 287 обозначено движение, соотвсмсгвующее и° Дифференцируя У (и, х) по е и полагая е = 0, находим dJ/dt=0 при е- 0 Это равенство в развернутом еще может быть представтено в форме f [&»*&*] "-о. <2235> где Ъ,-=дх/дг при е = 0 Следовательно, £-=У(П $BVd/=0 (22 36) о Подставтяя (22 36) в (22 35) и меняя затем порядок итерирования, полечим 0 1 0 ' Так как вектор V нвтяегся произвотьиым вектором, ортого- iiaiMiMM ci рокам матрицы В, то будет существовать постоянный вектор к такой, что т V3 = °J* + §dJ*Ydt B(t) (22 37) Условия (22 37) — необхоцпмые \счовия огпиматыюсти управ- пения (22 34) при V = Vn Рассмотрим их иескопько подробнее в ряде конкретных стучаев 1 Пусть /„(/, х, u) = Ajx c,u-t-u*c2u Тогда необходимые условия олтимачьнсстп примхт вид 7 с; | 2uVs-i \A;Ydl B=VB (22 38) Будем искать решение уравнения (22 38) в виде V0 = V,+l/8c (22 39) Тогда получим v; = -j(klB—c; — §A[Ydt В J с?, (22 40) V\=±(KB-B)c>\ (22 41) где полагаем к = к1 + кас
288 ПР0БЛ1Л1Л СИНТЕЗА УП^АВЛГИИЯ |ГЛ IV Определим теперь из (22 40) и (22 41) Xt и кг, пользуясь условием $BVod/ = 0 Умножая (22 40) и (22 41) справа на В» о II шпегрируя в пределах от 0 до Т, найдем K^)\cfolB'-\ \A\Ydt Bc?B'\dt А~1(0, Т), (22 42) X; ■= £, (22 43) т где А-ЦО, T)=\BCtlB'dt о Таким образом, окончательно имеем V'^ "И1КсГ'Я* + ^ A\Ydt Bc^B* \dt A~40, T) B — —cl-^AlYdt filer1, (22 44) VJ = 0 (22 45) Таким образом, управление u = B*c | V„ (22 46) где c = —Л-1(0, Т) х,„ будет переводить систему (21 I) из любого начального состояния х0 в конечное состояние х = 0 за время [0, Т] и будет доставпять функционалу (22 33) стационарное значение В ходе вычислении было использовано, что матрица А (0, Г) является неособой Будем предполагать, что, более того, матрица сг является положительно определенной при /£[0, Т] Тогда управление (22 46) будет являться оптимальным, именно, бучет доставлять наименьшее возможное значение функционалу (22 33) Доказательство этого утверждения оставим пока в стороне Заметим лишь только, что с помощью управпения (22 46) можно решить также задачу синтеза оптимальных управтеннй Действите тыю, г.одставтяя (22 46) в (21 1), найдем -У-'х-Л (', /)cH-j[BV1 + V ~4\dt (22 47)
§ 22) УПРАВЛЕНИЯ С ЗАПАЗДЫВАНИЯМИ В НЕЛИШ-ЙНЫХ СИСТЕМАХ 289 Отсюда имеем с = —Д-1(<. Т)\ Y-^+^BV.+Y-^dt , и, следовательно, оптимальное управление будет иметь вид и = —ЯМ-Ч*. Т) \Y-lx-\-\{B\x + Y-4)dt\ +V, Если измерение компонент вектора х ведется с запаздыванием, то оптимальное управление будет иметь вид и = —ЯЧОЛ"1*' — т, T)\Y-4Jt — i)x{t — i) + + j [BVt + Y-njdll+V^t) (22 48) Управление (22 48) будет переводить систему (21 1) из любого начального положения х0 в положение х = 0, если начальная функция х = <р(/), t £ (0, т] выбрана в соответствии с (22 47) При этом (22 48) будет доставлять наименьшее возможное значение функционалу (22 33) 2 Пусть в (22 33) f0(/, x, u) = xM2x + u*5Ix + x*fiIu + /4l*x + c*u + u*c2u (22 49) Тогда необходимое условие оптимальности будет илеть вид »B-Tt + fyYdt в = т = 2х*Б,* + с? + 2u'c, + J (2xMt + 2u*£, + А\) Y dt В (22 50) Здесь, как и выше, элементы матриц и векторов Аг, Ах, сг, clt By считаются вещественными непрерывными функциями, заданными при t ^ 0 Будем искать решение системы (22 50) в форме Ь = л,+^с, V0 = V1 + K8c Тогда х (0 —решение системы (21 1) при управлении u = fi*c+V0
(22 51) 290 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ можно представить в форме х = х, + *ас» где г г Xl«= — Y(t) J (BW. + Y-^dt, ха = - У (0 J (5B« +BVt)dt t t Тогда будем иметь vi-ylxjB—2х;в;—cj—^гх^+гу^ + лоУсИ-в} v;=yK;s—2x;bj—2Bc,— ^ас^+г^+уо^ул-ви,- (22.52) Уравнения (22 51) и (22 52) можно рассматривать как линейные интегральные уравнения, которые служат для определения искомых величин Vx и Уа Покажем, что эти интегральные уравнения имеют единственное непрерывное решение при любом выборе величин X, и Я2 Действительно, уравнения (22 51), (22 52) могут быть записаны в общей форме W = q(t) + ^W(x)K(t, x)dx, (2253) где г|>(0 и х(/, т)—непрерывные функции, заданные при t £ [О, Т], т€[0. Т] Уравнение (22 53) получается из (22 51) и (22 52) после соответствующего изменения порядка интегрирования в двойных интегралах. Положим И?о = 0 и определим последовательные приближения по формуле W*+i =* + j BW- T)dT- (22 54) i Из (22 54) будем иметь ll^*+i-^JI<Jm||U7,-rft„J|dt<^^m1, (22 55) где m = <maxj.]||x(/, т)||, т^ = ™хт]\\ *(/)||. т«[0.'г] Из (22 55) вытекает, что последовательность Wk сходится равномерно при t (£ [0, Т], и, следовательно, интегральное уравнение (22 53) имеет непрерывное решение W (/) При этом это решение является единственным, так как при наличии двух
§ 23J aiLVEHTH движения в лит иных системах 291 решений такого сорта б>дет иметь место неравенство т \\W—W\\^ml\\W—W\\dT^ <{Т~^тк ||F-FH<g^.||F-P|| (22 56) Последнее неравенство должно иметь место при любом к, что возможно лишь при условии || W — W ||=0, следовательно, установленное выше непрерывное решение является единственным Таким образом, существование решений (22 50) и (22 51) можно считать установленным Используя далее ортогональность вектора V0 строкам матрицы В, можно отыскать величины Alt Kx из линейных алгебраических систем, которые получаются из (22 51) и (22 52), если каждое из этих уравнений умножить слева на матрицу В* и затем проинтегрировать в пределах от 0 до Т Ее in полученная система разрешима, то система (21 1) может б..1ть переведена из любого начального положения х0 в положение х=0 за время [0, Г] с помощью управления u^B'c + Vx + V.c, (22 57) с=— Л-1 (0, 7>х„ При этом управление (22 57) будет доставлять функционалу (22 33) наименьшее возможное значение при условии, что матрица С2 в (22 49) положительно определена и квадратичная форма (22 49) положительно определена Далее с помощью управления (22 57) можно решить задачу синтеза оптимальных управлений Однако требуется, чтобы матрица \ В (В* -\- Уг) dt была неособон при /£ [0, Т] Если же компоненты вектора х измеряются с постоянным запаздыванием т, то требуется, чтобы эта матрица была неособой при ^£[0, Т — т] В этом случае, как и выше, начальную функцию х=<р(/) приходится выбирать специальным образом Именно, должно быть Ц- = Xj + ХгС, t £ [0, т] § 23. Определение элементов движения в линейных системах Рассмотрим линейную управляемую систему x = />(0x+Q(0u + f(0 (23 1) Предположим, что в процессе движения измеряются компо ненты вектора z = Px(t)x-\ QiWu-Ktf). (23 2)
292 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV На основе этих измерений требуется определить компоненты векторной функции l = Pt{t)x+Qt(t)u + tt{t) + Rz (23 3) Будем считать, что элементы матриц, входящих в (23 1)—(23 3), а также компоненты векторов flt f2 являются вещественными функциями, заданными при / ^ 0, непрерывными и ограниченными Будем считать, что вектор фазового состояния х имеет размерность п, вектор управлений и имеет размерность г, вектор z имеет размерность / и | — размерность k Обозначим через К фундаментальную систему решений для системы х = Р (t) х, Y = £ при / = 0 Предположим сначала, что управление и является известной функцией времени Обозначим через Ву матрицу ^ = ^(0^(0 Теорема 23 1 Если существует число т такое, что векторные функции, стоящие в столбцах матрицы В„ линейно независимы на промежутке [t—t, t], то векторная функция % определяется в момент t единственным образом через известные функции и наблюденные значения вектора г на промежутке [/-т. t] Доказательство Пусть х0 — произвольное начальное состояние для системы (23 1). Тогда система (23 1) имеет решение x = 7x0 + l/5F-1(Qu + f)d/. (23 4) о Подставляя (23 4) в (23 2), находим z = .B1x0 + /,1}/$r-1(Qu + f)d/+Q1u + fl. (23 5) о Из условий теоремы вытекает, что матрица Al(t—т, t) — = ^ BXB^dl — неособая Домножая обе части (23 5) на матрицу В[ слева и интегрируя по / в пределах от /—г до /, найдем t i J B[zdt=Al(t — т, 0*о Н $ Br[^"1(Qu + f)d/ + Qlu + f,]rf/. (23 6)
§ 23] ЭЛЕМЕНТЫ ДВИЖЕНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 293 Исключая вектор х0 из (23 4) с помощью (23 6), а затем исключая вектор х из (23 3), найдем l = R(t)z(t) + P,YAT4t—t. I) S Xzdt + bV), (23 7) где !о(0—известная функция, не зависящая от начального состояния системы (23 1) и наблюденных значений вектора г Дадим теперь другое представчение векторной функции |, отличное от (23 7) Так как векторные функции, стоящие в столбцах матрицы В\, линейно независимы в промежутке [t — т, t], то, как было показано в § 14, можно указать п точек в этом промежутке /—x/f / = 1, .., п, таких, что среди строк матрицы By{t—xj), j = l,. ,n, имеется ровно п линейно независимых Заменим в (23 5) t на t—x/t затем домножим полученный результат на матрицу B\{t —xj) и просуммируем результат по индексу / Тогда получим t B*l(t-T,)z(t-xl) = H1x.+ 2 B;(t-x,)X X [p^t-x^Yit-Xj) J Y~4Qu + f)dt + ° 1 + Ql(t-xt)u(t-x/) + f(t-x,)\ (23 8) В формуле (23 8) через Я, обозначена матрица #.= 2 B'At-xJBAt-Xj) /=i Матрица Я1—неособая Поэтому из (23 8) и (23 4) можно исключить вектор х0, а затем исключить вектор х из (23 3) Тогда получим |(0 = «(02(0 + '>.(0У(0«Г,(0|11ВГ('-т,)2(/-г/) + л. (23 9) В формуле (23 9) функция г\0 не зависит от начального состояния системы (23 1) и от наблюденных значений вектора г. Формулы (23 7) и (23 9) доказывают теорему 23 1 полностью. Остановимся теперь на решении проблемы локализации движения управляемой системы Пусть задана линейная управляемая система x = P(0x \-Q(t)u + t(t). (23 10)
294 ПР0Б1ЕМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV Эаементы матриц Р, Q и компоненты вектора f будем считать заданными при t^O, вещественными, непрерывными и ограниченными Пусть известно, что управление в эгой системе стеснено ограничением т $u2d*<cc2, (23 1I) о где и является, как и прежде, г мерной векторной функцией, х —«-мерной векторной функцией, дающей фазовое состояние системы Предположим, что относительно некоторого управления u = u(0 (23 12) известно, что оно удовлетворяет ограничениям (23 11) и переводит систему из известного состояния х0 в конечное состояние х = 0 за известное время [О, Т] В остальном управ пение (23 12) остается неизвестным При этих условиях требуется указать ту область фазового пространства Е„, в которой может находиться движение системы (23 10) при управлении (23 12) Дадим решение этой задачи локализации движений Прежде всего управление (23 12) может быть представлено в форме u = B*c + V, (23 13) где, как и выше, B = Vr-1Q и с —постоянный вектор Значения этого вектора можно определить из условий задачи единственным образом А именно, домножая (23 10) слева на матрицу У-1 и интегрируя в пределах О, Т найдем г — х0=Л (0, 7)с+ J Y-4 dt. о Отсюда имеем с = -Л-1(0, T)(x0+^Y-4dt\ (2313*) Здесь т А(0, Г)= J BB*dt. было использовано условие ортогональности V строкам матрицы В т В этих выкладках векторной функции
§ 23J эчьменты движения в линейных системах 295 Подставим (23 13) в (23 11) Тогда получим $V*d/<a*—(х,+ $Г-аыЛ*Л-'(0, Т)(х0+ \Y-4dt) (23 14) Если (23 10) после умножения слева на У-1 проинтегрировать от t до Т, то получим т т — у-»(<)х(0 —Л(/, T)c—lY-ltdt=[BVdt. (23 1 Г.) Представим теперь векторную функцию V на промежутке [t, 7 ] формой V(t) = B*(t)?(t) + W(t), (23 16) где W удовлетворяет условию ортогональности $£(T)U?(T)dT = 0 Таким образом, вектор у(0 в формуле (23 16) может быть определен единственным образом г y(t) = A'l(t, T)SB(T)V(x)dT. Подставляя (23 16) в (23 14), нахоцим V*('M(/. T)y(t)< <а2-(х0 + [У-ЧЛП Л"Ч0, Г)(х0 + [Y-ltdt\ — [w*dt (23 17) Используя (23 15) и (23 17), находим далее ПМ"1(/, Т)л< <«*-(х,+ lY-4dt\ i4-I(0, л(х.+ Jr^fdM-J Г»<Н, (23 18) где ^—левая часть (23 15) Неравенство (23 18) в фазовом пространстве Е„ задает семейство эллипсоидов Есчи положить в (23 18) W - 0, то получается
296 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ |ГЛ IV эллипсоид, охватывающий это семейство: {x-x)*(Y-l)*A-l(t, T)Y-4*-i)< <a'-fx0 + lY-4dt) Л-»(0, Г)Гх„+Jr-'fd/J (23 19) В неравенстве (23 19) положено х = — Y Л(/, T)c+ \У-Чси . (23 20) Легко видеть, что (23 20) дает решение системы (23 10) при управлении (23 13) при условии, что V = 0 Таким образом, установлена Теорема 23 2 Если управляемая система (23 10) под действием управления (23 12), удовлетворяющая условию (23 11), переводится из некоторого известного начального состояния ха за известное время [0, Т], то при условии линейной независимости векторных функций, стоящих в столбцах матрицы В*, на любом из промежутков [t, T] движение системы (23 10) может располагаться при любом фиксированном t £[0, Т] лишь в области, опредегяемой (23 19) Перейдем теперь к решению проблемы локализации движения управляемой системы на основе использования некоторых измерений П^сть вновь рассматривается система (23 10) при наличии ограничений (23 11), и пусть известно, что измеряется величина z = R(t)x(t) (23 21) И пусть также известно, что система (23 10) находится под действием управления (23 12), переводящего систему (23 10) из неизвестного начального состояния х0 в конечное состояние х=-0 за известное время [0, Т] Требуется по измерениям величин z найти ту область фазового пространства Е„, где могут располагаться движения системы (23 10) Будем искать управление (23 12) вновь в форме (23 13) Однако вектор с будет теперь неизвестным Векторная функция V по-прежнему удовлетворяет условию ортогональности \в\ш = о.
§ 23] ЭЛЕМЕНТЫ ДВИЖЕНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 297 Вектор с можно выразить по формуле (23 15) через неизвестное начальное состояние с = -Л-1(0, Т)(хш+ \Y-4dt) явление (23 13) в (23 10), умн интегрируя затем в пределах от к = _И A{t, T)c+\BVdt+^Y-lldt (23 2Г) Подставляя управление (23 13) в (23 10), умножая слева на матрицу Y-1 и интегрируя затем в пределах от (до Т, находим (23 23) Подставляя (23 23) в (23 21), получим т г z = — RYA (t, T)c — RY J B\dt- \ Y~4dt (23 24) r t Заменим в (23 24)$BVd/ через — \BVdt. Домножая обе части t о (23 24) на матрицу /?* и интегрируя в пределах [0, Т], получим т т т t г т J Rfrdt = $ Я*Я, dt-c+l RIY J BVdi— $ R*Y $ Y~4dt 0 0 0 0 0 < (23 25) Здесь положено R1 = RYA(t, T) Изменяя в среднем члене, вхо дящем в правую часть (23 25), порядок интегрирования, получаем т t т [R*Y[B\dt = [BlVdt, t о о где т Bf = ^R:(T)Y(T)B(x)dt т Положим Bt = "к*В + Вг, где $ В2В* dt = 0 Тогда о k'^^B^dt Л-х(0, Г), о и, следовательно, (23 25) можно представить в форме г г т г т $/?Jz<tt-J/?;/?,*" i + l BtV dt — l R1Y \Y~4dt (23 26)
298 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV Будем искать векторную функцию V в форме V = 5:v + W (2327) Тогда из ограничений (23 11) будем иметь т cM(0, T)c + vMa(0, Г)7<а*- $W2d/. (2328) где т Л2(0, T)=\BtB\dt. о Подставляя (23 27) в (23 26), найдем также т т т т ^Rlzdt^lRlR.dt с + Л,(0, r)v —S^ivjr-U^ (23 29) 0 0 0 ( Предположим, что матрица As(0, T) неособая Тогда при любом векторе с вектор у определяется из (23 29) единственным образом Исключим, пользуясь (23 29), вектор v из (23 28). Тогда для определения вектора х0 получим семейство эллипсоидов Эллипсоид, получаемый при W = 0, будет охватывать это семейство Обозначим этот эллипсоид через S0 Теорема 23 3 Если в процессе управления системой (23 10) измеряется величина (23 21), где R(t)—матрица, заданная при t^O, вещественная, непрерывная и ограниченная, если векторные функции, стоящие в столбцах матрицы В*г, линейно независимы на промежутке [0, Т] и векторные функции, стоящие в столбцах матрицы В*, линейно независимы на каждом из промежутков [t, T], то система (23 10) может переходить в конечное состояние х = 0 за заданное время [0, Т] лишь из начальных состояний, расположенных в области S0 При этом движение системы (23 10) в любой момент (£ [0, Т] может располагаться в множестве состояний x0£S0 и х£2, где 2—область, определяемая (23 28). Доказательство теоремы вытекает из предыдущего анализа Замечание Теорема 23 3 дает конструкцию того множества, содержащегося в фазовом пространстве системы (23 10), в котором может находиться управляемая точка Однако конструкция этого множества осуществляется в зависимости от наблюдений, на всем промежутке движения [0, Т], хотя для некоторых случаев локализации движений конструкцию этого множества полезно выражать через измерения, предшествующие моменту t Покажем, как можно сконструировать упомянутое множество фазового пространства через такие измерения Умножим обе части (23 24) на R1, но проинтегрируем лишь в пределах [0, Т], тогда,
§ 24] ЭЛЕМЕНТЫ ДВИЖЕНИЯ В НЕЛИНЕЙНЫХ СИСТЕМАХ 299 меняя порядок интегрирования в том же члене, найдем tilt Т J /?;У dt\ В\ dt = J J Rl (т) Y (т) В (() dx V (I) dt = [ B,V dt, 0 0 0т О где B1W = lR*l(r)Y(T)B(t)dx при т£[0, t] и 5, = 0 при т£(/, Т] Как и выше, представим В1=ГВ + Ва и V = fijv Если окажется, что матрица 5г(0, 0 неособая, начиная с некоторых значений /, то для таких значений возможно решение задачи локализации через измерения величины (23 21), предшествующие значению t % = ч\, ц = г. § 24. Определение элементов движения в нелинейных системах Рассмотрим сначала квазилинейную управляемую систему x = Px+Qu+f + p.G(/, х, и) (24 1) Предпо1ожнм, что в процессе движения измеряются компоненты вектора z z = P1x+Q,u + f1 + |iG1(/, x, u) (24 2) Предположим, что с помощью этих измерений требуется определить компоненты векторной функции l = P2x + Q2u + f2-r-p.G2(/, х, u) + R г. (24 3) Будем считать, что векторные функции G, Gj, Ga заданы при t > О, х£Еп и и£Еп вещественны, непрерывны и непрерывно дифференцируемы относительно компонент векторов х и и Будем считать далее, что если в (24 П —(24 3) положить ц = 0, то получим соответственно (23 1) — (23 3) Пусть Q„ — некоторая конечная область фазового пространства Еп, и пусть известно, что начальное состояние системы (24 1) х0 располагается в этой области Обозначим через fi, матрицу Bl = PtY и будем сначала считать у правление и известной непрерывной векторной функцией Теорема 24 1 Если существует число т> 0 такое, что векторные функции, стоящие в столбцах матрицы Blt линейно
300 11РОБ1ЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV независимы в промежутке [t—т, /], то существует ц0 > 0 такое, что при всех \ \i | < \i0 векторная функция | определяется в момент t единственным образом через известные функции и наблюденные значения вектора г на промежутке [t — т, t] Доказательство Пустьх0£О„ Тогда система (24 1) имеет при всех достаточно малых'ц., |^|<(х1, решение \ = \(t, x0, р.). (24 4) х = х0 при / = 0 Подставляя это решение в (24 2), найдем z=z(/, x0> р.) (24 5) Домножая (24 5) на матрицу В* слева и интегрируя в пределах от t — i до t, найдем J B\zdt = J B\(t) z{t, x0> \i)dt. (24 G) Правая часть (24 6) имеет якобиан, вычисленный по компонентам вектора х0, отличный от 0 при р. = 0, так как он совпадает с определителем матрицы A1(t — x, t), где Л,(/ —т, 0 = «= } B*B1dt Следовательно, (24 6) определяет неявную функцию х0 = ф(1, £х. t, р.), (24 7) где g,= J В*zdt. Пользуясь (24 7), исключим из (24 4) вектор х0, а затем исключим вектор х из (24 3) Тогда получим, что вектор будет определяться единственным образом через известные функции и наблюденные значения вектора z на промежутке [t — т, t] Как и в § 23, можно дать представление функции | через дискретные наблюдения вектора г Для этого в формуле (24 5) заменим / на t—Ту, домножим после этого слева на матрицу B\{t — т,) и просуммируем по индексу / Тогда получим %^B\{t-TJ)z{t-TJ)=^B\{t-T,)z(t-iJ, x0, р.) (24 8) Якобиан правых частей (24 8), вычисленный по компонентам вектора х0 при ц = 0, отличен от нуля, так как совпадает с определителем матрицы SerC-TyW-v)-//,.
§ 24] ЭЛЕМЕНТЫ ДВИЖЕНИЯ В НРТННЕЙНЫХ СИСТЕМАХ 301 Точки / — Ту считаются выбранными на промежутке [/ — т,, /] так же, как в предыдущем параграфе Поэтому можно считать, что существует ц0 > 0 такое, что при всех р., для которых | ц. | < ц„, система (24 8) может быть разрешена относительно компонент вектора х = *(£*. t, V), (24 9) где С-ЗВГС —Т/). /=i Пользуясь (24 9), исключаем х0 из (24 4) и затем х из (24 3) Тогда получим выражение вектора £ через известные функции и дискретные наблюденные значения вектора г, что и требовалось доказать Рассмотрим теперь систему нелинейных уравнений x = f(/, х) (24 10) Предположим, что измеряется величина z = G(/, x) (24 11) и требуется определить элементы движения, определяемые величиной & = Н(/, х) (24 12) Будем считать, что векторные функции f, G, Н заданы при t ^ 0, х £ £„, вещественны, непрерывны, и, кроме того, функции f и О непрерывно дифференцируемы по отношению к компонентам вектора х Пусть далее система (24 10) имеет положение равновесия х = 0, f(*. 0) = 0 Пусть также G(/, 0) = 0 Положим р — д\/дх при х = 0, pt = dG/dx при х = 0 Обозначим, как и выше, в теореме 24 1 5 = />,У, где Y—фундаментальная система решений линейной системы x = P(t)x, У(0) = £. Теорема 24 2 Если для Т > 0 можно указать число т > 0 такое, что cyuificmeyem промежуток [/ — т, t], в котором векторные функции, стоящие в столбцах матрицы В, линейно независимы * €[т, ^П» т0 можно указать 8 = 8(7) > 0 такое, что для любого движения системы (24 10), начинающегося в области ||х„|| < 6 при '=0, можно вычислить единственным образом элементы |(fl) no измерениям г для любого д £ [0, Т] При этом измерения должны осуществляться в промежутке [t — x, t] Доказательство Выберем число е тлк, чтобы любое решение х = х(/, х0) (24 13)
302 ПРОБПЬМА СИНТЕЗА УПРАВЛЕНИЯ (ГЛ IV системы (24 10), начинающееся при ||х0||<е, £ = 0, было определено на промежутке * £ [0, Т] Подставим (24 13) в (24 11), затем умножим обе части на матрицу В* и проинтегрируем в пределах [t—т, t] Тогда получим j B*zdt= j B'(t)G(t, x(/, х„))Л (24 14) Легко видеть, что правая часть (24 14) обращается в нуль при х0 = 0 Якобиан правых частей (24 14) по отношению к компонентам вектора х0, вычисленный при х0 = 0, совпадает с определителем матрицы J B*Bdl, и, следовательно, отличен от нуля t-x Тогда существует столь малое 6 = 6(Г), что при ||х0||<б вектор х0 можно единственным образом определить из системы (24 14) при любом / £ [т, Т] Выберем б к тому же так, чтобы было 8<е Тогда существует единственное решение системы (24 10), удовлетворяющее найденному значению х0 Вычисляя на этом решении функцию |, получаем искомый результат § 25. Построение управлений в линейной задаче преследования Пусть заданы две управляемые линейные системы *i = Pi*i + QiUi + if (25!) is = P*x2+Q4u2 + fa (25 2) Будем считать, что элементы матриц Ph Qt и компоненты векторов f,- заданы при t > 0, вещественны, непрерывны и ограничены Обозначим через nt размерность векторов f,-, х,-, через г,- — размерность векторов и,- Рассмотрим сначала простейший случай встречи Именно, будем считать, что произошла встреча управляемых систем, если выполнено соотношение HjX^Hji, при < = 7\ (25 3) Здесь Я, —постоянные матрицы соответственно размерностей /х«,, 1хпг Предположим, что в системе (25 2) задано начальное со стояние и управление Требуется найти условия, при которых из любого начачыюго состояния система (25 1) может произве сти встречу при помощи надлежащего выбора управления и, П>сть Yi есть фундаментальная система решений для системы х,= Р,х„ J = 1,2 (25 4)
§ 25) УПРМПЕННЯ В ЛИНЕЙНОЙ ЗАДАЧЕ ПРЕСЛЕДОВАНИЯ 303 с начальным условием У, = £/ при ^ = 0 Положим В* = YflQt и A;{t, T) = ] BjBl(dt Рассмотрим множество управлений и1 = В*,с1 + \1, 1=1,2, (255) где с,- — постоянные векторы и V,-—векторные функции, удовлетворяющие условиям ортогональности ^B,V,d/—0 о Подставим (25 5) в (25 1) и (25 2) Тогда по формуле Кошн будем иметь х,. = У,Х/0 + YtA (0, Т) с,- + К, J Yr^t dt + Y, J fl,V,d* (25 6) о о Подставим (25 6) в (25 3) Тогда получим #i^i СО Л, (0, Т) с. + нА Уг (7) xw + Y1 (T) J Yt% dt = = Я2У, (Г) Л, (0, Т) с» + Яг Уг (Т) х20 + Уг (Г) $ V^f, Л (25 7) Систему (25 7) можно рассматривать как систему линейных алгебраических уравнений для определения вектора сх Теорема 25 1 Если матрица HlY1 (T) At (0, Т) является квадратной и неособой, или если строки этой матрицы линейно независимы, то задача встречи разрешима при любом выборе начального состояния х,„ и любом выборе управления щ Замечание 1 Если условия теоремы 25 1 не выполняются, то условие (25 3), вообще говоря, не будет иметь места Однако можно указать такие управления u1( u2 и начальное состояние х,„, при которых условие (25 3) будем выполняться Если условия теоремы 25 1 не выполнены, то (25 3) удовлетворяется тогда и только тогда, когда ранг матрицы HlY1(T)x X Л, (0, Т) будет совпадать с рангом расширенной матрицы, полученной из нее добавлением столбца свободных членов, которые не зависят от вектора с, в (25 7) Замечание 2 Задача встречи разрешима при любом вы боре и2 тогда и тотько тогда, когда столбцы матрицы 52= ~HtYt{T)At(0,7)iiBCKTopS = //t Y2(T)xit) + Y2(T)\Y7%dt — — ft, П/1(7,)х104 Y1{T) J Vf'f, d/ являются линейными комби-
804 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV нациями столбцов матрицы Sl=H1Y1(T) Аг(0, Т). Иначе говоря, St=SlKt, (25 8) S^S.T, (25 9) Действительно, если существует управление их, разрешающее задачу встречи при любом выборе и2, тогда, полагая, с2 = 0, получим S^i^S Далее, полагая са = е,-, где е,—единичный орт пространства £„з, находим также S1cl = S2/( где S2/—i'-й столбец матрицы 52, и это означает, что (25 8) и (25 9) выполнены И наоборот, если начальные состояния х,0 и матрицы 52 таковы, что (25 9) и (25 8) выполнены, то из (25 7) будем иметь Sl(cl—kft—k) = 0 (25 10) Из (25 10) вытекает общий вид вектора с1( при котором задача встречи разрешима с, = *Л+ *- + <*!?. (25 11) где Oj — матрица, удовлетворяющая условию Slal = 0 При этом считаем, что столбцы матрицы ах образуют базис в ортогональном дополнении подпространства, натянутого на векторы, стоящие в строках матрицы 5lt у—произвольный постоянный вектор, размерность которого равна рангу матрицы о, Предположим теперь, что управления ut и и2 стеснены ограничениями вида \u1dt^a? (25 12) о Возникает вопрос, при каких условиях, наложенных на начальные состояния х,„, задача встречи будет разрешима при любом выборе управления и2, удовлетворяющем (25 12) Иначе говоря, когда существует управление и„ удовлетворяющее (25 12), при котором уравнения (25 7) имеют решение при любом выборе век тора с2, согласованном с (25 12) Вычислим Jujd/ при условии (25 11) и найдем минимальное о значение этого интеграла по отношению к вектору у Дифференцируя этот интеграл по компонентам вектора у и приравнивая ча стные производные нулю, найдем о;Аг(0, Т)с, = 0, (25 13) откуда находим V = 53-1axM1(0, T)(?v2c2 + a), (25 14) где Sa = a*lAl{0,T)al.
§ 25] УПРАВЛЕНИЯ В ЛИНЕЙНОЙ ЗАТ.АЧЕ ПРЕСЛЕДОВАНИЯ 305 Подставляя (25 14) в (25 11), найдем с,о=Лс, + Ь—alS;ialA1(Q, T)(l2c2 + X). (25 15) Легко видеть, что Т Т min J u? dt = cf0A t (0, T)clu-\-\\\dt. (25 16) V 0 О Теорема 25 2 Для того, чтобы задача встречи при ограничениях (25 12) была разрешима при любом выборе управления и2 при начальных х,0, х20, необходимо и достаточно, чтобы были выполнены следующие условия 1) выполняются условия (25 8), (25 9), 2) при любом выборе вектора с2 из условия MHO, Г)сг<а? (25 17) вытекает с^Л^О, Т)с10^а\ (25 18) Доказательство Так как при выполнении условия (25 17) можно выбирать вектор с2 коллинеарным любому из ортов пространства Е„з, то условия разрешимости (25 7) при условии (25 17) совпадают с условиями разрешимости этой системы при отсутствии каких-либо ограничений на вектор с, Отсюда вытекает необходимость и достаточность условия 1) теоремы 25 2 Пусть теперь выполнено условие 2) теоремы 25 2 Покажем тогда, что задача встречи разрешима Действительно, с>шествует вектор у такой, что, с одной стороны, условие (25 12) для управлении их будет выполнено по крайней мере для V, = 0 (в качестве у можно взять нулевой вектор) Управление и,, соответствующее вектору (25 П) при таком v. будет удовлетворять ограничению (25 12) и разрешать задачу встречи И, наоборот, если задача встречи разрешима при любом векторе с2, удовлетворяющем (25 17), то необходимо будет иметь место (25 18), так как левая часть (25 18) дает наименьшее значение (25 16), получающееся при V1 = 0 Если это минимальное значение не будет удовлетворять условию (25 18), то не существует управления и,, удовлетворяющего условиям (25 11) и (25 12) Таким образом, условие 2) теоремы 25 1 является совместным с условием 1), необходимым и достаточным для разрешимости задачи встречи при условии (25 12) Рассмотрим теперь дифференциальную игр> Пару управлений Uj, u2 назовем «допустимой ситуацией» в этой игре, если при управлениях iij и иа задача встречи разрешима
806 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ. IV Выше была установлена общая конструкция множества допустимых ситуаций Именно, ut = В: (Хаса + a]y + k) + Vl (25 19) и u3 = SJc2 + Vs (25 20) Предположим теперь, что задан некоторый функционал J = *= J (ult и$) Допустимую ситуацию uj, и°г будем называть ситуацией равновесия по отношению к этому функционалу, если имеет место равенство minmaxy(u1, u2) = max min./ (u„ и2) = У (uj, ug). u, u, u, u, Управление uj, и°г, входящее в ситуацию равновесия, называют также оптимальными стратегиями игроков. Положим т J (ult u2) = J f0 (/, xlt x2, Uj, u2)dt, (25 21) где fu = fou + ^2'. ^"—линейная форма, fjw—квадратичная форма относительно компонент векторов х1( ха, ut, uy Будем считать, что в квадратичную форму fj2> в качестве слагаемых входят квадратичные формы u*#,Uf, /=1, 2 Элементы матриц Я,-, как коэффициенты форм fj", f£", являются вещественными, непрерывными функциями, заданными при t^O Будем считать, что матрица Я, является положительно определенной, матрица Я2—отрицательно определенной Предположим, что существует ситуация равновесия uj, ulj и что эта ситуация получается из (25 19) и (25 20) при с2 = с20, Y = Vo. vi = vio. V2 = V20 Легко установить, что для ситуаций ult u2 имеют место формулы "i = В\ [а2 (с20 + е2с2) + a, (у„_ + e,у) + Ц + V10 + е, Vlt (25 22) u2 = В*2 (с20 + eac2) 4 V20 + e2V2, (25 23) где c2, v—произвольные постоянные векторы, V,-—произвольные векторные функции, ортогональные строкам матриц В,-, е„ е2 — вещественные параметры Подставляя (25 22) и (25 23) в (25 1), (25 2), найдем затем решение этих уравнений и вычислим функционал (25 21) Тогда из условий равновесия будем иметь Условия (25 24) являются необходимыми для того, чтобы ситуация u{0), u20> была ситуацией равновесия.
§ 251 УПРАВ1ПНИЯ В ЛИНЕЙНОЙ ЗАДАЧЕ ПРЕСЛЕДОВАНИЯ 307 Представим эти условия в развернутом виде Тогда будем иметь где |1 = 3х1/3е, при el = 0, r\i=dxjdti при е2 = 0, |2 = дх,/де., при е, = 0 Таким образом, имеем li = Yi$BiB'i°idt y + Y^B^tdt, (25 25) о о 4, = Ki JfliBIM' c„ (25 26) о |2 = У2$ Д^^-с^ + У^Я^^. (25 27) Подставляя (25 25)—(25 27) в необходимые условия оптимальности и производя перестановку порядков интегрирования, получим (25 28) -j^y2dTB2(0]vsj +\^+)7£Y>dTB*Wr*}di=° <2529> Так как векторы с2 и у являются произвольными, то из условий
308 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ [ГЛ IV (25 28), (25 29) получим необходимые условия следующего вида Г ?!±уЛ B&Otdt + j± В;ох d/=0, (25 30) Так как векторные функции V, ортогональны строкам матриц, то из условий (25 28) и (25 29) получим также г **- + ^YxdlBl(t) = vxBl(t), (25 32) г l^+ISr^^w^^w- (2533) Необходимые условия оптимальности (25 32), (25 33) можно рассматривать как линейные интегральные уравнения, служащие для определения функций V10, V20 Как было показано ранее, такие интегральные уравнения имеют единственное решение, так как матрицы Я, и Я2, по предположению, являются неособыми Далее постоянные матрицы ц, и цг можно выбрать так, чтобы функции V,0 удовлетворяли условиям ортогональности строкам матриц В/ После отыскания функций V,0 их можно исключить из уравнений (25 30), (25 31), которые будут являться линейными алгебраическими уравнениями, служащими для определения компонент векторов сгп и Yu Естественно, что эти уравнения будут разрешимыми, если определитель системы будет отличен от нуля. Предположим, что квадратичная форма т $U2,(/, I,?. 0, u,Y, 0)dt (25 34) положительно определена, причем |, = У, \ BlB*aldt, а также о предположим, что квадратичная форма т I »Se(', Ч,с„ 7l2c2> мл, и2сг)М (25 35)
§ 26] УПРЛВППШЯ В ЛНИЕЙНОП ЗЛДЛЧР ПРЕСЛЕДОВАНИЯ 309 отрицательно определена, причем о о Тогда определитель системы (25 30), (25 31) будет отличен от нуля, и будет существовать, следовательно, единственное решение этой системы Итак, установлено, что необходимые условия оптимальности дают единственную ситуацию равновесия, удовлетворяющую этим условиям Теперь можно показать, что найденные здесь условия будут являться также достаточными Теорема 25 3 Если квадратичные формы u*#tu, и — u*#2u2 положительно определены и если квадратичная форма (25 34) положительно определена, а квадратичная форма (25 35) отрицательно определена, то при условии разрешимости задачи встречи существует ситуация равновесия в дифференциальной игре, определяемой функционалом (25 21) § 26 Построение управлений в нелинейной задаче преследования Рассмотрим сначала две квазилинейные управляемые системы х,=Р,х +Q,u, + f,+(AG1, (26 1) х2 = Рх, + Q „u2 + f2 + nG2 (26 2) В системах (26 1) и (26 2) векторные функции G, заданы при 1^0, х,-££„,-, и,-££,.,•, вещественны, непрерывны и непрерывно дифференцируемы относительно компонент векторов х, и и,- Матрицы Plt Qi и векторы /, обладают теми же свойствами, что и в системах (25 1), (25 2) Пусть условие встречи имеет вид Я,х1 + |1ф1 = Я1!х2-г-цф, при t=T. (26 3) Здесь Н{—постоянные матрицы соответственно порядков 1хп,-, ц>,-—векторные функции размерности /, обладающие теми же свойствами, что и вектори .ie функции G, Предположим теперь, что начальные состояния х,-0 располагаются в ограниченных об!астях Q„,-, i = l,2, и управления имеют вид u( = B;c,-j V/, (26 4,
310 ПР0БТЕМА CIIIITL3A УПРАВ1ЕННЯ [ ГЛ IV гле с, —постоянные векторы и V, —непрерывные функции, удовлетворяющие условию ортогональности, и, кроме того, множество векторов с, и векторных функций V/ ограничено в совокупности Теорема 26 1 Если выполнено условие теоремы 25 1 предыдущего параграфа, то существует число ц0 > 0 такое, что при всех, | и | < Но будет существовать управление \хи удовлетворяющие условию (26 3) Доказательство Для начальных состояний х,0 и управлений (26 4) построим решение системы (26 1) и (26 2) х,- = хД/, х,0, с,., ц.) (26 5) Заметим, что можно выбрать столь малое щ, что при |н.|<ц.,. решения (26 5) будут существовать при t£[0, T] Подставим (26 5) в (26 3) Будем искать решение (26 3) в форме Ci^lHtY^A^O.T)]*?, (26 6) где у—-искомый постоянный вектор Подставим (26 6) в (26 3) Легко видеть, что тогда (26 3) имеет единственное решение для вектора 7 при |г=0 Далее якобиан, вычисленный от левой части по компонентам вектора v ПР" Ц = 0. отличен от нуля, так как он совпадает с определителем матрицы tfi^i (Л А (°. 7')[tfiyi(7')4i(0, Г)]*. Отсюда следует, что можно указать \л0 > 0 такое, что при | ц | < ц0 (26 3) будет определять единственным образом векторную функцию 7 Эга векторная функция определяет управление и1 = В1*[Я1К1(Г)Л1(0, T)]* v + Vlt (26 7) которое и будет осуществить решение задачи встречи, что и требовалось доказать Замечание При доказательстве теоремы 26 1 указан способ построения одного из управлений ult разрешающих задачу встречи Покажем, что существует, вообще говоря, целое семейство таких управлений, а именно, это семейство будет зависеть от п — / произвотьных постоянных, где / — число строк матрицы Sl = HlYl{T)Al(0, T) Действитетыю, будем искать решение системы (26 3) в форме c1 = S*7 + o16, (26 8) где 0, — матрица, стотбцы которой ортогональны строкам матрицы S„ S,o, = 0 При этом считс)ем, что о, имеет п — / линейно независимых столбцов 6 —постоянный вектор размерности п — 1 Подсывияя
§ 26J УПРАВЛЕНИЯ В НЕЛИНЕЙНОЙ ЗАДАЧЕ ПРЕСЛЕДОВАНИЯ 311 (26 8) в (26 3), найдем, что (26 3) имеет решение при ц = 0 относительно v, и якобиан, вычисленный по отношению к компонентам вектора у при ц = 0, отличен от нуля для любого вектора 6 Следовательно, (26 3) будет иметь решение в форме (26 8), причем v будет функцией векторов св, б и параметра \и Рассмотрим теперь дифференциальную игру Пару управлений u„ u2, удовлетворяющую (26 3), будем называть допустимой ситуацией Таким образом, допустимая ситуация определяется формулами и, = В\ [Sty + о^б] + V,, u2 = B;ct + Va (26 9) Допустимая ситуация и?, иЦ называется ситуацией равновесия по отношению к функционалу / (ulf u2), если имеет место minmax./(iii, u2) = maxmin J (щ, u2) = /(uj, и?) (26 10) и, и, и, и, Заметим, что в (26 10) minmax и maxmin берется по множеству допустимых ситуаций. Положим далее т /(и,, u2) = 5(f0 + ^G0)d/, (26 11) о где f„—функция, рассматриваемая в § 25, G —вещественная, непрерывная, заданная при /^0, и(££,., х(££„ функция, непрерывно дифференцируемая по отношению к компонентам этих векторов, ц. —малый параметр Теорема 26 2. Если выполнено условие теоремы 25 3, то существует число р-0 > 0 такое, что при любом | ц | < ц0 существует ситуация равновесия uj, uj no отношению к функционалу (26 11) Доказательство Выведем сначала необходимое условие существования ситуации равновесия Для этого предположим, что эта ситуация определяется формулой (26 9) при с2=с20,_б = 60, V, = V10 Положим в (26 4) V^V^ + e^,, V2 = V20 + e8Vs, где V,-—непрерывные функции, ортогональные строкам матрицы Б,- Подставляя (26 4) в систему (26 1) и (26 2), а затем разыскивая решение и подставляя в (26 3), найдем, что вектор v. входящий в (26 8), будет не только функцией векторов с2 и б, но и функцией параметров г, Вычислим функционал (26 11) при управлениях, определяемых формулами (26 9). Тогда будем иметь / = /(с„ б, elt e2)
312 ПРОБЛЕМА СИНТЕЗА УПРАВЛЕНИЯ Из условий равновесия ситуаций uj, u°2 имеем dJ n dJ n dJ dTt = 0' д& = 0< дГ, " о. #-о. «-о са = с20. б = б0, е, = 0, е2 = 0 Эти необходимые условия приводят к нелинейным интегральным уравнениям для определения функций V,0 При достаточно малых значениях параметра \i эти интегральные уравнения имеют единственное непрерывное решение, причем будут соблюдены условия ортогональности этих решений строкам соответствующих матриц В/ Далее из этих же необходимых условий определяются векторы с„ и б как неявные функции параметра (i, так как соответствующий якобиан, по предположениям теоремы 25 3, при ц = 0 будет отличным от нуля Таким образом, необходимые условия дают при достаточно малых значениях ц единственную допустимую ситуацию вида (26 9), в которой будет с, = с,(ц), 6 = 6 (м-), V/0 = V,0(n) При условиях теоремы 25 3 можно показать также, что эта допустимая ситуация будет обязательно ситуацией равновесия
Глава V ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ ПРИБЛИЖЕННОГО НАХОЖДЕНИЯ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ § 27. Метод последовательных приближений для отыскания оптимальных программных движении Предположим, что задан некоторый управляемый объект, движение которого описывается некоторой системой дифференциальных уравнений dx/d/ = f(x, u, /) (27 1) Пусть фазовые координаты *„ ..., хп и управления «t,. , иг, этого объекта стеснены некоторыми ограничениями вида g,(x, u, /)<0 (/-1 к) (27 2) В качестве допустимых управлений можно рассматривать всевозможные кусочно-непрерывные функции и(/), которым отвечают движения х(<), удовлетворяющие совместно с и(/) системе (27 1) и ограничению (27 2) Требуется найти управление и0(/) и соответствующее ему движение х0(/), *€[0, Г], х0(/) = х0 при / = 0, где х0—заданная точка фазового пространства, которые удовлетворяли бы на всем движении системе (27 1) и ограничениям (27 2) и чтобы управление и0 доставляло функционалу г J = />(x(T))+$/0(x, u, i)dt (27 3) о наименьшее возможное значение, т е чтобы было У(и)>У(и0) (27 4) Определение 27 1 Всякую последовательность допусти мых управлений Uj(/), u2(f), ... будем называть минимизирующей, если последовательность чисел J (u,), J (и,), не возрастает Предложенный ниже метод последовательных приближений заключается в последовательном построении членов минимизирующих последовательностей Пусть и, (О — некоторое допустимое управление и х^) —соответствующее ему движение Система уравнений x(/)=f(x(/), МО. /). (27 5)
314 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [П V вообще говоря, для каждого начального вектора х0 определяет решение х = х(/, х0) (27 6) Рассмотрим систему (27 5) совместно с уравнением dVjdt = -/„ (х, u,(0. О (27 7) Построим интеграл системы (27 5)—(27 7) следующим образом подставим (27 6) в правую часть (27 7) и найдем функцию Vx с начальным условием V1 = p(\(T, x0)) при 1 = Т. Тогда получим т fi-M*. хв) = /»(х(Г, x0)) + S/,(x(Tt x0), Ui(t), x)dx. (27 8) Найдем вектор х0 из (27 6) х0 = Ф(х, /) (27 9) и затем, пользу ясь (27 9), исключим вектор х0 из (27 8) Получим *\(х, 0 = ^('.Ф(х, t)) = p(x(T, Ф(х, ())) + т + $/,(* (т, Ф (х, 0). и, (т), т) йт (27 10) В формуле (27 10) вектор х рассматривается как параметр Покажем, что величина z = V, —V\(x, 0. рассматриваемая как функция п-\-2 переменных Vlt хг, . , х,„ t, является интегралом системы (27 5)—(27.7), т е она сохраняет на движениях этой системы постоянное значение. Если взять решение системы (27 5)—(27 7) в форме x = x(*,x0), V1 = K,1e»— $/,(х(т, х0), иДх), x)dx, (27 11) о то z = V[°' — J(ul). Следовательно, величина г сохраняет постоянное значение При этом она принимает значение „нуль" на всех движениях, для которых У1 = р(х(Г, х„)) при / = 7\
§ 27] оптим\лbiu.iF ni'orp\M\iHui цви/Кения 315 Следоватетьно, будем иметь, с одной стороны, V\0> — V,(x0, 0)=-0, и с др> rout/I»'=</(и1) Тогда построенная выше функция Vj(x, t) будет облачать свойством УЛ*о, 0) = J(u1, х) (27 12) Аргумент х в формуле (27 12) означает, что функционал J вычистяется при управлении и, вдоль движения (27 6) Если правые части системы (27 1) непрерывно дифференцируемы по А'1( , л'„, то функция Vl(x, () также будет непрерывно дифференцируема, во всяком случае, в некоторой окрестности движения х1(/) Это, разумеется, имеет место, когда также непрерывно дифференцируемы функции р и /0, что будет установлено далее Из того, что величина г является интегралом системы (27 5)—(27 7), будет вытекать тождество ^-ЬЕДЫх, «, 0.-/0-0 (27 13) При этом, естн функция ^(х, () определена всюду, то тождество (27 13) имеет место также всюду, а не только вдоль интегральных кривых системы уравнений Действительно, пусть ~1 6 [О, Т]— некоторый момент времени_н х —некоторая точка фазового пространства Пусть x — x(t, x, t) — решение системы (27 5) с начальным условием х = х при t — 1 Положим xo = x(0, x, t) Тогда решение (27 6) будет проходить через точку х npji t = t Следовательно, (27 13) будет иметь место при / = /, х = х Остановим теперь дифференциальные свойства функции Vj (х, () Пусть компоненты вектора f и функции р и f0 непрерывно дифференцируемы q раз всюду по переменным xlt . ., хп, причем эти производные являются также непрерывными функциями относительно и и / П^сть также и,(0 —допустимое управление, x1(t) — соответствующее ему движение Положим х0 = х,(ОН-с, где с —вектор (с,, ..., с„) с вещественными компонентами При достаточно мапых clt . ., с„ решение (27 6) будет определено при '€[0, Т] и q раз непрерывно дифференцируемо по clt ..., с„ Якобиан функций (27 6) но си ..,сп при ct = ct= ... = с„ = 0 обращается в единицу при t = 0, поэтому функция Ф(х, t) существует и q раз непрерывно дифференцируема по а,, . , хп в неко-
316 ВЫЧИСЛИТЕЧЬНЫЕ МЕТОДЫ [ГЛ V торой достаточно малой окрестности решения х,(/) Из вида функции V, (х, /), определяемой из (27 10), вытекает тогда, 4toKj(x, /) дифференцируема q раз относительно хг хп. Перейдем теперь к построению последовательных приближений Найдем управление иг(х, /), оптимальное по отношению к демпфированию функции Это управление будет доставлять наименьшее возможное значение функции ИМх, и, о = ^Ч-ЕД;/,(х. и, 0 + /.(х. и, 0 (27 14) при условии выполнения ограничений (27 2) Положим в системе (27 1) u = u2(x, /) Предположим, что полученная система имеет решение х = х2(1), х2(0) = х0, (27 15) заданное при /€[0, Т], и пусть u,(0 = uf(x,(0, 0- (27 16) Будем считать, что управление (27 16) и соответствующее ему движение х2(/) являются допустимыми С помощью управления иа(/) построим функцию Vt (x, t) точно так же, как была построена функция Vl(\, t) с помощью управления и, (/) Найдем управление ц3(х, I), доставляющее наименьшее возможное значение функции U72(x. и. 0 = ^ + Ё д£Мх. u,0 + /o(x. и, 0 (27 17) Подставим управление и3 в систему (27 1) Построим решение полученной системы х,(/), /€[0, Т], х3(0) = хо (27 18) и положим и,(0 = й1(х,(0, /) Продолжая этот процесс далее, получим две последовательности последовательность управлений ux(/), u2(/), . н последовательность соответствующих им решений МО. МО. ••
g 27J ОПТИМАЛЬНЫЕ ПРОГРАММНЫЕ ДВИЖЕНИЯ 317 Получим также последовательность функций Vt(x, t), Vt(x, t), ... Эти последовательности связаны между собой х,(/) является решением системы (27 1) при u = u,(x, /), где u,(x, t) доставляет наименьшее возможное значение функции ^-i-t+Z^m*. «. о ш*. и, о при ограничении (27 2), и;(/) = и,(х,(/), /) Теорема 27 1 Если проведенное выше построение оказывается возможным при любом /=1,2,. ., то возникающая в результате этого построения последовательность управлений щ (/), Uj(/), .. является минимизирующей Доказательс тво Функция W, (х, и, /) тождественно обращается в нуль при 11 = 11,(0, поэтому при u = DJ+1(x,/) будет Wt < 0 Следовательно, также будет ЧМ*1+,(0. ul+I(0.0<0 Проинтегрируем последнее неравенство по / £ [О, Т] и получим г [Wi<*n.» ul+ut)dt = Vl(xt+l(T),T)-V((xo,0) + т + J /.(xi+l, ul+I, l)dt = p(x[+i (T)) + о т Ч 5/o(x,+l,u,+1,Od/-lMx0,0)<0 (27 19) и Из (27 19) имеем 1Мх..0)>У(и|+1, х/+1). С другой стороны, Vt(xe,0)=J(ut, х,) Следовательно, последовательность чисел J(u„ х,), 1=1, 2 будет невозрастающей, и поэтому последовательность управлений ult tij, . . будет минимизирующей Рассмотрим теперь несколько подробнее тот случай, когда система (27.1) является линейной х = Лх + £и-И(0, (27 20)
} 318 ВЫЧИСЛИТЕПЬНЫЕ МЕТОДЫ [гл v а функции р и /о являются полиномами относительно xlt . , д- порядка s, причем коэффициенты полинома /„ будем считать непрерывными функциями переменных их ur, t. Пусть ограничения (27 2) имеют вид |и,|<1. » = 1, .... г. (27 21) Если ut (0 — кусочно-непрерывная функция, удовлетворяю- щая (27 21), то система (27 20) при u = ut(/) имеет решение (27 6), которое будет являться линейной функцией вектора х„ Построим функцию Vx (x, /), соответствующую управлению и,(/) Эта функция является полиномом относительно величин х„ ..,х„ порядка s с непрерывными относительно / коэффициентами. Действительно, функция Vl((, x0) является полиномом порядка s относительно величин л^0', ...,х^\ вектор х0 является линейной функцией относительно х, так как функция Ф(х, /) линейна относительно х Отсюда вытекает, что функция ^(х, /) = М/, Ф(х, 0) является полиномом порядка s Итак, почожим У г (х, 0=2 УГ. /.= S /Г, (27 22) т = 0 т = 0 где V\m}—однородные формы порядка т относительно хи .. , хп с коэффициентами, непрерывными относшельно / и подлежащими определению из условий Vj = p(x) при t = T и W + Ё д£ (А* + fiu> +f (0), + /о (х, к, (/). 0 = 0 (27 23) Подставляя (27 22) в (27 23) и приравнивая формы одинако вой степени относительно величин л,, ...,д„, найдем систему линейных уравнений гр+Ё[^мч+^(*..+.№]+в--о. m = 0, . , s—1, (27 24)
§ 27] ОГПНМА1Ы1ЫЕ ПРОГРАММНЫЕ ДВИЖЕНИЯ 319 Пусть Р(х)=2р"'", Р"'" " /о"" —однородные формы степе- ш = 0 ни т относительно *,, .. , хп Начальные условия определяются из равенства V<1m>=p<m) при i = T. Уравнения (27 24) и (27 25) служат для опредепения коэффициентов форм V[m и являются линейными Следовательно, они имею г единственное решение, заданное при / £ [О, Т] Этим функция V,(x,/) определяется полностью Если форма /is) не зависит от управлений, то н форма V",s) не будет зависеть от управлений и для всех приближений будет иметь место равенство y<s)=l/<s) Линейные уравнения, служащие для определения коэффициентов форм К(,ш), будем далее обозначать символом (*) и считать в них ut(/) некоторым управлением Выберем управление йг(х, I) так, чтобы оно доставляло функции Wl (x, и, /) наименьшее возможное значение и удовлетворяло (27 21) Подставим управление иг(\, t) в систему (27 20) Предположим, что полученная нелинейная система имеет решение х,(0, '€[0. Т] Положим и2(0 = МхЛО. О (27 2С) Пользуясь u2(/), c помощью линейной системы (/) можно построить функцию Уг(\, t) Продолжая этот процесс далее, построим минимизирующую последовательность управлений В этом случае, когда функция /0 не зависит от управлений, управление й/ + 1(х, /) определяется в явном виде с помощью формул (и/+1 (у,/))/ = - sign (£ g^.) (27 27) Положим далее "/ = "/W = I^s/. /=1... ,л (27 28) Рассмотрим тот случай, когда /0 не зависит от управлении Пусть построение последовательностей иг(/), xt(t) оказывается возможным Тогда ввиду равномерной ограниченности множества функций и,(/), /=1,2, .. .функции х, и коэффициенты полиномов V, будут равномерно ограничены и равностепенно непрерывны при / £ [О, Т] Следовательно, из них можно выбрать подпоследовательности, сходящиеся равномерно при / £ [О, Т] Пусть именно х,(/), V,(x, t), /= 1, 2, , и есть эти последовательности.
320 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V Тогда X/—*хв(0 при / — + оо, V,—*К0(х, 0 при / — + °° равномерно для / € [0, Т] Обозначим через и)щ функции и}» = — sign aj (х„ (0), (27 29) причем будем считать signa = 0 при сс = 0 Пусть Е6 — множество всех точек / 6 [0, Г], для которых l*/(x,(0)l>6. /=1. ••' Тогда оказывается, что можно указать число /д. обладающее свойством и, (/) = u0 (t) при / € £е Для любого / > /6, иначе говоря, на множестве Ей при любом б > 0 последовательность управле ний и, при /^/б не меняется и становится равной и0(/) Действительно, из равномерной сходимости xt(t) к х0(/) будет вытекать равномерная сходимость последовательностей Oj(x{) К оДх,), /=1 Г. Следовательно, по числу б можно указать 16 > 0 такое, что Но тогда при / £ Е6 будет sign сг/(х/) = sign ау.(х0) Следовательно, «х(0 = "о(0. '€£«. 1>U. Далее, если множество F нулей функций ау(х0(/)), /=!,.. , г, имеет меру нуль, то оказывается, что ut(t)—►u0(/) по мере Иначе говоря, по е>0 и б, > 0 можно указать /х такое, что мера множества всех t, для которых 1К(0-иД0||>е. не будет превосходить б: при /^/t Действительно, множество F располагается в дополнении Ее, ко всему промежутку [0, Т] при любом 6^0 Обозначим это дополнение через Ё6 Ввиду того, что mes F — 0, mesEe сколь угодно мала, если б достаточно мало При (£Е& имеет место равенство МО — и0(/) = 0 при 1^*1й. Следовательно, неравенство 1К(')-М0||>е
§ 27] ОПТИМАЛЬНЫЕ ПРОГРАММНЫЕ ДВИЖЕНИЯ 321 может иметь место лишь во множестве £в, меру которого можно сделать за счет выбора 6 меньше наперед заданного числа Этим сходимость по мере и,(/) к и0(/) доказана полностью Отметим тот случай, когда mesF = 0 Этот случай бывает, например, когда элементы матриц А, В и компоненты f(/), а также коэффициенты функции являются аналитическими функциями при t £ [О, Т] и /о линейна относительно х„ . , х„ Более того, в этом случае множество F будет конечным Действительно, обозначим через Xsl функции dV,/dxt, s= I, ...,n Тогда эти функции вдоль кривых х,(/) удовлетворяют системе уравнений i-^ = -2XV-|r. s=l « (2730) Функции Af0, следовательно, удовлетворяют системе уравнений ^« = -£VVo-|e. *=1 «• (2731) Из (27 31) вытекает, что функции \sa являются аналитическими при (£ [0, Т] и, следовательно, аналитическими будут функции Известно, что аналитические функции на конечном промежутке имеют разве лишь конечное число нулей, если они не тождественно равны нулю Итак, вообще говоря, множество F будет конечным. Перейдем теперь к изучению управления и„(/) Введем в рассмотрение функцию Вектор u0(/) доставаяет W0(x0(t), u, i) наименьшее возможное значение при любом фиксированном / (J [0, Т], причем этим наименьшим возможным значением является нуль Иначе говоря, может иметь место соотношение ini W0 (x0, u, /) = W0 (x0, u0f 0 а 0, t € [0, Т] (27 32)
322 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [П V Покажем, что (27 32) действительно имеет место. Если vtf-Ф о, то и ыЧ)(/)=йг0, во всяком случае, начиная с /^/6. Выберем вектор и0 (/) так, что inftt70(x0,u, t) = W0(x0, u„/). Остается показать, что Г0(х„, u0, /) = 0 При 1—+ + оо предел Wt{xlt щ, t) равен W„(x0, u„ /) при любом таком/, что uj"=£0 по крайней мере для одного значения /=1, ...,/■. С другой стороны, R7,(x«.U<- 0=0, следовательно, К70(х0, и0, /) = 0 Этим (27 32) доказано Покажем теперь, что управление и0 доставляет функционалу J наименьшее значение по сравнению со всеми другими управлениями, достаточно мало отличающимися от управления и, на множестве Ее Компоненты вектора являются суммируемыми функциями на [0, Т], ибо они ограничены и измеримы, так как функции о/(х0) непрерывны Следовательно, signay(x0)—измеримая функция Пусть и(/) — произвольная суммируемая функция, отличающаяся от функции и0 разве лишь на множестве £й Пусть также |й,|<1 и ||и0—й||<е при t^Ef,. Покажем, что при достаточно малом е >0 будет У (и0, х0)</(й, х) Действительно, введем в рассмотрение функцию a (0 = W„ (x, u(t), t) (27 33) Утверждение будет доказано, если при достаточно малом е > 0 будет т
§ 27] ОПТИМАЛЬНЫЕ ПРОГРАММНЫЕ ДВИЖЕНИЯ 323 Это обстоятельство вытекает из следующего рассуждения. Проинтегрируем (27 33) Тогда будем иметь -р(х(Т))-И,(х(0), 0)+ $/,(*. t)dt = J(ju, x)-/(u„ Хо). о Итак, если г Ja(0««>0, о то _ /(и, х)>У(Иа, х0) г Оценим величину интеграла }a(/)d/ Ясно, что о W0(x, й, t) = W0(x, о,, 0+2о/(х)("/-«П=- = Sa/(x) («,-«)«). Последнее имеет место, так как №0 (х, и9, *) = О при любом х и t €[0, 7]. Далее имеем Гв(х, й, 7) - 2 «J/(x,)(5/-ajP>) + 2 (a/(x)-a/(x0))(«/-u</«). (27 34) Первое слагаемое в (27 34) может быть оценено следующим образом т г г \ 2o/(Xo)(",-Od<>6 J ^U,-uf\dt. Эта оценка имеет место потому, что при любом / ОТ, (Х.) (и,-!!}*» 0, т. е. sign a, (Хо) = sign (й,—ы}°>), откуда 07 (Хо) (U/ -И*,0») = I О/ (X.) | |Й,- Uj"|
324 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ. V Легко видеть, что |оу(х)-ау(х0)|<ае при /€[0, Г]. Выбрав е < б/о, найдем, что при таких е У(й, х)>У(и0> х0), что и требовалось доказать Аналогичные результаты могут быть получены путем соответствующих рассмотрений, когда элементы матрицы В являют- ся линейными функциями относительно хх, ..., х„. Действительно, в этом случае величины bt/ будут линейно зависеть от хи ... хп, однако функции V, по-прежнему будут оставаться полиномами, и все сделанные выше выводы, за исключением свойств старших форм, входящих в функции Vlt будут оставаться в силе Эти формы будут также в таком случае зависеть от управлений, если даже старшие формы, входящие в функции /„ не зависят от управлений Приведенные выше рассуждения в полной мере относятся и к нелинейным системам, правые части которых линейно зависят от управлений Если правые части таких систем являются аналитическими функциями относительно xlt .... хп, то функции Vt также будут являться аналитическими относительно xlt .. , х„ Для их построения будет требоваться решение счетного числа линейных дифференциальных уравнений возрастающего порядка Это обстоятельство является весьма затруднительным при практическом использовании предлагаемого способа последовательных приближений в нелинейном случае Перейдем к рассмотрению другой задачи Пусть заданы система x=f(x, u, 0. (27.35) где f==0 при х = 0, и система ограничений ^(х, и, 0<0, /=1 k (27 36) Требуется при заданном начальном условии х, построить управление u0(f) и отвечающее ему движение x0(t) так, чтобы были выполнены ограничения (27 36), xe, u0 удовлетворяли системе (27 35), нулевое решение системы (27.35) было асимптотически устойчиво при u = u0(f) и чтобы среди всех таких управлений и0(0 и соответствующее ему движение х0(/) доставляли наименьшее возможное значение функционалу /= J Мх, u, t)dt. (27 37)
§ 27] оптимллышс программные двнжгиия 325 Построение минимизирующей последовательности в общих чертах остается таким же, как и ранее Если управ пение и, (О и соответствующее ему движение х{(/) уже построены, то строится функция Vt(x, t), которая вдоль интегральных кривых системы (27 35) при и=-и,(/) удовлетворяет уравнению V,(x, /)-5/.Л Функция и,+ | (х, /) выбирается из условия, что при и = й/+1(х, /) функция W (х, и, /) принимает наименьшее возможное значение с учетом ограничений (27 36) Далее _рассматриваегея система уравнений (27 35) при управлении и = й,+1(х, /), строится решение этой системы х = хн.,(/), проходящее через точку х = х1щт / = 0 Полагаем u<+,(0-ul+1(xJ+1(0. 0 Управление ut+1(/) и соответствующее ему движение х,+1(/), если они допустимы, образуют новое приближение. Если подобное построение оказывается возможным при любом /, то последовательность и,, , uz, будет минимизирующей Наиботее трудным местом в этом алгоритме является построение функции Vt, и даже вопрос о ее существовании требуется рассматривать особо Покажем, что в широком классе саучаев функция Vt(x, t) существует Подставим в систему (27 35) вместо и управление и,(/) и сделаем в полученной системе замену искомых ф\нкиий по формулам у = х—х,(0 Для у получается система dy/dt = A(t)y + g(y, t) (27 38) Пусть, например, компоненты g дважды непрерывно дифференцируемы и являются ограниченными функциями t Тогда, если линейное приближение системы (27 38) образует правильную систему с положительными характеристичными числами, то существует семейство решений У = У(Л Су сп) системы (27 38), зависящее от а произвольных постоянных,
326 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ у которое удовлетворяет неравенствам ||y||«z||C|!e-« при *>0, где а>0, Ь > 0—постоянные, С = (с1( ..., с„), причем Dy/DC^O при с,= . . =с„=0 Следовательно, можно найти функцию <р(у, t) такую, что С = Ф(у. О При известных предположениях относительно /„ интеграл jMMO+yC С), U|(o. t)dt будет существовать и равняться функции Vt (С, t). Исключая произвольные постоянные, находим V,MO + Y. t) = Vt{t, ф(у, 0) Следовательно, функция Vt (x, t) определена, во всяком случае, в некоторой окрестности кривой х,(/) Остановимся несколько подробнее на том случае, когда система (27 35) является линейной и ее коэффициенты являются линейными функциями управлений £ = (л(0 + ЕЛ/(')«,)х, (27 39) где А и Aj, /=1, .... г,—матрицы размерности п, элементы которых суть вещественные, непрерывные, ограниченные функции при />0 Предположим, что управления таковы, что |ау|^1 при f^sO, j = l, .... г Положим '-.£""• где Дто—однородные формы степени m относительно xt, ...,*„ с вещественными, непрерывными, ограниченными коэффициентами относительно /, ult .... иг Будем считать, что Д*'—положительно определенная квадратичная форма, так что f?>c\\x\\\ где с—положительная постоянная Будем считать также, что ряд, представляющий /0, сходится в некоторой окрестности точки (х[0} xi0>) равномерно по отношению к/>0и (ult ., ur)
§ 27] ОПТИМАЛЬНЫЕ ПРОГРАММНЫЕ ДВИЖЕНИЯ 327 |«y.J<l. Требуется найти такое управление, при котором* 1) нулевое решение системы (27 39) равномерно асимптотически устойчиво; 2) справедливо неравенство ||х(*,х., /,)||<аИх,||«-*«-'•>. t>U\ (27 40) 3) среди всех допустимых управлений функционал J=\Udt о принимает наименьшее возможное значение. Здесь х(/, х0, /0)— решение системы (27 39), х(/0, х0, *0) = х0; а>0, &>0 —постоянные Пусть ut(/)—допустимое управление. Тогда функция Vt(*> t) = j hdi существует, является однозначной, аналитической и предста- вима в форме сходящегося ряда У» (*. 0=2 Щт> (х, 0. т = 2 где Vf1' (х, /)—однородная форма степени т относительно ж,, .... х„ с непрерывными ограниченными коэффициентами, заданными при />0, причем VJ2) — положительно определенная квадратичная форма Определим последовательные приближения» как и ранее Тогда й2(х, /) — управление, при котором w*- dt +2*,dxsXs + '<> имеет наименьшее возможное значение Ясно, что 5p = ~dgn(i;5§(V).). /=1 '• (27 41) Подставляя (27.41) в систему (27 39) вместо управлений «и . , ип получим нелинейную систему Предположим, что она имеет решение х5(/), х2(0) = х1 Подставляя это решение в (27 41), найдем управление и}2)(/), / = 1, , г Пусть это управление допустимо Если это построение окажется возможным при любом /, то получим минимизирующую последовательность ии ..., и,, .., которой можно пользоваться для отыскания оптимального управления.
328 вычислитгльныг метолм [гл v Остановимся теперь на построении метода последовательных приближений для отыскания оптимального программного движения в гом случае, когда первый конец траектории остается на некоторой поверхности Пусть вновь заданы система (27 I) при ограничениях (27 2) и функционал т J = P(x(T), 7-)+$Мх. ". Odl, о где (х(7), T)£S, S—некоторая поверхность в пространстве (*и • 1 х„, Т) Ясно, что число Т в такой постановке может быть как закрепленным, так и незакрепленным Требуется найти управление и0(/) и соответствующее ему движение xo(0) = xx, (х0(Г), T)£S так, чтобы управление и0 и движение х0 удовлетворяли ограничениям (27 2) и доставляли среди всех таких управлений и движений наименьшее возможное значение функционалу /. Введем дополнительную координату хп+1 = /. Тогда размерность системы (27 I) станет равной п-\-1 и система запишется в виде dx/d/ = f(x, u) Здесь х—(п-И)-мерный вектор, /„+1=1; (п + 1)-я координата вектора хх есть нуль Предложенную выше задачу можно решить следующим образом Зададим число т, > 0 и обозначим через у точку поверхности S, такую, что (х-у)* = р«(х. 5), где р(х, 5)—расстояние от точки х до поверхности S. Будем минимизировать функционал А = (хК)-У)2 Этот функционал соответствует тому случаю, когда [, = 0и Р = (х(т1)-у)*. Действительно, вектор у можно рассматривать как непрерывную функцию вектора х Следовательно, (х(т1)-у)*=РМх(т|), 5) Будем считать, что минимизация функционала /f проводится способом, указанным в начале этого параграфа Пусть в результате этого получается оптимальное управление, которое даст
§ 27] ОПТНМЛ1Ы1ЫЕ ПРОГРАММНЫЕ ДВНЖ1 МИЯ 329 точку х2=х„(т,), где х„—движение, соответствующее этому оптимальному управлению Выберем е, > 0 так, чтобы o<Cl<JiizM Будем минимизировать далее функционал J до тех пор, пока MTi) будет удовлетворять условию ||х2—х,(т,)||<е1 В результате этой минимизации получается точка х2 = х,(т1), причем II х*—х2|Ке, С точкой х2 поступим, как с начальной, а именно, зададим число т„ и начнем минимизировать функционал Jl = (x(xt + xl)-y)\ где х—решение исходной системы с начальным условием х (0) = х. Остается теперь указать способ построения последовательности чисел т„ т2, . , Tj—время, за которое движущаяся точка достигает поверхности S, двигаясь из х, по кратчайшему н>ти с максимальной скоростью, допускаемой исходной системой дифференциальных уравнений, т2—соответственно время, за которое движущаяся точка достигает 5, если она движется из точки х2 по кратчайшему пути с максимальной скоростью, допускаемой системой дифференциальных уравнений Рассмотрим для примера линейную систему х = Ах + Ви \-f(t) (27 42) Пусть задана точка х, и требуется построить управление, переводящее эту точку в начало координат, причем так, чтобы функционал J т J=P(T) + lf.(x. u, t)dt о принимал наименьшее возможное значение Здесь аргумент х(7") функции Р не указывается, так как х(7) = 0 Пусть VJ== sup (Ax+Bu + ty IIMKIU, II и пусть х1—то значение /, при котором впервые 5^(т)Л = ||х,||, о т, есть то время, которое нужно для перехода из точи и xt в начало координат по прямой с максимальной скоростью, допускаемой
330 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [П V исходной системой управлений В рассматриваемом случае А = х»(т,) Произведя при построении минимизирующей последовательности для функционала /,, например, одно приближение, найдем точку х, = х(т1) Выберем некоторое число е и будем минимизировать функционал J при Т= Tj с тем, чтобы ||x(xt) — х2|! <е Выполнив, например, одно приближение, получим точку х, Для нее определяем величину т, как такое значение /, при котором впервые будет ) K1(x)dt = ||xa|| Далее процесс повторяется для 7,=т1-г-та Величины тх, т„ можно определять также и другими способами, например из нижней оценки нормы вектора х. Действительно, умножая обе части уравнения (27 42) на х* слева, получаем •J-- \г = х» (Л» + А) х + 2x»flu + 2x*t Положим || х || = г Тогда имеем V-llfl||-PII<-§-<V+llfl|| + l|f|l. где %1 и А.,—наибольшее и наименьшее собственные числа квадратичной формы 4-х'(Л» + Л)х Пусть ||5|| + ||f||=6=const Тогда, интегрируя последнее неравенство, найдем 1М1>*'(|1*,||-£) + £. Правая часть полученного неравенства обращается в нуль при Ti=iln*-M*iii-
§ 28) СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 331 При любом управлении и движущаяся точка, исходящая из х,, не может достичь положения равновесия за время, меньшое т,. Из последней формулы вытекает также, что при Ах < 0, вообще говоря, при любом хх интегральные кривые могут достигать начала координат Если A.t > 0, то интегральные кривые, начинающиеся в области ||х,|| >Ь/А,„ не могут достичь начала координат ни при каком выборе управления Замечание В развитом выше методе последовательных приближений управление и,(х, /) является, вообще говоря, разрывным, поэтому система (27 1) при этом управлении может не иметь движения х,(/), х,(0) = х1, определенного при всех / 6[0, Т], ввиду невозможности продолжения решения через поверхность разрыва. В этом случае будем поступать так вместо и,(х, /) будем брать многозначную функцию Уточним ее вид для линейной системы Положим fj(a) = — l при a^—lj и /y(ff)=-f-l при <*<!*/» / — 1» •• • г< {/>0 Положим также иу(х, t)'=fj(Oj(x)), где функции о-у(х) введены выше Тогда числа 1и .... 1Г можно выбрать столь малыми, чтобы получающаяся последовательность была минимизирующей Это показывает, что с таким видоизменением применение метода посчедовательных приближений всегда оказывается возможным § 28. Метод последовательных приближений для решения задачи синтеза оптимальных управлений Пусть задана система x-f(x, и, /), причем фазовые координаты хи , х„ и управления ы, подчинены ограничениям вида gj(x, u, /)<0, у-1 А, и задан функционал г P(x(7))+J/,(x, u, t)dt, (28 3) где Т > 0—фиксированный момент времени Возьмем управление и(х, /) Подставим его в (28 1) и построим решение полученной системы х = х(/, X!), х(0, х,) = х„ (28 4) где х,—-некоторая точка фазового пространства Вычислим значение функционала (28 3) при управлении u = u(x, /) Тогда (28 1) ..., иг (28 2)
332 вычислит™ьиыь мктоды (гл v получим некоторую ве шчину У (и, х,) Управление и0(х, /) называется оптимальным, если оно доставляет величине У (и, х,) наименьшее возможное значение в каждой точке х, и притом удовлетворяет ограничениям (28 2) Дадим метод последовательных приближений для отыскания оптимального управления u0(x, t) Пусть u, (x, t) — некоторое допустимое управление Подставим это управление в систему (28 1) и найдем решение получившихся уравнений х = х(/, xt) Далее рассмотрим уравнение dVt/dt= — f0(x, u,(x, 0, 0, (28 5) где К, — искомая функция Величина х в правой части уравнения (28 5) есть решение х(/, xj упомянутой системы Найдем решение уравнения (28 5) с начапьным условием Vl = P(x(T, х,)) при t = T (286) В результате получим функцию V,(/, xj Пользуясь решением системы, исключим вектор xt из функции V, Тогда получим функцию Vl(x, t) Величина Z = Vl — V1(x, t) является интегралом системы dx/dt = i(x, u,(x, /), 0. dVxfdt = — f0(x, u,(x, 0. 0 (287) При этом интеграл принимает нулевое значение на любом движении вида х = х(/, xt), Vl — Vl(t, xt) Пользуясь функцией Vt, построим управление u2(x, t) так, чтобы оно удовлетворяло ограничению (28 2) и доставляло функции 1Г/,(х, u, 0 = ^ + Z ggU*. «. 0т/,(х, и, 0 наименьшее возможное значение Разумеется, что наименьшее возможное значение функции H/t (x, ua(x, I), I) не потожителыю, так как \Vx(x, u, (x, /), /) = 0 С функцией ua(x, t) поступим точно так же, как и с и, (х, /) В результате этого получаются последовательности ult u4, , V,(x. 0. Vt(x, (), Ее in процесс построения этих последовательностей оказывается возможным, то для любой точки Xj последовательность u,, u2, .. будет минимизирующей '(u*. Xi)-^(x,. 0).
§ 28] СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 333 так что K,(Xi. 0)>Vg(x„ 0)> Внешне процесс последовательных приближений мало отличается от рассмотренного в предыдущем параграфе Однако здесь функции К„ Vlt ... строятся более сложным образом, что связано с интегрированием системы (28 1) при управлениях, зависящих от фазовых координат Напомним, что в предыдущей главе были даны теоремы о сходимости такого метода последовательных приближений для специального вида функционала J В общем случае этот метод остается методом минимизации функционала и сходимость его к оптимальному управлению имеет место, вообще говоря, лишь при выполнении ограничительных условий на правые части системы (28 1), на функции g/t входящие в (28 2), и на Р и /„ из (28 3) Построение последовательных приближений для систем с неограниченным временем еще более затруднительно Действительно, пусть дан функционал J = ]fn(x, u, t)dt (28 8) о Допустимыми управлениями и (х, /) будем считать такие, при которых система (28 1) имеет асимптотически устойчивое нулевое решение и выполняются условия (28 2) Пусть ut(x, /)—некоторое допустимое управление Построим семейство решении х = - x(f, х,) и функцию Р,(/, х,) -=JMx(t, x,), ut(x(T, xt), x))dr (28 9) Пользуясь семейством решений, исключим из (28 9) вектор х,, тогда полечим функцию Vl(x, /) Затруднительным является построение семейства решений и, следовательно, самой функции ^(х, /) С помощью функции К, (х, t) строим управление ua(x, t) так, чтобы оно доставило функции ИМх. и. О-^ + ХД/Лх, и, /)+М*. и. О наименьшее возможное значение при условии выполнения ограничений (28 2), причем минимум ищетря среди всех таких управлений, которые доставляют системе (28 1) нулевое асимптотически устойчивое решение Если и,(х, /) построено, то, поступая с ним как с V, (х, /), найдем функцию V,(x, t) и т д Если процесс построения оказывается возможным, то в результате получим
334 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V минимизирующую последовательность u,(x, t), и2(х, t), ... такую, что V1 (х„ 0) > Va (xlt 0) > ..., (28 10) где Vk(\u 0) = J(uk, x,) Следовательно, ult и4, . —минимизирующая последовательность для любой хх Напомним, что подобный метод последовательных приближений был использован в предыдущей главе Там была дана сходимость этого метода в ряде случаев Пусть система регулирования некоторым заданным объектом описывается с помощью дифференциальных уравнений 3r = M*i *», 0 + £"A/(*i.....■*». 0.*=1... ,п (28 11) Предположим, что управления ии ..., иг удовлетворяют некоторым ограничениям Именно, пусть К|<1, i = l, ., г. (28 12) Будем рассматривать движения системы, определенные на промежутке [0, Т] Следовательно, управления будем считать кусочно непрерывными функциями, заданными на [0, Т] Предположим, что качество управления определяется спомощью функционала J т г J = S (/. (*i, . . *„, 0 + 2 ufil (xlt ...xn,t)) dt (28 13) и что задано начальное состояние системы х = х0 при / = 0 Требуется среди указанных выше управлений найти такое, которое доставляет функционалу J наименьшее возможное значение Такое управление будем обозначать через «,<0), , ulrm и называть оптимальным Для решения этой задачи введем в рассмотрение функцию V (xlt , xn, t), являющуюся решением уравнения в частных производных dV . A 3V а7+Е^/, = М*, *., О (28Н) с граничными условиями V = 0 при / = Г (28 15) Существование функции V может быть легко установлено с помощью следующего рассуждения Рассмотрим левую часть урав-
§ 281 СИНТВЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 835 нения (28 14) как полную производную функции V, вычисленную в силу системы уравнений dxs/dt=fs(Xl хп, 0, s=l п. (28 16) Тогда уравнение (28 14) может быть записано з виде dV/dt =M*i. •••• *л. О (28 16') Найдем решение уравнения (28 16) с начальными условиями ** = *"'+5, при t = 0, s = l, .... п. Обозначим это решение через xs = xa{t, 6U .... 6.) (28 17) Подставляя (28 17) в (28 16') и интегрируя с учетом условия (28 15), находим т V = -\f0dt = V(t, g, U (28 18) Разрешая равенство (28 17) относительно i, g„, Б, = Ф,(<. *i хп) (28 19) Подставляя (28.19) в (28 18),получим функцию V(t, xlt ..,,хп), которая будет удовлетворять уравнению (28 14) при условии (28 15). Итак, будем считать, что такая функция построена. Перейдем к решению задачи Рассмотрим функционале г J-J-l%dt. (28 20) В функционале (28 20) полная производная от функции V берется в силу системы (28 11), следовательно, J = J + V(0, х?> х™), откуда вытекает, что управления, оптимальные по отношению к функционалу У, будут оптимальными по отношению к функционалу 7 и наоборот
336 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V Проведем преобразования над функционалом 7: 7=Ш,(*, хп, t) + jZufit(xlt .. , х„, /)- -ЭГ-ЕзЕ;^-£"/У/(*.. ..., хн, t)\dt, (2821) где Yi-2*3£**/ Из уравнений (28 14) следует, что первый, третий и четвер тый члены под интегралом в формуле (28 21) исчезают, следовательно, окончательно имеем 7«S[/S«i<*/--Y/)]<« (28 22) Из (28 22) непосредственно вытекает, что оптимальное управление приближенно определяется формулами и? = sign (?,(*,, ...,xH,t)—c,(xu . , *„,/)). ' = • /-{2823) Эти формулы содержат в себе приближенное решение проблемы синтеза оптимального управления для того случая, когда правый конец траектории остается свободным Ниже будет также предложен метод последовательных приближений для решения проблемы синтеза оптимальных управлений в случае наличия краевых условий на правом конце траектории, а также при наличии ограничений на фазовые координаты системы (28 11) Рассмотрим теперь проблему синтеза асимптотически устойчивых оптимальных управлений Предположим, что система (28 11) при любом выборе кусочно-непрерывных управлений, удовлетворяющих условиям (28 12), имеет положение равновесия х1 = х1 = . =х„--0, /,(0, . ., О, 0 = Ь,/(0. ., 0,0=0, s=l, . ., п Будем считать это положение равновесия асимптотически устойчивым при и, = . =м, = 0 Требуется выбрать управления «,, . , и, так, чтобы положение равновесия системы (28 11) было по-прежнему равномерно асимптотически устойчивым и чтобы функционал К=ДМЧ. ••• *». t)dt (28 25)
§ 28] СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ 337 имел наименьшее возможное значение, где /0(*i, , х,„ t) есть положительно определенная функция xlt , х„ Для решения поставленной задачи рассмотрим функцию V, являющуюся решением уравнения (28 14) и удоваетворяющую условию V = 0 при *,= .. = л„ = 0 (28 25) Известно, что решение уравнения (28 14) с начальным условием (28 25) существует, причем V явпяется отрицательно определенной функцией Рассмотрим функционал K=K-lwdt (28 26) Полная производная функции V в функционале (28 26) бередя в силу системы (28 11) Eciii управления их, , иг делают положение равновесия равномерно асимптотически устойчивым, то функционал К вполне определен и может быть представлен в виде K = K + V(0, *?, .. , *•), так как V -* 0 при / -* + оо Произведя преобразования над функционалом К, получим 7С= J [_i>,Y,(*,. . vIIt/)]rf/, (28 27) откуда находим, что оптимальное управление будет приближенно определяться формулами u? = signv,(*i. • , х„, t), i=l, . , г, (28 28) где, как и выше, ЕМ и -1 згЛ" • • При управлении (28 28) положение равновесия системы (28 11) действительно будет равномерно асимптотически устойчивым, так как для этого управления будет dV dV A dV . , ^ , „ A dV , = Ы*.. , хп, 0+£>/(*., ...*-. ON
338 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V Следовательно, % = Ul*i *„. О + £ IY»(*i *.. 01 (28.29) Функция V является отрицательно определенной, имеет бесконечно малый высший предел, ее полная производная в силу системы (28 11) положительно определена. Следовательно, нулевое решение системы (28 11) равномерно асимптотически устойчиво при управлении (28 28) Управления (28.23) и (28 28) могут быть построены лишь в том случае, когда известна функция V. Эту функцию можно строить путем последовательных приближений Это обстоятельство приводит к методу последовательных приближений для отыскания управлений (28 23) и (28 28) Остановимся сначала на случае конечного интервала Пусть f„ является полиномом степени / относительно xlt . ..,*„, а /у— линейные функции Ь=2в,Л + М0 (28 30) При этих условиях оказывается, что уравнение (28 14) имеет единственное решение V в виде полинома степени /, удовлетворяющее условию (28 15), причем определение функции V сведется к интегрированию линейных систем обыкновенных дифференциальных уравнений Если же в (28 30) г, заменить рядом относительно^, . ..,**„, в котором разложение начинается с членов второго порядка, то функция V также определится единственным образом в виде ряда. Остановимся подробнее на случае (28 30) Будем искать решение уравнения (28 14) в виде к=2К(т)- (2831) Полагая в (28 14) /.= 2 ЯГ, (2832) найдем ■1Г + 1-'5^£а"*'+2,-3*Гг*а=Я"' "i = 0.1....,/-l (28 33) Для т = / имеем
§ 28) СИНТЕЗ ОПТИМАЛЬНЫХ УПРАВТЕНИЙ 339 Формы Vcm) удовлетворяют условиям 1Лт> = 0 при t = T. Уравнения (28 33) и (28 34) получены путем подстановки в (28 14) выражений (28 31) и (28 32) и приравнивания слева и справа форм одинакового измерения При этом частная производная заменена на полную, так как она относится только к коэффициентам форм Из уравнений (28 33) и (28 34) вытекает, что коэффициенты искомых форм являются решениями линейных неоднородных дифференциальных уравнений с начальными условиями, заданными на правом конце при / = Г, и, следовательно, определяются единственным образом Приведенные выше рассуждения позволяют дать простой метод последовательных приближений для определения функции V. Предположим, что задан полином Vlt например Vx = 0 Построим последовательные приближения VN как решения уравнений t=i \<=i с начальными условиями VN=0 при t = T Следовательно, V»-\[±^(±°,,*, + r,)-t.(* «.. о]*. N =2, 3, ... (28 35) Переменные *,, , хп под интегралом в формуле (28 35) рассматриваются как параметры, следовательно, интегрирование относится лишь к функциям времени Легко видеть, что VN —► V, ~gp —► ^- равномерно по отношению к /6 [О, Т] в любой ограниченной области изменения переменных *,, . ., х„ Положим EdVN, "I ,_,«*'" [ <2836) u,w = sigii(vlW—с,), / = 1, ..., г ) Ясно, что управления иш (( = 1, ..., г) сходятся при N—юо к управлению и,!0) (( = 1, , г) Аналогичный метод последовательных приближений можно сформучировать для того случая, когда (28 31), (28 32) заменяются рядами относительно xlt ..., хп,
340 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ. V разложение которых начинается с членов не ниже второго порядка Рассмотрим теперь случай полубесконечного промежутка. Пусть где Д"'\ gi""—однородные формы степени т относительно хи . ., хп Будем считать, что/i" является положительно определенной квадратичной формой Предположим, что нупевое решение системы ^ = 1>*Л-. ''-1 я, <2837) равномерно асимптотически устойчиво Тогда существует квадратичная форма Vlr\ являющаяся отрицательно определенной и удовлетворяющей уравнению Положим Vl = Vtr\ а приближение VN определим как ограниченное решение уравнения ^+±Щ^-1.-±^.. *-*.*.... Здесь xlt , x„ следует рассматривать как параметры При известных предположениях относительно сходимости рядов f0 и gs можно утверждать, что равномерно на всяком конечном интервале [0, Т] в некоторой фиксированной окрестности положения равновесия, причем функция V здесь является отрицательно определенным решением уравнения (28 14) Отсюда вытекает, что последовательность управлений ulN = slffiyw, где iy,v = 51 -тг^Ь;!, можно рассматривать как последовательность приближений для управлений (28 28).
§28] chhtej оптимлмьиых у[||>лвли1ий 341 Обратимся теперь к учету краевых чсловнй и ограничении ГЬеть требуе1ся найти оптимальное уравнение по отношению | к функционалу J среди всех тех управ пений, дчя коюрых | выпол)1яюгся граничные и краевые условия x|V(7\ xt(T), , x„(T))^Q, /--1, . , k, и которые удовлетворяют ограничениям Фа С Ч. , V,KO, 0-1, , Ц Способ учета краевых условии п oi рлничений сводится к введению ьового функционала L- J+ 2 L/il>; |- $ £ Ко (1 -I sign Фв)Л, (28 39) где Lj и Ка (/—1. . к, а—\, , \а) — положительные величины, подлежащие определению Функционал (28 39) можно представить в форме + f /. ь Z «л+X ч4г W)+X к° <l + si*n «p») dt <28 40> •Ц .=1 1=1 о=1 J Полная производная функции tyj может быть представлена в виде Рассмотрим функцию V, уювче ширяющую уравнению вида ^ + Х"1Н = /<Н X lift} I X Л'„ (1-1-sign ф„) (2841) и условию V = 0 при f Т (28 42) Решение уравнений (28 41) при условии (28 42) можно искать в форме где функция Va удов кчноряег уравнению (28 14) и условию
342 НЫЧИС III IF IhllWE MFTOAhl [ГЛ V (28.15), а функции V1;- и Via у юн отворяют соответсгнснно уравнениям dVu Л dVu r Ot ' ■*"* dxs " °'' ' ' ' ' OV. Л <Э1/ f и краевым усювиям 1/];. = У2(Т = 0 при < = 7\ /=1, . ., k, а-1, .., ц. Предио южпм, что решение уравнения (28 41) при условии (28 42) найдено Обозначим через uf(t, L„ , Lk, /С,, . , /Сд), ' — It t r, управления, доставляющие функционалу /.наименьшее возможное значение при условии, что правый конец свободен и ограничения не учитываются Тогда это управление также будет оптпмачьным н по отношению к функционалу т L = L-^dt (28 43) о Произведя преобразования над функционалом (28 43), получаем £ = £/-,! но. Ъ • - ^ ьк(°- Л- • *«) + + ljZiUi[c,+ 2clJLJ-y?)dl, ои<уда вытекает, что ы? (/„„ , U, К» .. , /С„) = sign Ut-d - 2 CtjLA, (28 44) uie *-£,£'-+£ <?,£*-<)Ф-(£ &'•<) Поюывим управ!ение (28 44) в функционаа Lh будем выби paib величины Lu , Lk, K^ , ЛГц так, чтобы функционал /. минимизировать При этом в ряде случаев можно установить что существуют такие последовательности ветчин /.,, , LA, /С,, ' , Кц, которые позволяют сколь угодно точно аппроксимировать решение задачи с учетом краевых условий и ограничений, если такое решение существует
§ 29] МЕТОД НАПРАВЛЕННОГО ПОИСКА КОЭФФИЦИЕНТОВ УСИЛЕНИЯ 343 В приведенных рассуждениях величина Т считалась закрепленной, однако предлагаемый метод последовательных приближений пригоден также для решения задачи и в случае незакрепленного Г Заметим, что выше нигде не были оговорены свойства функций, входящих в дифференциальные уравнения Можно считать, что эти функции удовлетворяют условиям, при которых существует решение дифференциальных уравнений, и их даже можно считать для простоты дифференцируемыми, принимающими вещественные значения и заданными при всех значениях аргументов, входящих в них Из формул (28 23), (28 28), (28 44) вытекает, что управления разрывны по отношению к фазовым координатам Это обстоятельство может привести к тому, что движения не будут определены в кпасснческом смысле на всем рассматриваемом промежутке Для того чтобы избежать этого, необходимо либо принять соглашение о скользящих режимах, либо в окрестности поверхностей разрыва ввести гистерезисные петли, которые позволят однозначно определить движения на всем рассматриваемом промежутке Управаення с петлями гистерезиса будут весьма мало отличаться от построенных оптимальных Заметим, что в некоторых случаях формулы (28 23) и (28 28) определяют оптимальные управления Например, это всегда имеет место для линейных задач с линейным функционалом В общем случае рассмотренное построение служит для определения второго приближения, ест в качестве первого взято нулевое управление § 29. Метод направленного поиска коэффициентов усиления в системах управления Задача построения оптимальной в том или ином смысле системы управления часто упрощается путем сведения ее к задаче отыскания коэффициентов усиления в некотором законе управления Это отыскание проводится с тем, чтобы минимизировать заданный критерий Итак, пусть дана система x = F.-.z.O. z = g(x, z, t, a), где х=(д:1, , xn)— фазовые координаты объекта, z=(z1, , ., гт) — координаты рулевых органов, a = (alt , am)—коэффициенты усиления в законе регулирования g Пусть на движениях системы (29 1) заданы функционалы У0, У,, . ., Jt В общем случае коэффициенты усиления alt , am требуется выбрать так, чтобы функционал /„ имел наименьшее возможное значение при условии,
344 ВЫЧИСЛНТРЛЬНЫЕ МЕТОДЫ |ГЛ V что функционалы У;<0, /=-1» .. ./ (29 2) Предпопожим, что заданы конкретные начальные значения для (29 1) x = xtu\ z = z«" при / = 0 и что удалось найтн решение системы (29 1) при всех значениях коэффициентов усиления х = х(/, a), z — z(t, а) Подставляя эти функции в функционалы У,, .... Jt, получим функции переменных J, = f,(*i. ■■• «-). .... Ji=-f,(*u • .. «») Задача отыскания оптимальных коэффициентов усиления сведется тогда к отысканию наименьшего возможного значения функции переменных fQ(alt , а,„) при наличии ограничений //(«». •• . «-Х0, /-1. . , / Разумеется, что разыскание решений системы (29 1) и построение функций /0, /„ .. , /, в явном виде возможно лишь в очень ограниченном числе случаев. Однако идея сведения задачи отыско- ния оптимальных коэффициентов к задаче отыскания наименьшего возможного значения функции многих переменных является основной в вычислительных методах направленного поиска оптимальных коэффициентов усиления Для того чтобы отыскать приближенное значение градиента функции /0(а„ . , ат) в заданной точке а<0', требуется т-\-\ раз интегрировать систему (29 1) при начальных данных х(0>, z<0) и коэффициентах усиления а<и>, а«д> + й/л / = 1, . , т, где lj—единичный вектор, все компоненты которого нули, за исключением у'-й компоненты, равной единице Частные производные функции f0 приближенно даются формулами -g-(a«")«i.[/0(a'0'-f-Л//)-/o(a,0,)]. / = 1 « Обозначим через к0 век гор размерности т с компонентами ^[№ \ /«//)-/.(««")]. /-1. • -. т Тогда grad /0(a(0,)«k0 Метод направленного поиска, основанный на использовании градиента, может быть аибо чисго градиентным, либо методом наискорейшего спуска В первом случае в пространстве коэф фициентов усиления нл\от,им точку а"' -а<<1>— ек„, где е>0-—
§ 29J МЕТОЛ НЛПРЛВЛ1 МНОГО ПОИСКА к'ОйФФИЦШ-ИЮВ УСКЛ1 ПИЯ 345 шаг Если оказалось М«(,,)</.(«""). то с а(1) поступаем, как с aw Ecin же /.(«"')> /о (а(0)). то шаг е уменьшается вдвое В резчльгате применения этого алгоритма получаем вычислительный метод направленного поиска коэффициентов усиления На каждом шагу в этом алгоритме требуется т + 1 раз интегрировать систему (29 I) Метод наискорейшего спуска можно получить, если рассмотреть последовательность точек а<1( = oc<u) — ек0, а'8'= а<и)—-2ek0, ... Вычисление останавливается тогда, когда будет иметь место /. (a<fc)) > L (а»"1'). /. («"""J < U (а(*-8)) Точку а**-1) берем за начальную и поступаем с ней, как с а<0> В этом методе на каждом шагу необходимо также определять новое направление градиента, что требует снова нахождения m-fl решений системы (29 1). Большой объем вычислений может получиться из-за значительных затрат машинного времени на интегрирование системы (29 1), хотя это интегрирование прямо не связано с минимизацией функционала Особую роль в связи с этим обстоятельством для отыскания коэффициентов усиления играют итеративные методы, не требующие отыскания градиента функции /0 Эти методы были сформулированы во второй главе, и потому здесь мы их касаться подробно не будем, заметим лишь, что основная черта этих методов — минимизация функции т переменных заменяется на каждом шагу минимизацией функции к переменных, k < /и, например к = 1, 2 При проектировании систем управления практически возникают три задачи задача точности, состоящая в том, чтобы коэффициенты оп ., ат выбрать так, чтобы функционал J„ имел наименьшее возможное значение, задача устойчивости, состоящая в том, чтобы коэффициенты усиления а„ ..., а,л выбрать так, чтобы выполнялись ограничения J,<0, /=1, ., /, и, наконец, общая задача, состоящая в том, чтобы отыскать коэффициенты усиления, доставляющие J0 наименьшее возможное значение среди всех, удовлетворяющих ограничениям У/<0. Предыдущие алгоритмы и те, которые содержатся в главе II, можно рассматривать как вычислительные методы последовательных приближений для решения задачи точности.
346 бычпс-штечьные методы [гл v Покажем способ решения задачи устойчивости Пусть ограни, ченпя /у<|0 дочжны удовлетворяться при / £ [О, Т] Построим функционал U0 U. = t(a), где /(а)—тот момент, в который впервые выпочняется по крайней мере одно из равенств Jj = 0(j=\, , /) на интегральной кривой х = х(/, a), z = z(/, a) Здесь a — (alt , am)—фиксированный набор коэффициентов усиления Для каждого значения коэффициентов усиления определена функция U„(a) = U0 Будем решать задачу точности для функционала U„ и максимизировать его значение до тех пор, пока не окажется t (а) = Т Таких коэффициентов усиления может оказаться целое множество U Это множество обладает тем свойством, что при a£U будет Уу^О, /=1, . , /, при всех / 6 [0, Т] Далее можно предложить атгоритм обхода границы множества U Этот алгоритм основан на том свойстве границы множества U, что в сколь угодно малой окрестности тобой граничной точки имеются такие точки, при которых U0(a) < Т, и такие, что U0(a)>T Алгоритм решения задачи устойчивости пригоден дтя любых нелинейных систем вида (29 1), однако в ряде конкретных случаев, например при решении задачи об чстойчивости по первому линейному приближению, можно предюжить более совершенные алгоритмы решения задачи устойчивости Дадим теперь общее описание метода направленного поиска коэффициентов усиления для решения общей задачи, когда при сохранении устойчивости требуется достичь оптимальной точности Известно, что, как правило, свойство точности противоположно свойству устойчивости в том смысле, что системы с большим запасом устойчивости оказываются менее точными, и наоборот, системы с высокой точностью оказываются на границе устойчивости Это имеет место в связи с тем, что сильно устойчивые системы «плохо» управляемы, поэтому естественно считать, что искомые коэффициенты усиления а,, , ат будут давать траекторию, лежащую в окрестности границы множества, определяемого ограничениями Уу^0 (/ —1, , /) Разумеется, что можно найти область устойчивости и в ней минимизировать функционал У0, однако алгоритмы такого рода являются громоздкими Дадим способ одновременного решения задачи устойчивости и точности Будем осуществить направленный поиск коэффициентов усиления таким образом, чтобы функционал У0 минимизировать, а функционал U0 максимизировать Функция U0(ai< . ат) возрастает в точке а1<" вдоль всякого направления, составляющего
5 80] нелинейные системы с краевыми условиями 347 с вектором grad U0(aw)) угот, не превосходящий л/2 Функция /0(а) = /0 \бывает вдоль всякого направления, состав тяющего с •—grad/0(а(0)) утоа, меньший л/2 Таким образом, если векторы grad (/„(а'"') и —grad f0(cc(u)) не составтяют угол л, то всегда существует такое направление к0, вдоль которого, исходя из точки а(0), функционал U0 возрастает, функционал J0 убывает В качестве точки а(11 возьмем a,0>-f tk„ так\ю, что а /. («(,,)< М«,в)). и с ней поступим, как с а<0> Эгот алгоритм даст аналог метода градиента Чтобы получить аналог метода наискорейшего спуска в этом случае, построим последовательность a«>=^a(0) rek0, , аш =aw-\-kek0, Процесс вычисления останавливается тогда, когда будет t/0(a(*')<i;o(a<*-l»)> У0(<х<*-2>), или Точку а(*_1) возьмем за hcxoihnk) В результате этого получим последовательность коэффициентов усиления, на которой значения функционала ./„будут убывать, значения функционала U0 возрастать § 30. Движения нелинейных систем, определяемые краевыми условиями Пусть в фазовом пространстве системы заданы два многообразия Требуется построить интегральную кривую системы дифференциальных уравнений, которая, начинаясь в некоторый момент tl на одном из этих многообразий, достигает другого многообразия в момент t2 Легко показать, что отыскание такой интегральной кривой может быть сведено к отысканию периодического движения вспомогательной системы дифференциальных уравнений, построенной на основании исходной системы уравнений движения Это обстоятельство позволяет использовать развитые в [12] методы построения периодических решений для решения упомянутой задачи Однако целесообразно изложить также прямой метод решения таких задач, называемый методом прогонки Ниже дается развитие этого метода решения краевых задач для обыкновенных дифференциальных уравнений Оно состоит в распространении метода прогонки на случай нелинейных задач
Обратимся сначала к краевой задаче с одной степенью свободь Пусть задано уравнение U = f(t, У, У), (30 1 и пусть известно, что это уравнение имеет решение y-y(t), *6[0,7], (30^ удовлетворяющее краевым условиям Ч>Ц/(0). 0(0)) = 0, (30' У(У(Т). У(Т)) = 0 (30^ Требуется дать способ построения решения (30 2) уравнени (30 1), удовлетворяющего краевым условиям (30 3) и (30 4) Дл решения поставленной задачи введем в рассмотрение общее реш< нне уравнения (30 1) y = y(t, С,, Ct) (30 Е Предположим, что (30 5) п соотношение 0 =■£{/('. Clt Ct) (30 ( разрешимы относительно величин С, и Сг, так что Сг = вЛ1,У. У). \ c^eAt.y.y) 1 (30'. Известно, что в эюм случае функции g/(t, у, y)(i = 1, 2) буд\ являйся первыми интегралами уравнения (30 1) Покажем, чт существуют два интеграча уравнения (30 1) £=-£(*, У, У), (30 I Л = Л(*. У. У), (30 i обладающие свойствами 1(0, у, у)^ц>(у, у), (30 К г\(Т.у, У) = У(У, У) (30 1 Действительно, пользуясь (30 5) и (30 6), исключим величины у (0 у(0) из выражения для функции (р Тогда получим Ф = Ф(,(о.с,.с,,.^#^) Далее исключим из найденного выражения величины С, Cs, почьзуясь формулами (30 7) Результат этого исключена
§ 30| НЕЛИНЕЙНЫЕ CHCTFMU С КРАЕВЫМИ УСЛОВИЯМИ 349 обозначим через l=--l(t,y,y) Эта функция обязательно является интегралом уравнения (30 1),так как она является функцией первых интегралов (30 7) но построению Если положить / = 0, то получим 1(0, у, у) = ф(у, у) Аначогично, подставляя (30 5) и (30 6) при t = T в функцию У(У(Т), у (Т)), а затем исключая С\ и Сгс помощью формулы(30 7) и обозначая результат исключения через r](t, у, у), найдем, что функция r\(t, у, у) является интегралом уравнения (30 1) и удовлетворяет условию (30 11) Из проведенных рассуждений вытекает, что £ и tj являю!ся решениями уравнения 9-+%y+fy«-v-to = o (30I2> Заметим, что на любой интегральной кривой уравнения (30 1), удовлетворяющей лишь условию (30 3), интеграл £(f, у, у) сохраняет постоянное значение, равное в этом случае нулю I{t. У, J/)=-0 (30 13) И далее, на любой интегральной кривой, удовлетворяющей лишь условию (30 4), интеграл r\(t, у, у) также сохраняет постоянное значение, при этом также Л С У. У) = 0 (30 14) Это позволяет предложить несколько способов решения посявленных выше задач отыскания решения (30 2) уравнения (30 1), удовлетворяющего краевым условиям (30 3) и (30 4) I Решение (30.2) при t = Т обязательно будет удовлетворять системе уравнений Пусть (30 16) имеет решение (у, у) Тогда, чтобы получить решение (30 2), надо проинтегрировать уравнение (30 1) в обратном направлении по времени / при начальных условиях У(Т) = у,} У(Т) = ~У ) или проинтегрировать уравнение lit, у, У) = 0
350 ВЫЧИСЛИТЕТЬНЫЕ МЕТОДЫ IГЛ у при начальном усювии У(Т)=~у II Решение (30 2) при / = 0 обязательно удовлетворяет системе уравнений Ф(0. У) = 0,\ т,(0, у,у) = 0 ) (30 16) Обозначим через учу решение системы (30 16) Чтобы построить решение (30 2) уравнения (30 1), надо проинтегрировать теперь уравнение (30 1) при начальных условиях У(0) = £. | у(0)=у I Ч(Л У> У)=0 УФ)=у или уравнение при начальном условии III Решение (30 2) уравнения (30 1) удовлетворяет одновре менно условиям (30 3) и (30 4) Поэтому оно будет удовлетворять также одновременно уравнениям (30 13) и (30 14) Таким образом, решение (30 2) можно найти без интегрирования из системы уравнений W, у, у) = 0,\ Л». У, У)=0 I Из приведенных способов построения решения (30 2) выте кает, что задача сводится к отысканию решений уравнения (30 12) при начальных условиях (30 10) и (30 11) Построение таких решений можно производить различными численными и аналити ческими методами Дадим теперь вычислительный алгоритм для нахождения приближенных решений краевых задач в квазилинейных системах с одной степенью свободы Пусть задано уравнение У Л P(t)y + g(t)y = r(t) + iif(t, у) (30 18) Здесь р, g, r— вещественные непрерывные функции, заданные при /€[0, Г], (.1 —малый параметр, f(t, у) —вещественная
§ 30} НЕЛИНЕЙНЫЕ СИСТЕМЫ С КРАЕВЫМИ УСЧОВИЯМИ 351 непрерывная функция, удовлетворяющая условию Липшица по у: \f(t,y)-f(t,y)\<i\'y-7\, где / — положительная постоянная Предположим, что уравнение (30 18) имеет решение y = y(t), (30 19) удовлетворяющее краевым условиям У(0) =а0у(0)+Ьо (30 20) и У(Т) = а0у(Т) + ?>0, (30 21) где а0, Ь0, а0, ро—вещественные постоянные Требуется дать способ последовательных приближений для отыскания решения (30 19) уравнения (30 18) Предложим план решения поставленной задачи Сначала построим интегральное уравнение, которому будет удовлетворять решение (30 19) Затем дадим способ последовательных приближений для решения этого интегрального уравнения и в заключение покажем, что при достаточно малых р. эти приближения обязательно сходятся к решению (30 19) уравнения (30 18) Итак, покажем сначала, что функция (30 19) обязательно удовлетворяет интегральному уравнению вида y(t) = yAt) + vlf(i, УЮ)<*Л*> г)<*т + ц$а2(/, т)/(т, y(j))dT 0 Г (30 22) Для построения уравнения (30 22) предположим, что функция (30 19) найдена Тогда функция /(/, y(t)) представляет собой известную функцию времени t Обозначим ее через rt(t) Функция (30 19) будет обязательно удовлетворять линейному уравнению y + p(t)y + 8(t)y = r(t) + y.rl(t) (30 23) и краевым условиям (30 20) и (30 21) Уравнение в частных производных (30 12) для рассматриваемого случая имеет решения l=A(t)[y-a(t)y-b(t)\, (3024) т!=В(0[(/-а(/)!/-Р(4 (30 25)
352 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V при этом искомые решения обязательно удовлетворяют условиям | = 0, (30 26) т) = 0 (30 27) Из (30 24) и (30 26) находим, что функции a(t) и b(t) будут удовлетворять системе обыкновенных дифференциальных уравнений « + (« + Р>«+*«0. \ b + (a + p)b=r + iir1i и начальным условиям а(0) = ао, 6(0) = fr0 Аналогично функции a(t) и 0(0 удовлетворяют системе а0,\ К 1 z + (a + p)a + g = 0, = 0, \ (30.29) Р + (« + р)Р = 'Ч-цгх[ и начальным условиям а(Г) = сс0Л Р(Л = Р„. I Из второго уравнения системы (30 28) имеем -J"[a(x)+/>(T)Jdx I + J"|al6|+/><9))</9 fr(0 = V ° +Je ' [г(т) + 11г,{х)]йх. (30.30) о Аналогично из второго уравнения системы (30 29) получаем -f la<T)+/>(T»di ' -J"|a<ei+/><e)J<<e Э(/) = р0е + $е * [r(T) + ^(T)]dT. (30.31) Выражая из (30 26) и (30.27) учу, найдем „_ б(0-Р(0 У- a(i)-a{t)' Используя (30 30) и (30 31), из (30 32) найдем (30.32) y = ya + \i\at{t, x)rt{x)dx + iilat(t, x)ri(x)dx, (30.33)
§ 30] НЕЛИНЕЙНЫЕ СИСТЕМЫ С КРАЕВЫМИ УСЛОВИЯМИ 353 где -J[o(T) + p(t)ldt / -J [а (6) +о (в)] de Ъ* ° + $е т r(x)dx У*= а(/)-а(0 + Рое Г +Se T 'МЛ + грр=5то • (3034> -jta(e) + P(6)]de fli С т) = -' Tg(0_a(<) . (30 35) -|[а(в) + р(в)1<*в М<.т)-''а(0-а(0 • <3036> Заменим теперь в (30 33) функцию г, (т) равным ей выражением Мт) = /(т, «/(т)) Тогда получим, что решение (30 19) уравнения (30 18) будет действительно удовлетворять интегральному уравнению (30 22), в котором функции (/„(О, Oi{t, т) и at(t, x) определяются формулами (30 34), (30 35) и (30 36) Запишем уравнение (30 22) в операторной форме У = У* + рК{у), где К (у) — интегральный оператор, стоящий в правой части уравнения (30 22). Построим последовательность функций ya(t), УхУ), yt(t), .. , определяемых формулой Уп (0 = У, (0 + И* (Уп-t) (л = 1, 2, ...) (30 37) Оказывается, что существует ц0 > 0 такое, что при любом ||1|<ц0 РЯД Уо + (Ух— Уо) + (уг —yj+ •• сходится абсолютно и равномерно к решению (30 19) уравнения (30 18), если только функции y0(t), М'> т). а»С х) являются непрерывными функциями своих аргументов Ниже будет дана более точная формулировка этого утверждения Рассмотрим теперь случай нескольких степеней свободы Пусть задана система п обыкновенных дифференциальных
354 ВЫЧИСЛИТЕ ЧЫШЕ МЕТОДЫ (п у уравнений dysidt = fs{t, у„ . , у„) (s=-l, .. , п) (30 38) Предположим, чго существует решение этой системы У, "0,(0. '€[0. Т] (s=l, . , я), (30 39) удовлетворяющее краевым условиям <Р/(</,(0), . ,*/„(0)) = 0 (t = l k), (30 40) *у(У,(Г), . , уп(Т)) = 0 (/=!, .,/»-*) (30 41) Требуется дать способ построения такого решения Рассмотрим уравнение в частных производных £+££'.-» (3042> Построим решения уравнения (30 42) li=li(t, Уг У,,) d =1,.... А), (30 43) 4y = V'. У,. •• , У») (/' = 1 "-*)• <3044) удовлетворяющие начальным условиям 6/(0,0,. • , </„) = <Р,(!/,. • ., У») (i = l,..,ft). (30 45) Ч,(7\ l/i. ... УЯ)=*/<У </«) (/ = 1. ... «-*) (30 46) Решение (30 39) с помощью (30 43) и (30 44) можно отыскивать различными способами I Найдем решение «/,, . , у„ системы уравнений 6,<7\*. ...*„) = 0 (<=1,...,*), \ *,(Уг. - У«) = 0 (/=!• •-. "-*) I { ' Чтобы найти решение (30 39), надо проинтегрировать систему (30 38) в обратном направлении по времени при условии У3(Т) = У, (s=l я) II. Найдем решение ylt . , у„ системы уравнений ф#<01. .а.)-о а = \, . .. k), \ 4,(0.»,... , </„)=о и,- .«-*) I (3048) Для того чтобы построить решение (30 39), надо проинтегрировать систему (30 38) при начальных условиях У*(0) = У* (s==1 ")
§ 30] НЕЛИНЕЙНЫЕ СИСТЕМЫ С КРАЕВЫМИ УСЛОВИЯМИ 355 III Так как решение (30 39) удовлетворяет условиям (30 40) и (30 41), то обязательно выполняются следующие равенства £,(/, ух у„) = 0 (t = l, .... k), \ П/«.Л.—.*-> = ° (/ = 1. ..«-*) I (3°49) Равенства (30 49) имеют место вдоль любой интегральной кривой, удовлетворяющей (30 40) и (30 41) Следовательно, искомое решение (30 39) можно отыскать из них, не обращаясь к интегрированию системы (30 38) Воспользуемся равенствами (30 49) для построения вычислительного алгоритма, позволяющего определить с наперед заданной точностью решение (30 39) системы (30 38) в том случае, когда краевые условия линейны и система (30 38) является квазилинейной Пусть /,('. Ух 0») = tS/»./(Oft+*,(O + №.(<. Ух Ун). Ф/ = 2} */*& + *!. Тогда уравнения (30 38) и краевые условия (30 40) и (30 41) можно записать в векторно-матричной форме: iJ. = P(/)Y + Q(0 + |iO(/, Y), (30 50) A,Y(0) + Bo = 0, ГвУ(7) + Д, = 0, где Y = (t/lf .... у „У, Q(0. G(/, Y)—векторные функции своих аргументов, В„, Д0—постоянные векторы, P(t), A0 и Г0—матрицы соответствующих размерностей Имея в виду получить интегральные уравнения, которым непременно будет удовлетворять решение (30 39), будем теперь рассматривать векторную функцию G(/, Y) лишь как функцию времени, считая, что она вычислена на интересующем нас решении (30 39) Легко видеть, что в рассматриваемом случае решения (30 43) и (30 44) уравнения (30 42) будут линейными функциями, а именно S = i4(/)Y + B(0. H = r(0Y + A(/). где S = (|! 1к)\ H = (tj1? ... т)л-а)*, причем матрица A(t)
S56 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ. и вектор В(/) удовлетворяют системе уравнений dA/dt + AP = 0, (30 51 db/dt + AQ' = 0, (30 52 А (0) = А0, (30 53 В(0) = В„ (30 54 Аналогично матрица Г(/) и вектор А(/) удовлетворяю системе ^ + ГЯ = 0, (30 55 ^• + ГО' = 0, (30 56 Г(Г) = Г0, (30 57 А(Т) = Д0 (30 58 Здесь Q' = Q(/) + |iG (/. Y(/)) Интегрируя уравнение (30 52) при начальном условии (30 54) найдем B(t)=:B1(t)-lilA(x)G(T, Y(x))dt, B1(0 = B0-S/l(T)Q(T)dT о Аналогично А(0 = А1(0-5г(т)О(т, Y(x))dx, т A1(0 = Ao-Sr(x)Q(x)dT Из (30 49) имеем Л(/)У + В(/) = 0, (30 5£ Г(ОУ + А(0 = 0 (30 6С Умножая слева (30 59) на A*(t), а (30 60)—соответственно н Г*(/) и затем складывая почленно и умножая слева на матрии
§ 30] НЕЛИНЕЙНЫЕ СИСТЕМЫ С КРАЕВЫМИ УСЛОВИЯМИ 357 СУ) = (АЛА + ГТ)~1, получим Y(0=Y.(0 + |i5>M'. *)G(t. Y(x))dx + + (ij/l2(/, t)G(t, Y(x))dx, (30 61) T где Y0 (/) = - C(t) (i4*(/)B1 </) + Г»(0 A, (/)), i4t(/, t) = C(0^(0>4(t). Л,(/, т) = С(/)Г«(/)Г(т) Обозначим через Z(t) фундаментальную систему решений линейных уравнений ~ + ZP = 0, (3062) где Z(0)=£, E—единичная матрица Тогда A(t)=A„Z(t), T{t) = r0Z-1(T)Z{t) Поэтому A'(t) A (t) + Г» (/) Г (0 = Z- (0 [ЛМо + (Z-1 (Г))» r0T0Z-» (Г)] Z (1), откуда вытекает, что для того, чтобы существовали матрицы Л„ Л„ необходимо и достаточно, чтобы постоянная матрица, стоящая в квадратных скобках, была неособой Теорема 30 1 Пусть' 1) правые части системы дифференциальных уравнений (30 50) заданы при /£[0, Г], ||Y — Y„||<r вещественны, непрерывны и функции gs(t, Y) удовлетворяют условию Липшица по уи .., у„, 2) матрица A^A0 + (Z-l(T))'x X rtFoZ-' (Г) — неособая Тогда существует ц0 > 0 такое, что интегральное уравнение (30 61) будет иметь единственное решение, удовлетворяющее условию ||Y(0-Y.(/)||</n||i|, ] р. | < и-» Здесь г и т—положительные постоянные и II Y (О-Y. (011 = У tiyj-ypf. Доказательство Обозначим через /C(Y) интегральный оператор, входящий в уравнение (30 61) Тогда это уравнение
358 1ШЧНСЛИГРЛЬНЫЕ ME1O0.U 1ГЛ v можно записать в форме Y = YQ + |i/C(Y) (30 63) riocipoiiM последовательность векторных функций Y„ = Y0 \-nKfy,-,) (я=1. 2, ...) Обычным способом убеждаемся, что существует такое число ц0>0, что при ||х|<ц.0 будет || Y„ — Y0||<|fi|m < г, и, следователю, построение всех приближений оказывается возможным Далее, как при доказательстве сходимости в теореме Пикара, с помощью условия Липшица убеждаемся, что ряд V. + (YI-Y.) + (Y1-YI)+ . +(Yn-Y„_1)+. сходится абсолютно и равномерно к решению Y (/) интегрального уравнения (30 61), которое обязательно будет удовлетворять исходным дифференциальным уравнениям и краевым условиям На возможность построения последовательных приближений для квазилинейных систем с линейными краевыми условиями автору указал В В Новожилов Рассмотрим теперь общий случаи неразделенных краевых условий Пусть задана система дифференциальных уравнений dys/dl = fs(t,yi, ,y„), (30 64) и пусть на промежутке /£[0, Т] система (30 64) имеет решение У, = У,У) (s=\, . . л), (30 65) удовлетворяющее краевым условиям Ф/ (Y (*,), Y (/,), . , Y (tk+l)) = 0 (i = 1 л), (30 66) где <о = 0, tk+l = T, /,</,< </ft+1, Y(/) = (f/l, ,Уау Требуется дать способ отыскания решения (30 65) системы (30 64), удовлетворяющего условию (30 66) Перейдем к решению поставленной задачи Пусть решение (30 65) найдено Y = Y(0 Положим Yy(0 = Y(/, + a,0 (/=1, . ,k+l) (30 67) Легко видеть, что векторные функции (30 67} будут удовлетво рять уравнениям dYy/d/=Fy(/#Y/), (30 68)
§ 30] Hl-MHIIFfillUK СИСТЕМЫ С КРАЕВЫМИ УСЛОВИЯМИ 3*39 где F,.(/, ¥,)-<*/(/, +a/, Y,) Векторная функция F имеет компоненты fs(l, Y), являющиеся правыми частями системы (30 64) Кроме того, векторные функции (30 67) удовлетворяют начальным условиям Y/(0) = Y(//) (/ = 1, , *-И) (30 69) Итак, если система (30 64) имеет решение (30 65), удовлетворяющее условию (30 66) то необходимо система п(к + 2) уравнений (30 64), (30 68) будет иметь решение вица (30 65), и это решение будет удовлетворять краевым условиям 9,(Y(0), Y,(0), . , Y4+I(0)) = 0 (i = l, . , n) (3070) Обратимся теперь к постоянным величинам а,, , ал+1 Выберем эти величины так, чтобы в заданный момент 7^(0, Т) были выполнены соотношения Y(7) = Yy(7) (/=1, .. , k+1). (30 71) Для того чтобы имело место (30 71), следует потожить «у = Ь^ 1 t При таком выборе вечичин_ ау для систем уравнений (30 64), (30 68) на промежутке [0,7] возникает краевая задача с разделенными краевыми условиями (30 70), (30 71) Следовательно, на этом промежутке можно применить развитую выше теорию Однако можно действовать и непосредственно, а именно рассмотрим уравнение в частных производных f + t^f.+ll'^-O, (30 72, где /^ — компоненты векторов Fy и ySJ— компоненты векторов Yy Построим п решений уравнения (30 72) S, = 6/(*. Y,Y„Y„ ...,Y*+1) (j=l, .,„) (30 73) с начальными усювиячи |,(0, Y,Y„Y„ ,Y*+,) = <p,<Y,Y,.Y,. fY4+1) (30 74) На искомом решении функции (30 73) будут удовлетворять уравнениям li(t, Y(/), Y,(0, Y,(/), ,Y*+1(0) = 0. (30 75)
360 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ [ГЛ V Для того чтобы найти искомое решение в точке t, достаточно в равенствах (30 75) положить / = / и воспользоваться условиями (30 71) Тогда уравнения (30 75) позволят определить векторную функцию Y (7) Если считать теперь величину 7g (0, Т) произвольной, то приведенная выше процедура позволяет найти решение (30 65) системы (30 64) без дальнейшего интегрирования Рассмотрим несколько подробнее случай квазилинейных систем с линейными неразделенными краевыми условиями Итак, пусть краевые условия (30 66) имеют вид SV(/y)TB, = 0 (30 76) Здесь ^„ — вещественные квадратные матрицы с постоянными элементами и В„ —вектор с постоянными вещественными компонентами Пусть исходная система (30 64), записанная в векторной форме, имеет вид dY/d/ = P(/)Y + Q(0 + ^F(/, Y) (30 77) Тогда система уравнений (30 68) будет иметь вид -3£=P,(t)4/ + Q/{t) + VLF/(t,\/) (/=1, , A + l), (30 78) где />,«) = «/>(*, +а/), Q/(t) = a/Ht/ + aft), F,(/, Y,) = o/F(// + o//, Y,) Предположим, что решение (30.65) найдено Тогда с помощью этого решения можно вычислить векторные функции F и ?{ Положим (30 79) R(/) = F«, Y(0), R/O-F^.Y,*/)) 0=1 * + 1) Здесь \j(t) — векторные функции, определяемые формулой (30 67) Если в системах (30 77) и (30 78) нелинейные члены заменить по формуле (30 79), то получим линейные уравнения, которым будут удовлетворять функции (30.65), (30 67) Уравнение (30 72), составленное для полученных линейных систем, будет иметь решение (30 73), линейное относительно компонент векторов Y, Y„ , Yft+1 Обозначим через S вектор, компонентами которого являются упомянутые функции £, Тогда 2= .2 i4/(0Y/ + Bl/). (30 80)
§ 30J НЕЛИНЕЙНЫЕ СИСТЕМЫ С КРАЕВЫМИ УСЛОВИЯМИ 361 Матрицы Aj(t) и вектор В(/) удовлетворяют линейной системе дифференциальных уравнений dA, ST + Afj^O, (30 81) *+1 ^ + Е i4,(Q/ + |*R/)=0 (30.82) В формулах (30 80) —(30 82) Y0(0 = Y(0, P0(t) = P(t), Q,(0 = Q(0. R.(0 = R(/) Матрицы Aj(t) и вектор В(/) удовлетворяют начальным условиям Aj(0) = A/o, В(0) = Во Обозначим через Z(t) фундаментальную систему решений для системы уравнений ^- + ZP=0, (30 83) где Z(0) = £, Е—единичная матрица Тогда матрицы Aj(t) можно представить в виде Л/(/) = Л/02-1(//)2(// + а/0 (/ = 0 А+1) (30 84) Интегрируя уравнение (30 82), найдем В(0 = В0— V S А.(т)Q,(т)di—ц V 2 А.(т) R,(x)dx (30 85) Из (30 85) имеем, что искомое решение удовлетворяет системе уравнений 2Л/(0^, + В(/) = 0 (3086) /-о ' Положим в (30 86) t =Т Используя далее соотношение (30 71), из (30 86) найдем Г* + ,Л,(7)| Y(7)=-B(T) (30 87) П
Предположим, что матрица 2 Л/(0 — неособая Обозначим обратную ей через C(t), югда из (30 87) имеем Y (7) -= С (7) Г*2 5 А, (т) Q, (т) dx- B0 I + + цС (7/2 J А/ (*) R/ <т) Л (30 88) Заменим в выражении (30 88) функции Ry(x) их выражениями через функции F,- и введем в /-м слагаемом новую переменную интегрирования 6 = // + а/т Тогда формула (30 88) примет вид _ _ k+lJ Y (0 = Y0 (7) + (1 2 S Л, (7, 0) F (6, Y (0)) d0, (30 89) где A/(7,Q) = CCt)AuZ-4t,)Z(Q), Y°(7) = 2 j Л/7, G) Q (0) dG — С (7) B0 (30 90) Уравнение (30 89) можно рассматривать как интегральное уравнение, служащее для определения векторной функции (30 65), так как величина / в уравнении (30 89) может теперь считаться независимой переменной t £[Q, T) Заметим, что векторная функ ция Y°(f), определяемая уравнением (30 90), будет давать реше ние постав ченной задачи при ц = 0 Обозначим через /C(Y) интегральный оператор, входящий в правую часть (30 89) Тогда уравнение (30 89) можно представить в форме Y(/) = Ve(«+n/C(Y) (30 91) Положим YA'(0-=Ye(/)H (-i/C(YA-'), N=l,2, .. Оказывается, что при широких предположениях относительно правых частей исходной системы дифференциальных уравнении последовательные прибаижения Y°, Y1, равномерно сходятся к решению (30 65) системы (30 77), удовлетворяющему краевым условиям (30 76) А именно, имеет место следующая теорема
§ .30) нрлинрйные системы с краевыми условиями 363 Георема 30 2 Пусть I) правые части системы уравнений (30 77) заданы при /£[0, Т], || Y°(/) — Y ||<r вещественны, непрерывны и удовлетворяют условиям Липшица по Y, 2) матрица У AjnZ~l (t-) —неособая Тогда существует положительное число ц0 такое, что при любом ц, для которого | ц | < (х0, система (30 77) имеет непрерывное решение (30 65), удовлетворяющее краевым условиям (30 76), причем это решение будет единственным Доказательство Если ц0 выбрано так, что |А0т, < г, где число /л, превосходит ||/C(Y)|| на множестве /£[0, Г], || Y- Y«(/)||<r, || Y"_Y» || <|im, (AT = 1,2. ) Д<^ее из условий Липшица будем иметь || Y«v-YA-'||<|i«, II Y"-»-Y"-1| Здесь W=2, 3, Если величина ц0 к тому же выбрана так, чтобы было [i(tmi < 1, то ряд Yo + (Yi-Y0) + (Y'-Y')+ . буде! сходиться равномерно и абсолютно при /£[0, Т] к непрерывному решению системы (30 77) Это решение непременно будет удовлетворять краевым условиям (30 76) Единственность такого решения устанавливается стандартным образом Дадим теперь условия разрешимости краевой задачи Выше был рассмотрен случай, когда матрица A{t)= 2 А,,(/) (30 92) неособая Уравнение (30 87) можно переписать в виде i4(OY(0 = B,+|iB2, (30 93) где Bi=S.2//(T)Qy(T)dx-B0=.2o [Aj9Z-*(t,)Z(t)b(T)di-b„ (30 94) B>=i IlAJ(t)R(z)dT='£ y-'C^WFii, Y(x))rfT о )=o /=o / ' (30 95)
364 ВЫЧИСЛИТ F/lbHblE МН10ДЫ [ГЛ V Пусть теперь матрица (30 92)—особая Тогда, как будет показано ниже, ранг этой матрицы не зависит от t Обозначим его через k Теорема 30 3 Система (30 77) при (х=0 имеет непрерыв ное решение, удовлетворяющее условию (30 76), тогда и только тогда, когда любой постоянный вектор А, идовлетворяющий со отношению AM = 0, будет удовлетворять также условию Л*В,=0, где Л*В,— скалярное произведение Л на В,, k+i 'j В, = В0-| 2 \ A.0Z-Ht,)Z(x)Q(-c)dx /=о S Доказательство При выполнении условий теоремы ранг матрицы A (t) и ранг расширенной матрицы, получающейся из Л (0 путем приписывания (п-|-1)-го столбца, равного В^/), бу дут совпадать А тогда линейная система уравнений, получающаяся из (30 93), при (д = 0 б\дет иметь решение, зависящее от п — k произвольных постоянных Итак, покажем, что ранги упомянутых матриц совпадают при выполнении условий теоремы Матрица А (/), определяемая выражением (30 92), может быть представлена также в форме A(t)=2lA!0Z->(t/)Z(t)~AZ(t) /=о Так как матрица Z(t) — неособая, то ранг матрицы A (t) будет совпадать с рангом постоянной матрицы А Пусть А—некото рый постоянный вектор такой, что ЛМ = 0 Тогда AM (0 = 0 Вычислим скалярное произведение ректора Л на В, (I) Поч\чнм Л-ВДО^А* V* J /^„/-'(^Z^CKth/t -BJ=- = Л*| "•£[ A/0Z-i(t/)Z(x)Q(T)dx'\- A*Bt
§ 30| ИКЛИМ1 ИНЫЕ CIICTFMM С KPAFBUMII УСЛОВИЯМИ 365 Покажем теперь, что обязательно будет имен» место равенаво А«В,(0 — А*В, Действигетьно, Л* J $<4/0Z-1(//)Z(t)Q(t)<Jt = AM rZ(T)Q(t)dx-0 '=о о о Итак, при выполнении \сювня теоремы из АМ(0 = 0 вьпекаег Л*В(/) = 0 Эго н означает совпадение рангов матрицы Л (0 и расширенной матрицы, что и требовалось доказать Если матрица (30 92) имеет ранг k, то обязательно существует л—k линейно независимых векторов Л,-, удовлетворяющих условию Л"Л(/) = 0 Предположим, что условия теоремы 30 3 выполнены и существует решение системы (30 77), удовлетворяющее краевым условиям (30 76) Подставляя это решение в уравнение (30 93), получим систему тождеств Умножая слева полученные тождества на \'lt находим A?B,(Y)=0 (i-l, , n — k) (30 96) Итак, если система (30 77) имеет решение, удовлетворяющее условиям (30 76), то это решение необходимо удовлетворяет уравнениям (30 93) и (30 96) Преобразуем уравнения (30 96) А;*2 ^A/)Z-l(t/)Z(x)F(x. Y(t))</t= = A;^Z(t)F(t, Y(x))dT-A?*2 $ i4/eZ-i(//)Z(T)F(T, \ (x))dx= 1=0 0 -A;*2 \ AJaZ-4lj)Z(x)? (x, Y(T))rfx Отсюда вытекает, что уравнения (30 96) можно представить в виде Л;*2 J A/0Z-l(t/)Z(x)F(x, Y(x))rfT=»0 (30 97) Обозначим через Y° — Y°(/, С,, , C„_ft) решение уравнения (30 93) при |.i = 0 Подставим данное решение в подынтегральные выражения, входящие в (30 97) Полеченные в результате этого функции произвотьных постоянных С,, , C„_ft обозначим через gi ЫС„ ,U = A;2JV'(',)^T)F(T,V')(h (30 98)
366 ВЫЧИСЛИТЕЛЬНЫЕ МЕТОДЫ | ГЛ V Теорема 30 4 Пусть 1) выполнены условия теоремы 30 3, 2) существуют вещественные постоянные С,0, С20, .., Сп-ка, удовлетворяющие уравнениям g,. = 0 (i = l, . ., n — k) (30 99) и такие, что якобиан функций gt, .. , g„_A no переменны» С,, . , С„_А отличен от нуля в точке С10, С20, . , С„_Ло Тогда существует положительное число \i0 такое, что при любом (1, для которого | р. | ^ р,0, будет существовать непрерыв ное решение системы (30 77), удовлетворчющее краевым условиям (30 76) Это непрерывное решение может быть получено как пре дел последовательных приближений, указанных ниже Доказательство Обозначим через Y°(/) то решение системы (30 93) при р. = 0, которое соответствует величинам С,„, Сгй, • •» С„-кп Определим далее решение системы А (0 Y1 = В, (0 + цВг (Y0) (30 100) Это решение будет зависеть от n — k произвольных постоянных \1 = \1(t, Сг С„_л) (30 101) Выберем произвольные постоянные Си .. , С„_*так, чтобы функ ции (30 101) удовлетворяли уравнениям (30 97) Решение системы (30 100), соответствующее этим значениям произвольных посто янных, будем обозначать через Y*(/) Действуя таким образом далее, можно определить N-e приближение как решение урав нения A (t) VN = В, (О -Ь цВг (У"-1), (30 102) удовлетворяющее соотношениям, получающимся из (30 97) при подстановке туда функции Y" вместо Y Указанный способ построения последовательных приближений позволяет однозначно найти векторные функции \N(N~l, 2, ), если иметь в виду, что произвольные постоянные С1( С2, ., С„.к на каждом шагу определяются как решения уравнения вида (30 99), расположенные в малой окрестности точки С10, С20, . , Сп~к0 При доказательстве сходимости этих последовательных приближений используетсяфактдифференцируемости правых частей системы (30 77) Будем предполагать, что правые части системы (30 77), заданные при /£[0, Т], || Y°(/) — Y|| < г, вещественны, непрерывны и непрерывно дифференцируемы Здесь, как и ранее, г — некоторая положительная постоянная, Y°(/) — решение уравнений (30 93) при ц. = 0, соответствующее выбранным значениям произвольных постоянных С10, С£0, ., С„-к0 Обозначим через С вектор размерности n — k, компонентами которого являются произвольные постоянные С,, С2, , С„_*
§ 30| 111 'ШИРИНЫ! СИСТЕМЫ С КРА1 ВЫМИ УСЛОВИЯМИ 367 Тогда из уравнений (30 102) можно найти Y"(/)^tfl(/)BI(0-|-^a(0B2(Y'v-1H-tf,(/)C", (30 103) где#1(/), H2(t), Нл{() — матрицы, определяемые при решении уравнений (30 102) Подставляя функции Yv(/) в равенство (30 97), полечим, что постоянный вектор Сл' удовлетворяет уравнениям А?*2 \ A^VjZix) F(t, Я,(т) В,(т) -|- i=o5 -|- ц#а (т) Bs (Y*-1) + Иг (т) С") dx = 0 (30 104) (i = l, . , n—k) Система (30 104) имеет решение С при ц. = 0 Якобиан функций в точке С0 отличен от нуля Поэтому существует непрерывно дифференцируемая функция CN(\i), удовлетворяющая системе (30 104) и такая, что C"(|x)=C° при ц = 0 Оценим величину || Y^— y^-1 || Из (30.103) будем иметь || Y"_ ул'-» || ^ /rtl || с"_С""11| + тг\л || Y"-1— Yv-* || Записывая равенства (30 104) для номера Л^ — 1 и почленно вычитая их из (30 104), а затем применяя формулу конечных приращений, найдем ||С"_с"-11«т,(х II Y"-1-Y"-21| Отсюда вытекает, что || ул _ y"-i || <- ц,п<1| ул'-' — Yv-*1| Нетрудно показать, что положительное число р.0 можно выбрать так, чтобы при любых |^|^р.„ величины т.; (/= 1, 2, 3, 4) были положительными постоянными, не зависящими от ц., и построение всех последовательных приближений оказалось возможным Если Н-0 к тому же выбрать так, чтобы ц0/л4 < 1, то последовательные приближения Y°, Y», , YA', будут равномерно сходиться при /£[0, Т] к непрерывному решению системы (30 77), удовлетворяющему условиям (30 76) Если в условии (30 76) положить k = 0, A00 = E, Л10= —£ и Во = 0, где Е—единичная матрица, то получим так называемые периодические краевые условия Y(0) = Y(r) Для такого рода условий способ построения интегральных уравнений в одном частном случае был указан еще А М Ляпуновым
Глава VI СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ § 31 Стохастические системы дифференциальных уравнений П^сть задано некоторое множество Q, элементы которого будем называть эчементарными событиями Пусть задано также некоторое множество F, элементами которого являются подмножества множество Q Элементы множества F будем называть событиями Предположим, что события, входящие в F, образуют борелево тело множеств, т е если Flt Ft, . есть элементы F, ТО 00 » U F, и Л F; 1=1 !=\ также есть элементы F Будем считать, что пустое множество — элемент F и Q£F, если F^F, то и QXF.g.F. Зададим на множестве F такую неотрицательную вполне аддитивную функцию Р, что P(Q)=1 Если Fl^F, то P(F,) — вероятность события Fr Введем в рассмотрение множество функций 1 (о), cog Я, измеримых по отношению к F, иначе говоря, для любого A,(J(—оо, -f-oo) множество всех точек со таких, что £(со)<Я,, является элементом F Это множество далее будем обозначать {$ (со) < Я,} Функция /(Я) = Р{|и<М называется функцией распределения Ясно, что /(-+-оо)= 1, /(—оо) = 0, f (к) не убывает и непрерывна слева в каждой точке X Измеримую функцию |(со) называют случайной величиной Тогда f(k)—функция распределения случайной величины I Если существует интеграл Лебега—Стилтьеса |(<о) dp = £(&), то говорят, что случайная величина | имеет математическое ожидание Всюду в дальнейшем будем рассматривать лишь такие случайные величины, для которых существует математическое ожидание их квадрата Множество всех таких случайных вели-
§ 31 I СГОХАСП1ЧЕСКИЕ СИСТЕМЫ УРАВНЕНИЙ 369 чин, заданных на Q, обозначим через L2 Если задано k случайных величин |,, £,, , gft, то можно определить их совместную функцию распределения ПК . К) = Р &(<*)< К • l„W<h\ Случайные величины называются независимыми, если f(K ,К) = 1ЛК)* х/А(лЛ), где Функция i](l) называется случайной функцией или вероятностным процессом, ест и она задана при t£T, где Т—некоторое множество вещественных чисел, и i\(t) при каждом / € Т есть случайная величина, те ц(() при любом фиксированном/ есть измеримая функция со, так что фактически r\(t) = i\(t, со)— функция двух аргументов Говорят, что вероятностный процесс задан, если заданы всевозможные совместные функции распределения случайных величин г|(/,), v\(tt), , 11 (tk), k=\, 2, ... при любом выборе чисел /х, , tk из Т, так что задано М,. ..**.',. ,'*) = Я {л (*,)<*,. . ,ч(1,)<У Пусть /,, /я—какие-либо точки множества Т Функция двух аргументов /■(/„ /,) = £[л(',>л('.)] называется корреляционной функцией верочтностного процесса r\(t) Если заданы два вероятностных процесса л (О и £(f). то можно определить взаимную корреляционную функцию Г^Иг, ',) = £[!(*,) 4 (*,)] Ясно, что мл, u) = r(tx, и) и гь,и,, /,) = ы(/„ ;,) Пусть вероятностный процесс л (О задан при /6[0, Л], а Л> 0 —постоянная Будем говорить, что л (О непрерывна в точке т£[0, Л], если Е[ц(t) — r\(x)f—*0 при /—»т Если г('р ^s)—корреляционная функция процесса л(0> то л (О будет непрерывна в точке I тогда и только тогда, когда г(/,, /„) — непрерывная функция двух аргументов в точке /, = т и tt = т Это утверждение вытекает из двух неравенств E[4)(t)-4(T)Y^lrll ()-г(т, т)|4 2|л(т. т)-г(/, т)| и /*-(«. t)-r(x, i)Kj£[t]J(s)]£[ri(0-Ti(TjjTH
370 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ. VI При рассмотрении дифференциальных уравнений, описывающих движение объекта под действием случайных возмущений, приходится использовать понятие интеграла и производной вероятностного процесса Интеграл \r[(t)dt о будем понимать, следуя Крамеру, как предел в среднем интегральных сумм Римана Разобьем [О, Л] точками 0=/1</а<. .< </„+,=А Выберем в промежутках [tk, tk+l] точки тк и построим случайную величину Se = Jl Л (**)(/*+,-'*). где 6 = max(/ft+I — tk) Будем говорить, что г\(() интегрируема и J Л (О Л существует, если существует случайная величина £ такая, что E(S6 — £)8 — 0 при б-—О, причем £ не зависит от способа дробления [О, А], от выбора и от способа стремления б к 0 Для существования случайной величины | достаточна и необходима сходимость в себе при 6—у 0 последовательности случайных величин Se Это обстоятельство приводит к утверждению, что вероятностный процесс r\(t) интегрируем тогда и только тогда, когда его корреляционная функция r(tt, l2) интегрируема по квадрату 0^/lt tt^.h и, более того, Lo J о о Остановимся теперь на понятии производной вероятностного процесса Будем говорить, что случайная функция r\(t) дифференцируема при /=т, если существует такая случайная величина £, что при / — т и t^x Случайная функция r\{t) будет дифференцируема в точке т, если г (tu /,) будет иметь частные производные по аргументам и смешанную производную в точке /, = /, = х.
§31] СТОХАСТИЧЕСКИЕ СИСТЕМЫ УРАВНЕНИЙ 371 Рассмотрим теперь последовательность v\„(t) Если £[Т1„(0-П(0]2 — 0 при я —+ оо равномерно по отношению к /£[0, А] и ц„(1) непрерывны, то спучайная функция r\(t) будет также непрерывной Пусть }п(К> . К< Л. . fk) есть конечномерная функция распределения вероятностного процесса t]„((), и пусть /(X.,, , Хк, Л. • » **)—конечномерная функция распределения вероятностного процесса г|(/) Если при всех t £[0, А], то f„(K. •• К, ',, , t/,)-+f(K ■ . **. Л '*) во всяком случае в точках непрерывности функции / Действительно, так как т)„(/)—♦ л(0 при любом фиксированном t в среднем, то r\n(tj)—»• г|(/у), /— I, , к, по мере, иначе говоря, для каждого е>0 и б>0 можно указать такое N (г, б), что при п> N(&, б) будет Я{|л«,)-Пп(Л)|>е. • ., \Mtk)-ri„(tk)\>e\<6 Обозначим множество точек со, заключенное в скобках, через Ge, тогда будем иметь M',)<*i-e, .... т)(1к)<К-ь\<= с^/.Х?.,, ., г]п((к)<Хк\с: c{t|(M<^ + e, . , ri(/ft)<X4-fe[ Последнее включение имеет место с точностью до множества точек со, образующих Ge Находя меру этих множеств и совершая предельный переход при е—«-О, б—► (), получаем fa(hlt . , Я,Л, tlt . , tk)—>7(A.j, . , Хк, /,, .., tk) в точках непрерывности функции f при я — + 00 Это обстоятельство показывает возможность использования функции fn в приближенных расчетах вместо функции / Рассмотрим теперь систему x = f(x, у, 0. (31D где x = (v„ .. , дгЛ.), у = («/, уя), ! = (/„ .. ,Ы Будем считать, чю ветчины yt—вероятностные процессы, заданные при t€[0, T] Компоненты вектора х — случайные величины, являющиеся элементами Ц Функция f(x, у, /) задана
372 chctfmu управлрния, ommivibiiUE по вероятности |i;i vi пои тюбых конечных векторах х, у и t £[0, Т) и удовлетворяет JC10BHHM 1) вероятностные процессы у,, , у,„ непрерывны; 2) функции fs(x, y(t),t) непрерывны по совокупности х, t, т е при любом выборе векторов х, х и чисел t и I будет E[f,fr, У(0, 7)-/Д у(Т), 7)У<г при 2Е[х,-х,)-{ |7-7|<6, где е сколь угодно мало, если б достаточно мало, 3) функции fs (s — 1, , п) удовлетворяют условию Липшица £[/,(х. у, 0-/,(х. у. /)]*</-2 £[*,-*,]*. где L — постоянная, не зависящая от х, х, у, / Пусть х<0)—начальный вектор с компонентами из L2 Положим x<"'(0 = x<»-l^(xi-«(t), у(т), т)Л. я -1.2, . (312) о Покажем, что существует h > О такое, что в [0, h] компоненты каждого из векторов х(,,,(/) являются вероятностными процессами, непрерывными по /, постсдоватеаьность (31 2) сходится равно мерно к х(/), /£[0, ft], каждая компонента х(^) — непрерывно дифференцируемый вероятностный процесс, причем x(0)=x«\ x(t) = flx(t), y(0. О Действительно, если х("-11 непрерывен, то вектор х""{<) также будет непрерывен вследствие непрерывности / Тогда любая ком понента fs(x{a~l), у, /) будет иметь непрерывную корреляционную функцию, а следовательно, будет существовать $Мх«-»(т), У(т). т)йт и каждая компонент вектора х(п> (t) будет являться непрерывным всфоятностным процессом Установим теперь сходимос гь последовательности x(n) (t) Имеем х«»+»(0-х1"'(0 = 5[/1*(",(т), У(т). т)-/(х«»-"(т), у(т). x)]dT (31 3)
§ 31J СТОХАСТИЧЕСКИЕ СИСТЕМЫ УРАВНЕНИЙ 373 Умножив скалярно обе части (31 3) на вектор х<я+1)(/) —х«я,(0 и взяв от обеих частей математические ожидания, получим £(2 W*u-*.eB],) = = $Н 2(*Г"—^",)'(/.(х«-»(т).У(х),т)-/,(х«-"(т). y(x),T)]dT. о Ls= I J (314) Из (31 4) находим Е ( 2, КГ»-д*Ч') < 4"Е (|, №"-**" J2) + +y^(f2[^,(x«->(T), У(т), T)-f,(x(-"(T). у(т). т)р)<*т< (315) где ТУ— порядок системы (31 1) Обозначим через S„+, (/) левую часть равенства (314) Из (31 5) имеем SH+l(*)<£rlS"Wdx (316) Положим /i<min(2, T) и будем все приближения рассматривать на промежутке [0, к] Тогда Sa+l(t)<a^S„(r)dx, (317) о где a = NL/(2—h) Из (31 7) находим S.+iCX^m. (318) где т>0 — такая постоянная, что 5х(0<т при f €(0, h] Неравенство (31.8) показывает, что последовательность векторов х(я,(<) сходится в среднем в себе в Lt, а тогда по теореме Рисса — Фишера будет существовать вектор x(t), компоненты которого принадлежат Z-, при любом фиксированном /€{0. 7*] Вследствие равномерной сходимости х(я,(*). компоненты векторов х<в>(/) — непрерывные вероятностные процессы, но тогда функции fs(x(t), У10» 0 будут иметь непрерывные корреляционные функции
374 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ VI Вследствие этого оказывается, что компоненты вектора х непрерывно дифференцируемы и, следовательно, х(/) удовлетворяет системе (31 1), при этом вектор х(/)—единственное решение системы (31 1) с начальным условием х(0)-=х° § 32. Программные управления в линейных системах, оптимальные по вероятности Пусть движение управляемого объекта в фазовом пространстве (хи . , хп) под действием управлений ut, ..., иг описывается системой уравнений x(t) = A(t)x + B(t)u + 1(t) + C(t)\ (32 1) Элементы матриц А, В, С будем считать вещественными непрерывными функциями при /€[0, Т] Такими же будем считать компоненты вектора f Управления и„ . , иг—кусочно-непрерывные функции, заданные при /£[0, Т] и такие, что |uy|<l, /=1, , г Вектор Y(/) имеет компоненты y1(t), , ym(t), каждая из которых является непрерывным вероятностным процессом при t £[0, Т] Обозначим через Z(t) матрицу фундаментальной системы решений однородной системы x = A(t)x, Z(0) = £, где Е—единичная матрица Тогда вероятностный процесс, определяемый системой (32 1) с начальным условием х(0) = х(0), можно представить в форме K(t)=Z(t)xW+lZ(i)Z-i(x)[Bu + i + C\]dx (32 2) Пусть задана некоторая область S фазового пространства (*i, . ., х„) Положим J(u) = P\x(T)£S\ (32 3) Функционал J представляет собой вероятность попадания правого конца стохастического движения, описываемого системой (32 1), в область 5 Задача состоит в том, чтобы найти управления ы„ . , иг так, чтобы функционал J имел наибольшее возможное значение при условии |Uj|< 1 (/ = 1, , г) Решение этой задачи в общем случае затруднительно Дадим способы решения этой задачи в некоторых конкретных случаях Прежде всего найдем математические ожидания и дисперсии компонент вектора х(/) Имеем £[x(/)] = Z(/)£[x"»]+Sz(0Z-»(x)[5u + f + C£[Y]]dT (32 4)
§ 32[ программны! УПРЛНЛ1 нии в лит иных системах 375 Компоненты вектора £[х] будем обозначать через о,, , а„ Легко видеть, что каждая компонента представпяегся в форме Дисперсии компонент вектора х определяются по формулам Dl(t) = E[xt(t)-a,(t)Y, s=-l. ,n (326) Из формулы (32 6) вытекает, что дисперсии компонент вектора х определяются через корреляционные и взаимно корреляционные функции вероятностных процессов ук, , ут и не зависят от управлений ult , ttr Будем считать, что компонента х,(/) вектора х (/) распределена по нормальному закону с математическим ожиданием E[xl(t)] = al(t) и дисперсией Dt (/) Положим У1(и) = Р{|х1(Г)|</} Функционал У, есть вероятность попадания правого конца стохастического движения х(Г) системы (32 1) в л-мерный слой — /<! vt^Z Требуется управления ut, , иг выбрать так, чтобы 7j(u) имел наибольшее возможное значение при условии |иу|<1 (/' = 1, . , г) Функционал У, (и) может быть представлен в форме У, (и) = Г-=! ехр ( x~ai„{T))2)dx. (32 7) J У2яО,(Г) v \ 2Di(T) J Из (32 7) вытекает, что У, (и) имеет наибольшее возможное значение тогда и только тогда, когда |в1(7,)| достигает наименьшего возможного значения, так как J1 (и) монотонно возрастает при убывании а2 (Т), если «,(7)> 0, и при возрастании о, (Г), если я, (ГКО Обозначим оптимальное \ правление через uf (/ = 1, .. , г) Если «Г (Т) > О и ««»• (Л- j 2 I < „ (Т, т) |dx > О, о '= i то uf = —signr./T. О Если же а<°> (Г)< О и а«» (Г) + j 2 I cv (Г, х) | Л < О, о /'= ' то «}M = signc1/(r, х)
376 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ (ГЛ VI Итак, в рассмотренных случаях «}•'=- sign К' (Т) си (Г, т)] При этих управлениях оптимальное значение вероятности попадания дается формулой т , |с,/(Г,т)|А) / Lr-fl{M (Г) + signe^S 2 I Р\ 2D? (Г) • • 2D? (Г) л <««-•)-j4 р^^у * Если же г г а<в> (Г) > 0 и < - S 2 | с1; (Г, т) | dt < О, о /=1 или г г а'»> (Г)< 0 и а<°> + \ j | с„ (Г, т) | dx > О, то оптимальных управлений существует, вообще говоря, бесконечное множество В качестве одного из них можно взять то же самое управление, что и выше, однако задав его на [0, /0] На промежутке же [/„, Т] движение объекта при таком управлении должно быть автономным «</» = -sign[аГ(Т)С1/(Г, 0]. '€[0. /.], ttfaO, *€[*.. Т], где t0—наименьшее значение /, при котором < = J 2 | сх) (Т, т) | оЧ, если о'0' (Г) > 0 о /= i Если а(1О)(Г)<0, то ta выбирается как наименьшее значение t, при котором ^(D + SSlMr, т)|от = 0 о /= ' Автономное движение объекта можно осуществлять не только на последнем участке движения, а на любом другом участке t €['i» U\ или на какой-либо совокупности таких участков, однако участки автономного движения должны удовлетворять следующему необходимому условию Обозначим объединение этих участков через Л, а дополнение до промежутка [0, Т]—через А Если управление «;.<» = —signfo;.0'(T)cu(T, t)]
§ 32] ПРОГРАММНЫЕ УПРАВЛЕНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 377 при t£A и и(10)з=0 при t£A, то оно будет оптимальным при а\» (Т)- sign ар (Т) $ 2 | си (Т, т) | dx = О Пусть Су, / = 1, , п, как и выше, — математические ожидания Jc1( ., , х„ Тогда величины а} могут быть представлены в форме т г a/ = a/0, + S 2 &//М'. / = 1 « (328) о /=• Пусть так же, как и ранее, dJt /=1, .. , п,—дисперсии xt, .. ,х„ Предположим, что случайные величины хх (7), ,хп(Т) независимы и нормально распределены Тогда их совместная функция распределения Р(К • •• К) = РЛК)РЛК) ... FM, где Fj(Kj)—функция распределения случайной величины Xj(T), / = 1, .., k, так что Положим J(u) = P\Xl(T), . , МЛ^Ь где Р—вероятность события, заключенного в фигурные скобки. Множество 5 есть fc-мерный параллелепипед — ll^x^lj, /=1, ...k, l/>0 Функционал J может быть представлен тогда в виде У (и) = /,(") Л (") •• Л("). где Выше было найдено программное управление, оптимальное по вероятности в случае k=\ Поставим задачу построения программного оптимального управления для k > 1 Для отыскания такого программного управления можно предложить различные методы последовательных приближений Отметим некоторые из них Предположим, что u(Q,=(u(10', , u(rm) представляет собой оптимальное управление Функции uf могут принимать одно из
378 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ. VI трех значений. — 1, 0, +1. Выберем некоторую точку т £ [О, Т) так, чтобы управление ы}0) принимало одно и то же значение в промежутке [т—е, т + е], где е достаточно мала. Иначе говоря, предположим, что точка т не является точкой переключения для управления ы}0', а величина е/-=и{-ю(т) может быть либо +1, либо — 1 Построим управление _ы{0) следующим образом ы}^=— еу при /€[т—8, т + е] и ы}0)=ы}0) при / 6 [О, Т] и / € (т—е, т + е) Рассмотрим управление и0=(ц{0>, . , ul?lt, и,-, и}°+\, ...,t40)) Так как и(0)—оптимальное управление, то обязательно У(и'«)>У(й«>) при любом выборе достаточно малого е > 0 Если обозначить ау через Яу(и), то будем иметь af = aj (u<°' + бу)=aj (и»'), / = 1 * Функционал У(и)_является аналитической функцией величин б„ , бА при и = и<0' Если разложить этот функционал в ряд по степеням filt .., Ьк и ограничиться лишь линейными членами разложения, то получим у(й««) = .мо+2 сА+.... Следовательно, / /Qi«»x1 ■/<цЦ,>| Из последней формулы вытекает, что Отсюда следует, что число с,- имеет тот же знак, что и число — fl/(u(0)), т е sign С/—— sign a,- (u(0)).
§ 32] ПРОГРАММНЫЕ УПРАВЛЕНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 379 Предположим, что при любом достаточно малом е > О 2с,-6,.^=0 Тогда, в силу оптимальности управления и<0), 2 СА < О Найдем фактическое выражение для б,- 8,=а,-(""")—а,(п»>)=— 2 J R/bi/(t)di=—2 J uf>biy(t)dt, откуда ДсА 2 J (JjC/*//)«r' Из условия оптимальности управления u(0), как уже отмечалось, следует, что j 2 cpijiif* dt > Ъ Значит, "Г = sign 2 ^Ау (32 9) Это выражение для оптимального управления фактически совпадает с тем, которое было получено при /г=1, если иметь в виду, что при 6=1 имеется лишь одна величина сг, знак которой совпадает со знаком —а1(и10>) и, следовательно, с — аш в том случае, когда участок автономного движения отсутствует и иу»=—signta10*,) (32 10) При k > 1 формулу (32 10) можно использовать для построения последовательных приближений Возьмем некоторое управление и(1) Вычислим с помощью иш величины сп, ., ск1 подобно тому, как с,, , ск вычисляются через и(0' Положим далее «P'-signijc/A/. '€(0, Т] Управление образует второе приближение С управлением и<2) поступаем так же, как и с иш. В результате этого процесса получим
380 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ VI последовательность и'", и(2>, .. , и0-', ..., образующую последовательные приближения, вопрос о сходимости которых остается открытым Систему равенств (32 10) можно рассматривать как систему нелинейных интегральных уравнений, служащих для определения оптимальных управлений. Тогда описанный выше способ последовательных приближений можно рассматривать как обычный способ для решения этой системы интегральных уравнений От системы интегральных уравнений (32 10) можно перейти к системе алгебраических уравнений для определения постоянных с,, . , ск С/ = Ф,(с, ск), t = l, ...ft (3211) Уравнения (32 11) получаются, если в формулы, определяющие величины с,-, подставить выражение (32 10) Уравнения (32 11) можно решать каким-либо приближенным способом. Например, можно воспользоваться каким-либо методом направленного поиска минимума функции У = Д1(с/-ф/(С1. • -.^))а Если с[т, .., ckm — n-e приближение для решения системы (32 11), то функции «J* = sign 2Л/. / = 1, •• .*. можно рассматривать как п-е приближение к оптимальному программному управлению Исследуем далее тот случай, когда случайные функции #i(0> . Ут С) не зависят от / и, следовательно, являются случайными величинами Обозначим их £„ .., \т Пусть Л. •. Fm~Функции распределения величин \и ..., \т Предположим далее, что случайные величины £„ ..,, \т независимы, а начальные данные, определяющие решение системы уравнений (32 1), либо детерминированы, либо включены в число величин £t, , £m Совместная функция распределения величин £,, • . 6. F(^, ...,Xm) = Fx(K)-- F.(K) С помощью этой функции можно построить функцию распределения G (Я,) случайной величины х, (Т) Пусть m т г «=1 о '=1
§ 32) ПРОГРАММНЫЕ УПРАВЛЕНИЯ В ЛИНЕЙНЫХ СИСТЕМАХ 381 В пространстве т переменных Х„ , кт возьмем область S(K), определяемую неравенством х, (Т)<Я. Тогда 0(Я)= ldF(K • ,К)= , - $ dF.fo) $ ^.(W J d/\.(S«) (32 12) Из (32 12) вытекает, что функция распределения G(X.) может быть представлена также в виде Поставим задачу отыскания программного управления uitt\ которое доставляет функционалу У(и) = /ЧКК'} наибольшее возможное значение Обозначим через а и В соответственно наименьшее и наибольшее значение величины через а* обозначим точку промежутка [а, В], в которой функция В(^Г-«)-в(-т~«) имеет наибольшее возможное значение как функция а 6 [а, В] Тогда, если а* совпадает с одним из чисел а и В, то оптимальное управление дается формулой uf = - sign [«- а») Ъ,), у = 1, . , г (32 13) Если же а < а* < В, то оптимальное программное управление может использоваться лишь на части траектории движения Пусть управление и}0> определяется формулой (32 13) в точках управления В моменты, когда движение автономно, uf' = 0 Тогда участки, на которых происходит управление, определяются равенством
382 системы уш'лнлкнии, оптимлпьных но вероятное!и |гл v Таким образом, и в этом случае при произвольных закона) распределения случайных величин, входящих в систему (32 1) задача построения оптимального управчения решается полностью Для величин v,(T), , х„(Т) можно найти совместную ф\нк цию распределения G(Xlt , Хк) через функции F„ ," Fm С помощью этой функции можно построить функционал У(и) = />{|*,|</,. ,|*ft(7)|<U Этот функционал есть вероятность попадания стохастической решения системы (32 I) при t = T в область | лу-1 </у, /'= 1, . , k vy € (—°°, +оо), /=1, • ." Для такого функционала можно как и ранее, предложить метод последовательных приближение к оптимальному программному управлению § 33 Программная настройка коэффициентов усиления Законы управления часто формируются как линейные комби нации некоторых выражений Коэффициенты этих линейных ком бннацпн называют коэффициентами усиления системы управле ния После того как структура закона управления выбрана, ос новиая задача при проектировании системы управления сводите к отысканию таких коэффициентов усиления, при которых ка чесгво системы управления будет наивысшим возможным или же будет удовлетворять заданным требованиям Во многих случаях коэффициенты усиления во все время движения сохраняют свое постоянное значение Поставим вопрос как найти закон программного изменения этих коэффициентоЕ во времени, такой, при котором повышается качество системь управления Дадим способ решения одной из таких задач Пусть движение управляемого объекта описывается системе дифференциальных уравнений х = Л(/, u)x + f(0 + C(OV(0, (33 1 где A(t, и) = Л(0+2|В,(0"/(0 (33 2 Будем считать, что матрицы A(t), B^t) (»'=l, , г), C(t и вектор f(/) обладают теми же свойствами, что и в предыду идем параграфе Пусть по-прежнему управления ыД/), , иг(1, являются кусочно-непрерывными функциями, заданными на [О, Т], и удовлетворяют ограничению j 2 uj{t)dt^K-r<x>. (33 3,
§ 33) ПРОГРАММНАЯ НАСТРОЙКА КОЭФФИЦИЕНТОВ УСИЛЕНИЯ 383 Компоненты вектора Y(t) = (y1(t), , ym(i)) будем по-прежнему считать вероятностными процессами Положим as = E(xs), ds = E(xs — as)\ s=l, . , п Здесь jc„ , хп есть стохастическое решение системы (33 1), ваданное при t£[О, Т] и удовлетворяющее начальным данным х, |/=о =х\, где х?, s=l, ..., п,— случайные величины Математическое ожидание as, дисперсия ds, фазовые координаты xs являются функциями времени и зависят от выбора управлений и„ . ., и, Обозначим через Z(t, и) матрицу фундаментальной системы решений для однородной системы уравнений dx/dt = A(t, u)x, (33 4) тогда a = Z(/, u)a0 + $Z(/,u)Z-4T, U)[f (t) + C(t)£(Y {r))]dx, (33 5) о где a = (a„ .... a„), a° = (af, ..,a%), aj = £(;c°), s = l, . , n. Пользуясь (33 5), найдем dt = E(xs-as)* = «=£(£*./«. a)W-aJ)+J 2г„(/,т, u)2c<v(«/у-£(«//))dxY* Здесь {z,/(/.t,a)} = {Z(/,u)Z-»(T, u)}„, a cu есть элемент матрицы С, s, i=l, ., n, / = 1, ..., m Если считать, что случайные величины xj, , x% попарно независимы между собой и с величинами «/„ , ут, которые при каждом / также предполагаются взаимно независимыми, то ds = 2 *!,('. u)d?+$ J 2/„(/, <i. ^A/«i. ',)<",<«.. '=1 0 0 '=' где k,(tut%) = E{[yf(tl)-E{y,(tl))][yl(tt)-EUf,{tt))]\f *.y = (Jj*„(u, ',. 0^w)(bj;(u, /. /,)<:„«,)). s= 1, . , n, /= 1, ., m
384 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ VI Рассмотрим в фазовом пространстве случайный вектор x(*i(7"). • . *п(Т)) Будем считать, что его компоненты распределены по нормальному закону с математическими ожиданиями as и дисперсиями ds Пусть в фазовом пространстве задана некоторая область S Положим У(и) = Р{х(7-)€5}. Вероятность попадания вектора х (Т) в область S будет функционалом, значения которого зависят от управлений их, , иг Назовем управления uj, , u°r оптимальными, если они доставляют функционалу У (и) наибольшее возможное значение при условии (33 3). Рассмотрим важный случай, когда область 5 определяется неравенствами — /,<*!<£ (33 6) В случае (33 6) H")=vk\r{-~'i^dx- (337) Предположим, что оптимальное управление по отношению к функционалу (33 7) существует Естественно предположить, что для этого оптимального управления имеет место равенство г , \ 2«?(0Л=* (33 8) о '=' и что для любых управлений wt, ..., иг, удовлетворяющих ограничению т , к—б<5 S«M0<«<ft. о '=' будет У(и),>У(и), где б—некоторая положительная постоянная Тогда, каковы бы ни были допустимые управления vlt , vr, являющиеся кусочно-непрерывными функциями, заданными на [О, Т] и удовлетворяющими ограничению т , обязательно при достаточно малом е будет выполняться
§ 33] ПРОГРАММНАЯ НАСТРОЙКА КОЭФФИЦИЕНТОВ УСИЛЕНИЯ 385 неравенство J(Uo)>J(Uo + ev), (33 9) причем т г sign е = — sign } 2 v,-u]dx о i=i Следовательно, при т , J 2 vrfdt <0 (33 10) о '=' будет иметь место неравенство (33 9) при любом достаточно малом е>0 Отсюда вытекает, что функция, стоящая в правой части (33 9), при е = 0 не возрастает, но тогда должно быть dJ/de^O при е = 0. (33 11) Если левая часть (33 10) положительна, то при достаточно малом |е|, е < 0, Имеет место (33 9), следовательно, правая часть (33 9) при убывании е также не возрастает. Отсюда dJ/de^O при е = 0, (33 12) причем (33 12) имеет место в том случае, когда левая часть (33 10) положительна Положим, что т , о ы\ где <р, —некоторые функции, зависящие от и\, .... и? и от вида системы (33 1) Соотношение (33 11) имеет место всякий раз, когда выполнено условие (33 10) Предположим, например, что при этом и,°?=0, управления vt — 0, t' = 2 г, a vx=qlu\-\-w, где т «-•т . j («D» dt о Функция w будет ортогональной к u°t, следовательно, при любом выборе величины р" неравенство (33 10) будет выполнено при
386 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО BFPOHTHOCII! [ ГЛ VI Из (33 11) вытекает, что при таких р* должно быть также вы по шено условие т г т т т $ 2 <№,-Ш = J ф,у, dt = р \ (piWdt + a J и?ф,<И<0. о •=1 о о о Последнее равенство возможно лишь при г \ <pkw dt = 0 о Это показывает, что функция ф, ортогональна к любой функции, ортогональной к и\ Отсюда <$l=aiu\ почти везде Аналогично рассуждая, устанавливаем, что Ф1=а,ц?, i = 2, ...,/-, где а,, 1 = 2, .. , г,— некоторые постоянные Эти уравнения можно записать также в виде "° = Р>/. i=l, ., г, (33 14) где т $i = —r , ' = 1, ,r. (33 15) Уравнения (33 14), (33 15) представляют собой следстпня (33 10) и (33 11) и являются необходимыми условиями оптимачь- ности управлений ы°, , и°г Если для вывода необходимых условий оптимальности использовать (33 12), то вновь получаем те же соотношения (33 14), (33 15) Eon «! = 0, то ф,=0 и, следовательно, соотношения (33 14), (33 15) будут по-прежнему выполняться Условие Ф,=^0 попучается при этом из основной леммы вариационного исчисления Дадим способ приближенного построения оптимальных управлении, основанный на использовании соотношений (33 14), (33 15) Положим ы{+1=оф')Р,(и')ф/("'). i=l г, (33 16) где и1 — (и[, . , и'г) есть 1-е последовательное приближение Величина а(и') выбирается так, чтобы бьпо О «=1
§ 33) ПРОГРАММНА НАСТРОЙКА КОЭФФИЦИЕНТОВ УСИЛЕНИЯ 387 с 1едователыю, ■ / \(l"^d() I* «=1/ * рц—- . Возьмем в качестве первого приближения некоторое управление и\, ...,и\ Тогда с помощью (33 16) можно построить последовательность управлений и1, иг, .,и1. Эту последовательность предлагается рассматривать в качестве последовательности, аппроксимирующей оптимальное управление Перейдем к фактическому построению функций q>lt .. , <рг, которые входят в уравнения (33 14), (33 15) Имеем dJ = dJ dax . dj ddt de da, ' de "•" dd, ' de ' Следовательно, для отыскания функции dJ/dz необходимо найти величины dajde и ddjdz, которые получаем непосредственным вычислением T-Ee's^<r)+fSszi/<7,'T)Sc'^T>£<«'/W)dt (3317) 1=1 0 1=\ /=1 Здесь функции ги(Т), г„(Г, т) зависят от управлений ult . ,иг, где U; = u4 + tVi и производные вычисляются при е = 0. Аналогично ^Г=% гк(7\ u)3? + SS £ A(/i/(r, tt. /,))*у(^ /,)*,<«. (33 18) Матрица Z(/, u) удовлетворяет системе dZ/dt = A(t, u)Z и начальному jciobhio Z = E при / = 0 Положим de |e=o 6' тогда матрица % удовлетворяет уравнению гче через Z0 обозначено Z при е=0.
388 СИСТЕМЫ УПРАВЛЕНИЯ, ОПТИМАЛЬНЫЕ ПО ВЕРОЯТНОСТИ [ГЛ VI Матрица £ удовлетворяет начальному условию £ = 0 при t—Q, следовательно, т г 6(гн $ z0 (Т) г? (о 2 B&Z, (t)dt. (зз 19) Легко видеть, что Таким образом, вид внеинтегральных членов в выражениях (33 17) и (33 18) найден Чтобы определить вид подынтегральных членов, надо найти элементы матрицы £z<r.T)-£pz-»w+z<r)jlz-»<T). При е = 0 имеем «= I (T) Z,"1 (t)-Z, (Г) Z"» (т) | (т) Z0"» (т) = *= Z0 (Г) (Z0-1 (Г) 6(t)-Z.-4t) I (т)) Zr(T), ибо ^i!>=-ZrI(T)5(T)2.-1(t) Таким образом, ^5^ = Z0 (Г) (Zjr1 (Г) I(T)-Z^ (х) I (т))Zr» (т) (33 20) Из (33 19) и (33 20) вытекает, что выражение (33 13) для dJ/de имеет место, причем функции <pt, ..,ФГ выражаются единственным образом через элементы матриц Z, Z-1 и £, а также через вероятностные характеристики начальных условий задачи и через корреляционные функции вероятностных процессов ylt , ум § 34. К построению программного управления в случае нелинейной стохастической системы уравнений Пусть задан некоторый объект, процесс управления которым описывается системой дифференциальных уравнений dx,/dt=f,(xl, ,xH,ult .,«/„ ylt ,ym), s-1, . ,n,(34 1) где v,, , xn—фазовые координаты, ы„ .., н,—управления; f/i. . Ут — вероятностные процессы Будем считать, что движение объекта рассматривается на промежутке [0, Г] Пусть Xj(0> ••
§ 34] СЛУЧАЙ НЕЛИНЕЙНОЙ СТОХАСТИЧЕСКОЙ СИСТЕМ» 389 ., *„(/) есть стохастическое решение системы (34 1)при управлении «,=«!(/), , ur = ur(t) с начальным условием xs — x% при < = 0, s=l, ., , п Обозначим через J (u) некоторый функционал, определенный на движениях системы (34 1) Например, этим функционалом может быть вероятность попадания случайного вектора х(Т) в заданную область фазового пространства Предположим, что управления их, . , иг подчинены некоторым ограничениям Через uf, , ы? будем обозначать управление, удовлетворяющее этим ограничениям и доставляющее функционалу наибольшее возможное значение среди всех допустимых управлений Будем называть такое управление оптимальным и поставим вопрос об отыскании оптимального управления Дадим описание одного из возможных алгоритмов приближенного решения этой задачи Рассмотрим последовательность случайных величин £„ £„ ... таких, что £(&£,) ■=<> при 1Ф1, £(Ш = 1. £(£/) = 0, i»2, 3, ... Таким образом, последовательность случайных величин является ортонормированной Будем считать, что она является полной Тогда M0 = W + Jl'/H0Si. / = 1,.../п. (342) Ряды, стоящие в правой части (34 2), сходятся в среднем к значению вероятностного процесса yJy а именно £(мо-М'>-2'/.-(0 6|)-*0 "Р" к-* + <*> Подставим ряды (34 2) в систему (34 1), предварительно отбросив все члены, начиная с £А+1 Тогда система (34 1) примет вид dxjdt= gs (t, хи ..., х„, ии . , и„ llt ..., lk) (34 3) Построим при фиксированном управлении ы,, .., иг решение системы (34 3) С этой целью поступим следующим образом. Зададим последовательности реализаций случайных величин £{, U> -, li. /=1. •»' Построим решения х', /=1, ...,'. системы (34 3), соответствующие этим реализациям и следующим начальным условиям х°=х' при / = 0, / = 1,. .,/.
390 C1ICTLMM УПРАВТЕИИЯ, ОПТИМАЛЬНЫЕ ПО ВКРОЯТИОСТП [ГЛ VI Здесь считается, что начальные условия детерминированы Построим интерполяционный полином х = я(М1. .. ,У (34 4) так, чтобы было л((, И, . ,#) = *'. т е чтобы он давал решение системы (34 3) при любой реааи- зации Ц, , 1{, 1=1, . ,/ Будем рассматривать теперь вектор (34 4) как решение системы (34 3) при любых возможных реализациях величин £,, , £ft Разумеется, что (34 4) будет давать лишь приближенное значение для решений системы (34 3) при тех реализациях, которые отличны от выбранных Построим функционал J (u), исходя из (34 4) Тогда значения этого функционала будут, вообще говоря, отличаться достаточно мало от истинных значений, принимаемых на движениях системы (34 1) Будем искать оптимальное управление для этого функционала Найденное таким образом управление, вообще говоря, мало отличается от искомого, если числа k и / достаточно велики Положим, например, г У(и)=$£(х(/)-г(0)2^, (34 5) о гдег(/) — заданная детерминированная вектор функция Тогда, подставляя (34 4) в (34 5), придем к минимизации функционала т 7(u) = SM'. *'(0. ,х'(0)<*/, где х^(/)—детерминированные решения системы (34 3), соответствующие своим реализациям Таким образом, построение оптимального управления сводится к решению задачи Лагранжа Реализация этого атгорптма затруднена, в частности, тем, что в приведенном примере задача Лагранжа получается большого объема, именно, содержит nl переменных
Глава VII ПРИМЕНЕНИЕ ЦИФРОВЫХ АВТОМАТОВ В СИСТЕМАХ УПРАВЛЕНИЯ § 35. Предварительное рассмотрение общих свойств систем управления Рассмотрим некоторый управляемый объект, фазовые координаты которого (*,, , х„) и координаты отклонения рулевых органов (z„ . , zm) связаны между собой во все время движения некоторой системой уравнений dxs/dt = ft(tl,x1,..,x,„z1,..,zm), s=l,...,n (35 1) Предположим далее, что задано некоторое программное движение *, = *ip,(0. г/ = гу"'>(0, s=l, ,п, /=1, .,т (35 2) Пусть перед системой управления ставится задача стабилизации этого программного движения Решение такой задачи может быть осуществлено с помощью построения законов управления, тес помощью построения функций gj(t, xv .. ,х„, г„ ..,гт), /=1, ...,/п, (35 3) таких, что система уравнений dzJ/dt=gJ, /=1, ...,m, (35 4) рассматриваемая совместно с системой (35 1), имеет решение (35 2), которое является стабилизированным программным движением. Характерным для системы автоматического управления заданного объекта, описываемой системой (35 1), является то, что в ее регуляторе, представляемом системой (35 4), вырабатывается скорость изменения координат рулевых органов по заранее предписанным правилам Эти правила состоят в выработке значений функций gj на основе использования выходных сигналов измерителей Здесь и в дальнейшем считается, что на борту объекта, а также, возможно, и вне его имеется система измерителей, вырабатывающая сигналы, характеризующие фазовое состояние объекта и положение его рулевых органов Если рассматриваемый объект является серийным, то закон управления (35 3) рассчитывается, вообще говоря, для какого-либо стандартного образца
302 примгнеиие цифровых лшоматоп (ы vu этой серии и поэтому будет обладать несколько другим качссчюм по сравнению с расчетным при применении его к любому объ екту данной серии Может оказаться также, что закон (35 3) рассчитан для некоторых нормальных условий протекания процесса управления к потому не будет обладать требуемым каче ством при нарушении этих нормальных условий Наконец, само программное движение может зависеть, например, от не in управления, иначе говоря, программное движение, около которого стабилизируется объект, может быть заменено другим в ходе процесса Итак, закон управления (35 3) не училывает изменения характеристик объекта, изменении внешних условий протекания процесса управления и не обладает способностью перехода на стабилизацию другого программного движения, надобность в стабилизации которого может возникнуть в ходе процесса у правления Разумеется, что частично эти обстоятельства могут быть учтены в законе управления (35 3), но характерная особенность его при этом не изменяется Он по прежнему остается набором правил, служащих для вычисления на основе сигналов измерителей не которых других сигналов, которые являются входными сигналами рулевых машин Если упомянутый выше объект управляелся человеком или коллективом людей, то в результате накопленного опыта все обстоятельства, возникающие в ходе процесса, могут быть учтены Человек, управляющий объектом, имеет способность различать, какая именно из возможных ситуаций имеет место в действительности Эга способность к опознаванию вырлбаты вается на основе практического опыта посредством обхчения Таким образом, человек, управляющий объектом, вообще говоря, способен и к дальнейшему совершенствованию способносли опо знасать. Опознавание ситуаций нужно не само по себе, а для того, чтобы должным образом настроить различные устройслва, осуществляющие процесс стабилизации При этом настройка этих усфойств, вообще говоря, производится не произвольно, а по заданным или сложившимся в результате опыта правилам lliaiv. система управления (с участием человека) обладает следующими свойствами 1) ей присуща способность к опознаванию, 2) спо собность к обучению, 3) способность к настройке различных }слройств, принимающих непосредственное участие в холе процесса управления Задача построения таких систем управления, которые обладали бы перечисленными выше способностями, яв (яется одной из важнейших в современной технике Иначе говоря, возникает задача проектирования 1акнх управляющих машин, которые об ладают некоторыми особенностями, присущими живым организмам, т е стоит задача конструирования бионических управляющие машин В настоящей паве предлагается один из возможных
§ 351 опщиг свойсгв\ снстгм умрлвпошя 393 подходов к конструированию управляющих машин такого рода на основе применения цифровых автоматов План построения бионических управляющих автоматов состоит в следмощем сначала следует изучить общие подходы к решению проблемы опознавания, проблемы обучения и проблемы настройки Затем нужно сформулировать конкретные алгоритмы решения этих проблем с тем, чтобы на их основе дать алгоритмическое описание систем управления, включающих в себя такие автоматы Перейдем к реализации этой программы Изучим сначата общие подходы к решению проблемы опознавания Пусть задано некоторое пространство R, природа элементов которого безразлична, и в R заданы множества М,, , М„ и некоторое множество М Обозначим через М,- дополнение множества Mh через М,-—множество, которое совпадает либо с Mh либо с М[ Каждое вхождение множества М,- в нижеследующие формулы принимается конкретно Обозначим через л,- характеристическую функцию множества М,- х: — Х;(Р), P£R, [ 1, Р£ Mi, *' = \0, P£Mt Через X/ обозначим характеристическую функцию М,-, через л:;—характеристическую функцию М; Каждое вхождение х{ понимается конкретно Предположим, что множество таково, что M=\j(MlinMitn ПМ,к ) (35 5) В правой части (35 5) объединение берется по некоторым группам индексов (i,, , ik ), каждый из которых не превышает п Рассмотрим функцию /(*„ ... r„)= Vr,, . х,к- (35 6) В формуле (35 6) дизъюнкция распространяется на те же самые группы индексов, что и в формуле (35 5) Напомним, что xt V Xj = max(x;, xj) Поставим вопрос, принадлежит ли заданный элемент Р пространства R множеству АР Ответ на этот вопрос дается с помощью функции (35 6) Оказывается, что Р£М тогда и только тогда, когда /(*,. .*„)=! Действительно, если Р£М, то, как следует из (35 5), Р принадлежит по крайней мере очному множеству, входящему в состав
394 iiphmi пение цифровых лвюматон [ы vn объединения (35 5) Но тогда эпемент Р будет содержаться в каждом из множеств, пересечение которых образует упомянутое выше множество Следоватетьно, характеристические функции этих множеств на элементе Р равны единице Тогда соответствующее спагаемое в дизъюнкции (35 6) будет обращаться в единицу, а значит, /= 1 И наоборот, если /==1 на эпементе Р, то, как вытекает из (35 6), обязательно будет обращаться в единицу по крайней мере одно слагаемое, входящее в состав /, но это слагаемое есть произведение характеристических ф>нкцнй множеств, образующих пересечение, входящее в объединение (35 5) Следовательно, элемент Р входит в упомянутое пересечение и поэтому Р£М Это показывает, что функция (356) является характеристической функцией множества М Итак, проблема опознавания Р£М или Р£М однозначно разрешима, если с\ществует «вычислительный алгоритм», позволяющий найти значение характеристической функции / множества М Ввиду этого множества М,, , М„ выбираются так, чтобы их характеристические функции можно было сравнительно легко вычислить Пример 351 П>сть чадано m-мсриое евклидово пространство точек (01 • • Ут) Пусть в этом пространстве опредепены множества Л1/ точек, подчиненных неравенствам Ч1(Уи- • . Ут)<0, 1 = 1. .. , я Тогда I— sign ff/ sign <?, = —! при q,- < 0, sign<7, = -r- 1 при <7,5г0, Точка (У1, когда функция 1) {- ~Т~ Зпак ~ в этой формуле заменяется знаком минус, если в соответствующем месте форму ты (35 5) стоит Af,-, и заменяется знаком плюс, если стоит ЛЬ Предположим теперь, что в пространстве R задано k множеств N,, , Nk, попарно не пересекающихся П\сть элемент P£R принадлежит и Л',- Треб\ется установить, какому именно из Л',-, / = 1, , к, принадлежит Р Предположим, что можно построить множества М,, , /VI,,, образующие покрытие объединения множеств Nlt , Л'А Иначе говоря, если Р£ и Л',, то
§ 35) ОБЩИЕ СВОЙСТВА СИСТЕМ УПРАВЛЕНИЯ 395 необходимо существует по крайней мере одно натуральное число i^.n такое, что Р£М; Предположим далее, что система множеств Mt, , Мп такова, что из нее путем применения двух операций пересечения и объединения можно построить множества ;Vi0), t = l, . , k, попарно не пересекающиеся и такие, что Nl0> гэ N; Таким образом, каждое из множеств Л^0) представляется через множества Mt, , М„ формулой вида (35 5) Введем в рассмотрение функции /,, , fk, яв1яющиеся характеристическими для множеств /V'0', . , Л^0' Функция /,- имеет тот же вид, что и функция /, определяемая формулой (35 6) Представим число k в двоичной системе Пусть получившееся двоичное число имеет / разрядов Введем в рассмотрение функции <р„ , фг, определив их через /,, .. , }к следующим образом Ф, = V ft- (35 7) Дизъюнкция в формуле (35 7) распространяется на те номера i, двоичный код которых оканчивается единицей Положим Ф/= W,. / = /", . , / (35 8) Дизъюнкция в формуле (35 8) распространяется на те номера /, двоичный код которых в /-м разряде, считая справа, имеет 1 Функции ф„ , ф,, опредепенные (35 7) и (35 8), полностью позвоаяют решить проблему опознавания в данном случае, именно, если элемент Р£ U Nh то элемент тогда и только тогда при- надпежит Nf, когда ф,, ф(-и , ц>1 представляет собой /-разрядный двоичный код числа / Действительно, если P£Nf, то ff=l и /,- = 0, {ф\ Разюжпм число / в двоичный код, занумеруем разряды справа налево числами 1,2, , / Если в t'-м разряде стоит 1, то только в этом случае функция f, входит в формулу для функции ф,-, отсюда вытекает, что последовательность ф/( , ф, будет совпадать с двоичным кодом числа /, следовательно, и Фл > Ф1 будет двоичным представлением числа / в /-разрядном коде Обратно, пусть эаемент Р таков, что вычисленная на нем поспедовательность ф,, , ф, образует двоичный код некоторого числа / Тогда, так как в ф,- входит лишь одно слагаемое, отличное от нуля, то двоичный код этого слагаемого будет содержать на t'-м месте единицу тогда и только тогда, когда ф,-= 1 Стедоватечьно, номер слагаемого, входящего в ф,-, i=\, , /, обращающегося в единицу, имеет двоичный код, совпадающий
396 применение цифровых Автоматов [гл vii с двоичным кодом числа /, счедовательно, P£Nf Итак, общий алгоритм опознавания может быть описан следующим образом Исходя из некоторых известных множеств, образующих покрытие объединения заданных множеств, строится непересекающееся множество, охватывающее заданные, затем вычисляются характеристические функции построенных множеств f,, .. , fk, на основе их строятся функции <р„. . , <р,, которые и дают ответ на вопрос, какому из множеств N/ принадлежит Р, если Р£ (J N,- Пример 35 2 Пусть R— множество всех вершин т мерного единичного куба, следовательно, R есть множество точек (у,, , ут), у,- принимает два значения 0 ичн 1 Пусть в R зааано к множеств Nu , N/,, попарно не пересекающихся между собой Треб>ется построить алгоритм опознавания Именно, если P£R и Я£ Q Л/f. то треб\ется установить, какому конкретно множеству принадлежит этемент Р Этот атгоритм будем строить указанным выше способом, именно, будем строить множества /V/0), попарно непересекаю щисся и включающие множества N/ Построение покрывающих множеств можно осуществить различными способами Изложим некоторые из них 1 Возьмем в качестве множеств М/, «' = 1, я, совокупность сфер размерности m таких, что с их помощью можно построить множества Л'}0>, i = l, , k, применяя операции пересечения и объединения такие, что yV/gyV/0' Тогда вопрос о принадлежности точки Р множеству Л// при уело вии Р£ U /V/ разрешается однозначно с помощью функций ср,, , <ft Эти функции строятся, как и выше, с помощью характеристических функций множеств М„ , М„ Отсюда вытекает, что дтя вычисления <р,, , <р, в каж дой точке Р необходимо иметь в памяти вычислительного устройства /i(m+l) чисел, которые дают центры сфер Лт, М„ и их радиусы Заметим, что центры и радиусы сфер Mt можно выбирать различными способами иа основе каких либо геометрических или статист и icckhx соображений Очевидно, также, что /И,, , М„ всегда можно выбрать так, чтобы Njm было точным покрытием .V/ 2 В качестве множеств Л-f,, , М„ можно взять совок\пность полупространств 1^,4 „,•«>, /=!, .я С помощью объединения и пересечения этих полупространств можно получить множества N\m i=l, , k, попарно непересекающиеся и такие, что iViCA'l*1 Тогда проблема опознавания решается с помощью фмжций Ф,, , Ц[, которые строятся те\1 же способом, что и ранее, с помощью характеристических функций этих полупространств Для вычистения функций ц,. ф, необходимо в память вычиоительного \стройства ввести л(т+1) чисел, так как плоскость, ограничивающая полупространство определяется m-rl числами Разумеется, эти пол\пространства можно выбрать так что множества Л''01 б}Д}т точным покрытием N,-, т е не б>д>т содержать дру- 1их вершин т мерного к^ба, не входящих в множество N,■ Существенная часть задачи опознавания в рассматриваемом примере состоит в построении таких покрытий, для которых чисто я б\дет наименьшим
§ 35] ОБЩИЕ СВОЙСТВ\ СИСТЕМ УПРАВЛЕНИЯ 397 Перейдем теперь к рассмотрению проблемы обучения Пусть 8адано вновь пространство R, природа элементов которого без- раз шчна Рассмотрим систему множеств /V,,. . , Nk попарно не пересекающихся между собой, NiCR Рассмотрим далее систему множеств М\а) с N,-, t = l, , k Пусть известно, что Р£ UNt Требуется определить, какому из множеств Ny принадлежит Р, исходя из возможности непосредственного сравнения элемента Р с элементами множеств М\°\ i — 1, ... , k При этом предполагается, что указаны некоторые правила сравнения элементов между собой Множества М\т можно рассматривать как результат накопленного опыта Итак, поставленная задача состоит в том, чтобы на основе накопленного ранее опыта цать ответ, какому из множеств N; принадлежит элемент Р При этом существенное значение имеют правила, по которым происходит сравнение элемента Р с элементами, составляющими накопленный ранее опыт Эти правила можно формулировать разными способами Примем, в частности, следующий подход к их построению В множестве R выберем систему множеств Mh i=\, , н, таких, что а) множества Mt покрывают множество U Nh б) с по- i=\ мощью объединения и пересечения множеств, входящих в систему Mlt. , Мп, можно построить множества Л^0) такие, что N?' попарно не пересекаются и N1/0 содержат М\"\ i=\, , k Пусть Xi есть характеристическая функция множества М; Тогда можно построить характеристические функции /,, , fk множеств iV',0', , N'p С помощью этих функций можно построить функции ф,, , tpi и сформулировать следующее правило P£Ni тогда и только тогда, когда последовательность ф,, Ф,_,, , ф, дает представление числа / в двоичной системе счисления Разумеется, что в этом случае точка Р принадлежит фактически Л/'/', и поэтому утверждение «Р^УУу» ф1ктически может оказаться несправедливым Однако принятое правию оставляет в стороне эту возможность Процесс построения функций ф,, . , ф, называется процессом обучения Будем говорить, что какая-либо система обучена, если такие функции построены Приведенное построение представляет собой одноступенчатое обучение Рассмотрим некоторое усложнение алгоритма Множества N't" включают в себя М\"\ поэтому могут существовать такие точки Р, для которых <Р; -0, i-=l, , I, Р€ U-V,. Ее пи появляется для некоторой точки Р нулевой сигнал Ф,- = 0, 1=1, , /, то отыскиваются новые множества из системы Л1,, , Л1„,
398 применение цифровых Автоматов (гл vii образующие множества #}", /=1, .., k,с помощью объединений и пересечений, N}0)с: N\1} Для множеств N}" строим характеристические функции ф}1' Если окажется, что Ф^'=0, t = l, ... /, то проиесс продолжаем дальше Если же последовательность ф}п.'« . Ф/". вычисленная для точки Р, дает двоичный код числа /, то P£Nj Рассмотрим несколько подробнее принятое выше усложнение алгоритма обучения Если при каком-либо Я оказывается Ф* = 0, t = l, ..., /, то это означает, что точка Р не попадает ни в одно к из множеств N[0> Вместе с тем Р £ U Nh следовательно, некоторые подмножества множеств Nt не покрываются множествами N1?1. Дальнейшее обучение сводится к расширению покрывающих множеств Так как число множеств Mh i = 1, .. , п, конечно, то в результате применения операций пересечения и объединения из них можно образовать не более чем 2гп различных множеств. Если среди этих множеств существуют множества N't,i = \, .. ,,k, такие, что N't попарно не пересекаются, N{cNi и, кроме того, пространство R состоит из конечного числа точек, то для полного обучения потребуется конечное число операций, связанных с построением характеристических функций ф„ ., ф, Если же множество R бесконечно, то найдется для любой последовательности Р„ Рг, . , PS£R число п0 такое, что усовершенствование алгоритма обучения производится не более п0 раз, иначе говоря, процесс обучения заканчивается на конечном шаге Если система обучена, то это еще не значит, что она дает каждый раз достоверный ответ, ибо из MfciV',1" еще не следует, что P£Nh если P€N?} Если же множества Mh i=\, ..., п, обладают некоторыми специальными свойствами, то может оказаться, что из Р £ N(is> будет вытекать Р G W,- и тем самым обученная система будет давать достоверный ответ Этот случай имеет, например, место тогда, когда каждое из множеств, входящее в систему Mlt . , М„, может пересекаться не более чем с одним из множеств N, Nk Перейдем теперь к рассмотрению вероятностного подхода Предположим, что в R заданы вероятностная мера и события М1г ., М„, Nt, .. ,Nk имеют определенную вероятность Примем «, № U N.\ "' _ Р (Ni) ' « Я/ и ЫЛ ' Здесь через P(N) обозначается вероятность события N. Если усложненный алгоритм обучения на s-м шаге дает ответ P£Nt,
§ 35] ОБЩИЕ СВОЙСТВА СИСТЕМ УПРАВЛЕНИЯ 899 то величина я'," называется вероятностью правильности этого ответа, величина ^"'—вероятностью неправильности ответа Усовершенствование обучения можно производить таким образом, чтобы я}" возрастало, a q\S) убывало при возрастании s Если события М„, .... М„ таковы, что в результате применения к ним операций объединения и пересечения можно получить события s„ .... sk, которые попарно независимы и с вероятностью 1 совпадают с Nu , Nk, то на конечном шаге можно получить ответ, правильный с вероятностью 1 и неправильный с вероятностью 0 для любого Р £ U /V,- Заметим, что в практических приложениях множества Nh t = l, .. , k, не задаются, задаются лишь множества Mf\ t = l, . , k, и требуется пространство R разбить на попарно не пересекающиеся множества N1? так, чтобы MpczN*** Это разбиение можно осуществлять с помощью некоторых стандартных множеств Мх, ..., Мп, покрывающих R путем применения операций объединения и пересечения Пример 35 3 Пусть R — совокупность вершин m-мерного единичного куба Пусть заданы множества УИ'Р>, i=I, , А, попарно не пересекающиеся между собой Произведем произвольное разбиение пространства Rnak попарно не пересекающихся множеств Nlt , Nk, П#/=Я. Ny»<zM,- Это разбиение можно осуществить, например, с помощью набора множеств Мх, .. , Мп — вершин этого куба, располагающихся в полупространствах |>/»У,+ */«>, '-1. •• .« Процесс разбиения пространства R на Л/„ , Nk и есть процесс обучения Результатом обучения является построение функций ф1( , ф, таких, что ф,- есть характеристическая функция множества Л/; и <»„ , yt строятся с помощью характеристических функций множества /И,- Остановимся теперь на проблеме настройки Пусть заданы два пространства R и S, природа элементов которых безразлична В пространстве R заданы k попарно не пересекающихся множеств Nu ..., Nk и задана функция s(P, Q), P£R, Q£S, s(P, Q)£S Функция s имеет постоянное значение при Р £ Nlt i = 1, ..., k и определяет правило настройки, если система находилась в состоянии Q и на входе опознающей системы появился сигнал, то с помощью функций ф1( . ., ц>1 устанавливается, какому из множеств Л^, , Nk принадлежит Р Если P£N,, то система переходит в состояние s{P, Q) При сигнале Р и состоянии Q на рулевые машины попадает входной сигнал Я,(Я, Q) Таким образом, процесс настройки состоит в изменении внутреннего состояния системы управления и в изменении входного сигнала, поступающего на рулевые машины Дадим теперь общее описание функционирования системы управ!ения Управ1яемый объект имеет некоторую совокупность
400 riiMiMKiirniii tuwoiiux \»гомаюв [i л vu измерительных устройств и некоторою совокупность нсполншель- пых устройств, называемых рулевыми машинами На выходных поносах измерительных устройств возникают некоторые сигналы Они попадают на входные полюсы опознающей системы Опознающая система устанавливает характер сигнала, в результате чего включается система настройки и подается сигнал настройки на устройство памяти и далее управляющий сигнал на входные попюсы рулевых машин Указанный процесс управпения можем быть осуществтен с помощью конечного автомата В следующем параграфе аается описание таких автоматов § 36. Управляющие автоматы и их структурная конструкция В настоящей главе рассматривается по существу, некоторое усовершенствование математической модели управляемого движения В качестве основного элемента системы управления при этом выбирается конечный автомат, в связи с чем возникав! необходимость дать описание структурной конструкции таких автоматов Это описание будет в особенности необходимо для построения полной структурной схемы упомянутой математической модели Конечный автомат служит для переработки входной информации в некоторую выходную информацию Как входная, так и выходная информации представляются в виде конечных посаедовательностей некоторых сигналов, являющихся элементами конечных множеств сигналов такого рода Эти множества называются входным и выходным алфавитом автомата Итак, пусть заданы три конечных множества X, Y, С, природа элементов которых безразлична Зададим две функции функцию переходов авгочита 8(Х, С) и функцию выходов К(Х, С) Будем считать, что эти функции обладают следующими свойствами 1) &(Х, С) и Х(Х, С) определены при X£Х, С6С, 2) значения функции б(Х, С) лежат в множестве С, значения функции К(Х, С)£\ Определение 36 1 Будем говорить, что задан конечный автомат А с множеством внутренних состояний С, с входным алфавитом X м выходным алфавитом Y, если 1) заданы две функции Ь(Х, С) и Х{Х, С), обладающие указанными ранее свойствами, 2)dw каждой конечной последовательности э чементов(Х,, ,XS) определена единственная последовательность (Ylt , Ys) элементов множества Y с помощью формул Y^XiXt, Со), /, = *.(*,. С,), , Yt = \(X„ С,-,), С.-б^, Со), Са = б(Х2, Ct), , Cs.l = 8(Xs.l,Cs-i). при этом состояние С„ автомата А называется начачьным состоянием.
§ 36] УПРАВЛЯЮЩИЕ АВТОМАТЫ 401 Функции б и А. естественно представить с помощью таблиц Л и Л с двумя входами Строки этих таблиц обозначим точками множества X, столбцы—точками множества С В пересечении строки X и столбца С в таблице Д будет стоять состояние автомата 6(Х, С) В пересечении строки X и столбца С в таблице Л будет стоять выходной сигнал К(Х, C)£Y Физически изобразить работу автомата можно следующим образом Автомат ставится в начальное состояние С0, на вход его поступает сигнал Хх, автомат переходит в состояние Су= = б (Х„ С0), а на выходе появляется выходной сигнал Y1=X (Xt, С0), сигнал X, переводит автомат в состояние С2 = б(Х2, С,), а на выходе появляется сигнал Уг=Х(Хг, С,) и т д Под входом автомата А будем понимать либо первый аргумент функции Ь(Х, С), либо первый вход таблицы Д Под выходом автомата А будем понимать выход таблицы Л или значение функции Х(Х,С) Определение 36 2 Будем говорить, что задан оператор разветвления входа автомата, если задана функция ц> нескольких аргументов, причем значениями этих аргументов являются элементы X и любое значение ц>—также элемент X Аналогично будем говорить, что задан оператор соединения выходов, если задана функция г|э нескольких аргументов со значениями аргументов из Y и значениями функции из Y Если задан конечный автомат А с входным алфавитом X, выходным алфавитом Y, множеством состояний С с помощью функций б и X и если задана функция k аргументов <р, явля ющаяся оператором разветвления входов, то функции бх = б {ф, С), Я,, = А.(ф, С) будут функциями перехода и выхода для конечного автомата В с множеством внутренних состояний С, выходным алфавитом Y и входным алфавитом Хк, где Xft—декартово про изведение k экземпляров множества X, иначе говоря, \k — множество всех слов в алфавите X длиной k Пусть задано теперь несколько автоматов А,, , Ар a,= a,-(x, y, с;> б,-, а.,., с;.°>) Последняя формула означает, что для этих автоматов задан единый входной алфавит X и единый выходной алфавит Y Множество состояний автомата А,- есть С,, функция переходов —б,, функция выходов—л,-, начальное состояние—С',0> Пусть задан оператор соединения выходов i|) как функция р аргументов со значениями в Y Тогда функция переходов 6 = (6j (X, С„), 62(Х, С,), , Ьр(Х, Ср)), и функция л = г|>(л,(Х. С,), Хр{Х, Ср)) будут функцией переходов и функцией входов автомата В с входным алфавитом X, множеством состояний С и выходным алфавитом Y, где С = С,х хС,—декартовы произведения пространств Начальным состоянием автомата В будет С«» = (С«>\ , С<°')
402 применение цифровых Автоматов [гл V» Определение 36 3 Конечный автомат А с входным алфавитом Х„, множеством состояний С = С,х хСр и с выходным алфавитом Y„ называется композицией автоматов А, А_, где А, = А,.(Х, Y, С,-, б,-, X,, С)0»), если 1) задано р операторов разветвления входов от п аргументов и т операторов соединения выходов от р аргументов q>, <р , *,. . +- 2) функция переходов автомата А определяется формулой 6(Х, С) = (б1(Ф1(Х), С,), .. , 6,(<р,(Х), С,)), функция выходов автомата к(Х, С) определяется формулой Я (X, С) = (Ч», (X, (ф, (X), С,), К2 (ф2 (X), С,), . . ., Х,(ф,(Х), Ср)), . , iMM<P.W, С,), . ., Я,(ф,(Х). С,))), где? Х = (Х,, . , Хп)—элемент Х„, С = (С,, , С „)—элемент С, С^' = (С{°\ . , С£0))—начальное состояние автомата А Порядок функционирования автомата А определяется естественным образом Любой последовательности g„ , £,, поступающей на вход автомата А, будет отвечать последовательность т)„ .. , i)s на выходе, причем эта последовательность определяется формулами !!, = *&. С.), Y, = «(£,. • . С.), n. = MS,. Y.). • • . Yi-i = *(6»-i. Y*-i). 4, = Y(E». Y,-i). Здесь 1,£ХЯ, 4,€Y., Y,€C Дадим теперь некоторое физическое истолкование понятия композиции автоматов Пусть задан некоторый набор физических объектов />,, . , рп и <7j, <72, > Чт> называемых входными и выходными полюсами Автоматы А,, , \р подвергнем операции разветвления входов с помощью операторов ф,, .. , <рр Возникшие п входов автомата соединим некоторыми входными каналами с полюсами plt , pn в том порядке, как это предписывается упорядоченностью последовательности X = (хх, , х„) £ Х„, i = l, , p Выходы автоматов А, подвергнем операции соединения выходов с помощью операторов ф,, . , г|>„ Возникшие при этом т выходов автомата А,- соединим некоторыми выходными канааами с полюсами qlt , qm Полученная при этом схема называется структурной схемой автомата А, представленного композицией автоматов \lt , Кр Все конечные автоматы разделяются на две группы К первой относятся те автоматы, которые имеют единственное состояние Это так называемые автоматы без памяти, или логические элементы Ко второй группе относятся автоматы, содержащие более одного внутреннего состояния Такие автоматы называют автоматами с памятью или запоминающими элементами Оказывается,
t) 36) УПРАВЛЯЮЩИЕ АВТОМАТЫ 403 что посредством композиции простейших логических элементов можно построить автомат, эквивалентный любому заданному автомату без памяти Если же к этим простейшим логическим элементам добавить простейший запоминающий элемент, то с помощью композиции можно получить автомат, эквивалентный любому заданному автомату с памятью Проиллюстрируем эти утверждения на примерах Пример 36 1 Пусть входной алфавит X состоит из двух чисел 0, 1; выходной алфавит Y—также из двух чисел 0, 1 Зададим два логических элемента Alt Аг Пусть функция выходов Л^есть At (Х)=Х и А2 есть А2(Х) = = Х, где черта означает отрицание, т е Х = 0 при Х=\ и X = 1 при Х = 0 Для любого логического элемента А с входным алфавитом Х„ и выходным алфавитом \т, заданного функциями выходов Y,= M*i. . x„), i=\, .. т, можно построить автомат А', являющийся композицией нескотьких экземпляров А|, А4 Он будет эквивалентен автомату А, т е будет описываться функциями выходов Yi = \Uxi, ,*„). i=l. ,m, причем 7ц = К1 при любом Х£Х„ Действительно, пусть (о,, , а„)—точка пространства Х„, гдеА! = 1. Возьмем несколько экземпляров автоматов А) и А2 Произведем у них разветвление выходов с помощью функций «p/JX) = x,- Тогда получим набор автоматов с выходными функциями или х/ и х,- Соединим выходы тех из них, которые могут быть записаны в виде последовательностей х^1\ лс(8а,), .. , jfj,""* при помощи операции Здесь х\ "=х/ при а,= 1 и х\ " = х/ при а,=0 Все полученные таким образом автоматы соединяем с помощью операции соединения выходов В результате этого получится функция *>!. . *„)=v*<<4 . 4°«> Дизъюнкция берется по всем наборам (<xt, , о„), для которых функция At обращается в единицу Таким образом, функция А, построена в результате применения операции разветвления входов к автоматам А„ А2 и суперпозиции двух операций соединения выходов Легко видеть, что суперпозиция операторов соединения выходов снова дает оператор соединения выходов Действуя тем же способом построим функции AJ, , Ат Покажем, что определяемый ими логический элемент А' "эквивалентен А Очевидно, что если Я, (а!, , а„)=1, то К[ (а„ , о„) = 1 Докажем обратное если X.J(P,, , Р„)=1, то А, (Р,, , Р„)=1 Если Aj =■ 1, то существует по крайней мере одно слагаемое вида Р^"1', pij*''. , Р„л> . обращающееся в 1 Ясно, что непременно должно быть Р, = а,- Следовательно, точка fft ft \ ппичтппржчт множеству тех точек ппогтаиства Х_ где
404 npiiMEHEHHF цифровых Автоматов [гл vu § 37 Алгоритмическое описание усовершенствованной модели движения Алгоритмическое описание усовершенствованной модели движения сводится к описанию тех алгоритмов, которые реализуются в системе управления конечным автоматом Остановимся сначала на алгоритмическом описании автомата непрерывной стабилизации Пусть уравнение движения объекта имеет вид dX/d/ = f(X, Z, /) (37 1) Пусть также Х^,, Zp — программное движение Положим X — X,= Y. Z — Z,= U (372) Тогда (37 1) примет вид d\/dt^A\ + BU+G(t, Y, U). (37 3) Пусть А и В — вещественные постоянные матрицы Тогда можно указать такое неособое линейное преобразование над искомыми функциями в системе (37 3), что в преобразованной системе матрица коэффициентов при линейных членах будет иметь вид С; :> (37 4) где А + —квадратная матрица порядка k, все собственные числа которой имеют неотрицательные вещественные части, А. — квадратная матрица порядка п — к, все собственные числа которой имеют отрицательные вещественные части Будем считать, что такое пинейное преобразование уже произведено, и матрица коэффициентов членов, линейных относительно yt, , уп имеет вид (37 4) Основным вопросом при решении задач стабилизации является вопрос о том, какой необходимый минимум величин следует измерять, чтобы с помощью их стабилизировать программное движение Если мы имеем дело с движением какого-либо тела или системы тел, то задача стабилизации сводится к стабилизации движения центра масс относительно опорной траектории и стабитизации движения тела и системы тел относительно центра масс Если задача стабилизации разрешима, то для решения ее достаточно, чтобы на выходных полюсах измерителей появлялись сигналы g|t , gk, являющиеся непрерывно дифференцируемыми функциями фазовых координат системы и такие, что якобиан D(y„ . Ы^ ' где (уи ..., ук) — первые k компонент вектора Y в системе (37 3)
§ 37] Л1Г0РИТМИЧЕСК.0Е ОПИСАНИИ МОДВЛИ ДННЖКНИН 405 Таким образом, первой исходной частью алгоритма является получение величин gt, , gk в том или ином виде Пус^ь в фазовом пространстве (*,, . , х„) задано некоторое множество Л/(О Пусть величины й„ . , hm характеризуют взаимное расположение управляемого объекта и множества М (t) На основе сигналов Л,, , hm могут вырабатываться по некоторым правилам те программные движения, которые нужно в действительности стабилизировать в ходе процесса управления Таким образом, второй составной исходной частью алгоритма является выработка вели чин /i,, , hm Правила выработки по этим величинам программных движений в различных задачах могут иметь различный вид Здесь будем считать, что они заданы и составляют третью исходную часть алгоритма Примем, что закон стабилизации, используемый в непрерывном регуляторе прямого или непрямого действия, аналитически представим линейной комбинацией где с,,. , ^ — коэффициенты усиления Коэффициенты усиления зависят, вообще говоря, от элементов матриц А и В и программного движения Будем считать, что эта зависимость в достаточной степени изучена и является известной Зависимость коэффициентов усиления от упомянутых выше факторов может быть установлена с помощью некоторых характеристик, получаемых на основе использования glt , gk, Л,, , hm Возможное множество значений этих характеристик обозначим через R Ра зобьем R на множества Nh »'=^1, , kx попарно не пересекающиеся между собой Обозначим через С множество состояний конечного автомата Каждое состояние будем представтять в виде (С, Р), где С — символ коэффициентов стабилизации, Р — символ программного движения Пара (g, h) образует входные сигналы автомата Зададим функцию его переходов С, = 6,(£, А, С, Р), Pi = &t(g.h. С, Р) При этом считается, что каждый выходной сигнал (g, h) представ тяется множеством N/ с тем или иным номером i и, наоборот, каждое множество представляется каким либо сигналом (g, h), содержащимся в нем Функция выходов k — X(g, h, С, Р) представ тяет собой выходной сигнал, поступающий на входные полюсы рулевых машин Разбиение пространства /?= U Л',- производится с помощью некоторого алгоритма обучения Из описанного
406 применение цифровых Автоматов [гл vn выше алгоритма управления вытекает, что рель конечного автомата в системе непрерывной стабилизации сводится к настройке коэффициентов усиления в ходе регулирования и к управлению программным движением объекта Если величины glt . , gh, /t,, , hm появляются на выходных полюсах измерителей с некоторым шагом дискретности и с некоторым запаздыванием, то с помощью арифметического устройства можно сформировать дискретный закон управления Если присоединить подобное ариф метнческое устройство к рассмотренному выше автомату, то по лучится автомат дискретной стабилизации, который настраивает коэффициенты усиления, управляет программным движением и вычисляет с некоторым шагом дискретности управляющий сигнал, поступающий на входные полюсы рулевых машин Другим возможным классом управляющих автоматов являются автоматы релейной стабилизации Предположим, что управляющий сигнал U может принимать лишь £/ = ±1 Это обстоятельство имеет место в тех системах, в которых для стабилизации используется, например, момент, возникающий от управляющего электродвигателя Можно поставить задачу о выборе моментов переключения и таким образом, чтоб л стабилизировать программное движение оптимальным по быстродействию способом т е так, чтобы движение Y(/) переходило при / = 0 из точки Y0 в точку Y = 0 за кратчайшее время Все пространство у,, , уп, или, веонее, некоторая окрестность точки Y = 0, разбивается на два множества S_ и S+ При YgS_ U = — 1, при Y £ S+ U = + I Построение таких множеств в общем случае затруднительно, поэтому можно поступить так Следует взять некоторые мно>> ества S™' и S'+", о которых заведомо из вестно, что S'_0)c:5_, S^czS* Множество строим по S^ и S^ с помощью некоторого алгоритма обученмл В результате этого возникает поверхность перек лючения 5 Эта поверхность может зависеть от элементов матриц А, В и от программного движения В авто мате непрерывной стабилизации состояние С следует за.ленпть на S, где S символизирует поверхность переключения Тогда возникает конечный автомат релейной стабилизации, который решает задачу управления программным движением и задачу настройки поверхности переключения Математический аппарат служащий дтя описания усовершенствованной модели движения, оспов..шлется, таким образом, на дифференциальных уравнениях и теории конечных автоматов, описывающих алгоритмы управления Для решения вопросов анализа и синтеза таких систем управления целесообразно в связи с этим применять цифровые и аналоговые вычислитеты'ые устрол ства с использованием выходных сигналов реальной аппаратуры, которая можел, вообще говоря, полключаться в елипып конт\р с аналоговыми и цифровыми вычислительными устройствами
§ 38] УПРАВЛЕНИИ АВЮМАЮМ РИЛЕЙНОЙ С1АЬИЛШ\ЦШ1 407 § 38. Исследование поведения объекта, управляемого автоматом релейной стабилизации Предпотожим, что управляемый объект описывается системой (37 1) и что X,,, Z^ecTb его программное движение Предположим также, что в системе (37 3) матрицы А и В вещественны и постоянны, причем А — квадратная п кп, В — прямоугольная с п строками и г стотбцами Векторы В,, , , Вг, образующие столбцы матрицы В, линейно независимы Пусть управления и1, . , мг могу г принимать лишь два значения +1, —1 Изучим поведение интегральных кривых систем уравнений, образующих линейное приближение для системы (37 3) \ = A\ + BV (38 1) Предположим, что система (38 1) такова, что при управлении U = CY (38 2) нулевое решение Y = 0 будет асимптотически устойчивым, где С—матрица порядка гхп, выбранная надлежащим образом Необходимые и достаточные условия существования такой матрицы С установлены в гл IV Введем в рассмотрение квадратичную форму V, являющуюся решением уравнения "• 6V . где MY | BCVf—s я компонента вектора, стоящего в скобках. Введем в рассмотрение линейные функции X!£-MY i ВСЧУ =-%уЪ (38 3) компон >ение ли <*-=£!£*"• /=i- -r <з84> Определим с помощью функций (38 4) релейные управления, для чего положим и,-ф(<т,.), 1=1, . , г, (38 5) где ((. — функция одного аргумента с петлей гистерезиса | + 1 при а < /, ^=1-1 при а>-1 <386> Величина /является достаточно малой положительной постоянной При управлении (38 5) движение в системе (38 1) опредепяется следующим образом ести начачьная точка Yl0) находится в области однозначности правых частей, то решение определяется обычным образом, если же она находится в области многозначности, то указывается, какое именно значение правых частей
408 ПРИМЕНЕНИЕ ЦИФРОВЫХ АВТОМАТОВ [f VI имеется в виду При переходе через плоскости с, = ±/ смена значений правых частей происходит естественным образом Следовательно, в об тает и многозначности через каждою точку проходит столько интегральных кривых, сколько значений правая часть имеет в этой точке Это описательное определение решении системы (38 1) при управлении (38 5) позволяет единственным образом строить интегральные кривые при t^O Теорема 38 1 Если все собственные числа (А -г ВС) имеют отрицатечьные действительные части, то при достаточно малой I любая интеграгьная кривая cut тема (38 1) с управлением (38 5) стремится к стабигьноиу колебанию при возрастании времени Это стабильное колебание расположено в сколь угодно малой окрестности точки У = 0, если t ^ 0 достаточно мало Доказательство этой теоремы содержится в гл IV Там же указывается, какие именно интегральные кривые стремятся к стабильному колебанию Напомним, что в общем случае таким свойством обладают лишь интегральные кривые, начинающиеся в некоторой фиксированной окрестности точки У = 0 Предположим, что матрицы А и В изменяются, точнее говоря, будем считать, что их элементы являются функциями некоторой совокупности параметров ос,, , ап П\сть эти параметры могут принимать значения из области S п мерного пространства Область S можно всегда разбить на попарно не пересекающиеся множества Slt , Sk таким образом, что будут выполнены следующие условия 1) (J S,—S, 2) схщесгв^ют матрицы С,, ,Ск такие, что матрицы А -\- БС, имеют собственные числа лишь с отрицательными вещественными частями при а,, . , ат£5,, i = l, , k Линейные формы а,, , аг, отвечающие матрице С,-, обозначим через о,"', , о'," Управления (38 5) обозначим соответственно через и['\ , u'r'\ t = l, 2, , к Из приведенной выше теоремы вытекает, что система (38 1) при управлении "НфЮ. /=-1, • , '. (387) б>дст иметь стабильные колебания, во всяком случае для всех тех с.,, ,ат, которые попадают в множества S,- Так как наличие стнЗнльного колебания означает стабилизацию програм мною движения, то управление (38 7) будет стабилизировать программчое движение в исходной системе Предположим теперь, что параметры с.,, , ат могут меняться в холе движения или чго их численные значения неизвестны То!да неизвестно, какое именно из к управлений (38 7) будет стабилизировать программное движение Для того чтобы решить задачу выбора стабилизирующего управления, поступим следующим образом П}сть на выходах измерительных хстройств возни-
§ 38] УПРАВЛЕНИЕ АВТОМАТОМ РЕЛЕЙНОЙ СТАБИЛИЗАЦИИ 409 кают сигналы ^(j/l . ., у„, t) gp(yt, ■ , Уп< 0 Положим в системе (38 1) и,~и\, t = l, . , г (38 8) Если параметры а,, . , ат находятся во множестве S/t то выходные сигналы измерителей, снятые в моменты tlt . , tq, заполняют некоторое множество М/ /^/-мерного пространства Пусть М=- U М, Построим систему опознавания и проведем ее обучение каким- либо указанным ранее образом В результате этого построения возникнет / функций ф1( , q>, Эти функции будут зависеть от а,, , ат таким образом, что alt . , am£S,-, когда последовательность ф„ ф,_я <р, представляет собой двоичный код числа I Функции <pj, .. , <pt позволяют выбирать из управлений (38 7) именно то, которое будет стабилизировать программное движение Тем самым построенная логическая схема будет осуществлять настройку автомата стабилизации, если представить себе, что входными сигналами этого автомата являются величины Ф,, . , ф,, выходными сигналами —величины (38 5), а внутренними состояниями — коэффициенты линейных форм of, / = 1, . , г, (= 1, , к (считаем, что эти коэффициенты вычисляются лишь для конкретных точек множеств S,, , Sk) Таким образом, эти коэффициенты представляются числами Начальным состоянием автомата является состояние, описываемое коэффициентами форм о), / = 1, , г Если установить естественную нумерацию внутренних состояний числами 1, 2, . , к, то из начального состояния автомат переходит в состояние i, если на его вход поступил сигнал ф,, , ф, такой, что ф,, Ф,.,, .. , Ф1 является двоичным кодом числа i Переход из этого состояния в начальное осуществляется лишь в том случае, когда нарушаются некоторые условия стабилизации программного движения Ветчины glt , gp, являющиеся выходными сигналами измерительных устройств, можно полхчать также с помощью специально предназначенных для этого цифровых автоматов Эти цифровые автоматы можно объединить с рассмотренным выше автоматом стабилизации с помощью операции комнозиции, в результате чего возникает самонастраивающийся автомат релейной стабитизации Среди цифровых автоматов, служащих для поту- чения величин glt . , gp, наиболее простыми являются навигационные цифровые автоматы В следующем параграфе дается краткое описание алгоритмов, которые лежат в основе их кон- стр>кций.
Глава VIII УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА, ВРАЩАЮЩЕГОСЯ ВОКРУГ НЕПОДВИЖНОЙ ТОЧКИ § 39. Ориентация заданного направления Предположим, что задано твердое тело Т0, имеющее неподвижную точку О, расположенную в его центре инерции Предположим, что с телом Т0 связаны оси Охуг, которые являются главными центральными осями этого тела Обозначим через 0|т)£ абсолютную систему координат, которую будем считать, как и систему Охуг, правой! декартовой Пусть далее заданы два орта sn и г0, причем орт s0 занимает неизменное положение в системе 0£ti£, а орт г0 занимает неизменное положение в системе Охуг Задача ориентации твердого тела Т0 в заданном направлении s0 состоит в отыскании такого управляющего момента М, который будучи приложенным к телу Т0, стабилизирует орт г0 в направлении s0 Уравнение_вращательного движения твердого тела под действием момента М будет иметь вид 6<в + шх6а> = М, (39 1) или, в скалярной форме, Ар + (С—B)qr = Mx, Bq + (A — C)pr = Mu, (39 2) Cr+(B—A)pq = Mit где <w—угловая скорость твердого тела Т0, р, q, r —проекции этой угловой скорости на оси системы Охуг, А, В, С—главные центральные моменты инерции тела Т0, М —главный момент сил, действующих на это тело, Мх, Му, М2—его проекции на оси связанной системы, в—тензор инерции _ _ Обозначим через s;, г, (» = 1, 2,_3) проекции векторов s0, r„ на оси системы Охуг Тогда вектор s0 _вращается по отношению к системе Охуг с угловой скоростью—<а. Следовательно, ^ = _йхГ0, (39 3)
§ 39] ОРИЕНТАЦИЯ ЗАДАННОГО НАПРАВЛЕНИЯ 411 откуда si = V—S»Q> St^SzP — ss, (39 4) s3 = sx</ — sj) Система (39.4) имеет первый интеграл 2s?=const Так как рассматривается только проблема ориентации тела в заданном направлении, то интерес представляет частный интеграл Ss?=l. (39 5) Рассмотрим движение твердого тела Т0 под действием момента М == ц (<й, r0, s0) + s0 х grad U (s0, г0), (39 6) где ц—некоторый момент, U — некоторая силовая функция, от которой берется градиент по компонентам вектора s0 _ Умножив обе части системы (39 1) скалярно на вектор <а, получим ±ZiJ(Ap, + Bqt + Cr*)~pVLx + (mll + rVL,+ »(i,XgradU) (39 7) Здесь \ix, цу, \lz—проекции момента |i на оси Охуг. Вычислим величину ©(sexgrad£/)=grad£/(<oxs0) = — gradUTn=— 0. Положим V = -L(Ap* + Bq* + Cr*) + U. Тогда из соотношения (39 7) имеем V = W, (39 8) где W = p\ix + qiiv + r\ig Таким образом, при управляющем моменте (39 6) любое вращательное движение Т0 подчиняется условию (39 8) Положим теперь для определенности в формуле (39 6) ц = —о> и £/=i(i0-F0)«=4ll(s<-'<)2; (399> Id
412 УНРАВЛ1 HUE ДВИЖЕНИЕМ ТВЕРДОГО ТГЛА системы (39 2) и (39 4) в этом случае примут вид Ар + (С— B)qr = — p + rts3 — r3s2, Bq + (A—C)pr-'—q + rts1—r1st, Cr \-(B — A)pq = — r + r1si—ris1, s, =s2r — stq, 52 = 53р—$хг, s3 = slq — sip (39 10) Система (39 10) имеет два положения равновесия 1) © = 0, s„= r0 и w = 0, s0 = — г0 Действительно, указанные векторы удовлетворяют системе (39.10) Покажем, что других постоянных решений система (39 10) не имеет Из равенства (39 8) для таких решений dV/dt = 0, откуда, следовательно, 117^=0 Для рассматриваемого случая tt7 = —<оа, следовательно, обязательно должно быть ы = 0 Тогда из первой группы уравнений_ (39 10) вытекает гох1о = 0, следовательно, либо s0 = r„, либо s0 =—г„. Покажем теперь, что положение равновесия w=-0, 5,, = ^ устойчиво, и притом асимптотически, а положение равновесия й» = 0, s0 r0 неустойчиво в смысле Ляпунова Действительно, функция V является положительно определенной относительно компонент векторов ш и s0 в окрестности точки w = 0, s0 = r0. Полная производная этой функции неположительна dV/dt = —соа. Отсюда вытекает, что положение равновесия со^=0, s0 = rj обязательно устойчиво по Ляпунову Для доказательства асимптотической устойчивости этого положения равновесия установим сначала общее свойство движения твердого тела Т0 под действием момента (39 6), (39 9) А именно, любое движение твердого тела Та, описываемое системой (39 10), является либо положением равновесия, либо асимптотически приближается к состоянию покоя Короче говоря, утверждается либо во все время движения о = 0, либо (а <-0 Покажем это Пусть, напротив, для некоторого движения «о2^а>0 при /^0, где а — некоторая константа Тогда из уравнения (39 8) находим dV/dt^—а, следовательно, V ^ <К0—а г, где VB—значение функции V при / = 0 Из последнего неравенства вытекает V ►—оо, что невозможно, так как функция V является положительной Из полученного противоречия очевидно, что обязательно существует последовательность моментов времени /1, .... 1к—► + оо такая, что ы{(к)—*0 при k—♦-foo Если ю(Пне стремится к 0
§ 39] ОРИЕНТАЦИЯ ЗАДАННОГО НАПРАВЛЕНИЯ 413 при /—»- + оо, то обязательно существуют две величины аир, 0<а<р, такие, что можно указать две последовательности ik, вк, удовлетворяющие >словию ю2(тй) = р\ <о2(вл) = а, к — 1, 2, , а<ю2(/)<Р при <€(т*. вк) При эгом тА—*4 оо, вл—* + оо при k—►-i-oo Так как векторные функции о и о» ограничены при *>0, то -jj (d)2) также ограничено, и поэтому величина <Эк — тА ограничена снизу положительной постоянной г при любом k= 1, 2, Из уравнения (39 8) имеем V = V0 — ] <o2d/< V0 — /ira, где я — наибольшее значение А, удовлетворяющее неравенству 6ft<f Ясно, что п—+ + оо при /— + оо Из этого вытекает. Что V—►— оо при t—►+°°. что невозможно Отсюда следует, что имеет место лишь последняя возможность поведения функции (о2, а именно (л2—► () при /—> + оо Покажем теперь, что на любом движении также будет r0Xs0—►О при t—►-f00 Умножим обе части первой группы уравнений (39 10) на этот вектор скалярно После некоторых преобразований получим J-[(F0x"s0) 6w] = [(F0xs0) (w—wxe^i + K^xsi^ew]-) (F0x^)2 Предположим, что оказалось (rnxs0)2>a>0 при*>0 Тогда существует такое число Т > 0, чго будет ^[(r„xs0) вю]> у при t>T Из этого неравенства вытекает тогда [(r„ys„) 0ш]—* —►-(-<» при t—--\- оо, что невозможно в силу доказанного свойства ю—+0 при t—+ -f оо Таким образом, обязательно будет существовать последовательность /,, ,tk tk ►оо,такая, 4Tor0xs„(/fc) — 0 при k—+oo. Если при этом оказывается s0(^)—<• г0, то в силу установленной выше устойчивости по Ляпунову должно быть s0(0—>-r0 при '—»-f°° Если же s0(fA)—►—г0, то также должно быть МО—►—г0 при t—►-г-°с>> что следует из устанавливаемой ниже неустойчивости положения равновесия w = 0, s„ = — г0 _ Выберем последовательность векторов <ол и soA так, чтобы <оА—► (), suA—>-г0 при k—►-t-oo, и так, чтобы V, < 0, где Vx - 7 (Ар* + Bq* + Cr*)—j (F0 + $.)».
414 УПРЛВЛГИИЕ ДВПЖЫШСЧ ТВЕРДОГО ТЕЛА [(Л \ Легко видеть, что функция Vt удовлетворяет условию dVjdt = W (39 I Построим инте£ральные кривые системы (39 10) при начал», ном условии <oft, soft Из уравнения (39 11) Vt < V0 при t^Q Кроме того, W-*0 при t —Н-оо Отсюда во все время движе ния (70 + sJ2J> oc>0. Тогда, по доказанному выше, должнс быть s„(/)~»-r0 при t—* + oo Следовательно, существуют интег ральные кривые, начинающиеся в сколь угодно малой окрестности положения равновесия о> — 0, s0 = — г„, которые покидают наперед заданную малую окрестность этой точки. Отсюда вытекает факт неустойчивости положения равновесия. Однако существуют интегральные кривые системы (39 10), отличные от положения равновесия, обладающие свойством Г,(/)— 7„ Действительно, рассмотрим систему (39 10) в отклонениях от положения равновесия ю = 0, s„ =- —70 Ар' -г (С — В) q'r' = — //—rj'2 -f r2s'3, Bq' + (A—Qp't'= — q'-i r^—r^. Cr' -\- (B— A) p'q' = — r' — rts[ 4 rls'3, sl= — (s'3 — r^)q'-\ (s't — rt)r', s2= (ss—гл)р' — (s[—rt)r', s3= — (s', — ri)p'-r{s'l—rl)q'. Характеристический многочлен линейного приближения для этой системы б>дет иметь вид ABCkt + (AC + BC + AB)Xi-l- .. Очевидно, у этого многочлена с>шествуют корни с отрицательными вещественными частями, следовательно, существуют интегральные кривые системы (39 10), отличные от положения равновесия (0 = 0, su = — г0, обладающие свойством МО—-^-7.. "О—"7 0 Теорема 39 1 Управляющий момент Ж (39 6) можно выбрать так, чтобы тело Т0 было ориентировало в заданном на-
§ 39] ост ШАЦня ЗЛ1ЛИН0Ю нмп'лткиня 415 приб ш жаетсч к состоянию покоя <о — 0, (s0 х г„) =-- О Состояние покоя и> —О, s0 = r„ асимптотически устойчиво по Ляпунову, а состояние покоя о>=^0, s„ — — г„ неустойчиво по Ляпунову Замечание 1 Выше было проведено исследование движений твердого тета пот, действием момента (39 6) при условии (39 9) Ана логично можно провести исс 1едование в том случае, когда функция (о>, ц) — W является отрицательно определенной функцией компонент вектора ы, а фчнкцня V является положительно определенной функцией величины (s0 — г„)- 3 а меч а и не 2 В управляющий момент М входят проекции мгновенной \гловой скорости ы Для определения эгпч проекций, вообще говоря, необходимо иметь в составе приборов управления датчики \повой скорости Поэтому такого рода управляющий момент оказывается невозможно создать, если указанных датчиков не имеется Предположим теперь, что известны лишь проекции вектора $„ в _системе Охуг Требуется построить управляющий момент М, стабилизирующий заданное направление г0 в теле по отношению к направлению s„, фиксированному в пространстве 0Ъц1 Проекции вектора ~s„ по прежнему буд^т >довлетворять второй группе уравнений системы (39 10) Из этой системы можно установить след>ющие соотношения in х 70 =. — [ш - Г„ (© s~) ] (39 12) Рассмотрим управляющий момент М=- —[ы—"s0(w sj] \ fjx7„ (39 13) Уравнения движения твердого тепа под действием момента (39 13) имеют вид ей-; (0X00) = — [w— 7>) s",,)]-! r0x"s0, 9 14 s„ = — со х s„ Умножая первое > равнение (39 14) скалярно на вектор о, получим dV,'dt=— [о>- — (ш s„y] (39 15) Умножая первое уравнение (39 14) скалярно на вектор s0, находим 70 вй-1гп (39 16) Покажем сначала, что любое движение системы уравнении (39 14)
416 УМРМЛПШК 1ВНЖ1 Mill M 1ВЬРД010 II,К ||| VIII об id час i свойством [со*—-(со sJ-] — 0 при t—~ f-oo, от к \ да BbiTeKdeT, что си — s0 (со s0)—>0 при / —► f-oo Из соотношения (39 15) ясно, что величина со2—(со s,)2 не может оставаться во все время движения больше некоторой положите тьмой постоянной В противном спучае функция V па таком движении будет неограниченно убывать В силу конечно сгп м товой скорости и конечности вектора со оказывается, что величина сог — (со s0)" не может также становиться сколь угодно малой, не стремясь одновременно к пулю Это обстоятельство устанавливается точно таким же образом, как и выше, в сл\чае ) иравпяющего момента (39 6) при условии (39 9) Таким образом, на чюбом движении системы (39 14) со" -(со s0)2 —-0 при t—- + оо \\i этого след\ег, что со—s0(co s„)—-О при /—►-) оо Отсюда coxsg также —-О при /—►4-оо Так как треб\ется стабилизиро вать орт г„ в направлении s„, то рассматриваемое движение до ажио обладать свойством s0—► г„ при /-— +оо Тогда со —г0(со г0) также до ажио стремиться к нучю Следовательно, нч (39 16) па- voAHM г0 0го(соо г0) = &, где k — некоторая постоянная Отсюда вытекает, что при s„—► г„ тело будет стремиться к равномерному вращению с угловой скоростью со -Яхп, где Я — некоторая постоянная величина Подсгавтяя потучеиные пречетьные значения в уравнение (59 14), находим, что дотжно быть г„Х0го>.- - 0 (39 17) Соотношение (39 17) выпотнлетсп в спучае, если Х = 0, либо в ciyiae, ее in г„ х6г0 = 0 В первом случае тело приводится в состояние покоя ы = 0 Второй сл_\чай может осуществляться тогда п тотько тогда для различных моментов А, В, С, когда вектор г„ направтен по одной in центратьных осей теча П\сть тля опрететенностп г„ —( 0 ) Найдем положения равновесия системы (39 14) со,, s0» II» второго } равнения системы (39 14) вытекает, чю в потожепип равновесия должно быть to, >s„, -0, стедовате 1ьно, со, ->s„« ToiAa из первого уравнения
§ 39) oi'iiKin шин зчдлиного направления 417 системы (39 14) имеем so,x(Peso, + rn) = 0; следовательно, a26s„, -|- г„ ~ |is„« или [\*в-1хЕ]&1)% = -7а, (39 18) где Е—единичная матрица Из (39 18) и (39 16) следует, что система (39 14) может иметь три совокуппости положений равновесия I. при згом II'. при этом ]|[ 1* = = л*В, ьм [i^± l |-л~М, „ ( «l \ (.>„ — AS,,,, S0, ~ ( % J , , S^—>J(A-B)> S' = й,= Й,.. s"o,--( 0 ) ±VT- •=*0. -sj, (39 19) (39.20) (39 21) (39.22) (39 23) (39 24) (39 25) as,,. 0JM = \ f щ— -Ь С] = *u, (39 26) (39 27) Дли того чтобы система (39 14) могла иметь совокупности положений равновесия И или III, необходимо и достаточно, чтобы существовали вещественные решения уравнения (39 23) и (39 26), удовлетворяющие условиям (39 24) или (39 27) соответственно.
418 УПРАВЛЕНИЕ ДВИЖЕНИСМ ТВЕРДОГО ТЕЛА [ГЛ VIII Перепишем уравнение (39 23) в виде ЯХ«—*ea» + _JLg- = /(A.) = 0. (39 28) Так как из интеграла (39 16) следует, что кк0 > 0, то будем для определенности считать, что X > 0, k0 > 0 Рассмотрим санкцию /(Я) Для нее d-L£> = l*(4B\-3k0) При Х>4^ имеем -^- > 0, при ^ = -щ функция /(Я.) достигает своего минимума, равного Легко проверить, что если 1*-'<7РГ=1Г (<*<т«). 4 \/-Щ=Щ (39 29) то все вещественные корни /(X), которые удовлетворяют условию Л.Аг0 > 0, если таковые существуют, находятся в промежутке (О, , . , т е система (39 14) не может иметь совокупности положений равновесия II Аналогично исследуется уравнение (39 26) Если ы«т#=*_ {A<ic). (зэзо) .с/3":0' '*•'< ,W=/ (">тс). то все вещественные корни уравнения (39 26) такие, что kk0 > О, если они существуют, находятся в промежутке (0, ■ ■ ■ , \ У\А—С\ J т е система (39 14) не может иметь совокупности положений равновесия III Если нарушено одно из условий (39 29), (39 30), то система (39 14) может иметь совокупность положений равновесия II или III соответственно Если выполнены оба условия, то система (39 14) имеет лишь совокупность положений равновесия I
§ 39] ОРИЕНТАЦИЯ ЗАДАННОГО НАПРАВЛЕНИЯ 419 Аналогично исследуется случай, когда А, В, С не все различны При этом оказывается, что если А — В = С, то система (39 14) имеет лишь положения равновесия (39 19), (39 20), если А=*ВфС или А = СфВ, то система (39 14) имеет положения равновесия соответственно (39 19), (39 20), (39 25) и (39 19), (39 20), (39 22); если В = СфА, то система (39 14) имеет положения равновесия (39 19), (39 20), (39 31), где (39 31) имеет вид ю. = л10„ s0. = fsM, (39 31) причем ц = №В, Sj = — Х2(А_В). «I + «! = 1 — sf, а Я, удовлетворяет соотношениям (39 23), (39 24) Если k0 удовлетворяет соотношениям (39 29), (39 30), то в этом случае система (39 14) будет иметь лишь положения равновесия (39 19), (39 20) Исследуем поведение решений системы (39 14) в окрестности положений равновесия (39 19), (39 20), (39 22), (39 25), (39 31). Положим © = ©.+«*'. s0 = s0,-fs\ (39 32) Рассмотрим функцию V = 1[«.0© + (IO-FO)'8] и для определенности будем считать, что В>С Подставляя (39 32) в (39.5), (39.6) и в выражение для функции V, получим s,f+2s's;,=s;*+s;1+«;"+2 (sis,+s'tst+sass) = 0, (39 зз) (i'+sj-ew' +?.вю, = Ар' (s^ + sJ + Bq' (s't + s,) + + Cr' (s; + sa) + X (As'^ + Bstst + Cs'asa) = 0, (39 34) У = i [(»' + ©.) • в («' + w.) + (? + s.. - r,)«] =- =^,+jK' e©, + (I0. - F,)«], Vi = -i.©'.e*»4-2©'.e©, + s', + 2s' (s0,—r0). (39 35) Из интеграла (39.34) находим p'=- irh^r №'(s»+s*>+Cr' &+s^+ + X (As'^ + Bs'tst + Cs'as3)]. (39 36) Подставляя выражение (39 36) в функцию (39 35), учитывая интеграл (39.33) и вычисляя минимум Vx по переменным q', г',
420 yilHAB'IFIltie ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [|71 VIII получим X j KBw, • (s'6s' + 2?es0,) + s[ (V +1,„) e (s' H s0J] = = . _ У»_ _, (39 37) («' + *..) »(*' + *„.) V. -* — [4-***®*** (Vei'+2s'0s;)») bs,' (s' +s0#)e(s' + ■».)]. (39 38) 1° Пусть w» и s„* определяются из соотношений (39 19) Из интеграла (39 33) имеем s; = — -J-s'1 = — 1 -{- V\— s'*-s'*. (39 39) Подставляя выражение (39 39) в функцию (39 38) и учитывая соотношения (39 19), получим V.*=-!jj {As'1—s'eP) + ~ s'* (A +s'es'—A~s'') = Отсюда видно, что Vt при достаточно малых s't, s'a является определенно положительной функцией этих величин, если Л„ произвольно (А > В), \*.\<у£% <И<*> (39,40) Следовательно, функция Vx будет также положительно определенной при достаточно малых s't, s'„ q', т'_. Так как полная производная по времени от Vt, равная {— [«о*—(w-iq)*]}, неио- ложитсльна, то рассматриваемое положение равновесия условно устойчиво по Ляпунову. Так как «'—(<o-s0)*—>0 и в достаточно малой окрестности положения равновесия (39 19) нет других положений равновесия системы (39 14), (39 5), (39 16), то рассматриваемое положение равновесия является условно асимптотически устойчивым по Ляпунову. Если (39 40) не выполняется, то функция Vt, а вместе с ней и V, не являются знакопостоянными положительными, т. е. в этом случае положение равновесия (39 19) неустойчиво. 2е. П>сть *>ф и s„ определяются из (39 20). Из (39 33) имеем s,* = is" _•= 1 — Kl_s;*-s". (39 41)
§ 39] ОРИЕНТАЦИИ 1ЛЛМ1НОГО НАПРАВЛЕНИИ 421 Подставляя (39 41) в (39 38) и учитывая (39 20), получим -7(s;,^-s;,)[(д-4л)s;,-ь(c-|.>l)s;,]- -j («;*+*»V [(в - у а ) *;•+(с-4 /1) $;*] + о ц£+£)]. Отсюда следует, что Vt для достаточно малых s't, s'3 является положительно определенной функцией этих переменных, если А >В, VAA ) 4 \ <3942> Если xoin бы одно условие из (39 42) нарушено, то функция И, не яв1ястся знакопостоянной положительной. Таким образом, аналогично пункту 1° устанавливаем, что если выполнены условия (39 42), то положение равновесия (39 20) условно асимптотически устойчиво но Ляпунову, в противной случае положение равновесия (1 20) неустойчиво 3° Пусть «о* и s"0, определяются из соотношений (39 22), т. е мы рассматриваем случай А Ф В, В>С. (39.43) Ич интеграла (39 33) находим 2s,$: = — 2s,s;-s'\ (39.44) Подстатяя выражение (39.44) в функцию (39.38) и учитывай равенство (39 23), получим Ув« ■5-(Xft,+2s;)[(fi_/i)S;,-i-(e-c)s;,]-}-2(B-/i)s,s;,=t = i (4 -г {В -A)kJ? + 2 (fl - А) Х\) s? + у (kj> + 2s|) (в -С) <\ (39 45) Рассмотрим величину [4-(-(В— A)kv\a]. Она положительна, если А0 произвольно (А<В), _q fi М-В)А0л'<4 М>В). (ЗЭ40) Кроме того, Л, и А, должны удовлетворять соотношениям (39 23) и (39.24). Соотношения (39.23), (39.24) и (39.46) совместимы,
422 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОЮ ТГЛЛ [171 VIII если k0 удовлетворяет условию \11.\>-?Л=г {В>Л), !±в\/Ш=Ш \ <3947> ™*V W=S ■ тЦ {*>*>)■ Отсюда следует, что если выполнены условия (39 47) и (39 43), то V„ для достаточно малых s[ и s's является определенно положительной функцией этих переменных, если хотя бы одно из условий (39 43), (39 47) нарушено, то функция V2 не является знакопостоянной положительной Таким образом, аналогично пункту 1° получим, что если выполнено условие (39 47), то положение равновесия (39 22) условно асимптотически устойчиво по Ляпунову, в противном случае положение равновесия (39 22) неустойчиво 4° Пусть со* и £„* определяются из (39 25), т е. мы рассматриваем случай АФС, В>С. (39 48) Из (39 33) имеем 2s3s'3 = — 2s,s;—s'2. (39 49) Подставляя (39 49) в (39 33) и учитывая (39 26), получим v*=i (4+<с~ А) к«кз+2 (С-Л) X'S'J s'2+т (fc«b+2s;) (с-в) $г\ Так как имеет место соотношение (39 48), то функция V2 не является знакопостоянной положительной, так что положение равновесия (39 25) будет неустойчивым 5° Пусть 5, и s0„ определяются из (39 31), т. е п>сть рассматривается случай В = СфА. (39 50) Из (39 33) имеем 2(s2s; + s3S3) = — 2sls[—s'\ (39 51) Подставляя (39 51) в (39 38) и учитывая (39 33) и (39 50), получим У2=^(4 + {В-А)ксК + 2(В-А)к%)5?, т е V2 не может быть знакоопределенной функцией величин s,- (t = l, 2, 3), удовлетворяющих соотношению (39 33), но для достаточно малых s[ V2 является положительно определенно."!
§ 39] ОРИРНТЛЦИП ЗАДАННОГО НАПРАВЛЕНИЯ 423 ф\ iiKUiici'i переменной s[, если 1*о1>т^Ьг (в>А), , 4 д */"31Л=В) . (39 52) '*•'«(' Vxri -Tib) {л>1»)- Если же (39 52) не выполнено, то функция V3 не является знакопостоянной положительной Здесь мы учли то обстоятельство, что k0 и X доажны удовлетворять соотношениям (39 23) и (39 24) Гаким образом, если выполнено условие (39 52), то Vt яв- мется знакопостоянной положительной функцией переменных </', г', s[ и («A-|-s,s3) Так как полная производная повремени от Vlt равная {—[о-—(ш s„)a]}, неположительна, то во все время движения будут выполняться неравенства O^V.s^o, (39 53) где через V10 обозначено значение функции Vt в начальный момент времени / = 0, причем величина Vl0 за счет выбора начальных данных может быть сделана сколь угодно малой На основании (39 53) мы заключаем, что для достаточно малых |s'|, |o)'| любое движение системы (39 14) стремится к одному из положений равновесия (39 31), а поскольку имеет место соотношение (39 33), то мы приходим к выводу, что исследуемое положение равновесия (39 31) будет условно устойчиво по Ляпунову Если условие (39 52) нарушено, то положение равновесия (39 31) будет неустойчивым Теорема 39 2 Под действием момента (39 13) твердое шею Т0 либо находится в одном из положений равновесия (39 19), (39 20), (39 22), (39 25), (39 31), либо стремится к одному из ник При этом 1) если выпо1нено усювие (39 40), то положение равновесия (39 19) условно асимптотически устойчиво по Ляпунову, если условие (39 40) нарушено, то положение равновесия (39 19) неустойчиво, 2) если выполнены условия (39 42), то положение равновесия (39 20) условно асимптотически устойчиво по Ляпунову, если хотя бы одно из этих условий нарушено, то положение равновесия (39 20) будет неустойчивым, 3) если выполнено условие (39 47), то положение равновесич (39 22) условно асимптотически устойчиво по Ляпунову, если это условие нарушено, то положение равновесия (39 22) неустойчиво, 4) положение равновесия (39 25) неустойчиво по Ляпунову,
424 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII 5) если выполнено условие (39 52), то положение равновесия (39.31) условно устойчиво по Ляпунову, а если (39 52) нарушено, то положение равновесия (39 31) неустойчиво Замечание 1 Пусть нам известно, что «о* (0) < R*. (39 54) Выберем момент М в виде М = [w-s0 (й i0)] + /(r"0 хs"0) (39 55) Здесь R и /—положительные постоянные Обозначим через k0+ такую положительную константу, что при | *01 < *о* выполнены условия (39 29), (39 30), а при | k01 > £„* хотя бы одно из них нарушено При выборе момента М в виде (39 55) условия (39 29), (39 30) запишутся соответственно 56) (*<т*). (39 (Л<4с), 09 57) При |А0|<^о* условия (39 56), (39 57) будут выполнены Из (39.16) следует, что 1«(0)|>П1.х(|^'д1 С). Если |<о(0)| < тах/л0д С) , то для \k0\ будут выполнены условия (39.56), (39 57), т. е система (39 14) будет иметь лишь совокупность положений равновесия I. Т. е. если / таково, что R < maXM°fl С) • то система (39 ! 4) имеет только совокупность положений равновесия I, причем положение равновесия (39 19) условно асимптотически устойчиво, а положение равновесия (39 20) неустойчиво по Ляпунову. Замечание 2. Управляющий момент М можно выбрать более общего вида, однако характер движения твердого тела будет таким же, как под действием момента (39.13), а именно.
§ 40] ОРИЕНТАЦИЯ ОСЕЙ, СВЯЗАННЫХ С ТЕЛОМ 425 можно взять М = ц + s0 x grad U, где ji = [s0xs0] <р. Здесь U — положительно определенная функция величины и ф—положительно определенная функция компонент вектора [s0xs0] = —[ш—s0(oj s0)] § 40. Ориентация осей, связанных с телом Пусть заданы два ортогональных орта slU, s011 занимающих неизменное положение в абсолютном пространстве 01ц£, и пусть заданы два ортогональных орта г0, и г03, занимающих неизменное положение в теле Г„ Требуется найти управляющий момент М, позволяющий стабилизировать орт г01 в направлении s01, орт ги, в направлении sU2 Положим s03 =s01xsoa, r03 = r0iXr0,. _ _ з М=ц+ 2 s0,Xgradu, (40 1) '=' "»„/ где (I—некоторый моменттакой, что (<о ц) = W^ W — отрицательно определенная функция относительно компонент (о,и—положительно определенная функция относительно векторов s0/—rol (t = 1, 2, 3) В формуле (40 1) grad и означает, что gradw берется по компонентам вектора s0, в системе Охуг, связанной с телом (см § 39). Вращательное движение берется по компонентам вектора s0/ Вращательное движение твердого тела под действием момента (40 1) будет описываться системой дифференциальных уравнений (см § 39) во. + й>Х0ш = М, (402) 50,=-ШХ50/ (/=1, 2, 3) Умножив первое уравнение скалярно на вектор at, получим dV/dt^W, (40 3) где V = ~[Ap^ + Bq^ + Cr^] + u и р, q, r —проекции о> на о и системы Охуг. Положим для определенности з «-Т £*/[«./-'о,]'. Д = -«. (40 4) Здесь а,—различные положительные числа.
426 УПРАВ ILIII1E ДВНЛЕИИКЧ ТЙЫ'ЧОГО ТЕЛА [1Л VIII Легко видеть, что система (40 2) при условии (40 4) б>дет отличаться от системы (39 6) лишь тем, что в правой части вместо компонент одного вектора s0xgradV выписывается с\мма трех аналогичных векторов su,/gradV Поэтому система (40 2) имеет положения равновесия о) = 0, s01=±r01, sO2 = ±r02, sn3 = = s01xs02, и при этом др\гих положений равновесия в системе (40 2) не будет Покажем, что положение равновесия со —0, s0,- = r„,-, i -=-1, 2, 3, асимптотически устойчивы по Ляпунову и что оста 1ьные положения равновесия системы (40 2) обязательно являются неустойчивыми В силу положительной определенности функции V относительно компонент вектора о и компонент векторов sn, — r(l/ и в силу отрицательной определенности функции W относительно компонент вектора <о из (40 3) можно установить, что \помяну тое положение равновесия будет обязательно устойчивым по Ляпунову Далее с помощью тех же рассуждений, что и в§ 39, _ з можно установить, что а>г >- 0, а также V а,- (г0/ — s0() —► 0 _ з _ _ при /—> +оо, ибо при условии (40 4) М = —о» Ь 2 «,-(Го/— s,„-) f=i Из этого обстоятельства и из устойчивости рассматриваемого положения равновесия вытекает, что s,„-—► rn/ при t—^ + оо (i' = l,2,3) Покажем теперь, что любое из оставшихся положений равновесия неустойчиво по Ляпунову _ _ _ Рассмотрим, например, положение равновесия со = 0, s„,=—r0I, s02 = г„2, s03 = — г03 Построим функцию V,= y [Ap* + Bq° + Cr'-a, (i01+F01)=+я2(*о ,-?„,)* -a, (s01+F0J)2] Легко показать, _что Vl = W Возьмем последовательность начальных данных toft—>0, slIft—>■ — r0l, sU2ft—>r02, s03ft—>•—r01 так, чтобы было Kt<0 при / = 0 Так как функция Vy убывает, то при / ^06)детК^Кю < 0, где V10—значение функции V, при /=0 з _ С другой стороны, (о2—►О при <—►-foo и 2 а(го/*s0/) —► 0 при /—►Ч-оо на любом движении системы (40 2) при )сновки (40 4) Но из предыдущего вытекает, что a, (s0l + r0,)2 + o3 (s01 -+- r0 ,)2 пе стремится к нулю при /—► -f-oo Это означает, что интегральные кривые, начинающиеся в сколь угодно малой окрестносш выбранного положения равновесия, покидают некоторую фикси-
§ 40] ОРИЕНТАЦИЯ ОССЙ, СВЯЗАННЫХ С ТЕЛОМ 427 ровапную окрестность при возрастании времени, что свидетельствует о неустойчивости по Ляпунову. Теорема 40 1. При управлении (40 1) любое движение твердого тела либо является состоянием покоя, либо стремится к такому состоянию, причем положение равновесия <а — 0, £0/ = — г0/ = 1, 2, 3, асимптотически устойчиво по Ляпунову, а любое другое положение равновесия, отличное от этого, обязательно будет неустойчивым Предположим теперь, что тройка ортов s01, s02, s^a вращается как твердое тело с угловой скоростью tal по отношению к абсолютной системе координат 0£т]£ Требуется управляющий момент М выбрать так, чтобы стабилизировать оси rol, F0„ FM, связанные с телом, в направлении соответствующих осей. Обозначим через щ угловую скорость управляемого тела Т0. Положим _ _ ^. - 3 _ М=— [«,—<*,]-l-et^-l-t»!Х0<оа-Ь 2«/[r0/Xs0/]. (40.5) Тогда вращательное движение твердого тела будет описываться системой уравнений вю. + ю.хв*»,,—М, * _ _ _ (40 G) Система (40.6) имеет семейство установившихся движений. <at^=utlt V= ±r0/, s03 = s01xs02, причем установившееся движение <ot~talt s0,- — Г0/ асимптотически >стойчиво по Ляпунову. Остальные из упомянутых установившихся движений обязательно неустойчивы Положим to = <o2—o>t Тогда система (40 6) может быть представлена также в форме 0w \- ЙX вю, =- -ю + ^2 а, [г„ X s0(], 8в/--»Х8,,. Умножая первое из уравнений (40 7) скалярно на ю, найдем [dV/dl -= -< (40 8) где / = 4[<o0W + £<7/(su/-ro,)2J.
428 УПРАВЛЕНИЕ ДИНЖ1.ННКМ ТВИСЛОГО ТЕЛА (ГЛ VIII Из равенства (40 8) вытекает, что упомянутое установившееся движение обязательно устойчиво по Ляпунову. Как и в § 39, можно показать, что w*—► 0 при / -—+ оо и что ^ а,- (rn/xs„,)—-0 при /—» + оо При помощи рассуждений, аналогичных предыдущим, приходим к выводу, что другие установившиеся движения, упомянутые выше, будут неустойчивы по Ляпунову Теорема 40 2 Любое движение твердого тела Т„ под действием момента (40 5) является либо установившимся, v>i — w1 и s0/=±r0/-, s03 = su, xsU2 либо стремится к установившемуся При этом установившееся движение <о2=<о,, sU(- —r,„- (t = l, 2, 3) является асимптотически устойчивым по Ляпунову Остальные установившиеся движения неустойчивы Замечание 1. Теорема 40 1 является частным случаем теоремы 40 2. Однако теорема 40 2, так же как и теорема 40 1, сохраняется при управляющем моменте более общего вида, а именно _ _ _ _ _ 3 М = ц + 0u>j + (i)x хв«о2 + 2 so/ X grad и, где « — положительно определенная функция величин (soi—70i)* и функция W = [(&>2—<o,)-jli] является функцией, отрицательно определенной относительно компонент вектора [<о4—©J Замечание 2 Если в системе управления телом Т0 пет датчиков угловых скоростей, то достаточно в связанной системе координат Охуг измерять составляющие ортов s01, н s02, так как S„3 = S01XS02 II — W=-2-X[s0,XS0/] Замечание 3 При ориентации связанных осей в направлении подвижной тройки векторов s0„, s01, s„3 возникает вопрос о построении управляющего момента еще и по причине вхождения туда угловой скорости <at этой тройки векторов, так как проекции угловой скорости ю, известны, вообще говоря, в системе координат, связанной с векторами s0/, t = l, 2, 3 Пусть ©I есть вектор-столбец компонент вектора ы1 в системе s0i. s„2, s„3, и пусть «J есть вектор-столбец компонент того же вектора в системе Охуг, оси которой являются главными центральными ^сями_тела Т0 Тогда o>i = Лсо^, где Л —матрица перехода. Столбцами этой матрицы являются компоненты векторов sM, s,,,, sUJ в системе Охуг
§ 40) ОРИЕНТАЦИЯ ОСЕЙ, СВЯЗАННЫХ С ТЕЛОМ 429 Эт обстоятельство дает возможность строить управляющий момент М фактически по проекциям векторов s01 и s02 в системе Охуг Остановимся теперь на решении задачи сканирования осей твердого тела Охуг Пусть задан орт s0, неизменный в системе 0£ч£. " пусть о», — мгновенная угловая скорость, задающая сканирование осей Охуг в системе 01л? Обозначим через о0 вектор- столбец компонент орта 7Л в системе Охуг, тогда о0 — — щ хо„ Начальное положение вектора s0 в системе Охуг при_/ = 0 и это уравнение единственным образом определяют вектор a0(t) Требуется построить управляющий момент М так, чтобы заданное сканирование осей Охуг было устойчивым Обозначим через ci>t угловую скорость твердого тела и положим <а~<аг—о>х Рассмотрим управляющий момент М вида М^=— ©Н-во), -\-щхв<ог + о0х*0. (40 9) Уравнения движения твердого тела и ортов имеет вид 0ю4 -!- Wj х во»,, =- М, 5,= -5,хь, <«»0Ю) о0 == —о», х о„ Легко видеть, что система (40 10) имеет два установившихся движения: ^ = ^' (40 11) _' »1 (40 12) s0=— о<,- Покажем, что установившееся движение (40 11) обязательно асимптотически устойчиво по Ляпунову, а установившееся движение (40 12) неустойчиво по Ляпунову Для доказательства этих утверждений сделаем в системе (40 10) замену искомых функций по формуле
430 yriFAB.ll МНС ЛВИЖСПШ М ТВКГДОГО ТЕЛА тогда получим 0w | ш 0u)2-^_o) + o0xs0, (10 13) _ 1 (40 14) o„ = —o),xa0 Умножая обе части (40 13) скалярно на вектор ю, найдем 4~(ы вш) = -5' + 5(овх5"0) (40 15) Вычислим величину ю (a0x?0) «о (<*„ X s0) = w2 (a0 X su) — o)j (o0 x s„) = - К i, + ou s„)= -£± (70_<70)'. Здесь использован тот факт, что 7|| = 0^ = 1 Из (40 15) находим теперь dV/dt = W, (40 16) где У = -1[ш 0ш h(s0 — о0)2] и W = —to2. Функция V является положительно определенной относительно компонент векторов со и s0 — a0 Полная производная этой функции знакопостоянно отрицательна, следовательно, установившееся движение (40 11) устойчиво по Ляпунову. Далее любое движение системы (40 13), (40 14) обладает свойством W—*0 и o0xs0—»0 при t—* + oo Это утверждение доказывается тем же способом, что и в § 39 Отсюда вытекает, что установившееся движение (40 11) также асимптотически устойчиво по Ляпунову Легко видеть, что функция V, =у [<о.0<о—(s0 + a0)2) удовлетворяет условию dVjdt = W Поэтому можно доказать тем же способом, как это было сделано выше, что установившееся движение (40 12) обязательно неустойчиво Здесь, разумеется, всюду предполагается, что угловая скорость сканирования со, является векторной функцией, заданной при />0, всюду непрерывно дифференцируемой и ограниченной вместе со своей производной Теорема 40 3 Тело Т0 под действием управляющего момента (40 9) либо находится в установившемся движении (40 11), (40 12), либо неограниченно приближается к этим движениям При атом установившееся движение (40 11) асимптотически устойчиво по Ляпунову и установившееся движение (40 12) неустойчиво по Ляпунову.
§ 40] орт итлция осьй, связанных с тиюм 431 Замечание При формировании управляющего момента (40 9) используется ряд величин Если во время движения измерять лишь проекции компонент вектора Т„, то построение управляющею момента (40 9) невозможно Если же среди аппаратуры управления имеется датчик проекций угловой скорости на направление s0, ro построение момента (40 9)_оказывается возможным При этом считается, что векторы <о, и <т0 являются заданными функциями времени В самом деле, угловая скорость <о2 действительного движения твердого тела может быть вычислена по формуле <ai = s0(<a2 s0) — s0xs0 Остановимся теперь на построении угловой скорости сканирования Wj и вектора о^ Направим ось От) абсолютной системы координат по вектору s0, и пусть в начальный момент система Охуг совпадает с системой O^rfe Дая описания положения Охуг в абсолютной системе координат 0£т]£ введем в рассмотрение три угла Обозначим через \J> угол поворота системы Охуг вокруг оси Оц Пусть при этом ось Ог займет новое положение Огх Повернем систему осей вокруг оси Ог, на угот 0, в результате этого поворота получим положение оси Оу Повернем далее систему па угол ср вокруг оси Оу до совмещения с системой Охуг Будем считать, чго все повороты происходят против часовой стрелки, если смотреть с вершины ортов, определяющих те оси, вокруг которых происходит поворот Тогда матрица перехода будет иметь вид А = = Л3 (<р) Л, (6М, (1>), где (cos\|) 0 sin\J)\ / cos 0 sin 0 0\ 0 10), i41(8)==( -sin9 cosO 0 I, —зшг|) 0 cosi|>/ \ 0 0 1/ / cosq> 0 sincp\ У18(Ф)= 0 10. \—sin ф 0 cos ф/ При этом столбцы матрицы А представаяют собой проекции ортов £„, ц„, ?„ системы Ot,r]t, в системе Охуг Положим теперь ty — kj, Q—kJ, <p — kj, где klt k,, k3 — некоторые постоянные, тогда <°1 ~ ЛрЬ + ^2Z10 "I" ^ гУо Здесь через т)„, z10, у0 обозначим соответственно орты осей Оц, Огу, Оу Ясно, что ^10 = ii0xy0 Проектируя угловую скорость (at
432 yriPABILMHE ДВИНШШЕМ ТВЕРДОГО ТЕЛА [\ П VIII на оси связанной системы, полечим (х„ ы.) = />,-*, (л„ х,) + К («,.. х0), (Уо. <V = <7i ■= *i (Уо. Чо) + *з._ (Z0l (»,) = /•!=*! Olo. Zo) + MZ10. Z(,) Вектор а0 представ шет собой вектор проекций орта ti„ в системе Охуг, отсюда Pi = Mi —*Л. ri = *1°з + *2<T, Из предыдущего построения вытекает, что проекции вектора а0 совпадают с соответствующими этементами второго столбца матрицы А Поэтому имеем о1 — а1г, a2 = агг, o3 = atat где 0,,=- cos ф sin 0, nZ2 = cosO, яг3 = —sinBsirlcp Почожим далее ki = nkl, /г2 = -^-, где п и т — некоторые целые числа, тогда за то время, в течение которого линия узлов O/i совершает полный оборот вокр\г оси Оц, ось Ох опишет п оборотов вокруг оси Оу, а угол нутации изменится на величину 2 л/т Предположим, что вокруг точки О описана сфера единичного радиуса, и п}сть на этой сфере указана некоторая область S Числа т и п можно выбрать так, что конец орта х0 оси Ох, обязательно попадает в указанную область S, причем это попадание будет происходить периодически, так как матрица ориентации А в рассматриваемом случае периодическая В си ту теоремы 40 5 тело Тп будет двигаться под действием управляющего момента (40 90) таким образом, что его ось Ох обязательно будет пересекать обтасть S на упомянутой единичной сфере. § 41 Уравнения движения твердого тела, вращающегося вокруг неподвижной точки и содержащего маховики Пусть задано тело Т0, несущее маховики Tj (/ = 1, , k) Будем считать, что маховики Tj и те то Т0 являются твердыми 1епамн Пусть центр инерции Тs Л1жит на оси if, вокруг кото рой тело ТJ может свободно вращаться Будем считать, что ось i,- чанимает неизменное положение в теле Т0, тогда центр инерции всей системы тел будет занимать неизменное попожение в тете Т0 Обозначим этот центр инерции через О и будем считать О неподвижной точкой Для вывода уравнения движения поступим
§ 41 J УРАВНЕНИЯ ДВИ/ЧКНИИ ТВ1РД010 ТЕЛА 433 обычным образом, а именно, заменим систему тел системой ма- терпатьных точек Mt с массами т1 Предположим, что на точку Af,- действует сила F{, которая представляет собой совокупность всех сит, действующих на эту точку Ее пи через г,- обозначить радиус-вектор точки М,- относительно О, тогда можно написать уравнения движений систем материальных точек т,т1=71 (» = 1, , N), (41 1) где N — число материальных точек Умножая обе части системы (411) векторно на г,- и суммируя, находим 2 !\ХШ,Г,- 2 [f~i*infii] = К=М Здесь через К обозначен момент количества движения системы материальных точек "К — 2 г,Х/н,г7, t = i а через М обозначен главный момент всех сил, действующих на системы материальных точек М- 2 rJxF, Таким образом, имеем 1< -М (41 2) Вычистим момент котпчества цпижения К рассматриваемой системы материальных точек Точки Mj мог>т принаате/кить как телу Т0, так и телам T/t стедовательно, момент количества движения можно представить в форме Здесь 2 или 2 означает, что суммирование происходит по тем <, Т, Tj дтя которых точки £Т0 ити Т, Обозначим через w—угловую скорость тела Тйн через о>;— уповую скорость Tj относительно Г„ Ясно, что o)/=ep/i/o, где 15—1353
434 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОЮ ТЕЛА [ГЛ VIII Фу—угол поворота тела Т/ относительно тела Т0 вокруг оси ij Здесь через iyo обозначен орт оси ij _Если /M,_€ Та, то г,- = ы X г,-, если Mt £ Tf, то г,- = rjC -f р,- = = <oxryC-f-((i)-|-ft),)xp,-, где г/С—радиус вектор центра инерции тела Тj относительно О и р, —радиус-вектор точки /И,- относительно центра инерции тела Ту Из этих соотношений имеем К=2 г,хгп,(сохг,) + 2 2 «"сX"».■ [«»X Г/с + (» +йу)X р,] = = У, Г;Х /И; (<0 X Г,) +2 2 Г/ + Щ (ft), X р,), так как р, представляют собой радиусы-векторы точек М( относительно центра инерции Т}, то будем иметь 2/"/Р« = 0. отсюда Отсюда имеем К=в0й+2©,Я-, (413) / = i где 0О—тензор инерции всей системы тел Т„, 7*,, ,.., Tk при условии «*у = 0 (/ = 1, . ., k), взятый относительно точки О, Qj—тензор инерции тела Т jy взятый относительно центра инерции этого тела Умножим векторно на р,- уравнения (41 1) и просуммируем по тем точкам Мь которые относятся к телу Т jt тогда найдем 2p,Xm/r, = My, где через ftV,—обозначим главный момент сил, приложенных к точкам М, и взятый относитеаьно центра инерции тела Tj m, = 2p,-xF, ' т. Обозначим через К/ момент количества движения точек Mt, относящихся к телу T/t взятый относительно инерции этого тела, тогда получим К,-My (41 4)
i 41] УРАВНЕНИЯ ДВИЖЕНИЯ ТВЕРДОГО ТЕЛА 435 Легко видеть, что Ку = 2 р,- X m,p, = Qj (ю 4- в»/), (41 5) ), — матрица Из (41 3) —(41 5) имеем £(0о" + £в/*/)=Мо, (416) Проведем упрощение записи системы (41 6), используя следующие предположения 1) будем считать, что тела Ту динамически симметричны и что орты их вращения 1у являются осями динамической симметрии, 2) тело Tj вращается вокруг оси \j с угловой скоростью qy, 3) с телом Тв неизменно связана система координат Охуг Оси этой системы будем считать главными осями инерции всей системы тел при условии Фу = 0, / = 1, .... k Обозначим через А, В, С главные моменты инерции упомянутой i истемы тел Обозначим через Cj осевой и через А{ экваториальный моменты инерции тела Tjt тогда найдем /А в0 = е, = ( В ) и eJ=AJE-(CJ-Aj)\/\;. отсюда К =в„ю+ 2 Суфу \/, к/=[л,£-(л;-с/)1у 1;](ш+ш/), откуда имеем систему уравнений 0о<о + юхво(о + 2 [ф/1/ + ф/(«хТ/)]С/ = Л^. (41 7) Далее имеем также К/=[Л/£-(Л/-С/)"./1*/]х х[© + ф/'/-(Л/-С/) (1,1} +1,1/) (© + ф,1/) = М/ (41 8) Спроектируем теперь обе части уравнения (41 7) на оси системы Охуг, а обе части системы (41 8) на соответствующую ось
43fi УПРАВЛЕНИЕ ДВИЖ1 IIIIFM ТВКРДОГО ТРЛА ЦЛ VIU вращения \j, тогда потучим Ар f (С- В) qr + 2 Сдам Л Ф, (?у, —/fy)] = М««. В? |- (А -С) pr + S СД Р/Р/ + Фу ('«/-/ty)] =- Миу, (41 9) Сг + (В - А) рд + 2 Сj [yJ% Н ФУ (/>Р,-<7<х,)] = Мог, С, (Фу + paj + q^j + ryj) = 6,, где a.j, p/t Y/ — составляющие орта ~\Jt в системе Олт/г, M,)v, МП|/, М„г—проекции момента М0 на те же оси, в, —проекция момента М/ на ось \j Здесь р, q, r—проекции мгновенной угловой скорости о тела Т0 на оси Охуг § 42 Решение задачи ориентации заданного направления с помощью маховиков Пусть в системе 0£г|2; задано неизменное направление, характеризуемое ортом s0, и пусть в теле Та задан орт г„, неизменно связанный с этим телом Требуется построить управляющие моменты, причоженпые к маховикам TJt такие, чтобы орт г0 был стабилизован в заданном направлении s0 Теорема 421 Существуют управляющие моменты, приложенные к Тj и обладающие следующим свойством тело Т0 либо находится в относительном покое ш = 0, s0 = r,„ (42 1) ш = 0, s~u = -70I (42 2) либо неограниченно приближается к положению относительного покоя, причем положение (42 1) относительного покоя асимптотически устойчиво по Ляпунову, а положение (42 2) относительного покоя обязательно неустойчиво Других положений относительного покоя тело Т0 не имеет Для доказательства этого утверждения, а главное, для фактического построения \правляющнх моментов рассмотрим систему уравнений, описывающих движение Т0 с маховиками Tlt ..., Tk e0w+й х е„й -j X ci КоФ/ и- Ф/ (*» x i/„) ]=м0, (42 з)
§ 42) ннпениь задачи opiifmtahhh 437 Покажем, что при /г = 3 можно построить указанные в теореме 41 6 управляющие моменты, приложенные к телам 7\, 7\, 7 л _ з Положим далее ^/ —С/Ф/ и <7=2<7/1/0. положим также Q= 2 Q/Ve' ТОГДа будем иметь 0оо) + ю X в0о Н q | o)Xq —M0, q + Dw = Q Здесь через D обозначена матрица D = LCL*, где С—диагональная матрица /С, 0\ с- с. \0 С,/ a L —матрица, /-й стоабец которой составлен из компонент l/it взятый в системе Охуг Выберем векторн>ю функцию Q так, чтобы было q4 wxq = M„—M, (42 5) где М — некоторый момент, тогда из (42 5) находим 0„<о + йх0ою = М (42 6) Из (42 6) находим далее Dtit^D&oW — Де7'(<йХвий) (42 7) Используя (42 5) и (42 7), найдем после подстановки во второе уравнение (42 4) Q = [Deo' — £]M + M0 — wxq — Z)e^(wX0ooJ) (42 8) Рассмотрим систему (42 4) при условии (42 8), тогда будем иметь 0o(o + (oX0o<o + q + a)Xq-=Mo, я"+Ой> = [Д0^ —£]М + М„ —wxq —О0^(йх0ою) Положим в системе (42 9) M=jJL-(-s0xgradH, (42 10)
438 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [п VIII где ц—некоторый момент такой, что ю ц=\У есть отрицательно определенная функция вектора ш, а ы_есть_ положительно определенная функция компонент вектора s0—г0, например, ц = —to, a u = -^-(sQ—г0)2; тогда (42 10) примет вид М = — <o + s0xr0. (42 11) Легко видеть, что при выборе момента М_в виде (42 1_1) система (42 9) будет иметь положение равновесия о> = 0, s0 = ±r0, q = q0, где q0 — постоянный вектор. Это положение равновесия соответствует тому случаю, когда тело Т0 не вращается, орт г„ ко1линеарен s0, а тела Гу (/ = 1, 2, 3) находятся в равномерном вращении Легко видеть, что других положений относительного покоя тело при таком управлении маховиками не имеет Формула (42 6) и момент (42 11) показывают, что рассмотрение поведения движения твердого тела Т0 можно осуществить, как и в § 39, с помощью функции V = 1 [ Ар' + В? + Сг* + (i0 - г>], причем будет dV/dt=W = — ю2. Это обстоятельство приводит с помощью уже известных из § 39 рассуждений к полному доказательству утверждений теоремы 42 1 Замечание В формуле (42 8), если задан момент (42 11), все величины можно считать известными, если известны компоненты угловой скорости о, компоненты вектора q и компоненты вектора s0 в системе Oxyz Для измерения этих величин необходимо в системе управления телом Т0 иметь специальные датчики, а именно датчики угловых скоростей маховиков относительно тела Т0 и датчики угловых скоростей тела Т0 относительно его главных центральных осей, а также датчики проекций вектора s0 в системе Oxyz Рассмотрим теперь общий случай Пусть с телом Т0 каким- либо образом связана система материальных точек, положение которых по отношению к телу Т0 единственным образом определяется с помощью обобщенных координат qt, .... qk При этих предположениях уравнения движения можно записать в следующей форме 0Q + QX0Q = M + Mft—М0, (42 12)
§ 42] РЕШЕНИИ ЗАДАЧИ 01'Ш.НТАЦИИ 439 где 0 —тензор инерции всей системы, рассматриваемой как единое твердое тело, Т — кинетическая энергия относительных движений, Мк — момент кориолисовых сил инерции, М0 — момент относительных количеств движений Величины Р/-= -- P/(qt, , q^ й) зависят от центробежных сил, величины Rj = Rf{qx, , qk, qv, , qk, Й) зависят от кориолисовых сил инерции Qj—обобщенная сила,_отнесенная к обобщенной координате <//. Еу- — некоторый вектор, Е/=Еу(qt, ..., qk), через М обозначен момент сил, действующих на систему Предположим, что выполнены следующие условия а) система (42 12) разрешима относительно компонент вектора й и величин qJt так что имеем Й = А0Н 2 A.-Q,, i = i Я/ = ЬЛ/+ gbj,Q„ 1=1, .... А» б) среди векторов А, существует три линейно независимых Выберем обобщенные силы Qj так, чтобы было выполнено соотношение 0АО + S QA/Qi + Q X 0Й = М (42 13) Пусть теперь s—орт, неизменный в абсолютном пространстве, и пусть R —орт, неизменно связанный с телом Т0 Теорема 42 2 Если выполнены условия а) и б)_и если_обобщен- ные сипы удовлетворяют соотношению (42 13), где М=—й-fZR xS, то тело Т0 будет иметь положение относительного равновесия R=S, Q = 0 При этом каждое движение, не совпадающее с другим относительным равновесием R= —S, й=0 будет обладать свойством R—>-S, й—»0 при t—»- + оо при надлежащем выборе почожи- тельной постоянной I > О Теорема 42 3 Если выполнены условия а) _« б) и обобщенные силы удовлетворяют соотношению (42 13), где М=—(й — й0) + + 0Qo + Q„x0Q + /RxSo, Sn — орпг^ вращающийся в абсолютном пространстве с угповой скоростью Й0, то система (42 12) будет, иметь положение относительного динамического равновесия R = S0> Й = Й0.
440 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕ1Л [ГЛ VHI Каждое движение^не совпадающее с R-^ — S0, Gf=Si0, будет обладать свойством Q—4.Q0, R—-Sa при t—► )-оо при надгсжащем выборе I > 0 Теорема 42 4 Если выношены условия а) и б) и обобщен ные cuibi удовпетворяют соотношению (42 13), где М = — (Й-S(ft S)) + /RxS, /по система (42 12) будет ы«етъ две системы относительных положений равновесия R = S, Q = XS и R=-S,Q = uS, где А, и \i — вещес'пвенные параметры Каждое движение твердого тела Т0, не совпадающее с положениями относительного равновесия второй группы, будет обладать свойством R—>S, Q—<-XS при t—v + oo при надлежащем выборе числа />0 Доказательство приведенных утверждений осуществляется путем построения функции Ляпунова и использования первых интегралов системы (42 12) § 43. Решение задачи об ориентации осей тела с помощью маховиков Пусть в системе Ogi|? задачы два постоянных ортогональных орта s01 и s02, положим s03=s(Hxs02 Пусть с телом Т0 неизменно связано два ортогональных орта г01, г02 поюжим гпз = г01хг02 Требуется выбрать моменты, управляющие движением маховиков 7\, Г2, Т3 так, чтобы стабтизировать_систему векторов г01, г02, г„з по отношению к системе векторов s0l, s02, s03 Теорема 43 1 Существуют моменты, управгяющие движением маховиков, такие, что тело Т„ либо будет находиться в попожении относительного равновесия (0 = 0, s0(- = ±r0, (i = l,2,3), (43 1) либо будет стремиться к поюженшо относите гьного равновесия при неограниченном возрастании времени При этом положении относительное равновесие ш = 0, se/=re, (1 = 1,2,3) (43 2) асимптотически устойчиво, остальные положения равновесия из числа указанных в (43 1) неустойчивы, других положений относитечьного равновесия, кроме (43 1), тело Т0 не имеет
§ 43] РЕШЕНИЕ ЗАДАЧИ ОБ ОРИЕНТАЦИИ ОСЕЙ ТЕЛА 441 Для доказательства этого утверждения положим в (42 9) M = jI+2so/Xgrad- ц, (43 3) 1=\ о/ где ц—некоторый момент такой, что w \i = W есть отрицательно определенная функция компонент вектора о>, а и — положительно определенная функция компонент векторов s0/ и г0(- Например з Д = -й, u = -i£(i0(.-F0,.)» (43 4) При условии (43 4) легко проверить, что тело Т0, кроме положений относительного равновесия (43 1), других положений относительного равновесия не имеет Анализ движения тела Т0 можно осуществить, опираясь на уравнение (42 6) так же, как это было сделано в § 40 При этом надо использовать функции Легко видеть, что будет dv/dt = W = — а>а Замечание Если существуют датчики, измеряющие проекции векторов s0l, s0! на оси Охуг, то для построения моментов, управляющих движением маховиков и удовлетворяющих условиям теоремы, можно не пользоваться датчиками угловых скоростей тела 7'0 относительно осей Охуг, так как 1 v< - <■> = — "2 2- so/ X so/ • При этом датчики угловых скоростей маховиков относительно тела Та остаются необходимыми для реализации упомянутых управлений Пусть теперь трехвекторник s„i, s02, s03 совершает вращательное движение как твердое тело вокруг неподвижной точки О с угловой скоростью ю, Требуется построить моменты, управляющие движением маховиков так, чтобы стабилизировать трехвекторник г01, гоа, г03 в направлении s01, s0„ sos Обозначим через <о, угловую скорость тела Т0 при его действительном движении и через х8 значение вектора к в этом движении, тогда получим
442 УПРАВПЕИИЕ ДВНЖЕНИРМ ТВЕРДОГО TI '1Л [П VIII из (42 9) систему уравнений вош2 + <й2Х0ою2+й24-<о2\>с2 = М,„ (43 5) «2 + Dw2 = [D0-1 — £]M + M„— й2хх2 — DS»1 (a>2x«w.) Положим в (43 5) _ _ _ _ _ 3 _ М = ц + еосй1 + ю1Хв0<о2+2vxgrad- и, (43 6) 1= 1 01 где ц—некоторый момент такой, что функция (ы2—е)1)ц=1^ является отрицательно определенной относительно компонент вектора <о2—со, и ф)нкция и является положительно определенной относительно компонент векторов s0,—г0(- (1 = 1,2,3) Покажем, что система (43 5) при управлении (43 G) имеет динамическое положение равновесия вида *>„ —«!, б0/ = ± г0/ (» = 1, 2, 3), где хх есть некоторое решение уравнения ^ + о»! X >е1 =М0— Ощ—ы1хв^а1 (43 7) Покажем это, пусть для определенности Ц= — К— ю,] и «=4ll (Su, —Го,)2 Подставляя в (43 5) вместо о)г, и2 величины со,, х, и учитывая уравнение (43 7), а также соотношения s,„- = ± г0/, приходим к тождествам Теорема 43 2 При управлении 0 = [ D6ol -£]М4М0 — w2 у х,—DB0-\o2 X 0«,, М = (ii+ 00»! + «1X0ow2 + 2 [s0,-N grads «] тело Т0 шбо находится в положении относите гьного динамического равновесия щ=ы1, s0l- = ±r0,-, либо неограниченно прибш- жается к такому положению При этом поюжение относительного динамического равновесия <йг=<йи s0/=r0<- условно асимптотически устойчиво Другие по южения относительного динамического равновесия из указанных выше будут обязатегьно неустойчивы
§ 43] РЕШЕНИИ ЗАДАЧИ ОБ ОРИЕНТАЦИИ ОСКЙ ТЕЛА 443 Доказательство Пусть функции ы2, х,, s0, (/ = 1, 2, 3) описывают некоторое движение рассматриваемой системы тел При этом функции s0, удовлетворяют уравнениям dsjdt = [й, — ©,] х s„, (i = l, 2, 3) (43 8) Вычтем из первого уравнения (43 5) второе уравнение системы (43 5) Тогда после некоторых преобразований получим [£—ое^неЯ+вчхеЯ—м] = о (43 9) Через £ здесь обозначена единичная матрица, а матрица Е — Ddu1 является неособой Поэтому из (43 9) обязательно будем иметь 0ой2 + »„ х 0о<о2 = М. (43 10) Сделаем в уравнении (43 10) замену <о2 = ю -+- ю1. Тогда получим _ _ _ _ 3 0О<» + (а Х0о(о3 = —<о + 2 г0, Xs0/. (43 11) Умножая обе части (43 11) скалярно на © и учитывая, что to х s0,• = — dsai 'd t, на идем ■i jt \aP + Bq + СГ- + £ (i0(- - F0,)« I = - «■. (43 12) Из (43 12), как и в § 40, найдем, что обязательно 5 — 0 и Se/xfo, —0 при * — + «>, (43 13) и далее найдем, что положение а> = 0, s0,=ro/ (i = l, 2, 3) асимптотически устойчиво по Ляпунову, следовательно, положение относительного динамического равновесия тела Т0 будет условно асимптотически устойчиво, при этом усювность заключается в рассмотрении вопроса об устойчивости лишь по части координат И далее, любое по аожение относительного динамического равновесия со = 0, s,1 = ±r0/, отличное от (43 13), будет неустойчивым Замечание Управляющие моменты, о которых идет речь в теореме 43 2, можно построить, не пспотьз\я датчики уповых скоростей теча Т0, а используя лишь датчики угловых скоростей маховиков Tlt Тг, Тл относитетьно тела Т0 и датчики проекций
441 yilPABlFMHC ЛВИ/KEIIHI M TBI РДОГО ТЕЛА [П VII! векторов s,„, s()2 в системе Охуг Действительно, <а2 = (о1 — — у 2* s<>; x so(- угловая скорость Wj трехвекторника s01, s0i, s„, известна в проекциях на этот трехвекторник, следовательно, проекции о), могут быть найдены также на оси Охуг, так как матрица перехода А между этими системами координат имеет в качестве столбцов компоненты векторов s0,- Остановимся теперь на решении задачи сканирования Именно, предположим, что система Охуг совершает заданное движение по отношению к системе 0£i|£ с угловой скоростью <о Тогда вектор s„, занимающий неизменное положение по отношению к системе 0<;г)С, буает вращаться по отношению к наблюдателю, находящемуся в системе Охуг, с угловой скоростью —ю, и будет единственным образом определяться в системе Охуг с помощью дифференциального уравнения ds0/dt- — wxs0 (43 14) и своих начальных проекций при /—О Обозначим через о„(/) поучающийся таким образом вектор Обозначим, как и выше, через и>2 и х, депствптепьное движение системы тел, через s„ (0 — вектор-стопбец, образованный из проекции вектора s„ на оси Oxyz при этом движении, тогда ch()idt=— w2xs0 (43 15) Положим в (43 5) М = ц + о0х70. (43 16) где fi—некоторые'! момент, такой, что (to2—(ox)\x=W—есть отри- цатепьно определенная функция относительно компонент вектора со2 — <а1 Для определенности можно считать (* = — (©,—©,) Теорема 43 3 При управлении 0 = [DO-1 — Е] М + ЛТ0 — Тог ххг- D6o»ю2 x 0w2) M = |Li + aoxs0 тело Г0 либо движется в режиме сканирования о2 = <о,, sn = ±0„, либо стремится к такому движению При этом движение о)г = <■>,, s0 = o0 условно асимптотически устойчиво Движение (аг = ы1, s0 = —a„ неустойчиьо
§ 44] цифровой навигационный ав'очлт 445 Доказательство теоремы 43 3 осущесгвтяется тем же приемом, который был применен в теореме 43 2 и с использованием результатов § 40 Замечание Для решения задачи сканирования в предлагаемой форме в системе управтения телом 7',, необходимо иметь датчики проекций угловых скоростей тела Г„ на оси Oxyz, датчики угловых скоростей маховиков и датчики проекций вектора s0 Однако датчики проекций угловой скорости тела Г0 на оси Oxyz можно исключить, если использовать датчики проекций двух векторов s01 и s,l2 на оси системы Oxyz § 44 Цифровой навигационный автомат Пусть задан некоторый объект, который представляет собой с механической точки зрения твердое тело Введем в рассмотрение две системы координат 0£т|£ — неподвижную по отношению к Земле, и G\yz — неизменно связанную с упомянутым объектом Точку О поместим в центре Земли Плоскость 1,0ц есть плоскость экватора, ось ОС направлена по оси Земли к северу, ось 0£ лежит в плоскости ну аевого меридиана, ось Оц — в п тоскостп меридиана расположенного на 90° восточной долготы Система 0|пь правая Точку О поместим в центре тяжести объекта Если это корабль, то ось Gx направим в диаметральной плоскости в нос, ось в птоскости мидель шпангоута—в левый борг и ось Gz — вверх Положение объекта будет полностью определено, если будет известно распо тожение системы Gxyz относительно системы 0|п£ Это расположение определяется единственным образом с помощью шести величин £, х\, £ (координат точки G в системе 0£г|£) и величин ij), 0, ф, являющихся углами Эй пера Эти углы полностью определяют матрицу A = a,j% i, /=1, 2, 3, перехода из одной системы координат в другую, так что atl есть косинус угла между i-н осью системы 0|г|£ и / й осью Gxyz Если какой- либо вектор h имеет компоненты hK, iiy, hz в системе Gxyz и компоненты hit /?„, Л? в системе 0£n,£, то будут иметь место соотношения /*С = °зЛ + ЯаЛ, + ° < >Л* Если в G провести оси С£и Gi|,, GLX, параллельные осям 01, On,, 0£, то, обозначив через G„ линию пересечения п тоскостп Оку с плоскостью G£,t|,, получим следующие углы <р—угол между G\i и G„, 0 — уюл между Gtv и Gz, ср—угол между G<
446 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII и G„ Напомним, что угол ty называется углом прецессии и отсчитываегся от G|t против часовой стрелки, если смотреть с положительного направления G£t Угол в или, точнее, его изменяемость, называется нутацией (8—двугранный угол, образованный плоскостями Gxy и G|1ril при ребре G„, называемом линией узлов) Угол <р называется углом собственного вращения, отсчигывается от оси Gn против часовой стрелки, если смотреть с положительного направления оси Gz Предположим, что на борту рассматриваемого объекта находятся шесть измерительных приборов три аксельрометра, оси которых направлены соответственно по осям х, у, г и три измерителя угловых скоростей объекта при вращении его вокруг осей Gx, Gy, Gz Будем считать, что все эти приборы размещены в центре тяжести объекта Обозначим через w ускорение центра тяжести и через <о—вектор угловой скорости вращения объекта около его центра тяжести Через w0 обозначим вектор ускорения силы тяжести в точке G, через (о0—вектор угловой скорости вращения Земли Положим W = w + w0, fl = o> + ft>0 (44 1) Акселерометры будут измерять проекции w на оси Gx, Gy, Gz Измерители угловых скоростей будут измерять проекции о> на те же оси Из (44 1) вытекает, что между проекциями вектора w на оси Gxyz и 0£п£ будут иметь место зависимости Wl — ai\WX + °12Wy + ai3WZ' wi\ — aawx + 0гашу + at3Wz > (44 2) wt = a3lwx + a32wy + a3iwz В равенствах (44 2) величины wx, w,n wz являются входными ciiriiaia\iH акселерометров и, следоватетьно, могут рассматриваться как заданные числа Кроме того, имеем Wl = wi + wol, В равенствах (44 3) величины w0t, wor], шо5 суть проекции ускорения силы тяжести в точке G°na оси 0%, Оц, ОС Следовательно, га>о! = — ёИр, к'оп = — <?¥Р. и'оС = — SVP, (44 4) где p = Vl* + 42+l2. В равенствах (44 4) величина g есть численное значение ускорения силы тяжести Соотношения (44 4) имеют место потому, что вектор ускорения силы тяжести направлен по радиусу OG
§ 44] ЦИФРОВОЙ НАВИГАЦИОННЫЙ АВТОМАТ 447 к центру Земли, а |, tj, £ есть компоненты вектора OG Величины U7|, W^, Wi представляют собой проекции ускорения вектора OG на оси 01, Оц, 0£, следовательно, И?5=|, W^=r\, U/t=t Используя эти равенства, из (44 2) найдем I = - J + anw» + auwy + ai3Wz, Ч = - у + anwx + a2zwy + a23w„ (44 5) t=-f + a31wx + a32wy + a33wz. Как было отмечено выше, величины atf являются функциями углов i|), 0, ф Эти углы изменяются с течением времени Введем дифференциальные уравнения, служащие для их определения. Эти уравнения получаются из рассмотрения связи показателей измерителей угловых скоростей с углами 1|з, 0, ф и их производными Обозначим через п0 единичный вектор, направленный по линии узлов G„, через z0—по оси Gz, через £„—по оси G£, Тогда угловая скорость <о объекта может быть представлена в следующей форме w = ^o + 0no + <pzo (44 6) Угловая скорость вращения Земли <о0=£па, где а—численная величина угловой скорости, следовательно, О=(ф + а)?0 + еп0 + ф20 (44 7) Проектируя равенство (44 7) на оси Gv, Qy, Gz, найдем Qx = (ф + a) (£0х0) + ё (пЛ) + ф (z0x0), Ц, = (Ф + «) (£0Уо) + 9 (ПоУо) + Ф (20Уо), (44 8) Qz = (if + ос) (50z0) -|- 0(nozo) + Ф (z0z0) Находя выражения скалярных произведений единичных векторов, входящих в (44 8), получим &* = (^ + а) o»i + 0 cos Ф> Gy = (y + a)a32 + Qs\n<p, (44 9) Qz = (i + a)au + <p,
448 ynPABTFHiii: движриинм тш i-дого тела [|л viii Выражая производные углов г|), 0, ф через их значения и через выходные сигналы измерителей угловых скоростей, найдем Qx sin ш — Qbcosu> a3l sin (p — a3,Qx— o^Q,, 032COS ф —«31 Sill О «in rr sin cp —o32cos ф Совокупная система уравнений (44 5) и (44 10) полностью определяет в пространстве положение рассматриваемого объекта в любой заданный момент времени на основе показателей нзмери гелей ускорений и измерителей угловых скоростей, если только в некоторый момент, принимаемый за начальный (t = t0), заданы девять величин £„, т)0, £0, |„, т|0, £0, г])0, 00, ф0, которые характеризуют положение центра тяжести, его скорость в начальный момент времени и расположение осей, связанных с объектом по отношению к осям, фиксируемым в пространстве Действительно, полученная система представляет собой систему шести дифференциальных уравнений, служащую для определения искомых функций £, г|, £, 1|з, 0, ф В силу теоремы существования и единственности для систем дифференциальных уравнений, она имеет единственное решение, отвечающее указанным выше начальным условиям Это решение и будет определять единственным образом по южение рассматриваемого объекта в пространстве Пусть 1(1), \\(t), £(0 — координаты центра тяжести объекта Найдем расположение объекта по отношению к земной сфере Пусть X и 6 есть географическая широта и долгота места, тогда точка, являющаяся проекцией центра тяжести на земную сферу, имеет спедующие географические координаты Я = arccos—, (44 11) где р — расстояние от центра тяжести Земли до рассматриваемой точки Обозначим через Н высот} точки G над земной поверхностью, тогда H = p-R, (44 12) где Н — радиус земной поверхности.
§ 44J ЦИФРОВОЙ НАВИГАЦИОННЫЙ АВТОМАТ 449 Формулы (44 11) и (44 12) дают положение центра тяжести объекта в географических координатах Приведем теперь формулы, характеризующие ориентацию объекта по отношению к местному горизонту Местный горизонт образуется плоскостью, перпендикулярной к местной вертикали, иначе говоря, к вектору OG Найдем углы между осями Gx, Gy, Gz и этой плоскостью Обозначим через 0 угол между осью Gx и горизонтальной плоскостью, через у — угол между осью Gy и горизонтальной плоскостью Если рассматриваемый объект есть летательный аппарат, то это соответственно углы тангажа и крена. Обозначим через г0 единичный вектор, направленный по вертикали вверх в точке G, тогда г. _«»+'№+«■. (44 13) Угол 0 может быть определен как дополняющий до прямого угол между осью Gx и вертикалью; следовательно, 6 = у — arccos (х0г0) = у- 7 = у—arccos(у0г0) = у—arccos lii,r J-" . (44 15) Для полной характеристики ориентации объекта введем еще угол рыскания г|>, определив его как угол между проекцией оси Gx на плоскость горизонта и направлением на север Найдем выражение этого угла через координаты центра тяжести и эйлеровы углы, выражающие ориентацию осей объекта в абсолютной системе координат Векторное произведение (г0х5) дает вектор, перпендикулярный к плоскости меридиана места и направленный по параллели на запад Двойное векторное произведение (гох£0)Хго дает вектор, направленный на север и лежащий в плоскости горизонта Обозначим этот вектор через а Вектор (г0 X х0) лежит в плоскости горизонта и перпендикулярен векторам г0 и х0, следовательно, вектор (гохх0)хго лежит в плоскости горизонта и направлен по линии проекции оси Gx на эту плоскость. Обозначим этот вектор через Ь, тогда будем иметь Воспользуемся правилом вычисления двойного векторного произведения ах (Ь х с) = b (ас) — с (ab)
450 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ. VIII для отыскания векторов a, b и их длин a = -(r„(r0> Q-Q, Ь = -(г0(г0, х0)-£0), (ab) = (£0х0) - (г0х0) (г0£0) = а31 —^ (аи1 + апг) + а31С), I а |2 = 1+ (г„£0)2-2 (г0?0)2 = 1 -(rng0)2 = 1 —jj-, | b |» = 1 -(r0x0)2 = 1 - <2ii£±£^±£««!. Следовательно, для угла ч|з имеем формулу * = arccos(fl„—Дг(ап6 + о11т| + а,гС))х x(i —g.)-,/a(i _(»»е+д»?+^в')-'/», (4416) Формулы (44 11)—(44 16) позволяют единственным образом определить положение центра тяжести объекта в земной системе координат X, 6, Н, а также определить единственным образом ориентацию его осей по отношению к местной вертикали и направлению на север В некоторых случаях эти величины полезно определять непосредственно по показаниям аксельрометров и измерителей угловых скоростей Для того чтобы иметь возможность проводить такое определение, выведем систему уравнений, связывающую непосредственно показания датчиков ускорений и угловых скоростей с указанными шестью величинами Построим с этой це 1ЫО оси G%\%, ось G| направим на север, G\\ на запад и GC но местной вертикали Плоскость |Gi] является плоскостью местного горизонта Чтобы получить представление об углах i|>, 6, ср, представим себе, что система Gxyz совпадает с системой G\r\t, Повернем систему Gxyz вокруг оси G£ на угол г|э Линию, перпендикулярную к новому положению оси Gx, обозначим через Gn и будем называть линией узлов Повернем далее систему на угол 0 вокруг линии узлов и затем на угол v вокруг полученного направления оси Gx Пусть п0 есть единичный вектор, направленный по линии узлов Угловая скорость <о объекта при вращении его около центра тяжести представляется в виде суммы трех угловых скоростей при вращении вокруг осей G£, Gn, Gx, следовательно, © = ^0+en0+Yx„, где £и — единичный вектор, направленный по оси Gl, Обозначим через В матрицу {by}, i, / = 1, 2, 3, где by есть косинус угла
§ 44| ЦИФРОВОЙ НАВИГАЦИОННЫЙ АВТОМАТ 451 между i-й осью системы G\r\l и /-й осью системы Gxyz Пусть далее матрица С — {с^}, i, j — l, 2, 3, дает матрицу перехода из абсолютной системы 0£т]£ в систему Gjtj£, так что cif есть косинус угла между t'-й осью системы 0\r)t, и /-й осью системы G|t)£. Ясно, что А = СВ, где Л—матрица перехода из системы Gxyz в систему Olrfe Следовательно, имеем з % = j£ с,-А/ Единичный вектор п0, направленный по линии узлов, можно представить в форме "о = !о sin 'Ф—"о c°s Ф. тогда сох=(солг0) = #31 + 9 (&п sin -ф—621 cos i|>) + у, ©г=(сог0) = фйзз+б (fei3 sin i|>—62S cos i|>) Угловая скорость вращения Земли представляется вектором ю0 = а£0, отсюда имеем й)ох = аа31, (о0у = аа3г, щг = ааа3 Положим, как и выше, Q =ы + ы0, тогда Qx = ax + w0x, Qy = CO;, + со0у, йг = (ог + £йог- Из этих уравнений находим . _ (Qy—й)оу) (&„ sin 1J>—&,, cos т|)) —(Ог—ы„г) (&i; sin г|>—»ga cos Ф) ^= Ьзг (*i3 sin -ф—*гз cos lb) — 63з (*1г sin i|>—622 cos гр) ' е (Qy—(о0у) Ь31-(а2—щг) Ьзг ~ l>32 (b13 sin "ф—г>23 cos ib) —633 (612 sin ty—bit cos tb) * V=(Qx-o,0x)- (Оу-Ыои)(&13 sin ф —6g3 cos гЬ)-(Рг—й)0г) (fr12 sin i|>-&22 cos ф) 31 632 (613 sin ib—623 cos tp)—633 (&12 sin ij>—6гг cos ф) -(*.i Sin ф-^1Со3l|>) 6з? (»„ sin y-bM cos ib)-ft33 0» sin *-b„ cos tb) * Будем считать, как и выше, что Земля сферическая и ее радиус R, тогда р= R + H, % = (/? + Я) sin A., (44 17) Tl=(/? + tf)C0SAX0s6, £=(#+//) cos A, sin 6.
452 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII Из этих равенств найдем дифференциальные уравнения для определения функций К, 6, Н, используя (44 5) ззз ((# + #) Sin Л)"^SinAg-j-tt^ 2 CilPln-rWy 2 C3kbte + Wz 2 сзАз> ((# + //) cos л cos 6)" = 3 3 3 = cos Я, cos5g + wx 2 cikbhi =wyHj ciiPk2 + w2 2 сиАм> (44 18) з ((R + H) cos К sin 6)" = cos К sin 6g+ wx 2 c2 Ai + Система уравнений (44 17)—(44 18) позволяет по сигналам датчиков ускорений и датчиков угловых скоростей однозначно определить положение объекта и его ориентацию в местной системе координат, если заданы в некоторый момент положение его центра тяжести и ориентация его осей, а именно, Х0, б0, //„, *.„, б0, Н0, %, 0о, 7о Управление объектов в некоторых случаях осуществляется по боковому отклонению, отсчитываемому от некоторой плоскости, поэтому в данном случае полезно использовать уравнения движения, выведенные непосредственно для такого отклонения § 45. Определение направляющих косинусов связанных осей Пусть заданы системы координат Oxyz и Ох'у'г' Система Oxyz является абсолютной, а система Ох'у'г' связана _с объектом, ориентация которого определяется Обозначим через х0, у0, z0 и х'0, у£, 7, орты осей соответственно абсолютной и связанной систем координат Через atJ обозначим косинус угла между i'-й осью связанной системы координат и /-й осью абсолютной системы Тогда будем иметь aa=(xj, x0) о12 = (х0,у0) ai, = (si, z0), (45 1) flti=(yj. x~o) ^t = (yi. Уо) ff» =(У";. z"o). (45 2) a3i = K, хц) озг = Й, У„) й^ = (20, z0) (45 3) Введем в рассмотрение векторы S и Н Обозначим через sh ft,- и s\, h\ (i = 1, 2, 3) компоненты векторов S и Н соответственно в абсолютной и связанной системах
§ 45] ОПРЕДЕЛЕНИЕ НАПРАВЛЯЮЩИХ КОСИНУСОВ 453 координат Векторы S и Н в абсолютной системе координат могут быть представлены равенствами S = s,x0 + s2y0 + ssz0, (45 4) Н = Лхх0 + Л2ув + haz0. (45 5) Положим N = S х Н. (45 6) Тогда, обозначая, как и выше, компоненты вектора N^ в абсолютной системе координат через «,, н2, п3, будем иметь N = «jX0 + Ai2y„ + njz0. (45 7) Умножая обе части равенств (45 4), (45 5) и (45 7) скалярно на вектор х'0 а учитывая соотношение (45 1), найдем ^ = SiOn + s2a12-|-s3a13, h\ = htau + Л2а12 + haal3, (45 8) п[ — nlan + п2а1г -f- n3al3. Выражения (45 8) представляют собой систему линейных алгебраических уравнений для определения направляющих косинусов оси Ох' связанной системы координат в абсолютной системе Легко видеть, что направляющие косинусы i-й оси связанной системы будут удовлетворять системе уравнений s? = SiO.i +siait + s3ai3, К = /i,aft + Мл + M*. (45 9) (/=1. 2,3) Здесь n'i (t = l, 2, 3) — проекции вектора N на оси связанной системы координат Найдем численное выражение опредечителя системы (45 9) Расирывая определитель этой системы по последней строке, найдем b = nl(stha—htsa) — nt(slht—hist)+ni{slht—hlsl) = N2 (45 10) Таким образом, определитель системы (45 9) отличен от нуля тогда и только тогда, когда векторы S и Н неколтинеарны Решим систему (45 9), для чего построим ее обратную матрицу Обозначим через В матрицу системы (45 9). Тогда ее обратная матрица С = В'1 определяется следующим образом. Элемент Сц равен апгебранческому дополнению элемента Ьц
454 УПРАВЛЕНИЕ ДВИЖЕНИЕМ TBFPflOTO ТЕЛА [ГЛ VIII матрицы В, разделенному на определитель матрицы В Отсюда легко видеть, что матрица С может быть представлена в виде C = -^(HxN, NxS, N). (45 11) Это означает, что первый столбец матрицы С состоит из компонент вектора HxN, взятых в абсолютной_системе координат, второй столбец—из компонент вектора NxS, взятых в той же системе, и, наконец, третий столбец—из компонент вектора N С помощью матрицы С направляющие косинусы осей можно представить в следующей форме A/=CF,., где А/Ца/,) и F/ = U;j. (45 12) Дадим запись направляющих косинусов_в скалярной форме. Для этого вычислим векторы HxN и NxS Н X N~= H~X (S X Н) = SH2 — Н (Н S) = 0 (Н) S, (45 13) где 0(H)—матрица 0(H) = £Н2—НН», где Н* означает транспонирование вектора Н, так что fh\ + h% —АД — АД\ 0(Н) = 1— АД Щ + hl —АД). (45 14) \—АД —АД AJ +А*/ Аналогично имеем NxS = (SxH)xS = Sx(H"xS) = 0(S) ff. (45 15) Из выражений (45 12)—(45 15) имеем o„N2 = s;.[МЛ?+ /*!)—s2(h1 A2)—s3(Ax Л3)] + + h'c[hl(sl + sl)—hl(s1 s,)—A,(s1-s,)] + /i;[s1A,—вД], (45 16) a{i№ = s'£ [— в,АД + s2 (A2 + /i»)—«Д Л3] + + h'i[—hls2sl + h2(s\ + sl)~h3s2s3] + n'i[s3h1—s1h3], (45 17) ai3W = s'l[—s1h3hl—s2h3h2 + s3(h\ + hl)] + ~\-hl[—h1s3s1 — h2s3si + h3(s* + sl)] + n'i[s,h2—s2h1) (t = l, 2, 3) (45 18) Формулы (45 16) —(45 18) дают направпяющие косинусы t-й оси связанной системы координат в абсолютной системе
§ 40] ОПРЕДЕЛЕНИЕ УГЛОВ КРЕНА, РЫСКАНИЯ, ТАНГАЖА 455 Произведем некоторые преобразования этих формул С этой целью положим a = _j4L_, o = S —|S| а -Д-. I SI |H| f 1-11 Величина а является косинусом угла между S и Н, вектор а ортогонален вектору Н (о Н) = 0,_и векторное произведение ахН дает введенный выше вектор N, т е <г х Н = N Заменим_всюду в предыдущих формулах векторы S, Н, N на векторы а, Н, N Тогда будем иметь HxfT=oH2, ^Xa = Haa. Из выражения (45 12) имеем аи = -=—=J (Н2а;а,- +1S |г (1 —а2) к\к, + njn,) (i= 1, 2, 3, /= 1, 2, 3). (45 19) В формуле (45 19) использовано равенство N2 = <r2|H|2 и <r2 = |S|2(l — a2) Следует иметь в виду, что в (45 19) a't и а/ определяются по формулам о'.-с' ^Lah< а .-.с ]WLahl 1 ' |Н| ' ' ' |Н| § 46. Определение углов крена, рыскания, тангажа Определим угол рыскания г|> как угол между проекцией оси Ох' на плоскость хг и осью Ох Угол тангажа 0 определим как угол между этой проекцией и осью Ох' Угол крена у определим как угол между осью Оу и ее проекцией на плоскость, проходящую через Ох' и Оу Представим эти углы через проекции векторов S и "Н в абсолютной и связанной системах координат Обозначим через п0 орт линии узлов находим ф = * arccos - "0 = ХоХУо UoXyol = arccos (z0, "и » П0). = = arccos
456 УПРЛВ1ГНИЕ ДВИЖСН111 М ТВЁРДОГО ТЕЛА [ГЛ VIII Легко видеть также, что О = arctg °хг K»1IT«U Аналогично имеем ?=■= arccos °M = = aiccoS' a"- =arccos °" (46 3) Воспользуемся формулами (45 16)—(45 18) дпя выражения углов крена, рыскания, тангажа через проекции векторов S и Н Тогда получим г|> = arccos[\s[[sl {hl + hl) — s2hlh2—s3hlhJ] + -\- h[ [hr (s] -f- si) —h^lsi—h3sls3] + + ni[sji,—hts,]\ {N4 — \s[[— s,AA+ «•№? + *!) — s3A2A3]-!- + ЛЛ— A,s2s, + A2(sJ f si)—//3s2s3]-bn;[s3Ai—«Л]}2}-,Ч (46 4) 9 = arctg[{s;[— s,Mi + *i№ + A5)—S3M3J + + A;[—A1s2sI-j-A2(sr + s3)—A3s2s,,] + + n[ [sA—s,A,]} {N4 —[s't (— s,A A + s, (A? 4- /»!)—«sMs) + + A',(— A.sa + A^sJ + s*) — A1s2s,)4-«;(s3Ai — s.A,)]*}-*'.], (46 5) V = arccos [ {s2(— s A'li + s, (AJ + AJ) — s,A A) -f- + Л; (— A1s"2sI + A, (s? + sD—fi^sfy) + + "i(sA— /l.s,)}{N4—[s|(— SjA^ + s^AI + A!)—s3A2A3) + + ЛК—MA + /»i(Si + s|)—AASj)-*-ni(sA—Aa)]*}_,/»] (46 6) Следует иметь в виду, что формулы (46 I) — (46 3) не позволяют однозначно опредетять величину углов рыскания и крена Поэтому остановимся несколько подробнее на способе уничтожения этой неоднозначности Прежде всего установим начало отсчета и промежутки изменения углов г|>, 0 и у Если представить себе, что системы Охуг и Ox'y'z' совпадают, то }гол рыскания г|) можно определить как угол поворота системы Ox'y'z' вокруг оси Оу против часовой стречки При этом ось Oz' займет положение On (линия узлов) Следовательно, угол гр отсчитывается от оси Ох в плоскости хОг против часовой стрелки и меняется от 0 до 2я Таким образом, форму па (46 I) дает г|)б[0, я], если о13 < О, и \|> £ [я, 2л], если ап > 0 Повернем вторично систему Ox'y'z' вокруг оси On на угол 0 против часовой стрелки Таким образом, если ось Ох' будет находиться над плоскостью Oxz, то 0£[О, я/2] Если же ось Ох' находится в плоскости Oxz или под ней, то 0€[О, —я/2] Формула (46 2) дает однозначно значение )гла тангажа Следовательно, угол меняется в пределах 0 6 [-я/2, л/2]. =arctg VV- (46 2)
§ 47] ТОЧНОСТЬ ОПРЕДЕЛЕНИЯ ПОЛОЖЕНИЯ 457 Повернем далее систему Ox'y'z' на угол у вокруг оси Ох'. Последний поворот совмещает связанную систему с ее положением в абсолютной системе координат, определяемой углами г|), 0, у. Формула (46 3) определяет угол у также неоднозначно Будем считать, что v£[0» я]» еслп вектор Уо лежит справа от плоскости х'Оу, и у€[п, 2я], если вектор у„ лежит слева от плоскости х'Оу для наблюдателя, смотрящего по направлению оси Ох'. Приняв это соглашение, следует считать 1) v€[0, я] при условии агз > 0 и г|>6|0, -jl или nf11-211 или а23<0 И1|>€ [-f, у я], 2) 7€[0, —я], если а23 < 0 и Ц€ [о, у] или ГуЯ,2л], либо а„>0 и *к[у, 4я]. § 47. Точность определения положения при двухвекторной системе контроля В общем случае компоненты векторов S и Н как в абсолютной, так и в связанной системах координат являются случайными величинами с заданными функциями распределения. Следовательно, направляющие косинусы ai} связанной системы координат также будут случайными величинами, а потому станут случайными углы крена, рыскания и тангажа В общем случае определить законы распределения величин или углов г|>, 0, у не представляется возможным, однако всегда можно указать методы вычисления средних значений этих величин и среднеквадратичных отклонений Таким образом, можно будет оценить точность ориентации рассматриваемого объекта, причем эту точность можно определить в зависимости от погрешности бортовых приборов и моделей физических векторов S и Н как по отдельности, как и в совокупности Будем считать, что компоненты векторов Sh H можно представить в форме s,-=«?+*,-, s; = s;°+*;, hi = hf + yh К = /г;° + y't (1 = 1, 2, 3), где s", hi, s,'°, h'i°—детерминированные величины, a xh yh v/, {/•—случайные величины с нулевыми математическими ожиданиями и заданными дисперсиями Будем считать, например, что все эти величины распределены по нормальному закону и независимы между собой В разложении величин at/ по их степеням удержим лишь чпены, линейные относительно х[, y'it xh у, Тогда
458 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОЮ ГЕЛА [ГЛ VIII будем иметь Е/дац дай да.-{ да,-, \ кт1№Х' + ^У* + -4Х'к + 'ЩУЧ С./вЬ2,3) (47 1) Правая часть выражения (47 1) представляет собой случайную величину с нормальным законом распределения Таким об разом, приближенно можно считать, что средние значения величин а;/ определяются формулами (45 16) — (45 18), если входящие в эти формулы величины заменить их средними значениями s?, hf, si0, h'f (i = l, 2, 3) Дисперсии величин a;j будут тогда определяться формулами + ^УЯЫ] (I, / = 1, 2, 3)(47 2) Частные производные, входящие в формулы (47 1), (47 2), вычисляются при средних значениях компонент векторов S и Н Если считать, что модель поля идеальна, т е D(x,) = Q и £>(у,) = 0 (1 = 1,2,3), то формула (47 2) будет давать квадрат средней ошибки, возникающей вследствие неточной работы бортовых приборов Если считать, что бортовые приборы идеальные или что их погрешность исчезающе мала D(x'i) = D(y'l) = 0 (i=l, 2, 3), то формула (47 2) будет давать квадрат средней ошибки возникающей из-за неточности физической модели, дающей векторы S и Н. Подобным же образом можно определить точность ориентации по отношению к углам крена, рыскания, тангажа Ограничиваясь в разложениях величин г|з, 0, у первыми членами относительно погрешностей, найдем ■Л ГЭО , дв , <Э0 , , «Э0 , .1 Ь^о + ^УъЪ+ЩУ'+ЦЪ + ЩУ']' (47.3)
§ 47] ТОЧНОСТЬ ОПРЕДЕЛЕНИЯ ПОЛОЖЕНИЯ 459 Из формул (47 3) имеем выражение для дисперсий этих величин B»)-gj(S),B«"'+(a)'D<»'»+(Sf)'D«)+(ss),DH" от=± [{%)'° <*>>+(|)'D <*>+(|)*D«)+$)'*> w]. (47 4) D(T)-t[(£)"'>W + (at),B(»,)+(^),D(«a + (%),D«)]. Найдем формулы для выражения частных производных величин а,у, t|), 0 и у. встречающихся выше Как следует из § 45, вектор Aj связан с F,- линейной системой BA,. = F,. (47 5) Пусть В = В° + АВ, А,- = А? + ДА? и F, = F» + AF; Здесь знаком А обозначена погрешность векторов и матриц, возникающая в результате измерений Система (47 5) примет вид (если учитывать члены, линейные относительно погрешностей) В" ДА,= AF,— ДВА?, (47 6) так как B°A? = F? Из выражения (47 Ь) имеем ДА? = С„ AF,—Со ДВА? (47 7) Распишем векторное равенство (47 7) по компонентам. Например, для Да,, будем иметь Дап = ■$? {x\ [st (hl + hD — sJiJis — sJifiJ + + У\ [К К + s\) - ЙЛ58 - h3slS,\ + Ч- [x'2h'30 + i/3s'2o—х'31ц° —s\°y'z] (s,h3—sA)}~ 3 —Srl«i (Л1 + ЛЗ)- s.(M.)-s»AA] £*,*?,- 3 —fjr [K (sj + sj)—A,(s,s,)—A^s,] 21 «/«<— ~W (sAsJh) [- x, (а?2/г»3-ft°a°3) + x, (oJ.A^-a?^?)- —x3 (aj,/i§ — а?гЛ?) + у, (fl;2s!j — sga°3)— —У% (oJi«S — «1V1) + 1/з («°ns2 — sja?.)]. (47 8)
460 УПРАВЛЕНИГ ДВИЖПИНСМ ТВЕРДОГО ТЕЛА [ГЛ VIII Из выражения (47 1) имеем cos г|) — —°1'. ■■, Vl-aU' откуда — sin т|) Атр = ■- ,—— + о?1«?. Аа12( 1 — af2)~~= У l-ail - (1 — af0)~ Т [Авц (1 — оЙ) + «и«?г Аяи]• Заметим, что °",и" / -, • |/ 1—сГз откуда окончательно имеем At|> = [Дап (1 — all) + а°,«»2 Afl12] -^ (1 — оЙ)"1. (47 9) (47 10) (47 11) Предположим, что компоненты векторов S и Н в абсолютной системе даются без погрешностей или что эти погрешности исчезают^ малы, тогда уравнение (47 7) примет вид AA,= C0AF(- (47 12) Найдем среднюю суммарную ошибку определения направляющих косинусов осей связанной системы координат. Обозначим через din эт> ошибку для i'-й оси связанной системы координат Тогда будем иметь d]n = 2 D (аи) = 2 М (Да,,)*. (47 13) Из выражения (47 12) имеем 2(A«,y)- = AF'C-C0Ar, (47.14)
§ 47] ТОЧНОСТЬ ОПРЕДЕЛЕНИЯ П010ЖЕНИЯ 461 Матрица С'0С0 имеет следующий вид / (H0XN„)2 ((H0XN„)(N0XS0)) 0 \ С'0С0= ((H0xNo)(S"oxN0) (S0xN„r- 0 Хт-^i (47.15) \ О О NJ/ Последняя компонента вектора AF,- может быть приближенно представлена как линейная функция величин х[, х'г, х'3, у[, у[, у'3 с номерами, отличными от i Следоватепьно, ее можно будет считать независимой от первых двух компонент этого вектора. Имея в виду это, возьмем от обеих частей (47 14) математическое ожидание Тогда получим din =^r WID (л,-) + SID (у-) + D (An,')] (i=1, 2, 3). (47 16) Найдем явное представление средней погрешности для каждой из осей Для этого вычислим величину D(An'i), где /=1, 2, 3. В результате имеем D(A»;) = D(A (s'M—sM)) i D (s,2'>y3 + r'Ji30 — s'jy2—xsfi'to) = = s-/D(y3) + s3»D(y',)+li'/D(x'2) + h'/D(x'3). (47 17) Подставтяя выражения (47 16) в (47 17), найдем di„--^-P(v;)H^D(A%)/b° + D(x'3)h'f + + D (y[ )S> + D (yd sf + D&) s'f], (4718) d,n = -V [D (a-;) H; + D (x3) h'f + D (x[) hf + No + D (y[) Ц +D{y'3) s'f-+ D(y[)s'/], (47 19) d3n = -^ [D «) H* + D (x[) hr + D (A-i) h'f + + D (у'л) S"5 -|- D (y[) s'/ + D (y't) s'f] (47 20) Заметим, что Nj; = HjjS|;sin2a, здесь a — угол между векторами S и Н Из формул (47 18)—(47 20) вытекает, что точность ориентации резко падает при уменьшении угла между векторами, причем зависимость уменьшения точности от этого угла обратно пропорциональная Если заданы дисперсии ошибок всех бортовых приборов и требуемые точности ориентации (верхние значения величин din), то можно указать те участки орбиты, на которых задача ориентации может быть решена достоверно с принятой точностью
462 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII Изучим теперь влияние неточности моделей векторов S и ~Н на погрешность ориентации Пусть AF, = 0 Тогда из равенства (47 7) имеем ДА, = — С0ДВА?. (4721) Положим ДВА? = ДВ,- (47 22) Тогда будем иметь ДА, = — С0ДВ,., откуда находим з 2 (Да,7)2 = ДВ;С0*С0 ДВ, (47 23) Учитывая, что первые две компоненты вектора ДВ(- не зависят друг от друга, найдем математическое ожидание от обеих частей (47 23) В результате получим <?ш = М Г £ (Аа(7)Ч =Е D {а ,) = Здесь bjj—компоненты вектора В,- Через diM в выражении (47 24) обозначена средняя ошибка в определении положения t'-й оси связанной системы координат в зависимости от погрешности моделей векторов S и Н Найдем явное представление через дисперсии погрешностей веаичин dm С этой целью определим дисперсии компонент вектора ДВ, /з \ з D (ДЬ1Ч) = Я (2 */»?/) = 2 a?/ D (xj) (47 25) Аналогично имеем з £>(Д6,-2) = 2о?/0(*/у)- (4726> Определим величину D(Abi3) при i = l, 2, 3 D(Aftft) = D(AN", A?) = D[(ASxHo + S0xAH) A?] = = D[AS(HexA?) + AH (A?XS0)]. Таким образом, имеем D (Ы>1з) = D (*,) (/i?a?3—a?Xy- + D (xt) (A?a?, - ЛК)2 + + D (x3) (h^-hlaiy + D (yj (5°а%-а№)* + + D («/,) (sW3-sW-I-D(«/,) (sjab-sjab)1 (47 27)
§ 47] ТОЧНОСТЬ ОПРЕДЕПЕНИЯ ПОЛОЖЕНИЯ 463 Подставляя выражения (47 25) —(47 27) в (47 24), найдем NJdJM = D (jc,) [Ща£ + (h°2ab—ani2h°3y] + + D (xt) [Ща£ + (AJo?,—*Sa?,)s] + D (*,) [ВД,* + (Л°а?а—Л'а?,)2] + + D (у,) [S*.atf f (Ф?з-sSa?.)8] + Я Ы [Sja?* + (s°a?3 -s»^)2] + + D (y3) [S;af3 + (sfa?, -sjof,)8] (/ = 1,2,3) (47 28) Предполагая, что погрешности моделей векторов S и Н и погрешности бортовых приборов не зависят друг от друга, найдем суммарную погрешность в ориентации осей связанной системы по отношению к абсолютной системе координат. d,= VdU + d}M, а именно, ^=■^{0 (х[) Щ + D (x't) hf + D (x't) h'o + D (y>) S% + D (y[) s'/ + + D (yl) sf + D (Xl) [Н«аЙ + (lilab-alX)2) + + D (xt) [HSaS + Wa^-aW)2] + D (x.) J,HSag + (h°a% - a^h*)*] -f + D (yj [Sla°l + (s;a?,—ajss§)4 + D(yt) [Sffl\ + (s\aa13— a«lS°3)] + + D (yj [Slaf3 + (s[a°12 — а?^)»]}*'1; d2 = ± {D (vi) Щ+D (х'г) hf+D (x[) h?+D (yl) Sl + D (yl) sf + + D (y[) s!f + D (Xl) [Ща* + (Kal,-a°Jiir] + + D {xt) [HgaS* + (ЛКз — o?ift§)s] + # (*») [HJalJ + (Л!в5, — <«)2]+ + 0(у,)[ЭД1Ч(Ф«-аМ)2] Н 0(0.) [5jaS + (s;aS,—aj^)1] + + D (у,) [SJag + (s^.-aS.sS)*]}*'. , d3 = ^ {D (л-з) H* + Z? W) /z;°2 + D (xl) h'* + £> (yl) Sl + D (y[) s'f + + D (yl) sf + D (Xl) [H>°2 + WaU-a№)*] + + D (х2)[Ща°зг + (A?a?3—aS,A;)s] + D (x3) [H02a°3 + (Л;а32 —<&*•)»] + + D (i/O [ЗД2 + (s°a33-o32s»)=] + D (yt) [SjjaS. + (sla033—a31siy) + + D (ys) [Sfrll + (s°a3i- a31s»)2]}v.. _ Рассмотрим другой способ задания погрешностей векторов S и Н Пусть S = S° + AS, Н = Н° + ДН. Будем считать, что AS и АН — малые векторы, функции распределения которых таковы, что векторы S и Н можно считать
464 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII расположенными в конусах Для аналитического описания этих погрешностей введем на плоскости, перпендикулярной S01 систему координат. В качестве одного орта возьмем N° = S°xH°. В качестве другого вектора возьмем M° = S°xN°. Тогда AS можно представить в форме AS = NVcos<p + MVsincpf (47 29) где угол ф распределен равновероятно в [0, 2я], величина г распределена по какому-либо закону, так что Л1[г]=0. Аналогично для вектора ДН имеем Д Н = N°p cos x + К°р sin %, (47 30) где N° = S°xH0, K°=H°xN0, p распределена по какому-либо закону, так что М_[р]=0, а % равновероятно в [0, 2л] Погрешности Д§ и ДН либо относятся к модели физических векторов, либо к работе приборов Первый случай будем обозначать черточкой, второй случай—штрихом Из формулы (47 29), (47 30) имеем *i = (*o, AS) *i=(0o. As) л-3 = (z,„ AS) 0,=(хо, ДН) ys=(y0, ДН) f/3 = (z„, ДН) Для вычисаения погрешностей работы приборов достаточно в формулах (47 31) символ черточку заменить на символ штрих Подставляя выражения (47 31) в (47 1), найдем аи = а°и + a?/ cos (ф—ф°) + р?,-р cos (% — х°) + + af,r' cos (ф' — ф0') + ЭД'р' cos (х' — X0')- Отсюда находим , D (aif) = -i- [<D (г) + pji/D (p) -f ofi'D (г') + p?/'D (p')]. I = П5,ГС05ф + (5^15— S°rt°) ГЭШф, = п?л cos ф + (sj/гJ — sfя°) /" sin ф, = /г'г соэф-}- (sj«?—s°rt?) ^тф, = /гJo cos x + (Л5"з — nW) P sin X. = п°2о cos x + (Л5«1—/гз/г?) Р sin X. = «go cos x + №rt!> — uj/z!j) p sin x
§ 48] СИТУАЦИЯ НЕОПРЬДЕЛЕННОСТИ 465 § 48. Ситуация неопределенности, возникающая при определении ориентации Из предыдущего вытекает, что направляющие косинусы связанных осей, а также углы рыскания, крена и тангажа определяются единственным образом с помощью шести величин sj и h\, если s, и ht известны (t = l, 2, 3) Так как первые из упомянутых величин измеряются бортовыми системами, то возможны также случаи, когда некоторые из этих величин не могут быть измерены ввиду отказа приборов или вследствие взаимного расположения Земли, Солнца и изучаемого объекта. В этих случаях задачу определения ориентации, опираясь на значение ориентации в предыдущие моменты времени, можно решать по крайней мере двумя путями Первый пугь сводится к решению задачи экстраполяции элементов ориентации на те участки орбиты, на которых некоторые из упомянутых величин не измеряются Второй путь связан с интегрированием уравнений динамики при начальных условиях, определенных на основе знания ориентации Дадим более детальное изложение этих двух подходов к решению одной конкретной задачи. Пусть задан промежуток [О, Т] и на частичном промежутке [О, <„■] задача ориентации разрешима единственным образом. Пусть далее на промежутке [t0, T] величины s't (i = l, 2, 3) с помощью бортовой системы не определяются Требуется определить направляющие косинусы связанных осей в абсолютной системе при '€['.» Т] В основу решения задачи положим формулы (45 1) — (45 3). Непременно имеет место равенство ввиду того, что скалярное произведение векторов инвариантно по отношению к поворотам ортогональной системы координат. Таким образом, косинус _угла между вектором Н'=(Л(, k'2, h's) и неизвестным вектором S = (s,', si, s'3) при / £ [ta, T] остается известным. Обозначим величину этого косинуса через з Положим 5=-??- + КГ=а»Х, (48 1) |Н| тг » v
466 ynPABlh'HHh ЛВНЖРННКЧ TBFI'lOrO TF'IA [l'l где Л—единичный_вектор, лежащий в плоскости, nepneiui лярной к вектору Н Положим далее 1о=- Орты |о. Ло задают прав\ю систему координат на плоскости, пер пендикулярной к Н и проходящей через конец вектора S Вектор Л в этой системе координат представим в форме Л = л,!0 + л2Ло, (48 2) и, следовательно, вектор S может быть выражен соотношением 5=-^г + 1/Г^^(Х1|0 + ЛЯ) (48 3) I "I Спроектируем вектор (48 3) на оси связанной системы координат Для этого найдем проекции |0 и т)0 на эти оси (х; _ (/о, (у; , 6.)= £) = . Ло) = i формул 1 i'. = (S. = 0, h'z ~~ Vli'f+h'a* ' tih* |н|1^/,;ч-/''.г' (48 4) и (48 3) i , x0)= —S (Уо (x;. ft • &.) = Ло) = i. Ло) : шеем 1 -Й2 Шу =«:— , V h'l + h'% |H| * /'3 /'1 |H| K/i^ + 'i/ ~Jh? (48 4) ix,., |H| ай,+ / =(A, | H | /1, + ХЛ/i2) «;=(s.y;)=—К/,;2ч/';'|Н| , (48 5) "2-(-Kh\\H\+htilh) s; = (S,-i'o)= Lfe*£_ I "I Положим, как и выше, n = sxh=|/T=7:(*i¥(1*h-i лЯхЯ)
СИТУАЦИЯ НЕ0ПР1-ДРЛ[:ИН0СТИ V tf + h? -\xv\— a2 Подставляя выражения (48 5), (48 6) в (45.16)—(45 18), найдем формулы для направляющих косинусов связанных осей в системе Оху _ a,-,N2 = а,-, + Р/Л + Y/Л. (48 7а) где «л = Л;А,(1—а*), рп = 1/П^а5 V h'S + hfisA—«А). P51 = J - [л;(s,h2—л,а|н d—л;л; (s,/i3—s3Ag)], |H| p„ = -^=^-[л;(51н2-/;,а|н|-)л;л;(5л-8зЛг)] . £i^£l |/"/j;* + ,l;J(SiH*_/,,fl| H |), I" I [h\h'2(sl\i--hla\ H |)+ft;H2(s2ft3 — s3ft2)], [ft'Afs.H2 — А,а|Н|)—/liHMSiA» — «A)]. fl/2N2 = а/г -|- ХД-, + X,vft, (48 76) а,-, = Л;Л2(1-аг) p.. = -^^'~ai л;ft; (s,a,—s,ft9), 1/ .'* I b's K"^+ft; К Лг'4-Л'з • [ft;(s,H2 — Л2а|Н I) — h'&isA — «A)]. К л;"+л; =-[h'2(sIHs — /ца|Н|) + А;л;(8зй1—s,ft,)].
468 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ. VH1 = [Kh'Asji*—hfi | Н |) + Л;Н* (s3ht—s,h3)], |Й|^ЛГ+Лз" |fi i К h'al+h3~ = [h[h3 (s2H*—A2a [ H I)—ft;H*-(s8>»r-Mi)]. aisti2 = a/s + р,-3л1 + 7,3Я,2, (48 7в) a/3 = A;A'3(l-a'), p«= p„= : [ft3 (s3H2—/t3a | н |)+a;a; (s^,—$А)], |H| Тзз = IHI^Ar+ft: Ц [A2 (s3H2 —A3a| H |) + h[h3 (sA—s^AJ], Аз" Vh'3+h3 (s3H2—A,a IH I), = [/i^s (s3H2 —A3a I H |) + Л3Н2 (SjA,—SjftJ], - [a;a; (s3h2—A3a 1 н |)—a;h* (s,a,—s a)]- |н|^А;'+л3а Из формулы (48 7) вытекает, что задача определения положения системы Oxt/z в системе Ох'у'г' однозначно разрешима, если известны величины Ки Я2 По построению обязательно имеет место равенство Величины Kt и \ являются функциями времени Эти функции обязательно удовлетворяют дифференциальным уравнениям вида dK/dt=p(t)Klt (48,8) где р(1) — некоторая известная функция времени, если векторы S и Н известны в системе Ох'у'г' Через эту функцию можно представить решение (48 8) в следующем виде: X^X^cos) p(t)dt—A40sin \p(t)dt, \ = K1Q sin J p (0 dt + bt0 cos J p (/) dt. (48 9)
§ 48] сшуАЦИя неопрсдсленпосш 469 Решение (48 9) системы (48 8) удовлетворяет условиям 7ч^=к19, ^3 = ^20 ПРИ t==t0 Таким образом, если функция p(t) известна при I £[0, Т] и при t = t„_ известны величины Х10, Х!0, что означает, что известны векторы S и Н в системе Ох'у'г' (т е задача определения положения в этой точке разрешима однозначно), то задача определения положения будет разрешима при любом iG[0,T], и это решение получается при подстановке ветичин Я,, Я., из формул (48 9) в (48 7) Дадим способ определения функции p{t) Предположим, что векторы S и Н известны в системе Ох'у'г' в точках tt, t2,.. , tk — t0 Тогда можно ввести в рассмотрение числа Формула (48 10) тем точнее дает значение функции р в момент ts, чем меньше изменяется эта функция на промежутке времени между соседними моментами измерений Положим Р(0 = А>+ Ё tocos ц»/-тАsin цЛ0. (48 П> где р0, ак, Ьк—вещественные числа, подлежащие определению Частоты \\.к будем считать пропорциональными орбитальной частоте (в общем случае их можно также отнести к неизвестным величинам, подлежащим определению) Выберем величины р0, акЬк (k — l, . ) так, чтобы было 21 [/>,-/> С)]8 =inf Цель такого выбора величин /?„, ak, bk (k = l, ...) состоит в том, чтобы угловая скорость, с которой вращается вектор Л, наименьшим образом уклонялась от «наблюдаемых» значений угловых скоростей ps Из предыдущих формул вытекает, что для их использования необходимо иметь выражение Xlt \ через проекции S и Н Умножая скааярно (48 3) на i0, tj0, найдем (48 12) (s, ~г\п)
470 УПРАВПЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО TI ЛА [гл VIII Из формул (48 12) имеем j __ I sJl3 — 5^/lг 1Ц у _—А (h'^ + h',")-1- sUi\lu+- s\h'3h[_ h\a— s\ |H| ,.R ■„. Подставляя выражения (48 13) в (48 9) п (48 10;, найдем n;(/ft)c-os \ipU)dt-(h\a(ia)-s\\\\\)s\n ^ p(t)dt M0 = 'V , -± , (48 14) n\ (/„) sin J p (t) di + (A,' (/„) a (/„) -s! (/„) | H I ) cos J p (I) dt *»(') = /o ,,, ,„.„ ., '- . (48 15) р, = К е.) [л; (/,+I)a (/,+,)-*; (/#+1) | ЩГ^1) ц_ -»;(^+.)[/'.'(^)a(M-s;(uiH77;)i]}(i-«2(^))-,/'x x(i-fl-(^+,))-,/'(/i;,(u+ft?(M)-,/«x x (h'l (/,+I) + h? (/,+1))-,/'(^+,U-1 Укажем способ использования уравнении с целью определения положения системы Ох'у'г' в системе Охуг в рассматриваемом выше случае неопределенности Обозначим через <as угловую скорость, с которой вращается вектор S в системе Окуг Через ш обозначим угловую скорость, с которой вращается система Ок'у'г' относительно системы Охуг Тогда вектор S будет_вращаться относительно системы Ох'у'г' с угловой скоростью и>, — о Принимая систему Ох'у'г' за неподвижную, будем тогда иметь dS/dt = (<as—a) x S. (48 16) Обозначим через <дн угловую скорость, с которой вращается вектор Н относительно Охуг Тогда также будем иметь dWdt=(ZiH—<o)xH. Проекции векторов ын и ю, на оси Ох'у'г' связаны с их проекциями на оси Охуг соотношениями з з _ «>« = 2 aiyu>sy, ыш = .2 я(7ю„у (t = l, 2, 3).
§ 48] СИТУАЦИЯ HI ОПРЕДЕЛЕННОСТИ 471 Найдем производную по времени от направляющих косинусов в системе Охуг Тогда будем иметь dAi/dt=Z>x A,. В скалярной форме получим «/1 = 0/2 = а!з — К -■= fti=- К-=- ds'Jdt = dsjdt=- ds'Jdt =■ — со3а,- — WjQ/. — <о2а,-, — («из -(coWl — (»//2 -Кз -Ki- -к,- , + ад5, ,+* J3a(I, t -J- {0^,-g, —«и — (0 —со — СОа —ш1 — (Oj i)K + (*'m l)h't + (v>iu i) Л!+ (»//! .K + K-- )«;+(«&- ,) s;+(©;,- -сог)л;, —»3)/ii. —«О л;, -»;>«;. ■Ms) «I, -Ci)J) S2 Здесь ©J, coWi co^— проекции векторов ю, юя> <•>*, на оси связанной системы координат, а со,-, соН;, cosl — проекции векторов с*, (Он, ш5 на ос» абсолютной системы Величины (о|- (i = l, 2, 3) удовлетворяют уравнениям относительного движения рассматриваемого объекта по отношению к системе осей Охуг Численное значение этих величин в момент t0 может быть определено, исходя из знания ориентации системы осей Ox'y'z' при / £ [0, /0] При t = t0 векторы S, Н также известны Поэтому задача интегрирования системы уравнения (48 17) совместно с уравнениями движения заключается в решении задачи Коши с начальными условиями при t = t0 Решение этой зидачн существует при /£ [О, Т] и определяет единственным образом вектор S(/), который совместно с вектором Н дает возмож ность однозначно определить ориентацию на основании формул (45 16)—(45 18) Рассмотрим теперь другие ситуации неопределенности, возникающие при решении задачи определения положения твердого тела, именно те ситуации, которые возникают вследствие отказов магнитометров Отметим три типичные ситуации Первая ситуация заключается в том, что отказывает зонд магнитометра, вторая состоит в том, что отказывают два зонда, и третья—для случая отказа трех зондов Если рассматривать все комбинации возможных отказов, то возникает семь различных комбинаций, а именно отказ одного первого зонда, одного второго, одного третьего, первого и второго, первого и третьего, второго и третьего и всех трех, причем эти отказы могут возникать как на освещенной стороне, так и на неосвещенной.
472 УПСА1) II II il ДВН/KEIH I.M ТВЕРДОГО ТС1Л (ГЛ VIII Рассмотрим задачу устранения неопределенности, возникающей в такого рода ситуациях Пусть имеет место отказ лишь одного зонда Покажем тогда, что задача определения положения может быть решена как на освещенной стороне орбиты, так и на неосвещенной Предположим, что отказал первый зонд магнитометра Тогда величина h[, входящая в выражения (45 16) — (45 18), не измеряется Однако во все время движения имеем ft.'s,' + /i&-j-ti3s3 = IS\ | H | a, '48 18) где с—косинус упа между S и Н, величина, известная во все время движения Из выражения (48 18) находим ISimia-ftgSa-ft,; (48 1У) откуда вытекает, что задача определения положения разрешима однозначно в том случае, когда величина s[ известна, т е объект находится на освещенной стороне, когда ^ФО Направляющие косинусы при этом получаются путем подстановки формулы (48 19) в (45 16)—(45 18) Дадим способ решения задачи в том случае, когда величина s[ неизвестна или когда s't принимает достаточно малые значения С этой целью введем в рассмотрение единичный вектор v, ле^ жащпй в плоскости, перпендикулярной к S, связанной с S и Н соотношением H = !H|(nS + kT=^v) (48 20) Пусть |„, 1]0 —ортогональные орты на упомянутой плоскости. Тогда Для определенности положим г _ Sxxp - _ bxlo ёв~ |sxii| * Цо~ |S| * Найдем проекции !„, т|0 и Н на оси Ох'у'г': <10.х;)=о, &-$) = —ф—, {%,?„) = ol.. xJ)—VWTZ\ (i,y'0)= ^-iiii— , (n.,z;) = - V s2*+s3* V sf+sa" /i^lHltflSi-KF^^v^s^ + s',2], (48.21)
§ 48] С1ПУЛЦИЯ НС0ПРСДЕ1ИШ0СТ1! 473 Подставляя формулы (48 21) в (45 16)—(45 18), полечим выражения для направляющих косинусов через v,, v2 Единичный вектор v на плоскости VjV2 совершает вращательное движение вокруг начала координат Следовательно, уравнения, описывающие движение конца, имеют вид dvjdt = — q (0 vt, dv2/dt = q(l)vl (48 23) Из формул (48 22) вытекает, что v, не зависит от h[ Следовательно, из первого уравнения системы (48 23) всегда можно определить знак величины сети известен знак величины q(t) Уповая скорость q(t) определяется в точности так же, как угловая скорость векторл Л, рассмотренного выше Пусть tlt tit . ., (к—точки, в которых производятся наблюдения Тогда „ _ 'I Us) 1>.(/д-и)-у» (^)1-уг its) Ivi C,+t)-vi Us)] 4i ts+i-ts (s = l,2, .. , ft —I) (48 24) Соотношение (48 24) дает приближенное значение угловой скорости вектора v в момент ts Заметим, что в выражение (48 24) входит ветчина li[ Для освещенной области и для случая, когда s[ не явтяется достаточно малой величиной, h[ можно вычислить по формуле (48 19) и подставить в выражение (48 24) Те моменты наблюдения, когда s[ мало, в определении вечнчины q(t) не учитываются, экстраполяция ведется по оставшийся qs.
474 УПРАВЛПШЕ ДВИЖИННЬМ ТВКРДОЮ TK'IA [ГЛ VIII Найденное выражение для функции q(t) дает возможность определить знак величины v2 и, следоватепыю, решить задачу определения положения дтя всех точек промежутка освещенности Рассмотрим теперь задачу определения ориентации также на неосвещенном участке орбиты при условии отказа первого зонда Пусть задан промежуток [О, Т), на котором требуется решить задачу определения ориентации, причем [0, /0] есть промежуток освещенности, а (/„, Т] — промежуток затемнения Первая компонента вектора Л не зависит от величины h\ Следовательно, если функция p(t) известна, то из уравнения всегда можно определить знак величины >.2 Выбросим из ряда ветчин ps(s=l, 2, .. , к— 1) те, для которых s[ достаточно мало В остальных же величинах ps заменим h\ по формуле (48 19) Тогда величины ps будут определены однозначно, несмотря на отказ первого зонда Путем экстраполяции строим величину p(t) на промежутке [О, Т] и определяем A.t и Я2 во все время движения С помощью \ и кг по формулам (48 5) определяем ветичины s'„ и s'3 на затемненном участке Это дает возможность определить величину v, во все время движения, так как она не зависит от s[ и h[ Экстраполяция величин qs и построение функции q(t) дает возможность определить знак величины v2 на всем промежутке [О, Т] Величины v, и v2 дают возможность определить ориентацию осей Ох'у'г' в системе Окуг Следует заметить, что только что установленная возможноеи> определения положения при отказе одного зонда позволяет определить ориентацию твердого тела лишь с дополнительной потерей точности Эти дополнительные потери точности происходят из-за процесса экстраполяции и из-за дополнительных операций над входящими величинами Аналогично решается задача в случае отказа одного второго зонда или одного третьего За основу берутся другие_орты_ |0, Ti0, v из расчета, чтобы первые компоненты векторов v и Л не зависели от показаний вышедшего из строя зонда Предположим, что отказали два зонда, и величины h\ и h's не измеряются Тогда задача определения положения может быть решена как на освещенной стороне орбиты, так и на теневой ее стороне Однако точность решения падает Дсйствитеаьно, во
§ 48] сшуапия нсопредепенности 475 время движения доажны иметь место соотношения з л;=^й„П/. (48 25) i=\ s'X ~ s,h'3 = 2 sA — s'ili'i (48 26) <= i Из (48 25), (48 26) величины /ij, h'j определяются единственным образом, если s'3* + s'3 Ф О Предполагая это условие выполненным, или, иначе говоря, рассматривая только те моменты наблюдений, когда s?-f s'3 ф О, выразим /ij и h\ из соотношений (48 25), (48 26) Величины /ij и 1г'3 единственным образом определяются через скалярное произведение (A,, N) A; = _(AItN)-^L_—^*L_[(s,h)-a;s;], «г Ь s3 s2 + *з по 97^ Л;= J2 tl(A„ N) | ,,* <t[(S,H)—h[s[] Si fSj Sj +s', Если с помощью (48 27) исключить величины h'2, h\ из (45 16)— (45 18), то получим направляющие косинусы осей Ох'у'г' в системе Охуг, выраженные через (AIf N) Найдем значение этого скалярного произведения Во все время движения должно иметь место равенство з lh+h'3* = H2 — Л|г = 2^—К2 (48 28) Подставпяя (48 27) в (48 28), получим (At. N)2 ,,' ,,+ ,,' ,,[(s,H)—/i;s;] = 7/«—л;1, откуда нахоаим (\,й) = ±((<г + 5зг)(Н"--Кг)-[(Ъ,Н)-И'151}*У>. (48 29) Из (48 29) вытекает, что при отказе двух зондов задача опре- де 1ения ориентации решается в каждый момент измерения, а именно, возможна одна из двух ориентации Для устранения неопределенности, возникающей здесь, следует рассмотреть соседние моменты измерений Пусть эти моменты б>дут /,, t2, tg Если предположить, что на промежутке [/,, /3] относительная угловая скорость объекта изменяется достаточно
476 УНРЛВЛНИНР ДВИЖРННКМ ТВРРДОГО ТРЛЛ [ Г I VIII мало, то ориентацию в моменты t2 и t3 можно получить из ориентации в момент tl и последующих конечных поворотов Величина (48 29) в точках tx и t2 может иметь различные значения интерес представтяет знак этой величины Таким образом, саедует рассмотреть четыре случая ориентации в точках *, и tt Будем их символически обозначать (+ + ), Н—), (—[-), ( ) Считая, что ориентация в момент /2 может быть получена из положения в момент tY конечным поворотом, найдем угловую скорость относительного вращения Таких угловых скоростей определяется четыре со+ + , о+_, <л~ + , о-- С каждой из этих угловых скоростей определим путем конечного поворота из положения в момент /, или положения в момент /г ориентацию в момент t3 Таких ориентации получится по крайней мере четыре. Для всех этих ориентации можно вычислить величины _ _ з _ _ з «J = (А„ S) = S] aijSj, h[ = (Ах, Н) = 2 я, Д (* = 1, 2, 3) С другой стороны, в момент /, величины s|-(/,), h\ (t3) определяются с помощью измерений Рассмотрим выражение з v=^l(sHt3)~sily--\-(fhUJ)-lhk)2 (k=\. 2,3) Значок k обозначает номер ориентации в момент tJt которая получена путем конечного поворота Выберем то значение k, дтя которой величина v принимает наименьшее возможное зьаченне Этому значению к соответствует один из случаев (+ +). Н ). ( (-). ( ) Его и возьмем за истинный Таким образом, ориентации в момент tx и 12 определены единственным образом Остается рассмотреть последний случай, когда все три зонда магнитометра отказали В этом случае система ориентации становится одновекторнои и задачу опредепения положения можно решить, либо исходя нз уравнений динамики относительного движения, либо из определенных предположений о характере угловой скорости относительного движения § 49. Определение положения оси собственного вращения в пространстве Дадим способы опредечения потожения оси тела, вокруг которой оно закручено с достаточно большой скоростью, причем предположим, что эта ось (которую в да чьнепшем называем осью собственного вращения) сохраняет неизменные направление в абсо потном п ростра не 1ве
§ 49) 0111*1 _ll И.НИК ПО 10/UI НИИ ОСИ CODClBFHHOrO ВРАЩКНИЯ 477 П\оь заданы векторы М,, М2, М, Обозначим через тц, т1ц, niil(i~l, 2, 3) их проекции на оси инерциальной системы координат (7£п,ц Через mix, miy, miz — ux проекции на связанные оси Gxyz(i=l, 2, 3) Предположим, что величины тц, min, т% известны Величины mix, miy, miz измеряются в процессе движения Треб\сгся определить направчение оси Gz и величину угловой скорости с помощью известных величин тц, min, тц и ранее наблюдавшихся значений mlx, miy, miz Обозначим через ф вели шну угловой скорости^ системы относите ir.no G\v^, Если предположить, что векторы М,, М„ М3 неизменны в пространстве G£n,C. тогда трехвекторннк М,, М,, М3 будет вращаться вокруг оси Gz с постоянной угловой скоростью, величина которой будет ср, по отношению к наблюдателю, неизменно связанному с системой Gxyz Это означает, что проекции любого из векторов М,- на плоскость xGy будет иметь неизменное по величине значение и будет вращаться в этой плоскости вокруг точки G с постоянной угловой скоростью ср Будем считать, что величины т,х, iniy,tniz являются функциями времени, непрерывно дифференцируемыми на рассматриваемом отрезке времени Тогда 1. (49 1) -^•' = -Фл1,х (1-1.2,3) Из \ равнений (49 1) можно найти угловую скорость ф Действительно, умножая первое vравнение на т,-и, второе на т!х и вычитай из первого результата второй, найдем т%А-г> (49 2) Предпотожпм, что величины tnix, miy, miz измерены в два соседних момента времени /, и /г Тогда из формулы (49 2) можно потучить формулу для вычисления приближенного значения ф * (^-fiHmfc+mk) Форима (49 3) тем точнее дает значение угловой скорости, чем меньше оказывается величина ф[/2 — /,]
478 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII Найдем далее ориентацию оси собственного вращения Предположим для этого, что векторы М„ М2, Мэ не комптанарны, иначе говоря, не лежат в одной плоскости Тогда вектор г„ можно представить в виде линейной комбинации ортов этих векторов. z0= 2*,т,о. (49 4) с=\ где Klt Х2, Х3—вещественные числа, подлежащие определению, т/о—орты векторов М,- (i=l, 2, 3), z0—орт оси собственного вращения Для того чтобы найти уравнение для определения величин Х„ Kt и Х.8> умножим обе части выражения (49 4) скалярно на вектор Мк (k = 1, 2, 3) Тогда получим з _ _ ткг = 2 h(ш/о, МА) (k = 1, 2, 3) (49 5) Ввиду некомпланарности векторов Mt, М2, М3 опредепитель системы (49 5) отличен от нуля, следовательно, система (49 5) всегда имеет единственное решение. Al = i-{mlz[(M2, m20)(M3, in30)—(М2, ni30)(M3, m20)] — — m„[(Mx. m20)(M3, m30)-(M3, m20)(Mi, S30)] + + m„[(«*!. m10)(M8, ifb,)-(Mt, 1гГ2а)(М1( m30)]}, Я2 = -1{—/nIZ[(M2, m10)(M3, m30) — (M3, m10)(M2, m30)] + + m„[(Mlt m10)(Ms, m30) — (M„ inie)(Mi, m"30)] — — mM[(Mi. m10)(M2> mM) —(M„ inu)(M„ ms0)]}, (49 6) К = X {mu [(M2, m10)(M3, in20)—(M3, m10)(M2, m20)] — —m«[(Mj, m10)(Ms, mj—(M„ mlt,)(M„ m20)j f- + т3г[(М1, m10)(M2, m20) — (M„ mle)(Mx, m20)]}, где Д—определитель системы (49 5) Л в (М„ М„ М3).
§ 49) ОПРЕДКЛЕНИЕ ПОЛОЖЕНИЯ ОСИ СОБСТВЕННОГО ВРАЩСНИН 479 Следовательно, этот определитечь численно равен объему парал- лепепипеда, построенного на векторах Mlt 1Лг, М3 Таким образом, из формулы (49 4) с помощью (49 6) можно опредечить ориентацию оси Gz, а именно, найти проекции орта z0 на оси инерциальной системы координат G£r|£ - - Д Л/ «»,, = &. Ло) = Е7^Г/"'П. (49 7) Формулы (49 7) определяют ориентацию осп собственною вращения единственным образом, если в результате наблюдений найдены величины ти (i = 1,2, 3) Так как последние не меняются со временем вследствие неизменности оси г в пространстве, то в формулах (49 6) при вычислении величин к можно использовать величины ти, вычисленные для различных моментов времени Формулы, полученные здесь для определения параметров вращательного движения, могут использоваться также в тех случаях, когда ось собственного вращения достаточно мало изменяет свое положение в пространстве за время наблюдения Векторы М,- также могут не сохранять свое положение в пространстве постоянным А именно, они могут вращаться, однако величина угловой скорости их вращения должна быть достаточно малой по сравнению с угло вой скоростью собственного вращения системы Gxyz Представим параметры вращательного движения через измерения физических векторов С точкой G свяжем векторы S, Н, Г Вектор S представляет собой направление на центр солнечного диска, Н —напряженность магнитного поля Земли, г—направление геоцентрической вертикали места С помощью этих трех векторов можно построить три системы некомпланарных векторов S, H, N, S, г, К и Н, г, L, где N = SxFT, К = Sxг, С = Нхг" Каждый из трех векторов можно взять в качестве векторов Mt, М2, М3, рассмотренных выше, если скорость собственного вращения системы Gxyz достаточно велика, а промежуток времени набчюдения достаточно мап Возьмем векторы S, Н, N в качестве триэдра Mt, М„ M,, рассмотренного ранее, тогда дая определения ориентации оси
480 управ'и iihf движ! ниим твердою тепа [г i вращения Gz найдем a3i = -h- s„ + -Ь- Л„ + -4±- я., |S| |Н| |N| л 0,, = -^J- St H- —J- lb + -т=5- Hi- |S| tn |Н| * |N| " (49 8) Величины ?lf ?,, А., удовлетворяют чинейной системе s« = M"s0. S) + ^,(Ti„ S) + X,rn0. S), ft, = К (S.. H) -г *, (P., H) + X, (n„, H), (49 9) «, = X,(s0. N) + A,,(h„. "N)4-^(n„ N). Так как векторы S п Н ортогональны N, то из системы (48 9) будем иметь I N Г К = —=—- - _—_ _ 1—=- , (49 10) 1 (s0, S);h„. H)-(s„ H)(h0 S) ^J 1U' 7. = _ -<»>_"> 7^'<>■_*• _ '*" (s0, S)(h„ H)-(s„ H)(h0 S) Для сокращения записи окончательных формул введем в рассмотрение )г_ол а_между векторами S_n Н Тогда (sn, S)=JS|, (H,_h0)_=|H|, (s0, H) = |H|cosc, (h0, S) = | S | cos a, |N|- = |H|JS)sina, и, следователю, ■) = s-g!» I —M S' cos а '' |SM Hi sin* a _' -s,|H|cosa^|S| I Sj| H| sin-a. X. = _ 1* . |H||S|sma Учитывая (49 6) и (49 11), найдем выражения дпя а =, _ _ /_f|_rs | Hi — /iJS|cosa] + 31 ] & 11 н | sin- cc I | SI lzl ' г| J Tif[;,|Sl-s.,|H|cosa]4-71^7„,j,
§ 49] ОПРЕДЕЛЕНИЕ ПОЛОЖЕНИЯ ОСИ СОБСТВЕННОГО ВРАЩЕНИЯ 481 + Wlft«|S|-s'|H|cMa)+7B17Tr"«}- |S||H|8in*a\|S| [s,|H|—A,|S|cosa] + + ^T[ft,|Sl-S,|H|cosa]+T^1T„,] Напомним, что формулами (49 12) можно пользоваться для определения ориентации оси собственного вращения даже в тех случаях, когда величины sz, hz, пг наблюдаются в различные моменты времени При этом nz = sxhv—svh? есть 2-я компонента векторного произведения векторов S и Н Таким образом, для определения ориентации по векторам S и Н необходимо иметь наблюдения по всем их проекциям Система Gxyz вращается вокруг оси Gz с угловой скоростью q>: Ity+hl Jhx(tt)-hx(t,))h1)(t,)-\hv(l,)-hy(i1))hx(ii) (49 13) (/.-/i)(A5+Aj) Обозначим через {5 угол между векторами S и г Тогда ориентация оси Gz с помощью векторов S, г и К определится следующим образом. |S||" |S|f sin4 P I | S | 4-[s,|r|-r,|S|cosP] + l is + -^-[r.\S\ — sJr|cosp]+ -L k.\ , T|r| I z\ I ,11 KJ ls||r| ,|. ■[s,|7|-MS|cosp] + + -^L[r,|S|-s,|r|cosP]-f-j^=j-ft,}, (49 14) _{1i{..|7|-,.|5|«»M+ +-j^[r,|S|-s,|r|cosP] + -|?i_AI} Обозначим через у угол между векторами Н и г Тогда ориентация оси вращения Gz может быть определена с помощью
482 УПРАВЛЕНИЕ ДВИЖЕНИРМ ТВЬРДОЮ ИЛА |_| Л V1U векторов Н, г, L следующим образом e«-T^^{TRT^rr|-^|R|C0S^ + A-[/Iz|7|-r,|H|cosY] + |H||r|sin*V l|H|l Zl ' " ' rj (49 15) + 4g-[/-JHl-/i,|7|cosv]+ _/"_ /I, |r| ' Yn |H||r| '/ . U!s_ " |H||r|8in>Y 1|H| [Л.|г|- r| I *l I *l I П-Г |(|)|r| zf " |r| При испотьзовании формул (49 14) и (49 15) возникает необходимость отыскания всех проекций геоцентрической вертикали на связанные оси Предположим, что бортовые системы не имеют в своем составе фиксаторов вертикали Однако существует прибор, фиксирующий инфракрасное излучение Земли Пусть этот прибор закреплен в плоскости xGy так, что он вращается вместе с системой xGy вокруг оси Gz, воспринимая инфракрасное излучение Земли в плоскости xGy Нашей ближайшей задачей является определение проекции гг геоцентрической вертикали через угловую скорость ф и время, в течение которого прибор фиксирует излучение Земли Предположим, что Земля неподвижна и представляет собой шар радиусом R Пусть точка G находится на высоте h над земной поверхностью Пусть далее плоскость xGy пересекает земную сферу по кругу С с центром Ог, центр Земли — Ох Найдем угол, под которым наблюдатель, находящийся в плоскости xGy, видит круг С С этой целью проведем две касательные GCt и GC2 к этому кругу в плоскости xGy Обозначим через б, угол между осью Gz и вертикалью Ofi, тогда 0,0, = (Я + ft) cos 6,, 02С, = VR% — (R + hY cos* blt 02G = (#-{-/г) sin 6, Обозначим через бг угон между Ofi и C,G в плоскости xGy, то! да
§ 49) ОПРЕЛРЛЕНИЕ ПОЛОЖЕНИЯ ОСИ СОБСТВЕННОГО ВРАЩЕНИЯ 483 П>сть т—промежуток времени, за который ось приемника инфракрасного излучения проходит угол между касательными GC2 и GCl к кругу С Тогда б2=уфт, (49 17) так как б2 есть половина угла зрения, под которым наблюдатель видит Землю в плоскости xGy Подставляя выражение (49 17) в (49 16), найдем V^-(/?+/Qac. sin (д (рт откуда (tf + A)sin6, 003^6, = tg^i-фт) [p^jp-l] +^. (49 18) Формула (49 18) не дает возможности однозначно определить значения проекции геоцентрической централи на ось Gz, именно Г*ь, = ± А»(1фт)[-1-(-^]+(-^ . (49 19) В формулу для определения ориентации оси (49 15), кроме гг, входит величина 1г, представляющая собой проекцию векторного произведения Нхг на ось Gz' lz=hxry — hyrx Так как проекции гх и гу невозможно вычислить с помощью показателя датчика инфракрасного излучения, то для определения величины lz придется воспользоваться условием нормировки о11 + о12 + о|3= 1. Это условие дает квадратное уравнение для определения величины lz а1\ + Ыг + с=\. (49 20) Из уравнения (49 20) можно определить два значения 1г L — Ь ± V Ьг—4а (с— I) 2а Ввиду того, что коэффициенты уравнения (49 20) зависят от гг, которое определено неоднозначно, то для величины 1г получены четыре возможных значения Следовательно, использование сигналов магнитометров и сигналов датчика инфракрасного излучения позволяет решить задачу ориентации оси собственного вращения лишь с точностью до четырех возможных положений. Найдем эти возможные четыре положения С этой целью определим коэффициенты уравнения (49 20) через исходные величины, входящие в (49 15) Так как z0 = A.,h„ +А,гг0 + ^з'п. то, возводя в квадрат, найдем 1 =zl = kl + ll + Kl + 2l1klcosy.
484 упрлв шпик лвил<Е1Шкм nsii-aoro гнлл [i;i viu Подставляя в поспеднее уравнение значение_?у (/' = 1, 2, 3) из формул (49 6), полечим при условии М, = Н, Мг-=Г, М, = L 4|H||7|sinYJ_ +[|H£|7|sin=Y]^ Х _ x![ft,_[r|-r1|H|cosvr + [/-,JH|-/j,|r|cosY]* + + 2[/гг|г| — гг\ Н | cos у] [г, | Н | —Лг | rjcos y]cosy} —1 = О Таким образом, мы получили квадратное уравнение относительно величины L, где "« = -_J , 6 = 0. [ | Н 11 г | si» vl С= ' , , ШНЧ1-С05^)+Г;1Н>(1-С05"у) + [ | Н||г| sin-YJ- + hzrz2 | Н 11 г | cos y(cos2у — 1)} — 1 Учитывая выражение дтя rz (49 19) и решения квадратного уравнения (49 20), получим четыре значения lz l2 = [\Ti\^l\*sm*Y-lil\7\>-rtl\7l\>ji-2\H\\l\hzrzlcosvy'\ /,--JjHHr|2sin-Y-^|r|--/l,|Wr :-2|H_|(r l/^/^cosvJ^^, /, = [|H|3|r|2sin-Y—/г'1гр — '^|H|- + 2|H||r|Vz2cosY],/2, lz = [\H\*\7\-<m"y-h-\7\°-r21\H\- |-2|H||T|V„cosy],/2 Используя четыре значения величины /, и два значения ве личины гг из формул (49 15), потучим четыре возможные ориентации оси Gz (Я;,,),-, (я30/. (а j)n где i = \, 2, 3, _4 _ Заметим, что при использовании векторов S, Н, N задача определения ориентации решается отнозначно шшь в тех сл> чаях, когда имеется возможность наблюдать проекции вектора S, иначе говоря, когда точка G не находится в тени Векторы Н, г, L позволяют определить параметры вращательного движения па всей орбите Однако это определение производится неодно- злачно Укажем способ опоедслепия положения оси собственного вращения с использованием лишо одного вектора Н П\сть /, и /„ — некоторые тва момента, в которые измеряются компоненты вектора Н Положим Н, = И (/,•) (i - 1, 2),И12 = Н, хН„ Б^дем считать, что норма Н12 не разна н>тго Таким образом, векторы И[, Н„ и Н,, б\д\т некомиланарпы, тогда орт оси собственного вращения мо/<ет быть представлен в виде линейной комбинации ортов этих векторов z„ = X,h10 + KK0 -r Khlia (49 21)
§ 49] ОПРЕДЕЛЕНШ ПОЛОЖЕНИЯ ОСИ COBCTBI ИНОГО ВРАЩЕНИЯ 485 _ Умножая обе части равенства (49 21) скалярно на векторы Н,, Н„ п Н,2, получим для определения величин Xlt л.,, Х3 систему чиненных алгебраических уравнений (Zo, Hl) = hu = Xl\Hl\+lt\ttl\cosalt, (z0, H1) = AM = X,|H1| + A.1|HJcosa11, (49 22) (z0, H1I)=hm = X,|H„|. где a,2 — угол между векторами Нг и Н2 Из уравнений (49 22) находим 3 IH.IIH.IsIiio,," Следовательно, направление оси собственного вращения будет даваться формулой /11г hiz /г2г /г,г - |Н,| C0Sgl2|H,|H |Ht| ^""IH,! r- Z°- sin2a12 "l0+ sin2a„ "^"t + ^=—Ihii hJ2„ (49 23) | Нг Ц H2| sin«l2 I2 Определим теперь величину угловой скорости и направление вращения Выберем два момента Xj и т2 так, чтобы та было больше Tj и величина т2—х: достаточно мала Выбор этой малости фиксируется тем, что векторы Н (Xj) и Н_(х2)_были достаточно близкими Введем в рассмотрение векторы а,- a, = z0xH (х,-) (t = l, 2) Предположим, что моменты наблюдения х, и т2 вы браны так, что интервал [х,, т2] лежит полностью во временном интервале, на котором латчнл инфракрасного излучения даег сигнал «Земля» Положим 6 = (a1,(a1xzn)) (49 24) Если величина б положительна, то вращение происходит вокоуг оси Gz против чковой стрелки, если отрицательна, то вращение происходит по часовой стрелке (если смотреть с отри цательчого направления осп Gz) Угловая скорость вращения
486 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО TF4A [ГЛ VIII при этом определится формулой (a„at) \ (49 25) (а„ at) \ |а,||а,|У Найдем явное выражение величины (49 24) e = M*,)MT.)-MTi)M-4) Таким образом, если Лх(т,)Л^(т8)—Лу (tJ Лх (т2) > 0, то вращение происходит против часовой стрелки, если hx (тх) hv (та)— — Л„(т,)/1х(т4)<0, то по часовой стрелке § 50. Определение параметров свободного вращения динамически симметричного тела Если момент количества движения сохраняет постоянное значение, то вращательное движение системы Gxyz по отношению к системе Gir)£ вокруг точки G сводится к двум вращательным движениям, а именно, к вращению вокруг оси Gz с угловой скоростью со2 и к вращению этой оси вокруг вектора Lk с угловой скоростью и,, где Lft—вектор момента количества движения При этом вектор мгновенной угловой скорости со лежит в плоскости, проходящей через точку G и содержащую векторы z0, •о* Оо* есть °РТ момента количества движения) Далее будем считать, что точка G является начальной точкой этого орта Таким образом, со = со,ТиА + co2z0 Задача определения параметров вращательного движения состоит в отыскании ориентации оси собственного вращения и оси мгновенной угловой скорости, а также в определении упо- вых скоростей вращений вокруг этих осей Иначе говоря, тре буется_определить величины соЕ, сол, со£, o31 = (z0, "£„), a32 = (z0, Ло). fl3J = (z0, £.). 14 и со, Для решения поставленной задачи введем в рассмотрение три некомпланарных вектора М,, М„, М3, которые явтяются постоянными в системе Gir|£ Дня наблюдателя, связанного с системой Gxyz, векторы Mj, M2, М3 будут вращаться по отпо шению к системе Gxyz с угловой скоростью со При этом вращательное движение может быть разложено на две составляю щие, т е векторы М,, М2, Mj враща_ются вокруг вектора Lk с постоянной угловой скоростью ш1, и Lk вращается вокруг оси Gz с постоянной уповой скоростью со. При этом в течение всего времени движения угол между векторами 1оА и z0 coxpa-
§ 50] ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ СВОБОДНОГО ВРАЩЕНИЯ 487 няется неизменным Будем считать, что величины тц, miri, тц (t' = l, 2, 3) заданы и что величины mlx, m,y, miz (t' = l, 2, 3) определяются с помощью наблюдений Перейдем к определению ортов z„ и 1оЛ Ввиду некомпланарности векторов Mt, M„ M, существуют такие Klt Хг, К3 и ц„ ц2, ц.,, что з _ Zo = SMi/o. (50 1) з _ u-Sft.-ni/, (50 2) Умножая обе части выражения (50 1) скалярно на вектор Мл (k — l, 2, 3), получим систему уравнений для определения величин X,, Х„ Х3, а именно, систему т1г = л1(т10, MJ+Мтго, MJ + Mm*,, MJ, } т2Г = лх (т10, М2) + л, (т20, М2) + Я, (тго, М"2), > (50 3) miz = Хх (т10, М3) + К (т20, М3) + К (т30, М3) J Разрешая систему (50 3) относительно К,-, найдем *i=4{'"u[(M2, m20)(M3, m30)-(M2, S30)(M3, m20)] - —/пм[(М„ m20)(M3, m30) —(M3, in.HM,, in30)] + + m3z [(Mlt m20)(Ma, m30) — (M2, m20)(M1( m30)]}, л2 = ^{—mu[(M2, mI0)(M3, m30) —(M3, m10)(M2, m30)] + + mu [(Mlt m10) (M„ m30)-(M3, m10) (Mlt m,0)] - (50 4) — тзг [(Mlt mie)(Mt, m30) — (M2, mI0)(Ml( m30)]}, ?3 = i{mu[(M2, m10)(M3, fn20) —(M3, min)(M2> m„0)] — — mM[(Mi. m10)(Ms, m20) —(M3, mJfM,, m20)] + + "».,[ M, m10)(M2, m20) —(M2, m10) (M„ mw)]}, где Л —определитель системы (50 3), A = (Mlt M2, M3) _ Подставив формулы (50 4) в (50.1), найдем выражение орта z0 через орты т/0 и величины (50 4). Вычислим положение этого орта в некоторые моменты времени tt, t2, /„, z0(/,) = z0I- (i= 1, 2, 3) и умножим скалярно выражение (50 2) последовательно на векторы z0(- (i = l, 2, 3). Тогда для определения величины
488 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛА [ГЛ VIII ц, (i= 1, 2, 3) получим систему линейных уравнений — 3 _ _ Ооа. z01) = cosei==2(n1.m(0l z01), 3 _ _ (\а. z0l) = cos Bt = 2 (ц,т(0, z02), (50 5) 0o*. z;,) = cos91= JS0i,m,„ z03). Разрешая систему (50 5), находим ^=^{[(z.a. mi0)(I03, m80)-(703f iO&,. й80)]- —[(*ei. mio)(z08. mso) — fo„ mM)(Zoj, inM)] + +[(z01, m,,)^,, in,,)— (z02, m20)(z01, m30)]}, Рг = ^^-{— [(z02. in10)(zos, m30)—(Ioe( m10)(z08, m80)] + + [(z0„ m10) (z"os, m,0) - (z0„ mw) (z01, m,0)] — (50 6) —[6,1, m10)(z0„ fn80) — (z02, m10)(z01, m80)]}, H.-^flfc... ml0)(I0„ й„)-&.. m20)(I08, m10)]- —[(z01, m10)(z03> ms0)— (z08, m10)(z01, m20)] + + [(z01, m10)(z02, m20)—(z02, ml0)(z0l, m20)]}, где Л—определитель системы (50 5) Для окончательного определения величин \i{ необходимо знать величину cos8x. Условие нормировки, получаемое из выражения (50.2), Оо*)1 = Vl + Pi + № + 2 (W* (m10, m20) + ц,ц3("Чо. т30Н- _ 4-(A2fA3 (тг0. т30)) = 1 дает значение cosOj с точностью до знака Действительно, величины (50 6) можно представить в форме (i,- = cos е,цЛ (i = 1, 2, 3). (50 7) Следовательно, cos» в, = = -t ; ; - ' =—= - , (50 8) U?0 + H?0 + W^0+2lulo |X,„(m,„ tn10)+u,0 и»<т„,т,0) + ц1()ц,(>(1п1в. m„)) откуда COS 6, =
§ 50] ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ СВОБОДНОГО ВРАЩЕНИЯ 489 Выберем знак плюс, т. е. будем считать, что угол вх в течение всего движения остается осгрым. Такой выбор угла Qt позволяет определить однозначно величины ц.и щ, |х, и, следовательно, орт ТоЛ. Перейдем теперь к определению величин угловых скоростей. Каждый из вектор_ов foftxM, располагается в плоскости, перпендикулярной орту 1оА и проходящей через точку G. Заметим, что векторы foftxM, (i = l, 2, 3) сохраняют свою величину и вращаются в этой плоскости с угловой скоростью ci^ вокруг вектора L по отношению к наблюдателю, связанному неизменно с системой Gxyz. Рассмотрим вектор г0хТоЛ. Этот вектор располагается в пересечении плоскости xGy и плоскости, перпендикулярной loft. Следовательно, его можно рассматривать как вектор, располагающийся на линии узлов Тогда можно утверждать, что он вращается в плоскости xGy вокруг оси Gz с угловой скоростью (о,,- откуда находим выражение угловых скоростей <ot и а>я. Пусть tt и /»—некоторые последовательные моменты времени. Тогда <o,=^^[arccos(x0, n0(^)) —arccos(x0, n", (/,))], (50.9) «>i* = (7pZ7j[arccos(x0> (tj, n0(/1)) — arccos(x0(g,'n"() (/,))]. (50 10) В формулах (50.9) и (50.10) вектор п0 есть орт вектора z0x\ok, а х,—£рт вектора 1оЛхМ, для некоторого фиксированного вектора М/. Формулы (50.1) и (50.2), а также (50,9) и (50 10) позволяют определить все параметры вращательного движения. Подставляя формулы (50.9) и (50.10), а также (50.1) и (50 2) в выражение угловой скорости, найдем з _ <о= 2 КИ-/ + <"Л) miv (50.11) позволяет найти проекции век угловой скорости: f-i |М/| f-* |м,| Формула (50 11) позволяет найти проекции вектора оси О^ и величину угловой скорости: ч_Е&в±^тл; (50.12) Ч) „.. |М,|
490 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТЕЛа (ГЛ VIII 14= [2 (ю1|х/ + в>Л), + 2(©1Ц, + «>ЛЖ1*. + «>Л)(т1в, тм) + + (со.и., + «Л) («>iM-a + м2^з) (т.о. т3о) + Т(и1|11 + »,11)Ц|»,тиЛ)(т1(, пЬв)]7' (50 13) Для ориентации оси собственного вращения имеем ^ >/ о-.. = > —- m.t, 31 £f I м,-| *' e»«=XTF7m"" (50,4) А я, а,,= \ — _ т.г 3 £4- IAI/I W Угловая скорость собственного вращения определяется при этом формулой (50 10) Это утверждение справедливо, если ввести понятие угловой скорости собственного вращения с помощью инерциальной системы координат, для которой ось Gt, совпадает с направлением вектора кинетического момента Введем в рассмотрение вновь векторы S, Н, N, которые использовались в § 49 этой главы С помощью этих векторов можно построить выражения, определяющие_параметры вращатечьного движения При этом векторы S, Н, N позволяют на освещенной стороне однозначно определить все упомянутые параметры Векторы S, г, К и Н, г, L не позволяют однозначно определить параметры вращательного движения, так как, во всяком случае, по одному наблюдению бортовые системы никак не могут фиксировать вертикаль, и, следовательно, непосредственно компоненты вектора г не определяются Приведем теперь способ определения оси собственного вращения и оси мгновенной угловой скорости при использовании одного вектора Н Пусть М—некоторый постоянный вектор по отношению к абсолютной системе координат Тогда ветчина тг (проекция М на ось Gz) даст возможность определить период вращения оси Gz вокруг вектора момента количества движения Этот период будет совпадать с периодом повторения максимумов величины тг Обозначим_его через т Будем считать, что ско рость вращения вектора Н при движении точки G ваоль орбиты достаточно мала по сравнению со скоростью вращения системы Gxyz по отношению к абсолютной системе координат, тогда упомянутый период т можно приближенно определить, исходя из кг
*| 50] Oni'F IFHI Mill П\РАМЕТ|'ОВ СВОБОДНОГО ВРАЩКИИЯ 491 Именно, будем считать, что период повторения максимумов функции hz достаточно хорошо совпадает с величиной т Возьмем в трех точках орбиты векторы Ни_ Н, и Н, так, чтобы они были некомпланарными, тогда орт zu оси собственного вращения можно будет представить в виде линейной комбинации ортов этих векторов з V=2WV0. (50 15) t=\ Вектор z„ вращается с постоянной угловой скоростью вокруг вектора момента количества движения Следовательно, величины Л.,- в выражении (50 15) будут периодическими функциями времени с периодом т Будем считать, что вектор Ht относится к моменту времени /, Н2 —к моменту / —«jT и Н3—к моменту t — «2т, где н2 > », — целые положительные числа Из выражения (50 15) вследствие периодичности величин Л. будем иметь з z0(t~nkr)= SMOh,o (* = 1, 2). (50 16) Умножая (50 15) на Н„ а (50 16) на Н, (i = l, 2, 3) скалярно, потучнм для величин А,- систему уравнений _ _ з /ilz=(z0, H1) = _2*./(h/0. H,), 3 _ ft2z=(z0, Ht)=S^(h/0, Ht), (50 17) 3 Лзг=(2„, н,)=^мйй, н3). Разрешая систему (50 17), найдем ^ = Х^1«[(Н„ h20)(H8, hM)-(H„ БЖ)(Н„ h10)] — -AM[(Hlt h80)(H„ Йз0)-(Нз, h20)(H1, h80)] + + ЛМГ(Н„ й„)(Н„ h„)-(Ht> h20)(H"„ h,0)]}, (50 18) ^, = 4-{-Л|Л(Н„ h10)(H"„ hI0)-(H„ h10)(H„ h,„)] + + AM[("i. Ы(Н„ БМ)-(Н„ h10)(H1, hJ0)]- -*to[(HIf h10)(H2, h,e)-(H„ h1(l)(Hlf h30)]},
492 управ iLHiih двнжипшм твадот 1кла [гл. vni ^=xf*i,[(H„ ^о)(Н3> hM)-(H„ h10)(Ht, h20)]- -А.Л(Нх, hl0)(H„ h20)-(Hs, h10)(H1( h20)] + + A„[(Hi. h10)(H2, hM)-(H„ h10)(H„ hM)]} Если подставить выражения (50 18) в (50 15), то получим направление оси собственного вращения в момент / Заметим, что это направление определяется по трем проекциям вектора Н на ось Gz, причем эти проекции берутся в различные моменты времени t, t — п^т, t—п„т Возьмем теперь какие либо три момента tlt /2, t3 такие, чтобы векторы z0{tj) были некомпланарнымп, тогда орт вектора момента количества движения можно определить в виде линейной комбинации L=.2^M';) (50 19) Умножая формулу (50 19) скалярно на z0 (/,-), получим для определения величин ц,, ц2, ц3 систему линейных уравнений О.*, Z.M) = COSe=S|i,(Z0(<,), £,&)), (Т0*, 2„ (/,))--cos0= 2 |i/ (zu (/,), z0 (/,)), (50 20) (U, z0 (/,)) _cos 0=2 Pi 6, (>,). z0 (/,)). Здесь О есть >гол, который составляетесь собственного вращения с вектором момента количества движения Найдем величины \ilt j.i2, \i3 из системы (50 20) -[([.('.). MMHZnM.M^))-^,). Zj,(/1))(Zo(/l), Z, (/,))] + + [(U'i), *» (',))(*. С). z0(/2))-(z0(/2), z.O^t^). *.(',))]}. cosO X {-[(z0 (Q, zn (/,)) (z, (/,), z0 (/,))-_(z0 (t3),j0 (MHz. (/.), z0 (*,))] + + [(M<.). Z„_(/1))(Ze_(/,). Z.J/,))-(Z0Jf,)I Z0_(<1))(Z0_(/1), Z, (*,))]- -[(z,(M, z0(/1))(z0(/t), z0(<,))-(z0(/t), z0(^1))(z0(/1). z, (/,))]}. (50 21)
§ 50] ОПРЕДЕЛЕНИЕ ПАРАМЕТРОВ СВОБОДНОГО ВРАЩЕНИЯ 493 1*1 = тг №> <'•)• *° ('»)> & ('»)• *<> ^)- -Я (/,). Zo «.)) & (*,), Z0 (/,))]- -[(MJi). Z0(Q)(z"0(*s), Zo(M)-(Zo(f3), Z0(g)(z0(^)f £(*,))] + + [(*.d). *.(',))(*.('.). *.(*.))-(*«('.). ze(ff))(z,(<i), z0 (/,))]} Подставляя формулы (50 21) в (50 19), найдем направление вектора момента количества движения Из условия l;Jft = 1 находим cos 6 cose = ±{|i1,.+|ia, + |i5i+2{|ilj, |i20(z„(^), z,(*L)) + + ^,oR3o(z„(/1), z0(t,)) + P* ^.(z.^,), z0(t3))]}-1/s- Будем считать, что угол Э острый Благодаря такому выбору угла однозначно определяются величины ц Определим теперь величины угловых скоростей и направление вращений С этой целью построим векторы \0gXz0 (ti) = C(. Эти векторы будут лежать на линии узлов и их взаимное расположение, следовательно, дает возможность определить и направление вращательного движения, и величину угловых скоростей. Если величина 6 = (с,, с„ \ок) > 0, то прецессия связанной системы координат по отношению к вектору момента количества движения происходит против часовой стрелки, если смотреть с положительного направления орта 1оЛ При б < 0 прецессионное движение происходит по часовой стрелке При проверке этих условий должно быть необходимо, чтобы /, — /j < т/2 Определим два угла ф,- = arccos (х^ с,) , фа = агссо5 (х!^Сг) . 1с, I Ys |с| Если величина 1г—11 достаточно мала, то эти углы позволяют определить как величину угловой скорости собственного вращения, так и направление этого вращения Если угол собственного вращения отсчитывать от оси Gx в сторону линии узлов, то при ф2 — ф, > 0 вращение будет происходить по часовой стрелке вокруг оси Gz с угловой скоростью если смотреть с положительного направления орта z0 Если Фг — ф!<0, то вращение будет происходить по часовой стрелке
494 УПРАВЛЕНИЕ ДВИЖЕНИЕМ ТВЕРДОГО ТНЛА с угловой скоростью Величина угловой скорости прецессии будет определяться по формуле ( '- , если (с„ сг) > О, и —л— arcsin - |c,l|ct| ,—t, 1 с, 11 с, | 6 U,l|c,| если (с,, с2)<0, 6>0 если (с„ сГ2)<0, 6<0.
ЛИТЕРАТУРА 1 Айзеке Р, Диффсренциачьные игры, М, «Мир», 1967 2 Андропов А А, Собрание трэдов, М, И «-во АН СССР, 1956 3 Б en 1\( а н Р, Динамическое программирование, М ИЛ, 1961 4 БеттманР и Кук К, Дифферепциачыю разностные уравнения, М , «Мир», 1967 5 Биркгоф Г , Динамические системы, М, Гостехиздат, 1941 6 Б i и с с Г А , Лекции по вариационному исчислению, М , ИЛ, 1962 7 Гантмахер Ф Р Теория матриц, М , «Наука», 1966 8 Гечьфанд И М, Локуциевский О В Метод прогонки Дополнение к книге Годунов С К, РябеньскийВ С Введение в теорию разностных схем, М , Физматгиз, 1962 9 Голубев В В, Лекции по интегрированию уравнений движения твердого тела около неподвижной точки, М , Гостехиздат, 1953 10 Гюнтер Н. М , Курс вариационного исчисления, М —Л , ОГИЗ, 1941 11 3\бов В И, Аналитическая динамика гироскопических систем, Л. Судостроение, 1970 12 3\'бов В И, Кочебання в нелинейных и управляемых системах. Л, Судпромгиз, 1962 13 3\ бов В II , Математические методы исследования систем автоматического регулирования, Л Судпромгиз, 1959 14 3 у б о в В И , Методы Ляпунова и их применение, Л , Изд во ЛГУ, 1957 15 Зубов В И, Теория оптимапыюго управления, Л Судпромгиз, 1966 16 Кодднпгтон Э А иЛевинсои Н, Теория обыкновенных дифференциальных уравнении, М , ИЛ, 1959 17 Красовский Н Н, Теория управления движением, М , «Наука», 1968 18 Красовский Н Н, Игровые задачи о встрече движений, М, «Наука», 1970 19 Лаврентьев М А, Шабат Б В, Методы теории функции комп- пекспого переменного, М , Гостехиздат, 1956 20 Летов А М, Динамика полета и управление, М, «Наука», 1969 21 Ляпунов А М, Общая яадача об устойчивости движения М, Гостехиздат. 1950 22 Лурье А И, Анатнтическая механика, М, Физматгиз, 1961 23 Лурье А И, Некоторые не пикейные задачи теории автоматического регулирования, М , Гостехиздат, 1951 24 Матвеев Н М, Методы интегрирования обыкновенных дифференциальных уравнений, Л , Изд во ЛГУ, 1955 25 МышкисА Д, Линейные дифференциальные уравнения с запаздывающим аргументом, М , «Наука», 1972 26 Немыцкнй В В и Степанов В В, Качественная теория диффе- ренциатьных уравнении, 2 с изд М, Гостехиздат, 1949 27 Пои тр яг и и Л С и др , Математическая теория оптимальных про цессов М , Физматгиз, 1961
Влади мир Иванович ЗУБОВ ЛЕКЦИИ ПО ТЕОРИИ УПРАВЛЕНИЯ Учебное пособие ЛР Я 065466 от 21.10.97 и сертификат 78 01 07 953 П 004173 04 07 от 26 04 2007 г , выдан ЦГСЭН в СПб Издательство «ЛАНЬ» lan@lpbl spb ru, www lanbook com 192029, Санкт Петербург, Общественный пер , 5 Тел /факс (812)412 29 35, 412 05 97, 412 92 72 ■ - - нок по России 8 800 700 40 71 ГДЕ КУПИТЬ ДЛЯ ОРГАНИЗАЦИЙ того тюбы заказать необходимые Ва и к, е любую и i торговых кочпаний Издате по России и зарубежью «ЛАНЬ ТРЬЙД. 192029, Санкт Петербург, ул Крупской, 13 гел (812)412 85 78, 412 14 45, 412 85 82, тел./факс. (812) 412 54 е mail trade(P>lanpbl spb ru, ICQ 446 869 967 www lanpbl spb t u/price htm в Москве и в Московской области «ЛАНЬ ПРЕСС». 109263, Москва 7 ая ул Текстильщиков, д 6/1 тел (499) 178 65 85, е mail lanpress@ultimanet ru в Краснодаре и в Краснодарском крас «ЛАНЬ ЮГ». 350072, Краснодар, ул. Жлобы, д 1/1 тел (8612) 74 10 35, е mail Iankrd98@mail ru ДЛЯ РОЗНИЧНЫХ ПОКУПАТЕЛЕЙ «Сова» http //www symplex ru, «Ozon ru» http //www ozon ru «Библион» http //www biblion ru также Вы можете отправить заявку на покупку книги по адресу 192029, Санкт Петербург ул Крупской, 13 Подписано в печать 13 05 09 Бумага офсетная Гарнитура Литературная Формат 60*90'/16 Печать офсетная Уел п л 31,00 Тираж 1500экз Заказ №1353 Отпечатано в полном ее скачеством предоставленных Д1 в ОАО «Издательско полиграфическое предприятие «Правда Севера» 163002, г Архангельск, пр. Новгородский, 32. Тел/факс (8182) 64 14 54, тел (8182)65 37 65,65 38 78,20 50 52 www ippps ru, e mail z ' "_/="