Текст
                    Н. Н. КРАСОВСКИЙ
ТЕОРИЯ
УПРАВЛЕНИЯ
ДВИЖЕНИЕМ
ЛИНЕЙНЫЕ СИСТЕМЫ
ИЗДАТЕЛЬСТВО «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ


6П2.15 К 77 УДК 62-50 Теория управления движением. Красовский Н.Н. Издательство «Наука», Главная редакция физико-матема¬ тической литературы, 1968,- 476 стр. В книге изучаются две проблемы, возникающие в тео¬ рии оптимальных процессов: (1) задача об управлении ди¬ намической спстемой при условии минимума выбранной оценки интенсивности к [и] управляющих усилий и и (2) задача о наблюдении, т. е. задача о вычислении текущих координат — ( ( ( движущегося объекта по доступным измере¬ нию функциям yj от этих координат. Основное внимание уделено объектам, описываемым линейными уравнениями (для которых однако из условий минимума х[и] выводятся не¬ линейные, вообще говоря, законы оптимального управления). Дано решение рассматриваемых задач, опирающееся на ме¬ тоды функционального анализа. Сформулированы и обос¬ нованы правила минимакса, которые определяют оптимальные управляющие воздействия или оптимальные разрешающие операции в случаях задач об управлении и о наблюдении соответственно. Обсуждена двойственность между процес¬ сами управления и наблюдения. Установлена связь рас¬ смотренных задач с основными понятиями математической теории игр. Описаны численные методы определения опти¬ мальных управляющих усилий. Рассмотрена задача об уп¬ равлении в конфликтной ситуации преследования одного управляемого объекта другим. Для решения этой задачи предложено правило экстремального наведения, обеспечи¬ вающее минимакс времени до встречи. Изучена связь между решением задачи о наблюдении линейного объекта и кано¬ ническим разложением по собственным элементам движе¬ ний динамической системы с последействием. Рассмотрена задача об успокоении возмущенных движений управляв - мой системы с последействием. Дано решение одной задачи о наблюдении движений линейной системы при случайных помехах. Табл. 2. Илл. 76. Библ. 565 назв. 3-3-13 138-67
ОГЛАВЛЕНИЕ Предисловие 6 Введение И ЧАСТЬ I ПРОБЛЕМА УПРАВЛЕНИЯ ДВИЖЕНИЕМ_ (ЭЛЕМЕНТАРНАЯ ТЕОРИЯ) § 1. Введение ■ 17 Глава 1 Постановка задачи об упршвлонии 18 § 2 . Дсфферницсаоьиын ураиинися двюкенис 18 § 3 . Прсмнры осинйиых управляемых листан 21 § 4. Пвстаивика задаче об управленис 33 Глава 2 Свойства линейных систем 37 § 5 . Формула Коши . 37 § 6 . Обобщенные уравнения длсжетия 43 § 7 . Импульсная перенсолная фушщия обънкта 48 Глава 3 Предварительном рншннин задачи об управллнии 54 § 8 . Эврссасческсе сооббаженис 54 § 9 . Решеисе задечч 58 § 10. Вычислительиая тхнма, моделирующая упраллеиее .... 62 ЧАСТЬ II ТЕОРИЯ УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ОБЪЕКТАМИ § 11. Введение 67 Глава 4 Математическая постановка задачи об оптимальном управлении . . 69 § 12 . Диежнися упраиоянмых тссанм с леиейные отерацее . . 69 § 13. Постаиоика задачс об опасмальиом уп]^г^1^л^енис 79 § 14 . Обобщенная задеча 84 Глава 5 Общем рншннин задачи об управлении 95 § 15. Задача об упрчиленсе как проблнма момниаои 95 § 16 . Проблнма моментао 100 § 17 . Решеиие задачс об управленис . 11Q
4 ОГЛАВЛЕНИЕ Глава 6 Свойства оптимального управления 121 § 18. Управление с минимальной энергией .... * 121 § 19. Управляемость линейных систем с постоянными парамет¬ рами 138 § 20 . Управляемость нестационарных систем 148 § 21. Управление миишмаллной сииой 152 § 22 . Управление в случае кваиилинейного объекта . •. . . с 164 § 23 . Управление при условии минимума импульса управляю¬ щего воздeйcитим 181 § 24 . Численное решение задачи об упpaлвойом 202 § 25. Управление механической системой в окрестности положе¬ ния глвновecим 221 Глава 7 Проблема предельного быстрооенйттвя 231 § 26. Постановка задачи о предельном быстродействии . . . 231 § 27. Решение задачи о предельном PыcтpoдойC’итaм 234 § 28. Управление по принципу обратной связи 251 § 29. Синтез оптимальных систем предельного быстродействия 257 ЧАСТЬ III ТЕОРИЯ НАБЛЮДЕНИЯ ЛИНЕЙНЫХ СИСТЕМ § 30 . ВвeдeйOIе 263 Глава 8 Постановка я решение проблемы иабшодения 264 § 31. Постановка заддчч 264 § 32. Задача об оптимальном оaблюдойом 270 § 33. Решение задачи об оптимальном оaблюдойом 279 § 34 . Решение задачи о оaблюдойнм 289 § 35. Наблюдение квазилинейной ииcиcйи 294 Глава 9 Двойственность между управлением я иаблюдениeм 298 § 36 . Соотношение двoйcттeйооcии 298 § 37. Свойство полной наблюдаемости линейной системы . . . .‘303 § 38. Проблемы управления и наблюдения и теория игр . . . 306 ЧАСТЬ IV РАЗНЫЕ ЗАДАЧИ § 39. Ввeдeеое 324 Глава 10 Игровая задача о встрече елижeний 325 § 40. Постановка задачи о преследоваини 325 § 41. Эвристические соображвши 329 § 42. Задача о встрече однотипных объектов 334
ОГЛАВЛЕНИЕ 5 Глава 11 Линейные системы с особешюстями 349 § 43. Система с последействием, реализующая наблюдаемую ве¬ личину 349 § 44 . Канонические координаты систем с последействием и зада¬ ча о наблюдении 353 § 45. Задача об успокоении систем с ослнд;^(^в^ствинм 358 § 46 . Наблюдение в случайных ббстоятельствах 364 § 47 . Приммнями 374 ПРИЛОЖЕНИЕ § 48 . Ввeденис 393 Глава 12 Линейные операции в векторных проссранствах 394 § 49 . Нормированное линейное пространств 394 § 50 . Линейные опeнацис 397 § 51. Норма линейной опeнацис 398 § 52 . Геометричеекая иниенаpатalтия 402 § 53. Отделение выпуклых миножетЕ 404 Глава 13 Нормированные пространства функции . . 408 § 54 . Предварительные заметанни 406 § 55 . Интеграл Лебега 411 § 56. Стандартные нормы в функциональных пространствах . . 414 § 57. Нормы в пространствах вектор-функций 422 Глава 14 Линейные операции в пространствах фунщии 428 § 58. Норма линейной опepацис 426 § 59. Линейные операции в стандартных пространствах . . . 499 § 60. Линейные операции в пространствах вектор-функций . . . -455 § . 61. Задача об отделении выпуклых множеетв 439 Библиография Учебная лстepатypа 443 Специальная лстepаттpа 444 Предметный указатееь 473
ПРЕДИСЛОВИЕ В настоящей монографии рассматриваются некоторые мате¬ матические задачи из теории управляемых систем. Именно, в книге изучаются следующие две проблемы: (1) задача об управ¬ лении, т. е. задача об определении управляющих сил, которые переводят динамическую систему в заданное состояние; (2) зада¬ ча о наблюдении, т. е. задача о вычислении текущих координат движущегося объекта по доступным наблюдению величинам. Эти задачи изучаются для управляемых движений, описываемых ли¬ нейными или квазилинейными обыкновенными дифференциаль¬ ными уравнениями. Материал книги составляют лекции, прочитанные автором для студентов-механиков в Уральском государственном университете им. А. М. Горького. Характер изложения рассчитан на соответ¬ ствующий уровень подготовки. У читателя предполагается зна¬ ние основ теоретической механики, математического анализа, ли¬ нейной алгебры и обыкновенных дифференциальных уравнений в объеме современного стандартного инженерного образования. Математические факты, которые выходят за эти рамки, но исполь¬ зуются в- книге, поясняются по ходу дела, даются ссылки на под¬ ходящие источники. Теории оптимальных процессов посвящена серия фундамен¬ тальных монографий, вышедших из печати в последнее время. Речь идет, прежде всего, о следующих известных книгах: [179, 28а, 32в, 213г]. По своей проблематике данная работа примыка¬ ет к упомянутым монографиям. Отметим некоторые ее особенности. Как сказано выше, книга посвящена двум вопросам: задачам об управлении и наблюдении в линейных системах. При этом движение управляемой системы трактуется как результат ли¬ нейной операции, которая выполняется над объектом благодаря наложению управляющих воздействий. Этот исходный пункт, определивший все исследование, позволяет привлечь к работе аппарат линейной алгебры и функционального анализа. Таким образом, теоремы об управлении и наблюдении оказываются просто следствиями из известных общих математических фактов. Здесь был заманчив следующий компактный способ изложения;
ПРЕДИСЛОВИЕ 7 сформулировать задачу сразу в весьма общем и абстрактном виде, а затем, указав ее интерпретацию в терминах функциональ¬ ного анализа, получить из его известных результатов общие тео¬ ремы, охватывающие самые разнообразные ситуации, отдельные из которых можно было бы привести в форме примеров. В каче¬ стве такой весьма общей математической схемы, включающей в себя большое число задач об управлении и наблюдении (в том чи¬ сле и задач более общего характера, чем рассматриваемые в на¬ шей книге), можно было бы выбрать схему линейного и нелиней¬ ного программирования в абстрактных пространствах в тех аспек¬ тах, как это изложено, например, в монографии К. Дж. Эрроу, А. Гурвица и X. Удзавы [28*] (см. в связи с этими вопросами так¬ же работы [29*, 317]). При этом было бы естественным ограничить¬ ся лишь обсуждением интерпретации содержательных понятий теории управления в терминах данной абстрактной схемы и очер¬ тить таким путем круг задач, сводящихся к ней. Конкретизацию же схемы для каждой отдельной проблемы управления можно было бы тогда предоставить читателю. Однако от этого пути, приятного для читателей-знатоков, мы решили отказаться, преследуя цель написать книгу, доступную для читателей, которые только зна¬ комятся с предметом, и такую, чтобы она могла послужить введе¬ нием для перехода к более общим абстрактным схемам, упомяну¬ тым выше. Хотелось бы надеяться, что для читателя, познакомив¬ шегося с основой рассматриваемой интерпретации, изложенной в данной книге, такой переход покажется естественным и нетруд¬ ным в принципе. В соответствии с этим мы вообще избегали чрезмерно общих постановок задач и все изложение развивали постепенно от про¬ стых ситуаций к ситуациям, несколько более сложным. Кроме того, избранный круг вопросов мы постарались обсудить по воз¬ можности подробно. Вероятно, это привело к избыточным повто¬ рениям отдельных положений. Подчеркнем также одну труд¬ ность, которую должен снисходительно учесть читатель. Рассмат¬ риваемые задачи по своему существу являются математическими проблемами из теории функций. В то же время они могут интере¬ совать читателя, далекого от тонкостей этой науки. Поэтому в книге сделана попытка изложить весь необходимый дополнитель¬ ный математический аппарат в наглядной форме, апеллируя к при¬ вычным пространственным представлениям. Этой цели служит Приложение, которое нетрудно раскритиковать со строгих пози¬ ций, но которому мы намеренно придали подобную далеко не без¬ упречную форму. Читателю, незнакомому с данными разделами математики, реко¬ мендуется проработать Приложение до чтения . II—IV частей книги. Следует, однако, иметь в виду, что дополнительные сведения из
8 ПРЕДИСЛОВИЕ высшей математики важны прежде всего для обоснования и для понимания внутреннего механизма тех теорем, которые даны в книге для . задач об управлении и наблюдении. Основные же вы¬ воды о решении этих задач можно понять и применять, не выходя фактически за рамки понятий, известных из рядового курса мате¬ матического анализа. Изложение постоянно сопровождается иллюстративными при¬ мерами. Подбор этих примеров определен также избранной тен¬ денцией: каждый раз выбирались самые простые механические модели с тем, чтобы отчетливо пояснялся смысл общих понятий, фигурирующих в теоремах, и чтобы возможно нагляднее просмат¬ ривались свойства изучаемых явлений. Читатель, которому эти примеры покажутся примитивными, всегда сможет в пределах рассматриваемого теоретического материала сконструировать бо¬ лее интересные для него реальные схемы. Монография снабжена библиографией, содержащей работы по теории управления и справочную литературу. Справочная лите¬ ратура вынесена в отдельный список и занумерована цифрами со звездочкой. Список специальной литературы наряду с основными моно¬ графиями по теории оптимальных процессов содержит журналь- ; ные статьи, относящиеся к линейным управляемым системам х). Первоначально предполагалось привести список всей доступной нам литературы, относящейся к рассматриваемым вопросам. Од¬ нако выяснилось, что вследствие чрезвычайного объема такой библиографии эта задача в рамках данной книги невыполнима. Поэтому мы ограничились только перечислением фамилий авторов, работы которых в данной области нам известны, оставив в списке для каждого из авторов лишь самое минимальное число работ, характеризующих направление его исследований. При этом при отборе работ, как правило, предпочтение отдавалось более ран¬ ним исследованиям либо тем работам, на которые делаются непосредственные ссылки в тексте книги. Неизбежный, вероятно, пропуск фамилии какого-либо автора или пропуск того или иного важного труда, связанного непосредственно с материа¬ лом данной книги, следует рассматривать как непреднамерен¬ ную ошибку, за которую автор заранее приносит извинения. На¬ конец, заметим еще, что краткие примечания, составляющие § 47, никак нельзя рассматривать как полный обзор даже той части библиографии предмета, которая дана в книге. Эти примечания являются лишь обсуждением той литературы, которая послу¬ жила основным источником для данной монографии. х Большой труд по подготовке библиографии был выполнен А. Б. Кур- жанским. ‘
ПРЕДИСЛОВИЕ 9 Наконец, необходимо еще раз обратить внимание читателя на следующее весьма существенное обстоятельство. По ходу изложе¬ ния мы лишь весьма бегло и значительно реже, чем это вероятно следовало бы сделать, касаемся связи рассматриваемых решений с основными методами теории оптимальных процессов: классиче¬ ским вариационным исчислением, принципом максимума и теорией динамического программирования. Кроме того,. осталась совер¬ шенно невыясненной связь проблем, изученных в данной моногра¬ фии, с задачами об оптимальной стабилизации управляемых си¬ стем. Это объясняется следующей основной причиной: изложение первоначально намеченного автором материала для книги об управлении движением потребовало бы непомерного увеличения ' ее объема. Поэтому и пришлось отказаться от подробного обсуж¬ дения ■ упомянутых выше основных методов, руководствуясь тем, что они широко известны и отлично изложены в таких фундамен¬ тальных монографиях и статьях, как, например, упоминавшиеся уже работы [4*, 28а, 32в, 1326, 1456, 179, 213г]. Следует еще иметь в виду, что характер изложения материа¬ ла в данной монографии в значительной степени определен одной из главных задач, которую ставил перед собой автор: на конкретном материале из теории управляемых систем позна¬ комить студентов-механиков и инженеров с некоторыми матема¬ тическими понятиями и методами, не включаемыми обычно в стандартные курсы инженерных факультетов; тем самым пресле¬ довалась цель вызвать интерес к соответствующим разделам ма¬ тематики. Поэтому отдельные математические конструкции, связанные с упомянутыми понятиями, не избегаются в книге и в тех случаях, когда их использование не вызвано крайней необходимостью. Книга состоит из введения и четырех частей. Во введении да¬ ется краткий очерк общей теории управляемых систем и пояс¬ няется, какое место в этой общей теории занимают вопросы, рас¬ сматриваемые в книге. Каждая из частей в свою очередь откры¬ вается небольшим введением, где дается краткая характеристика ее содержания. Первая часть книги содержит постановку задачи об управлении, II часть посвящена исследованию этой задачи, а в III части изучается задача о наблюдении. В IV части изучена задача о преследовании одного линейного управляемого объекта другим. Кроме того, в последней главе этой части рассмотрены линейные системы с особенностями, а именно, системы с после¬ действием и одна стохастическая система. Основной матери¬ ал книги заключается краткими примечаниями и Прило¬ жением. В книге принята сквозная нумерация глав и параграфов. Ос¬ новные определения, теоремы, примеры и формулы нумеруются
10 ПРЕДИСЛОВИЕ двумя числами. Первое число означает номер параграфа, второе число — порядковый номер внутри параграфа. Материал книги был подготовлен к печати сотрудниками ка¬ федры прикладной математики Уральского университета Э. Г. Аль¬ брехтом, А. Б. Куржанским, Ю. С. Осиповым, В. Е. Третьяковым и Г. С. Шелементьевым. Их труд намного выходит за рамки тех¬ нической обработки рукописи, и каждый из этих товарищей внес большой вклад в монографию по существу. Отдельные добавле¬ ния были подготовлены^!. Я. Кацем, который также просмотрел критически всю рукопись. Л. М. Куперман, В. И. Бондаренко, Ю. М. Репин, А. И. Субботин и Ю. М. Филимонов осуществили просчет примеров из §§ 21, 24, 27, 42 на ЭВМ. Всех этих лиц автор сердечно благодарит за большую помощь. Кроме того, автор особенно благодарен профессору А. А. Пер- возванскому, который внимательно прочитал рукопись и любезно сообщил ряд весьма важных замечаний. Все эти замечания были по возможности1 учтены при окончательном редактировании ру¬ кописи. Автор
ВВЕДЕНИЕ Развитие управляемых систем, вызванное запросами практи¬ ки, и, , прежде всего, потребностями современной техники, опре¬ делило круг задач, которые составили предмет математической теории управляемых процессов. Существенное место в этой теории занимают проблемы оптимального управления. В общих чертах задача состоит в следующем. Рассматривается объект (механиче¬ ская система, электрическая цепь и т. п.), подверженный управляю¬ щим воздействиям. Заданы элементы желаемого движения, напри¬ мер исходное и конечное состояния объекта. Указаны требования к качеству процесса, содержащие обычно условие минимума или максимума, а может быть, условие минимакса или максимина какого-либо показателя работы системы. Например, часто встре¬ чается условие минимума расходуемой энергии. Требуется найти закон, который определяет усилия, осуществляющие нужное дви¬ жение. Теория оптимального управления объединяет большое коли¬ чество разнообразных задач. Изучение ее усложнено из-за отсут¬ ствия общепризнанной классификации проблем, исследованием которых занимаются математики и механики, физики и инженеры, биологи и социологи, преследующие подчас различные цели и ис¬ пользующие разнородные методы при решении аналогичных задач. Отдельные ветви теории управления, развившиеся в последнее время, имеют обширную и запутанную библиографию. Это за¬ трудняет обзор результатов. В предлагаемой книге изучается довольно узкий круг задач. Рассматриваются лишь такие объекты, текущее состояние кото¬ рых и управляющее воздействие на которые можно описать соот¬ ветственно конечномерными векторами х = {х1,...,хп}, и = = {u1,...,ur}, причем движение {xt (t)} определяется системой
12 ВВЕДЕНИЕ обыкновенных дифференциальных уравнений Xi =- fi (t, , хп, щ,..., ur) (i == 1,..., n). (0.1) Здесь, как всегда, буквой t обозначено текущее время. Основное внимание уделено задаче о приведении объекта в за¬ данное состояние, что встречается особенно часто в. проблемах управления механическим движением. Известны два основных аспекта общей проблемы управления. I. Задача о программном управлении, где дана исходная инфор¬ мация о начальном состоянии объекта (к начальному моменту t = ta) и требуется найти воздействие в виде функции от времени и = и (t) (t , ta) так, чтобы к моменту окончания процесса t = система оказалась в заданном состоянии. При этом, как отмечено выше, требуется еще обычно обеспечить желаемое ка чество процесса. Примером такой задачи является проблема предельного про¬ граммного быстродействия: дано начальное состояние t = ta, х (ta) = х* объекта и указано положение x(t$) = аД в которое необходимо перевести объект; требуется найти воздействие и— и° (£), удовлетворяющее условию || и° (t) || . р и переводящее объект в состояние х (t$) = х& за наименьшее возможное время Т = — ta- (Символ Ци|| означает величину (uj ...4- и?)1/2.) Для указанного типа задач характерно, что дополнительная информация, которая поступает, может быть, в ходе процесса, не используется для коррекции движения с целью улучшения резуль¬ тата, т. е. движение осуществляется по жесткой программе и = и (t), составленной заранее. Это ограничивает роль соответ¬ ствующих результатов и вынуждает рассмотреть проблему в следующем аспекте. - II. Задача о синтезе системы с обратной связью. Здесь наилуч¬ ший закон управления ищется в форме уравнений, связывающих воздействие и с некоторыми величинами {уг (t), . . . , Ут (£)}, до¬ ставляющими информацию о текущих состояниях х (t) объекта. В частном случае, когда возможно быстрое и достаточно точное из¬ мерение всех координат xt (t) вектора х (0, управляющие воздей¬ ствия Uj определяются обычно в виде функций Uj = Uj П, х± (£,... • • •, %П (01 •
ВВЕДЕНИЕ 13 Примером может служить задача о преследовании. В этой зада¬ че даны два объекта (которые, конечно, можно трактовать как две части одного составного объекта), описываемые уравнениями xW = /(D [^1) (> х£\ т,..., urJ, (0.2) (0.3) и изображаемые, следовательно, в некотором (-мерном простран¬ стве точками = {х(» (/)}, = {х? (/)} соответственно. Предполагается, что объект (0.2) преследует объект (0.3) и целью этого преследования является совпадение точки X1) (t) с точкой х2> (t); объект (0.3), напротив, стремится избежать встречи. Итак, выбор управляющих сил Uj диктуется желанием ускорить момент встречи t = ,, выбор Vj диктуется противоположным же¬ ланием отдалить этот момент. Если допустить, что в каждый мо¬ мент времени t оба партнера знают реализовавшиеся значения x$\t) и ' х<О, то можно поставить игровую задачу х), о выборе оптимальных управлений и0 [ж*1), х(2)] и v° [Х1*, я(2)], которые ограничены условиями ||u|| [ Ц, || v || , v, вычисляются в каждый момент времени t по реализовавшимся на деле значениям X1 , (t) и Х2) (t), т. е. в виде и0 = и° [Xx)((), Х2>(()], vo = vo [ [i [ (;), х& (i)], и обеспечивают минимакс для времени [ , когда впервые осущест¬ вляется встреча хX, (tp) = х2 (tp). Исследование задач о синтезе системы с обратной связью есте¬ ственно включает в себя проблему определения текущих коор¬ динат Xt (t) управляемого объекта по доступным наблюдению ве¬ личинам yj (t). Последняя проблема известна как задача о на¬ блюдении динамической системы. Здесь особенно важны вопросы о наилучшем согласовании наблюдения и управления с точки зре¬ ния оптимальности конечных результатов процесса. Остановимся кратко на некоторых основных направлениях в теории оптимальных процессов, описываемых обыкновенными дифференциальными уравнениями (0.1). Наиболее полные исследования и окончательные результаты относятся к необходимым признакам оптимальности для задачи х) Постановка этой задачи разобрана подробно в § 40.
14 ВВЕДЕНИЕ о программном управлении при условии минимума интеграла *3 I = со [£ #£). u(t)]dt. (О.4) Теория таких необходимых условий базируется на класси¬ ческих идеях вариационного исчисления [4*, 10*] и на их разви¬ тии в новых методах, разработанных в последние десятилетия [1326, 1456]. Широким по содержанию, строго обоснованным и удобным по форме для приложений критерием оптимальности является принцип максимума [179], соответствующий классиче¬ скому вариационному принципу Вейерштрасса и методу канони¬ ческих уравнений Гамильтона [4*]. Другой подход к проблемам управления, отвечающий задачам синтеза оптимальных систем с обратной связью, развивается по пути, получившему наименование метода динамического програм¬ мирования [28а]. Этот метод соответствует известным в вариа¬ ционном исчислении рассуждениям о распространении возбужде¬ ний и приводит к уравнениям, типа уравнений Гамильтона — Якоби в частных производных [4*, 10*]. Теория динамического про¬ граммирования охватывает многие проблемы оптимального управления как для детерминированных процессов, так и в слу¬ чайных обстоятельствах, указывая целесообразные пути иссле¬ дования, хотя, может быть, эта теория в смысле математической строгости еще нуждается в доработке. Следует подчеркнуть так¬ же, что методы ее применяются не только в форме необходимых, но и в форме достаточных условий оптимальности. В последнем случае она смыкается с теорией устойчивости движения (см., например, Приложение в книге [17*]). Для большинства технических приложений классическое ва¬ риационное исчисление, принцип максимума и методы динамиче¬ ского программирования доставляют, по-видимому, вполне до¬ статочное количество необходимых признаков оптимальности. Специалист, знакомый с литературой, как правило, не затруд¬ няется в этом вопросе. При встрече с новой задачей обычно удает¬ ся учесть дополнительные обстоятельства и составить необходи. мые условия минимума или максимума по известным общим ре¬ цептам.
ВВЕДЕНИЕ 15 . Успехи фундаментальной математической теории необходимых критериев оптимальности несколько затенили другие важные раз¬ делы теории управляемых процессов. Достаточные признаки оп¬ тимальности, проблема существования оптимальных движений, вопросы корректности задач об управлении и т. д. разработаны значительно меньше. Между тем, представляя теоретический ин¬ терес, эти вопросы не безразличны и для приложений, так как, например, теоремы существования оптимального управления указывают тот класс сил и, в котором надлежит выбирать опти¬ мальное воздействие и9. Одной из трудных и малоразработанных проблем остается крае¬ вая задача, связанная с необходимостью привести управляемый объект в заданное конечное состояние. В настоящее время эта краевая задача оказывается часто камнем преткновения на пути конкретного вычисления управляющих усилий. Дело в том, что известные признаки оптимальности указывают главным образом внутренние свойства оптимальных движений, описывая их ло¬ кальное поведение в окрестности каждой точки на данной траекто¬ рии. В силу этих свойств каждое оптимальное движение разверты¬ вается во времени совершенно определенным образом. Однако направление в пространстве {х}, в котором может уходить опти¬ мальная траектория из заданного начального состояния я(£а) = #а, определяется набором некоторых параметров Zn..., 1п. Труд¬ ность заключается в таком выборе этих параметров, которые на¬ правляют траекторию в нужную точку х (t$) = х&. Указанная задача прицеливания не имеет пока общего эффективного решения. Каждая новая серия таких задач требует обычно для своего раз¬ решения незаурядного вычислительного искусства. Таким образом, для теории управляемых систем и для ее при¬ ложений важна задача о построении управляющего воздействия w, которое приводит объект в заданное состояние. При этом целе¬ сообразно изучить данную задачу об управлении сначала даже без учета требования оптимальности по тому или иному показа¬ телю. В частности, это объясняется тем, что в ряде численных ме¬ тодов оптимальные движения находятся спуском от каких-либо исходных движений, удовлетворяющих заданным краевым усло¬ виям. Уже отмечалось, что в общем случае нелинейных уравнений
16 ВВЕДЕНИЕ (0.1) краевая задача не имеет общей работоспособной/теории. Од¬ нако для систем, описываемых уравнениями (0.1), правые части которых линейны по xt и Uj, рассматриваемая задача об управле¬ нии существенно упрощается и поддается исследованию методами линейного анализа. Для этой задачи построены удовлетворитель¬ ные теории, и она, несмотря на частный характер, имеет весьма обширную библиографию. Задача об управлении линейными объ¬ ектами и тесно связанная с ней задача о наблюдении линейных систем и составляют основной предмет предлагаемой книги. Итак, материал данной книги составляет изложение неко¬ торых функциональных подходов к проблемам управле¬ ния, позволяющих для линейных систем изучить ■ одну из главных конкретных трудностей, связанную с разрешением крае¬ вой задачи, особенно в тех случаях, когда выяснение зависимости решений от краевых условий оказывается особенно важным. Спо¬ собы решения краевых задач, составляющие предмет этой моно¬ графии, надлежит рассматривать как дополнение к основным ме¬ тодам теории оптимальных процессов, которые в свою очередь акцентируют внимание главным образом на необходимых (а иногда и достаточных) условиях оптимальности.
ЧАСТЬ ПЕРВАЯ ПРОБЛЕМА УПРАВЛЕНИЯ ДВИЖЕНИЕМ (элементарная теория) § 1. Введение Первая часть книги носит вводный характер. В ней начинает¬ ся изучение задачи об управлении объектами, движения которых описываются обыкновенными линейными дифференциальными урав¬ нениями. В главе 1 рассматриваются уравнения движения управляемых систем и приводятся простые модельные примеры механических объектов, описываемых линейными уравнениями. Обсуждается и иллюстрируется на примерах линеаризация уравнений движе¬ ния. В конце главы формулируется основная задача об управляю¬ щем воздействии, которое переводит объект из одного заданного состояния в другое в течение определенного промежутка времени. Глава 2 содержит вспомогательный материал из теории ли¬ нейных систем. Здесь приведена матричная запись формулы Ко¬ ши для решений неоднородных дифференциальных уравнений. Дано обобщение уравнений движения, которое позволяет доста¬ точно строго изучать задачи с управляющими воздействиями в виде мгновенных импульсов. Здесь же дается определение импульс¬ ной переходной функции, которая играет важную роль во всей теории линейных управляемых систем. В главе 3 приводится предварительное решение основной за¬ дачи об управлении. Это решение находится из элементарных алгебраических соображений. Построенное управляющее воздей¬ ствие зависит линейно от координат начального и конечного со¬ стояний объекта. Показывается, что оно является оптимальным в смысле минимума интеграла от квадрата модуля управляющего вектора.
Глава 1 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ § 2. Диффмрмнциа.еьиым уравннния движнния Буднм аассмчааслааь упачлляемые обънкаы, тосаояисе которых и каждый момнит лремеис t хчачкаеасзуеатя лелечсичме Хг (£), ... ..., хп (t), которын паедсачлляюа параметры, слязчитые л длеже- теем, как, иапремер, коордсиааы, ткоротас слс иекоаорые фуик- цсс коордсиаа с скоростн^ Велечеиы xt можио аачкаолчаь как компоиниты n-меатого лекаоач х = {xt}. Прндположсм, чао объ- нка подлеажеи упраиляющсм лоздейталеям ui,..., ur, который бу- днм ерчкаолчаь как компоиниты r-мериого лекеоаа и = {u}. ,Пнанмеиные xt слс дейстлстельио, могут смнть смысл ком- поиеит рнальных фсзеаеских лекторол. Напрпмнр, числа ., и2, и3 могут быть паоекцияме иа осс коордсиат трнхмнриого лектора сслы и, прсложнииой к инкоторой мехаиеческой сестемн. Одиако лелечеиы xt слс . ин иснгда будут яиляться компоиеитчме аечль- иых лектоаол х = {xt} (i = 1,..., п), и — {u} (j = 1,..., г). Напаемеа, можнт паедтталсться случай, когда xt = qt, xitm = gh гдн qi и qt (i = 1,..., m) — обобщеииын каслолитейтые коордс- иаты с обобщ^^н скоростс мехатсческой теттнмы тоотлетттлнт- ио. В таксх сстуацсях тачктолку объедеиеисй {хг,..., хп} слс {Uj,..., иг} и формн лектоаол следует рассматаслать как удобиый матееатеческсй прснм. Внктор и буднм ^змиать управлением. Паемем, что езметеиее лелсчси xt (t) ио лремеие опеcывается тестемой обыкиолеииых дсффepеицеальтых уралиеисй, которую можио прелестс к иормальтой формн: Х^ = (t, Zj,..., хп, ur) (i 1.,П). (2*1) Зднсь с и дальтейшем точка иад букиой озиачант деффнрет- цсаолатсе сооалеастлующей перемнииой по лремние. Внктор-фуикцию и (t) — {Uj (t)} иазоинм возможным упрчи- лниеем (иа ратсматрслаемом отрнзкн лрнмние ta t tp), нслс компоиниты Uj (t) яиляются кусочио-иепрерылтымс фуикцсямс, допускающими лсшь разрыин пнриого рода ([23*], а. I, стр. 150) прс отдельиых сзолсаолчттых зиааетеях t = t*. Для определет- иотее прсмем, что и точках рчзаылч, нслс оис нсть, фуикцсс и j (£) тепаерылиы справа.
§ 2] ИФФЕРЕНЦИАЛЬНЫЕ УРАВНЕНИЯ ДВИЖЕНИЯ 19 После подстановки в уравнения (2.1) какого-либо возможного управления u(t) = {wy (/)}, правые части этих уравнений обра¬ щаются в функции от t и xt. Будем предполагать, что на рассматри¬ ваемом отрезке времени эти функции ft (t, х^..., хп, иг (£,..., нг(О) удовлетворяют условиям существования и единственности реше¬ ний х (t) = {х} (£)} при всех начальных данных I ~ ^01 %1 (*о) = -^г 0 ^0> £ = и), (2.2) которые могут встретиться в задаче. Движение х (о = {xt а)}, порожденное начальным условием (2.2), обозначим символом х (t, t0, х°), где, следовательно, х° = {х®}. Если потребуется под¬ черкнуть, что движение х (£) ■ порождается некоторым фиксиро¬ ванным управлением и = и (/), то будем писать х (t, t0, х°', и). Условия существования решений х (Z) — х (t, t0, х°) здесь об¬ суждать не будем. Эти условия изучаются в курсе теории обык¬ новенных дифференциальных уравнений (см., например, [21*], стр. 57, 271). Отметим, лишь, что в точках t = t*, где функции Uj (t) разрывны, символ / в уравнениях (2.1) означает правую производную по времени / ■ (£j = lim [xt (t* -Д At) — Xt (t*)]/At при At -> 4- 0. Задание начальных условий (2.2) и выбор определенного воз¬ можного управления и (it) определяют, следовательно, единствен¬ ным образом непрерывное движение х (t). Вектор х будем назы¬ вать фазовым вектором объекта. Примем следующее определение. Определение 2.1. Фазовым вектором объекта назы¬ вается всякий вектор х = (i = 1,..., п), который обладает следующими свойствами: 1. Компоненты xt (t) характеризуют текущее состояние объекта. 2. При выбранном возможном управлении и (t) каждое на¬ чальное состояние х (t0) = х° единственным образом определяет значения х (t) = х (t, t0, х°) для всех рассматриваемых моментов времени t. При этом должны быть справедливы равенства: х (t, т, Xх) = х (t, t0, х°), если только хх = х (т, t0, х°), каковы бы ни были t, т и t0 из отрезка [£а, 1р] (рис. 2.1). Компоненты хг( = 1,..., п) буур&м называть фазовыми координа¬ тами объекта. Пусть, например, управляемым объектом является голо- номная механическая система, имеющая к степеней свобо¬ ды и описываемая обобщенными координатами дп..., qk. В ка¬ честве фазового вектора можно выбрать 2А-мерный вектор я = Чю gi,---, Qk}- Действительно, известно ([22*],стр. 331), что движение такого объекта можно описать системой из к дифференциальных уравнений второго порядка, которая сводится к системе из 2к уравнений вида (2.1). При этом задание в какой-
20 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 либо момент времени t = всех к°мп°нент q,r w w ,/ qi (t°) векто¬ ра х (t0) при известном законе изменения внешних сил и (I) — = {uj (t)} определяет единственным образом движение системы. Вместе с этим определяются и величины q, (t), q, (). Напротащ г A-мерный вектор . qk] фазовым вектором рас¬ сматриваемой системы не яв¬ ляется, так как значения qi (U, • ■ •, (Q не определяют единственным обра зом вели - чины q, (£) (z = 1,.., к). Заметим, что в отдельных случаях один и тот же объект может иметь несколько фазо¬ вых векторов различной раз¬ мерности. Так, уже в простей¬ шем случае точки т, дви¬ жущейся по прямой g в со¬ в качестве фазового вектора х x(t, t Z*=xX,t0,X°2 Я Ъ г Рис. 2.1. ответствии с уравнением mg = и, можно выбрать двумерный вектор х = {хх, х2} = .{g, В то же время, если интересоваться лишь изменением скорости g этой точки, а не ее координатой, то достаточно рассматривать одно¬ мерный фазовый вектор х = хх = g. Более содержательный при¬ мер подобного рода рассмотрен ниже в § 3 (см. пример 5°). Во¬ обще выбор того или иного фазового вектора определяется конкрет¬ ными условиями задачи. В этой книге мы ограничимся объектами, описываемыми урав¬ нениями (2.1), которые линейны по величинам х, и и,. Поэтому рассматриваемые системы уравнений будут иметь следующий вид: п г Xi=S + 3 Mj + { (i = i,..,n). (2.3) fc =1 ;’==1 Здесь aik, Ь,, wt — постоянные величины или переменные функции времени ,, которые полагаем непрерывными. Величины aik, b,j и wi определяются параметрами управляемой системы (и, может быть, внешними силами, которые приложены к объекту, помимо управляющих воздействий). В дальнейшем для сокращения письма часто будет использо¬ ваться матричная форма записи. Предполагается, что читатель знаком с основными понятиями и операциями теории матриц (например, в объеме материала [3*], гл. 1, 3). Как правило, строч¬ ными латинскими буквами а, 6,... будем обозначать векторы- столбцы. Прописные латинские буквы Л, В,... будут обозначать матрицы. Для обозначения скалярных величин используется
§ 3] ПРИМЕРЫ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ 21 греческий шрифт. (Исключение делается для индексов z, j, к,... и для общепринятых обозначений: t — время, g — ускорение силы тяжести, п — порядок системы и т. д.). Штрих в верхнем индек¬ се будет означать транспонирование. Следовательно, например, символ h' означает вектор-строку. Таким образом, символ К-х обозначает произведение вектора-строки hf на вектор-столбец х, т. е. скалярное произведение а = h'-x = h^x^ + ... -\-hnxn век¬ торов h и х. Предполагается также, что читатель знаком с матричной за¬ писью систем линейных дифференциальных уравнений. Этот ма¬ териал можно найти в книгах ([12*], стр. 29 или [19*], стр. 141). Так как anxi + • • • T а1пхп Яц . • • O'ln pl' _ап1х1 + • • • + аппхп . Лп1 • • • ^nn _xn_ &11м1 + • • ■ Х^1гиг Ы.. • ъ1г ~U— _ЬП1и1 + • • ■ + bnrur J ЬП1 • • ■ bnr • ? или, короче, X — Аx — Ви -р lz. (2.4) § 3. Примеры линейных управляемых систем Приведем простые примеры управляемых механических си¬ стем, описываемых линейными дифференциальными уравнениями. 1°. Рассмотрим движение материальной точки массы т в вер¬ тикальной плоскости {£, ц} по кривой В = 5 Ю п = п (□
22 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 где £ — криволинейная координата точки, равная по абсолют¬ ной величине длине дуги От между движущейся точкой т и на¬ чалом отсчета £ . = 0, ц = О (рис. 3.1). Предположим сначала, что движение происходит по гладкой кривой лишь под действием силы тяжести mg и управляющей силы и, которая составляет угол гр (t) с касательной к траектории. Рис. 3.1. Примем, что угол гр (t) есть изве¬ стная ■ функция времени. Какой должна быть кривая, чтобы урав¬ нения движения были линейными относительно координаты g? Для ответа на этот вопрос составим уравнение движения точки в фор¬ ме Лагранжа ([22*], .стр. 331) (3-1) где Г (g) и П (£) — кинетическая и потенциальная энергии точки соответственно, Q — обобщенная сила, порожденная управле¬ нием и (t). Эту силу вычислим, исходя из ее элементарной работы 6Л = Q6g = u-cosp-6g, т. е. Q= и*со$ ip. Подставляя выражения Г = g2, П = mgr\ в уравнение получим: mg = — mg^- + а .. и (0 (а(0 = cos гр (t)). (3.2) Чтобы уравнение (3.2) было линейным по g, должно выполнять¬ ся равенство dr]/<?g = eg. Поэтому полагаем: п=4-е£2 (е •— постоянная). (3.3) Найдем теперь функцию g (g). Эта функция определится из условия С £ = j/(W + 0'1)2 о или — после дифференцирования по g — из условия Интегрируя последнее равенство в пределах от 0 до g, имеем £ = ■ у 1 — е2ф2' = J_ (eg у1 — e2g2 + arcsin eg). (3.4) ’о
§ з] ШЧ1МЕ1’Ы ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ 23 а = 1/4 |е|.) (3.3), (3.4) имеют, Итак мы.видим, что искомая кривая должна иметь парамет¬ рические уравнения (3.3), (3.4). Эти уравнения определяют цикло¬ иду (Обычно уравнения циклоиды записываются в виде s = а((р • 4- sin (р), * л -= ± а (1 _ cos (р). Последние уравнения получа¬ ются из (3.3), (3.4) заменой £ = 4а sin > *Де Уравнения движения точки т по кривой следовательно, вид т£ — — Ц a (Z) и. (3.6) Если теперь предположить, что на точку действует также сила трения, пропорциональная скорости, • то полу¬ чаем уравнение = — гтgZ — v£ + а (0 и, которое заменой £ % = т приво¬ дится к системе уравнений в нормаль¬ ной форме (2.3) v - а (О .т2 = — egci #2 Н ~ * ° та га 1 / Г и J я Матрицы А и В, задающие систему (3.5) в форме (2.4), имеют для данного примера вид 0 1 ■ 0 А = V , В = а (Z) — e ° та _ т _ 2°. Пусть мы имеем упругий вал, несущий жестко насаженные маховики (рис. 3.2). Предположим, что система вращается вокруг оси вала с по¬ стоянной угловой скоростью со, однако вследствие возмущений возникают крутильные колебания, которые необходимо успокоить. Пренебрегая массой вала и его прогибом, рассмотрим эти крутильные колебания системы. Обобщенные координаты дп д2 и * * которые характеризуют состояние системы, выберем сле¬ дующим образом: примем, что величина д2 есть угол отклонения среднего маховика II от заданного движения системы ф — а величины дг и • д3 суть углы закручивания 1и2 участков вала соответственно. Предположим, что ко II маховику приложен
2А ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 внешний возмущающий момент v (£), а к / и III маховикам при¬ ложены управляющие моменты и± (t) и и2 (£) соответственно. Пусть А/Ци I3—моменты инерции маховиков, а символы ( и с2 обозначают крутильные жесткости соответствующих участков вала. Примем, ■ что система работает в пределах деформаций, под¬ чиняющихся линейному закону Гука (сх = const, с2 = const). Тогда кинетическая и потенциальная энергия всей- системы оп¬ ределяются равенствами: Т = -Tj- Ii (со + ?! + ?г)2 + ~2~ A (( + Q2) + (ш + /2 + <з)2, п l qt 1 t 2 п = —сИ1. + — Снова составим уравнения Лагранжа d / ат \ dt ( ( ( / ат _ ап . и “ dQi + V* (i = 1, 2, 3). Из выражения для элементарной работы dA = Q1S/1 + Q2/2+ + (зб7з = И (*)б£1 + (wi (0 + w2 (t) A- v (°))S?2 + и2 (!) б?3 следует,. что обобщенные силы Qi, соответствующие координатам qt и отве¬ чающие воздействиям v (I), и± (t), и2 (t), выражаются равенствами: <21 = Ы1 (*)> <?2 = “1 (0 + и2 (О + V (t), Qs = Щ (О- Итак, получаем следующие три дифференциальных уравнения второго порядка: IQi + = — С121 + W1, I<i + (Л + А + Д) $2 + А$з — Ui + щ + V, I3Q2 + Als ~ — с2<1з -ф и-. Запишем эти уравнения в нормальной форме (2.4). Вводя обозначения X2i-i = Ць x2i = ?f (& = 1, 2, 3) и проделывая не¬ обходимые выкладки, получаем: £1 О 1 0 0 0 0 ±2 ci (Л ( /2) 0 0 0 Со 0 х2 IlI% 7Г Хз о о 0 1 0 0 х3 Хл = С1 /2 о 0 0 Со 7Г 0 х4 ±5 о о 0 0 0 1 Х& Xq ci I. 0 0 0 - С2 (h -Ь Л) l2h 0 ^6
ПРИМЕРЫ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ 25 + 0 0 0 1 о 1 II 1* * 0 0 Г Mil 0 0 0 “1“ L U2 _| * 1 1з 0 0 0 1 1 л 0 Т __ 12 _ V. (3-7) — вектор скорости частицы dmr 3°. Рассмотрим материальную точку массы т, движущуюся в вертикальной плоскости ц} в поле силы тяжести. Предпо¬ ложим, что в качестве управляющего воздействия к точке т при¬ ложена реактивная сила /, возникающая в результате отделения от нее частиц с элементарной массой |Лпх|. Тогда масса точки является величиной переменной т = т (t) и ее движение можно описать векторным уравнением Мещерского ([13*], стр. 111) + (3.8) Здесь т = т (t) = m0 + rnx (Z), где то = const — неизменная часть массы точки, тх (£) > 0 — реактивная масса точки; f = (s — v) dm-Jdt; v — вектор абсолютной скорости точки в момент t + dt после ее отделения, так что а — s — v есть вектор относительной скорости отделяющейся частицы, р— вес. Проектируя уравнение (3.8) на горизонтальную и вертикаль¬ ную оси координат, получим следующие уравнения движения: т (t) £ = та^ (t) 1 т (t) т] = та^ (I) — т (t) g, J (3-9) где a- и а- — проекции вектора а на оси £ и ц. Допуская, что аб¬ солютная величина вектора а задана и равна о, запишем систему уравнений (3.9) в нормальной форме ^1 = ^2 — Мы #3 = ^4» #4 — g, _ г г ■ т т где х = ё, х.2 = ё, х3 = ц, х& = 1 ] , Ur = a cos я.5 — , и2 = <5 cos (3.10)
26 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [гл. i ос? и а V! —углы, составляемые вектором а с осями £ и ц, причем и* + и% = а2 (т/т)2. В матричной форме (2.4) система (3.10) запишется так: ^1 ^3 х& (З.П) Характерной чертой рассмотренных примеров является ли¬ нейность уравнений движения. Следует заметить, что количество управляемых систем, которые описываются линейными уравнения¬ ми к сожалению, сравнительно невелико. Однако изучение задач управления и наблюдения для линейных систем (2.3)является полезным по следующим причинам: (1) Многие реальные движения, описываемые нелинейными уравнениями (2.1), можно в первом приближении описать линей¬ ными уравнениями вида (2.3). Это позволяет заменить трудную нелинейную проблему более доступной для исследования линей¬ ной задачей. Если линеаризация выполнена разумно, то часто . удается из решения вспомогательной задачи извлечь полезную информацию для решения исходной проблемы. Однако линеари¬ зация проблемы должна всякий раз обосновываться. (2) Вторая причина, по которой полезно изучить задачи упра¬ вления и наблюдения для линейных систем, состоит в следующем. Для таких систем известны аналитические выражения, определяю¬ щие движения соответствующих объектов- При этом линейность уравнений (2.3) по координатам хг и по компонентам управления Uj переходит в линейную зависимость движений х (t, tQ, и) от начальных условий х° и от uj(t). Указанное обстоятельство позволяет привлечь к исследованию сильный аппарат линейной алгебры и функционального анализа. Поэтому здесь может быть построена общая теория и можно указать достаточно эффектив¬ ные методы решения конкретных задач. Приведем простые примеры линеаризации нелинейных урав¬ нений движения управляемых объектов. 4°. Рассмотрим гироскопический маятник ([13*], стр. 577). Он состоит из наружной рамки, которая может вращаться вокруг неподвижной горизонтальной оси О± и внутренней рамки, ко¬ торая может вращаться вокруг оси перпендикулярной к ОгОг. С внутренней рамкой жестко связан стержень ОА, на ко¬ торый насажен маховичок т, вращающийся вокруг оси стержня _ ОА с постоянной угловой скоростью со (рис. 3.4). Такая система, очевидно, имеет две степени свободы. В качестве обобщенных
§ 3J ПРИМЕРЫ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ 27 координат q± и q2 выберем углы поворота соответственно наруж¬ ной и внутренней рамок. Рассмотрим маятник в окрестности верхнего неустойчивого по¬ ложения равновесия, находящийся момента и (t), приложенного к наружной рамке. Составим урав¬ нения движения, пренебрегая массой колец и массой стержня. При таких предположениях ки¬ нетическая и потенциальная энергии системы имеют вид Т = у Ims* (j sin q2 + со)2 + + m<5|j2 cos2 q2 + П = mgh (cos 7 ! - cos q2 — 1), где величины и ^2 имеют смысл соответствующих радиусов инер¬ ции, % — расстояние от точки О до центра тяжести маховика. Выделим теперь в выраже¬ ниях для кинетической и по¬ тенциальной энергии члены под действием управляющего наинизшего порядка. Получим т — | т (б2<?1 + -1- 2*1®9172) + Тх (7, q), (3.12) П = _^д1+д2) + Пх(д). (3.13) Здесь символами Tx (q, q) и Пг (q) обозначены все те члены в выражениях для Т и П, которые имеют по совокупности перемен¬ ных 7i, q2 и qly q2 порядок измерения не ниже, чем третий. Эле¬ ментарная работа 6Л момента и (t) на перемещениях 6q±, dq2 имеет вид SA = uSq^ Следовательно, в нашем случае обобщенные силы 7 и Q2 определяются равенствами: = и, Q2 = 0. Составляя уравнения Лагранжа, исходя из величин Т, П (3.12), (3.13), получим уравнения движения системы в виде 91 + ю — 72 — 4?1 + 71^ 9) = — и, °2 92— о4-91 — + Та (9 9) = 0 (3.14)
28 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 где символы. , (q, q) и у2 (q, q) обозначают члены, измерение ко¬ торых по qt, q2, #1 и выше первого. Если стержень с маховиком т во все время движения остается вблизи вертикальной оси, причем скорости qr и q2 также остаются малыми, то величины ft и у2 в уравнениях (3.14) будут весьма малы, так как ■ они имеют по меньшей мере второй порядок мало¬ сти по , , <?2, <71 и В таком случае можно предполагать, что при решении задачи об управлении этой системой основное значение имеет линейная часть уравнений (3.14). Поэтому исследование задачи можно начать, исходя из уравнений линейного приближе¬ ния: б? 9i + g °2 .. 4 . 92— — — 41 — g °2 1 —Ги> 0. (3.15) % X 4* — Эти уравнения получаются из (3.14), если отбросить члены и у2. Полагая снова x2i-i = qi, x2i == , ,, получим нормальную си¬ стему четвертого порядка, где матрицы Л и В, определяющие урав¬ нения (3.15) в форме (2.4), здесь таковы: 0 1 0 0 ~ 0 “ gX 0 0 4 — 1 4 °2 /ПО? 2 2 , в = ъ = а 2 0 0 0 1 0 0 © —L gX 0 0 б2 б2 5°. Рассмотрим материальную точку массы т, находящуюся под действием центральной силы р, которая возникает в резуль¬ тате взаимодействия с другой материальной точкой массы М. Считая, что т значительно меньше М, будем пренебрегать движе¬ нием последней относительно общего центра масс. Предположим, что, кроме силы р, к точке т в качестве управляющего воздействия приложена реактивная сила’/ (см. пример ■ 3°). Пусть под дей¬ ствием этих сил точка т совершает движение по кривой Г, мало отличающейся от некоторой равновесной круговой орбиты Г° (см. рис. 3.5). Если вектор реактивной силы / все время находится в плоско¬ сти кривой Г°, то движение точки будет происходить в плоскости этой кривой, и оно вполне будет определяться изменением ее по¬ лярных координат г и ф. Величины г (£), г (£), ф (t), ф (t) могут
5 31 ПРИМЕРЫ ЛИНЕЙНЫХ УПРАВЛЯЕМЫХ СИСТЕМ 29 быть приняты в этом примере за фазовые координаты. Дифферен¬ циальные уравнения, описывающие изменения можно по¬ лучить, если спроектировать векторное уравнение (3.8) на напра¬ вление радиуса движущейся точки и на . перпендикулярное к не¬ му направление. Известно ([22*1, стр. 70), что проекции вектора ускорения w = dvldt на указанные по формулам: wr = Г гф2, Wф = 2г ф ф- гф. Следовательно, имеем два диффе¬ ренциальных уравнения, каждое из которых есть уравнение второго по¬ рядка относительно гиф: m(r — /-ф2) = p + fr, т (2гф + гф) = /ф Рис. З.о. где fr = арт, /ф = <mh, а а? и аф суть проекции вектора относи¬ тельной скорости отделяющейся частицы на направление радиуса и поперечное направление соответственно. Разделив оба уравнения (3.16) на т (t) и полагая, что сила р есть сила всемирного тяготения ([22*1, стр. 176), окончательно получим: г — гф2 4- Гф+ 2гф = а^. (3-17) Здесь v = v°M, v° — постоянная всемирного тяготения. Пусть при отсутствии управляющей реактивной силы точка т может двигаться по круговой траектории Г° радиуса Го = const > 0, так что го = 0, го = 0. Тогда из уравнений (3.17), в которых пра¬ вые части положены равными нулю, определяются значения ос¬ тальных фазовых координат, соответствующих движению по кри¬ вой Г°: 4|>0 = at, ф = « = Kv/rf. Запишем уравнения (3.17) в нормальной форме (2.1): У1 = Уъ, ? th = V + У1У1 + У1 Уз = у 4, • о ?/4?/2 , 1 Z/4 = 2 — и2. ■ У1 У1 (3.18)
30 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 Здесь обозначено: у4 = г, у2 — /, уа = ф, У4 = ф, u = arm/m, и2 = афп/т. Предположим теперь, что в момент включения управляющих воздействий фазовые координаты нашего объекта мало отличаются от их значений на выбранной круговой орбите Г°, а величина уп¬ равляющей реактивной силы / сравнительно невелика, так что в процессе всего управления точка остается в достаточно малой ок¬ рестности указанного кругового движения. Если ввести откло¬ нения х/ = ух — r0, х2 = у2, Х3 = у3 — at, х± = у4 — а фазовых координат от их значений на круговой орбите1), то для них из (3.18) получаются уравнения: 31 — #2, #2 = Т1 (*1> ®2, *3j а*) + Z1> Х3 == (3.19) *4 = Тз (®1, ®2, «3, «4) + Гз (®1> «2> ®3> где Г1 = V (*14- Г0)2 — (®1 + г(,) (х4 4- а), Т2 9 072 (#4 + а) „ *1 + Г ’ — 1 *14- Го • Мы предполагаем, что за все время движения на рассматри¬ ваемом интервале [£а, 7р1 координаты Х/ (t), x2 (t), х3 (t) и х4 (t) остаются достаточно малыми. Тогда можно составить уравнения линейного приближения в окрестности кривой Г° для системы (3.18) или, что то же самое, в окрестности х± =0, х2 =0, х3 =0, х± = 0 для системы (3.19). Эти уравнения имеют вид ®i — х%, $2 — #21®1 4“ #24®4 4‘ #1, &3 = Х4, Х4 = 642®2 4“ Ра22* (3.20) Зд2Сь П21= = 3#, a2l=(gL)o = 2r°X, С42 = (-g-)o = = — , P = (Тз)о = —— • При этом предполагается, что и = 0 при х/ = 0, х2 = 0, х3 = 0, х4 = 0. (Символ ( )0 означает, что выражение, стоящее в скобках, вычисляется при отклонениях х/ = 0, х2 = 0, х3 = 0, х4 = 0.) Здесь, впрочем, следует сделать еще одно пояснение. Движе¬ ние х/ (t) = ... = х± (t) = 0 при и = 0 неустойчиво по координа¬ те х3 (t). Это означает, что при отсутствии управляющих сил ука- х) Величины Xi (t) описывают отклонение точки т (t) от близкой к ней свободной точки т,, движущейся по круговой орбите Г°,
§ 31 ПРИМЕРЫ ЛИНЕЙН ЫХ УПРАВЛЯЕМЫХ СИСТЕМ 31 занная координата с течением времени довольно быстро возрас¬ тает по абсолютной величине и не остается, вообще говоря, огра¬ ниченной при даже если все начальные отклонения х == 1,...,4) малы. Поэтому пользоваться уравнениями (3.20) мы можем лишь при том условии, что действующие силы и± (/)', и (t) обеспечивании малость отклонений х- (t) в течение всего рассматриваемого отрезка времени [£a, fy], и это условие должно проверяться по ходу работы с уравнениями (3.20). В § 2 отмечалось, что один и тот же объект может иногда иметь несколько фазовых векторов различной размерности. Данный пример доставляет нам как раз такой случай. - Действительно, вместо фазового вектора у — {у^ у2, у3, у±} можно взять фазовый вектор меньшей размерности, а именно, принять за фазовые коор¬ динаты величины г (t), г (£), % (t) — фг2, так как совокупность их удовлетворяет всем условиям определения 2.1. Величина % яв¬ ляется обобщенным импульсом, соответствующим координате Уз = ф, которая будет циклической при отсутствии реактивной силы. Учитывая, что шф = 2 гф + гф ~ТТг(г2Ф) и ф = Х^, получаем из системы (3.17) дифференциальные уравнения, опи¬ сывающие изменение фазовых координат г, г, % во времени: г X Полагая величины аг и аф постоянными во все время движения, т. е. считая, что выброс массы п— производится ориентированно относительно системы координат, связанной с точками т и М, запишем систему (3.21) в нормальной форме (2.1): 21 — Z2, • V . z3 | z2 — — -I—3- + aru, Z1 zi Z3 — Z^U^H. (3.22) Здесь обозначено: Zt — r, z2 = f, z3 = %, и — т/т. Значения фазовых координат zx, Zj, z3 на круговой орбите радиуса г0 будут теперь следующими: Z = г0, г2 = 0, Z3 = Хо = /vr0. Обобщенный импульс %0 определяется из первого уравнения си¬ стемы (3.21) при ‘Го = 0, т — 0.
32 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 Поступая так же, как и в предыдущем примере, можно соста¬ вить уравнения линейного приближения в окрестности кривой Г°. Эти уравнения для данного примера записываются так: = я2, (3.23) Здесь = Zr — r0, х2 = z2 — 0, х3 = z3 — % есть отклоне¬ ния фазовых координат от их значений на круговой орбите Г°. Если выполняются условия, обеспечивающие близость рас¬ сматриваемого управляемого движения к движению по круговой траектории Г°, то исследование линейной системы (3.23) дает полезную информацию о движении в силу полной, нелинейной системы дифференциальных уравнений (3.22). Во всех рассмотренных примерах элементы матриц А и В суть постоянные величины, т. е. системы линейного приближения яв¬ ляются системами линейных дифференциальных уравнений с по¬ стоянными коэффициентами. Однако нетрудно указать ситуацию, когда элементы матриц А , и В будут функциями времени. Так, если в примере , 5° в качестве движения, в окрестности которого линеаризуется система (3.18), взять движение не по ок¬ ружности, а по эллипсу, то матрица А будет иметь элементы, пе¬ риодически меняющиеся со временем. Если же считать, что вы¬ брос массы производится по определенной программе в меняю¬ щихся направлениях относительно системы координат, связанной с объектом, то аг и х , будут заданными функциями времени, а сле¬ довательно, и компоненты матрицы В будут также переменными величинами. В заключение заметим следующее. Если в процессе управле¬ ния система совершает движение в окрестности некоторого по¬ ложения равновесия или вблизи некоторого заданного движения, то при составлении уравнений линейного приближения удобно пользоваться следующими двумя приемами. (1) В выражениях для кинетической и , потенциальной энергий, в выражениях для элементарной работы управляющих и внешних возмущающих сил, а также в выражениях для функций, описы¬ вающих диссипацию и гироскопические эффекты, выписываются лишь члены, имеющие наинизший порядок по совокупности пе¬ ременных и и. Затем по этим величинам в соответствии с об¬ щими правилами механики составляются уравнения движения. Таким путем были составлены уравнения первого приближения (3.15) в примере 4°.
§ 4 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ 33 (2) Второй способ составления уравнений линейного прибли¬ жения заключается в следующем. Сначала составляются полные нелинейные уравнения движе¬ ния рассматриваемой управляемой системы. После этого функции, определяющие эти уравнения, разлагаются в ряды по величинам Д#{, /■■ Aqt и и, описывающим отклонение управляемого дви¬ жения qt (£) от заданного q" (t). В полученных рядах сохраняются лишь члены не выше первого порядка малости по этим величинам. Коэффициенты при Aqit Д#г, \qt и и в уравнениях первого при¬ ближения определяются в таком случае производными соответ¬ ствующих ■ функций по qt, qt[ qt и п, вычисленными при qt = — 7? W, Qi = q°i (t) и и = 0. (Предполагаем, что на заданном дви¬ жении#? (t) управление и тождественно равно нулю.) Таким прие¬ мом мы воспользовались при составлении уравнений (3.20) и (3.23) в примере 5°. Оба способа, естественно, должны приводить к одинаковым ре¬ зультатам. Подробно о составлении уравнений первого приближения в окрестности заданного движения можно прочесть в книгах по теории устойчивости движения ([15*], стр. 21; [17*], стр. 17; [25*], стр. 13), где заданное движение принято называть невоз¬ мущенным, а сами уравнения движения вида (3.19) называются тогда уравнениями возмущенного движения. § 4. Постановка задачи об управлении Одна из основных задач об управлении формулируется сле¬ дующим образом. Задача 4.1. Заданы уравнения движения (2.1), отрезок вре¬ мени [fa, £j], начальное и конечное значения х* = {х*}, х$ = = {xt} фазового вектора управляемого объекта. Требуется найти возможное управление и (t), переводящее систему (2.1) из состояния х (ta) = х* в состояние х (t) = х?. Требуется, следовательно, найти кусочно-непрерывные функ¬ ции и} (t) (/ = 1,..., г; при подстановке которых в уравнения (2.1), последние будут обладать решением х (t, ta, ха; и), удовлетворяющим краевому условию x(t$, ta, х°-, и) = х&. Пример 4.1. Примером сформулированной задачи об управлении может служить задача об успокоении колебаний вала, рассмотренного в п. 2° § 3. Пусть в начальный момент t = tx известны углы поворота маховиков qt (ta) и их угловые скорости ■ (£а), а также пусть известно, что в течение проме¬ жутка времени ta t ■ ■ на вал действует периодический возмущающий 2 н. н. Красовский
34 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 момнит v (t) = sin (yt + б), ссчнзающсй прс.t = tp. Тогда задача 4.1 со- ттоет и иыборн управляющих мом-анитои u^t) с с2 (0, которын должиы рабо¬ тать и тнчнисн иaемеие . . t . и. с должиы к момниту t = tр прелнсае иал и тоттояисе аалномнрного лаащеися с сиять тчпряжеисе иа участках 1 с 2, т. н. требуеття паслесас обънкт и состояисн . (tp) = 0, . (tp) = 0(i = 1,2, 3). Задача об упрчллеисс часто емнет ин одио аншнисн и (t). В иыборн фуикцсй Uj (t), удоллетлоряющех услоисям задачс, иоз- можни большой просзиол. В то жн лаемя коикретиын проблнмы обычио содержат дополтстельтын таеболаися таслучшего (и том слс сиом смыслн) качества про^сса. Треболаисе ^стронися иас- лучшнго слс, мачн, оптсмчльиого упрчллется u(t) про^ссом можнт Формулсроичться и инсьма аазиообаазтых формах (см., тaпрсмеа. [28а], стр. 88; [356], стр. 46; [136а], стр. 4б0; [17*], стр. 478; [179], стр. 15; [213г], стр. 26). В этой кисгн мы аaстмоа- рсм лсшь инкоаорын задачс об оптсмальиом упраллнисс. В коткрнтиых задачах, как праисло, иыбсрaется инкоторая лелсчсиa, харакаерезующая затраты ресурсол иа осущнстилнисн процнсса упaaллеиея. Обычио трнбуется . достсчь желаемого рн- зультата так, чтобы эта лелсаеиа ин прнлосходсла инкоторых за- даииых граиц, слс так, чтобы нн зиачнисе оказалось мсисмаль- иым. Такую лелечеиу буднм иазыиать интенсивностью упраллеиея с обозиачать ссмиолом х[с]. Буднм паедполчгааь, что иелечсиа к[и] сынна смысл с иеотасцательта для любого иозможиого упрчл- лнися и (t) (ta t t t ty). Прсмер 4.2. Прндположсм, что и зчдччн сз прсмнрч 4.1 упралляющсн момниты их (t) с и2 (t) иырабааыиаются элнкареанткемс длсгчтнлямс с пропор- цсотальиы токам i. с г'2 роторои. Пусть для иормальиой работы тетенмы иаж- ио, чтобы лелеасны токои . с г2 по иозможиостс ин прсисмалс большсх зиччнисй и паоцессн упачллеися. Тогда и кччнсалн снтннсслиостс упаалле- ися х[с] разумио инбрать инлсаену x [u] = max [ I щ (z) |, I иг (t) | ] (t« < z < tg) (4.1) с постараться опрнднлсть упраллеисе и (t) = {иг (t), иа ($)} так, чтобы ин- лсчсич х[с] была иозможио меиьшнй. Еслс, одиако, большсн зиачнися токои г. с ia и отд^ль^н малын про- межуткс ирнмнис ин опчсиы, ио иажио умниьшсть теплолын потнрс и цнпях за инсь пнрсод упраилеиея, то и качнттин ситеитсииолте х [с] цнлнтообрчз- ио лыбрать лнлсасиу, опанднлеииую ааинистлом x4“l = J [“i(0 + »’(«)] dt> (4-2) ta с иаходсть упраллетсе и (t) = {Uj (t), и2 (t)} сз умоися мстсмальиоттс этой сиееисслиостс.
§ 4j ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ 35 Сформулируем теперь общую задачу об оптимальном управле¬ нии при минимальной его интенсивности. Задача 4.2. Заданы уравнения движения (2.1), отрезок времени К, *₽!, начальное и конечное значения х* = {х*} и фазового вектора и выбрана интенсивность x[zz], оцени¬ вающая управление. Среди возможных управлений и (f) требуется найти оптимальное управление u°[t), переводящее систему из со¬ стояния xf = ха в состояние x(t$ = о? и имеющее наимень¬ шую возможную интенсивность x[zz]. ' Таким образом, задача 4.2 — это задача , об оптимальном управ¬ лении, которое определяется двумя условиями. 1. Оптимальное управление и° (t) является возможным. 2. Управление u° (t) решает задачу 4.1 и обладает свойством к [и0] ■< х [и], (4.3) каково бы ни было другое возможное управление и (Z), также ре¬ шающее задачу 4.1. Пример 4.3. Рассмотрим движение материальной точки, описанное в п. 3°§3. Пусть за время ■, < t < tр эту точку требуется переместить из поло¬ жения g (*«) = [[ л (*«) = тЛ 1 («) = ° Л («) = 0 в положение g (д) = ° П (^) = 0 £ (fy) = 0 Л (^) 0- Масса точки т (t) складывается из двух частей: т (t) = т0 + гщ (£), где величина т0 задана и ' остается постоянной, а величина rnj, (i) является переменной и определяет запас реактивной массы в момент времени t. Уп¬ равляющим воздействием является реактивная сила, возникающая в резуль¬ тате отделения частиц dm. Предполагается, что в конце процесса вся реак¬ тивная масса 7гх (t.) должна быть израсходована, т. е. при t = ■, выполня¬ ется равенство тг (tg) = 0. Естественным является желание осуществить процесс с наименьшим запасом реактивной массы тг (ie) и при этом избе¬ жать больших перегрузок, вызванных дополнительными ускорениями точ¬ ки в процессе ее движения, обусловленными управлениями и. Последнее означает нежелательность больших значений управляющей силы. Таким образом, в данном случае выражение для х [и] должно включать в себя и величину, которая характеризует расход массы [ , и величину шах || и (t) ||, равную максимальному значению управляющей силы. (Здесь и всюду в даль¬ нейшем символ || q || означает евклидову норму вектора q, т. е. || q || = = (?г1.+---+92) ' 2- Но расход массы оценивается так. По определению функ¬ ций щ и и2в уравнениях (3.10) имеем || и (t) || == — о т (t)/m (Г),т.е.—о din т (t) = «= II и (t) II dt или после интегрирования М т (t ) р sin—L^.= \ ИЖ (4.4) m (tp) J откуда следует, что нужной нам мерой для величины т. (f_) является инте¬ грал [ || и (г) || dr. <« 3
36 ПОСТАНОВКА ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 1 Итак, исходя из указанных соображений, приходим к выводу, что в данном случае полезно принять за минимизируемую интенсивность х [и] величину х [и] = max /max || и (t) ||, X \ | и (т) || dx| (4.5) (X = const > 0). Изменением постоянной X можно регулировать влияние каждого из фак- (з торов (максимальной силы || и (t) || или ресурса управления \ || и (т) || dx) на свойства желаемого движения. Таким образом, для системы (3.10) имеем следующую задачу 4.2 об оп¬ тимальном управлении: найти возможное управление u° (t) (ta t < t), переводящее систему (3.10) из состояния х (0) = {£“, 0, т|“,0} в состояние я(<р)={0, 0, 0, 0} и имеющее наименьшую возможную интенсивность х [и] (4.5). Здесь же можно поставить задачу и несколько иначе. Именно, можно искать управление и0, которое минимизирует только величину (4.4), но при этом стеснено дополнительным ограничением || и (£) || <1 p(Za t t$). Впро¬ чем, последняя задача сводится к задаче о минимуме величины х [и] (4.5) при подходящем значении X (см. ниже в § 24 задачу 24.2).
Глава 2 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ § 5. Формула Коши В этом параграфе приводится формула для ■ решения х (t) линейного уравнения х = A (t) х + В (t) и + w (t) (ta < t < /р). (5.1) Наряду с (5.1) рассмотрим однородное уравнение z=A()) z. (5.2) Пусть z(1 (i) = {z(1? (t)}, .... z<n (t) = {z(} (t)} — n линей¬ но независимых векторов-решений уравнения (5.2). (Напомним, что некоторые п-мерные векторы qW = {qt} (к = 1,..., $) на¬ зываются линейно независимыми, когда любая их линейная ком¬ бинация q = ... + isq{s) дает вектор q, отличный от нуле¬ вого, если только среди чисел ■ есть отличные от нуля.) Извест¬ но ([21*], стр. 276), что векторы zk (t) (к = 1,..., п) линейно неза¬ висимы при всех t из отрезка {t«, £р] тогда и только тогда, когда они независимы по крайней мере при одном значении t = т из этого отрезка. Считая, что каждый из векторов z(k■ (t) является вектором-столбцом, составим матрицу zW (о • . . Zt (t) Z (t) — Zn\ (° in) (О Поскольку при всех рассматриваемых значениях t векторы zZt (t) (к = 1,..., п) линейно независимы, то матрица Z (t) яв¬ ляется неособой и, следовательно, при каждом^ из отрезка Иа, fp] существует обратная матрица Z~ (i). Составим матрицу X И, t>] = Z (О -Z-1 (t0). (5.3) Сголбцы ■ ■ [t, = {хи (t, £0)} этой матрицы также являются решениями уравнения (5.2), так как они суть линейные комбина¬ ции векторов ztV (t) (к = 1,..., п). Рассматриваемая матрица % £р] называется фундаментальной матрицей системы (5.2).
38 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. 2 Важно, что при t = t0 она обращается в единичную матрицу Е. Поэтому частное решение z (£, z°) системы (5.2), удовлетворяю¬ щее условию z (t0) = z° = {z[}, определяется равенством z (t, t0, z°) = X[t, Q z°. (5.4) В подробной записи равенство (5.4) имеет вид "21 (У n (О Я1(С to) ■ • • x-in (t, to) xn\ ( ( - *о) • • • Хпп (С М) п 2 Xi(t, 2o)z- г=1 п 2 &ni (С ^о) 2j — i=l Если в уравнении (5.2) элементы ац матрицы А суть постоян¬ ные величины, то известен аналитический вид решений z (t), а следовательно, известен и явный вид фундаментальной матрицы Х[£, £0]. Векторы-решения z— (t) в этом случае следует искать ‘ по методу Эйлера в форме zf) (t) = рМ (/) гцс р Р1 (t) — вектор-функции, компоненты которых либо постоян¬ ные, либо полиномы от t, - — корни характеристического урав¬ нения ап •— К .. . а1П | А — ХЕ| = = 0. (5.5) аП1 • • • апп— Структура решений z—- (t) (характер полиномов р[к) (/)) зави¬ сит от свойств корней — г уравнения (5.5). В частности, если все корни — - простые, то векторы р№ (t) оказываются постоянными векторами р(к), которые находятся из уравнений (Л -ХкЕ)рЮ =0 (* = 1,..., п). Построение решений ги([) в общем случае кратных корней и правила для вычисления компонент полиномов р&> (t) опи¬ саны. например, в книгах [19*] (стр. 69—74), [21*] (стр. 288—
§ 5J ФОРМУЛА КОШИ 39 297) [25*1 (стр . 57—64). Будем предполагать, что читатель в об¬ щих чертах знаком с этими вопросами. Если величины at} (t) суть функции времени t, то вряд ли можно указать общий метод построения в замкнутой форме пшенм z (t) уравнения (5.2) при п > 2. В этих случа¬ ях, как правило, элементы Хц (t, t0) фундаментальной матри¬ цы* X [t, /о] приходится определять численными способами. В дальнейшем всегда предполагается, что фундаментальная мат¬ рица XU, to] может быть так или иначе найдена. Поэтому мат¬ рицу Х[£, £о] будем считать известной для всех тех значений t и £о, которые могут встретиться в рассуждениях. (При решении прикладных задач часто достаточно лишь уметь моделировать си¬ стемы (5.1) и (5.2) на вычислительных устройствах, определяя та¬ ким путем элементы X И, /о].) Движение х (t) = х (t, t0, x°) системы (5.1), которое удовлетво¬ ряет начальному условию х (t0) = ж0, определяется формулой Ко¬ ши ([12*], стр. 80—82): t x(t) = X К, to] xQ + X К, т] • [2? (т) и (т) + w (т)] dx. (5.6) to Эту формулу мы здесь выводить не будем, а лишь проверим ее справедливость. Равенство (5.6) проверяется подстановкой пра¬ вой части его в уравнение (5.1). В самом деле х), X (t) = X [/, £0] + X [t, t] [5 (Z) u(t) -\-w (01 + t + X К, т] [B (t) u(x) (t)]c?r. to Но X U, Z] = E и X И, т] = A (t) X И, т], так как столбцы (t, т) матрицы Х|£, т] при каждом постоянном значении х являются решениями уравнения (5.2). Поэтому t ж (0 = Л (0 (х [t, t0] ж° + § X [^ т] [В (т) и (т) + w (г)] dx I + + В (Z) и (t) -)- w (t) = A (t) х (t) + В (t) и (t) + w (t) 0)_ Здесь вычисляются производные от матриц. Напомним, что под произ¬ водной от матрицы мы понимаем матрицу, получающуюся из данной путем замены всех элементов их производными. Для операции дифференцирования матриц сохраняются, с незначительными изменениями, правила дифферен¬ цирования скалярных функций ([3*], стр. 100). Кроме того, мы дифферен¬ цируем интеграл в правой части (5.6) по параметру t. Искомая производная складывается из подынтегрального выражения при т = t и из интеграла от частной пропз^днм по t, взятой от подынтегрального выражения ([23*],
40 СВОЙСТВА ЛИНЕЙНЫХ. СИСТЕМ [Гл. 2 и, следовательно, уравнение (5.1) действительно удовлетворяется. Кроме того, вектор х (t) (5.6) удовлетворяет равенству х (t0) = = X [£0, = Ex0 = ж0. Тем самым справедливость формулы Коши (5.6) полностью доказана. Если элементы ац матрицы Л в уравнении (5.1) суть постоянные числа, то справедливо равенство ([12*], стр. 84) Х£, = = X [Z — U где Х[Л — матрица, составленная . из столбцов- решений z<A (t) уравнения (5.2) и удовлетворяющая условию Х[0] =Е. Поэтому в случае постоянной матрицы А формула Ко¬ ши имеет вид t х (t) = X [t ■— £q] xQ + X |* — тЦ# (т) и (*) + w (t)] dx. (5.7) t. Заметим еще, что в случае постоянной матрицы' А фундамен¬ тальная матрица Х£] имеет видХ£] = eAt. При этом символ eAt обозначает матрицу, являющуюся суммой ряда eAt = Е + At + -1 АН* + . . . +-7ГЛ"Г + . . ., составленного из степеней матрицы Q = At по тому же правилу, как составляется ряд из степеней числовой величины v в случае обычной функции ev. Понятие сходимости матричного ряда и его суммы получается автоматическим перенесением на матрицы со¬ ответствующих понятий из теории обычных рядов, и мы здесь на этом не останавливаемся, отсылая читателя к книге [3*]. Рассмотрим два простых примера, иллюстрирующих формулу Коши. Пример 5.1. Пусть в уравнениях (3.5) имеем eg=<o2 > 0, v = 0, a (1) = 1, тогда система уравнений (3.5) запишется так: 1 ±1 = #2, ±2 = —(03#+ и. (5.8) Соответствующая однородная система (5.2) в данном случае имеет вид ii = Z2, Z2 = — <o5zi. (5.9) Корни характеристического уравнения (5.5) системы (5.9), т. е. корни Хх, Х2 уравнения = X3 4- со2 = 0, суть мнимые числа Х1=гсо, Х2 = — ico. Поэтому решения '' (t) и z(2) (t) сис¬ темы (5.9) ищутся в форме z(1) (t) = P»e™, /2) (t) = р»е-1иЛ (р(к > = const, е±гш< = cos wZ + 1 sin о>г). — X 1 1 — co2 — X I
§ 5] формула коти 41 Выполнив необходимые вычисления, найдем. А' [*] = cos со ( 1 — sinot со — со sin coi cos (t>t Следовательно, движение x (t) = x ( ,,, x°) системы (5.8) определяется равенством 1 , — sin a>(t — t0) Гж° 1 + cos со (i — to) х2(0 — co sin co (i — t0) cos co (Г — to) Ж0 J t cos со (t — т) 1 — sin • со (t — т) со 4 0 + \ 1 и (Т) dx J to со sin со (t — т) cos со (t — т) - т - Это векторное равенство, расписанное по строкам, приобретает вид Х2 п (t) = х° cos w (г — t0) + — sin со (Z — to) + * 1 i — \ sin со (t — т) и (т) dt, to I 1 С x2 (t) = — rj со sin о) (t — «о) + «2 cos w О • — *>) 4- ~\ cos со (t— т)и(т) dx. (5.10) Пример 5.2. Рассмотрим систему уравнений (3.20) из п. 5° § 3: £l = Х2, •t'2 — Х21Х1 Х24Х4 "4“ Х1, Хз = Хц, Х4 = #42Х2 3Х2. С°°тветствующая ей однородная система имеет вид Z| = Z2, Z — Х-21Х1 Х2121, Х3 = Х4, Z4 &J2Z2, (5.11) (5.12) где а21 = За2, а24 = 2аг°, а., = — 2а/г° Характеристическое уравнение (5.5) системы (5.12) 1 Д(Х) = — х За» О О 0 0 О 2аг0 — X 1 2а '•о — X О — X | = 0
42 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. 2 имеет корни Xj = Х2 = О, Х3 = to и Х4 =» —to. В данном случае кратного корпя Xj ■ Х2 структура решений z^ ■ (t) определяется свойствами миноров определителя Д (X) при X = Xj ([25*], стр. 61). У нас минор третьего по¬ рядка, полученный из определителя А (XJ вычеркиванием 4-й строки и 3-го столбца, отличен от нуля. Согласно ■ общей теории это означает, что система (5.12) имеет решение вида z® = pWt + р<Х), Z^2) (t) — р®, z(3) (z) = p<3)eiaf, где p(ll\ p®, p®, p® и p® — постоянные векторы. Следовательно, всякое решение z (t) (5.1* 2) есть линейная комбинация величин вида p®t + р(2\ p3)cos at и p4>sin at. Проделав необходимые вычисления, получим фундаментальную матрицу системы (5.12): 4 — 3 cos at За sin at **] = 6а 6 t + — sin at го ~ Г 6а 6а Г —— cosaZ Го Го 1 — sinaZ О cos at О -07“ (1 “ cos at) 1 2 sinaZ О го 2го . —— (1 — cos at) 2rosin at 4 — 3z -k — sin at 1 a — 3 + 4 cos at Таким образом, движение x (t) = x (z, to, x°) системы (5.11) определяется векторным равенством ®(Z) 4 — 3 cos a (t — t0) 1 — sin a (Z — Zo) 0 2r0 — cos a (Z — Zo]] z2(Z) 3a sin a (Z — Zo) cos a (Z — Zo) 0 2ro sin a (Z — Zo) 6a 2 is(t) = — 77 ■1 - *o) + -t^1- 1 — 3 (Z — Zo) -p- 6 4 + — sina(Z— Zo)- - cos a (z — Zo)] + — sin a (Z — Zo) 6a . 2 x4(Z) + — — sin a (Z — Zo) 0 — 3 + 6a + 4 cos a (Z — Zo) + cosa(Z — to)
§ В] ОБОБЩЕННЫЕ уравнения движения 43 4 — 3 cos a (J — т) 1 v — sin a (i — т) а 4 7 За sin а ( ( — т) cos а ( — т) 6а 2 ——■—т) 4— аг0 6 ( ч 4- —— sin а (t — т) — cos а (t — т)] 6а , 2 — т) “ 7“ + sm а (t го 6а . 4- — cos а (f — т) Г О 1 X о о О 2го sin а (t — т) О 1 — 3(г — Т) + 4 4- — sina (£ — т) Tf- — cos а (£ — т)] О — 3 + 4-- 4 cos а (/ — т) О X § 6. Обобщенные уравнения движения В предыдущих параграфах мы рассматривали системы, где в качестве возможных управлений выбирались кусочно-непрерыв¬ ные вектор-функции и (t) = {uj (t)}. Однако иногда оказывается целесообразным рассматривать управления более общей природы. Именно, оказывается целесообразным дать такое определение возможных управлений, которое позволяло бы также рассматри¬ вать управляющие воздействия в виде мгновенных импульсов. Рассмотрим одно такое обобщение для линейных систем. Пусть сначала, как и в § 5, система описывается векторным дифференциальным уравнением (5.1), где и (t) и w (t) — кусочно¬ непрерывные вектор-функции. Обозначая ^П,т]5 (?) = Я£,т] = {hi} U, т]} (i = 1,..., п; j = 1,..., г), (6-1) запишем векторное равенство (5.6) в координатах: n t г xi (0 = 2 хЧ (*» М —( [2 ha [* Т1 Uj (T)j dx + 5=1 to 3=1 t п + $ [S хи G т) (У Id? а (6.2) i. ;=1
44 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. 2 Введем ' функции Uj (т) и Wk (т), определенные соотноше¬ ниями т Uj (т) = Uj (О) dx'f (7 = 1, . . г), (6.3) t» (г) = 5 (O)dO (/г — 1> . . ., п). ■ (6.4) с Тогда равенства (6.2) принимают вид п г i X (О = 2 хи (С Q X + 2 $ hu R t] dUj (r) + j=l 7 = 1. to n t + 2$®ik(<. •*)(<■ = (6-5) k=l О Предположим теперь, что движения Xt (t) управляемой си¬ стемы описаны сразу при помощи равенств (6.5), а не в форме диф¬ ференциального уравнения (5.1). В таких случаях будем говорить, что дана система, описываемая уравнениями (6.5), или — в век¬ торной форме — уравнением х (t) = X [t, t0] x° + Н И, т] dU (т) + j t + X [£, т] (т) (6.6) tl и управляемая вектором dU (£). Но равенства (6.5) и (6.6) имеют смысл и в том случае, когда вектор-функции U (t) = {Uj (t)}, РИ (t) = {Wk (t)} суть функции более общей природы, чем опре¬ деленные выше величины (6.3), (6.4). Для этого следует лишь ус¬ ловиться понимать интегралы в правой части (6.5) в смысле ин¬ тегралов Стилтьеса. Теория интеграла Стилтьеса излагается подробно в курсах анализа ([23*], т. 3, стр. 89—122) и в курсах по теории функций действительного переменного. Сжатое, но вполне достаточное для нашей цели изложение теории интеграла Стилтьеса читатель может найти в книге [5*] (стр. 157). Для удобства чтения приведем здесь определение и отметим совсем кратко основные особенности этого интеграла. Интеграл Стилтьеса J h (t) dU (О (6-7)
ОБОБЩЕННЫЕ УРАВНЕНИЯ ДВИЖЕНИЯ 45 § ('J от скалярной функции h (t) по скалярной функции U(«) на от¬ резке t0 О t < 1» определяется как предел для интегральной суммы т_1 sm= 2 7=0 (7о d 11 <1 • • • d 7*/ ( 7^1+1 < 1»™ = 1“’ t ( О] ( 1;+1) при условии, что число т делений отрезка Ио, • 1 неограниченно возрастает и длина отрезков [tj, Zj-nl равномерно стремится к ну¬ лю. Предел интегральной суммы Sm, а следовательно, и интеграл Стилтьеса существует во всяком случае, если функция h (t) не¬ прерывна на отрезке [Zo, £,], а .функция U (/) имеет на этом отрезке ограниченное изменение ([23*], т. 3, стр. 74). Последний термин означает, что составленная для функции U (t) величина полного изменения ее на отрезке Ио, 1<J т—1 var [u] = sup [2 | U (И,,) - U (h) |], (6.8) i=0 где верхняя грань вычисляется по всем возможным m > 1 и ti из [/о, £], является конечной. Здесь 1 / — произвольные точки деления отрезка Ио, 1Ш1. Интеграл Стилтьеса ’ имеет много общих черт с обычным опре¬ деленным интегралом Римана. В частности, если функция U (t) имеет непрерывную производную U (t) — и (t), то интеграл Стилтьеса (6.7) превращается в интеграл Римана h(t) и (t)dt. to Следовательно, в этом случае символ dU (t) в (6.7) можно трактовать как обычный дифференциал. Отметим также, что спра¬ ведливо следующее важное неравенство: 15 h(t)ddJ((t|<sup| 1(t| • vaa[ U [())]*. (6.9) to В качестве примера рассмотрим еще тот случай, когда h (t) = у и U (t) = 0 при t0 d t d <t, U (t) = 1 при ft < t d tv- Тогда путем непосредственного вычисления интегральной суммы получим: § ( § h {x)dU (т) = 0 при t [ °, 1 h (т) dU (т) — у при t ^>■0. (1 t.
46 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. 2 Рассмотрим также несколько более общий случай, когда функ¬ ция h (Z) непрерывна на [£0, £ш], а функция U(t) непрерывна и дифференцируема всюду, кроме точки t = •, где она имеет раз¬ рыв, но при этом непрерывна слева. Вычисляя предел интеграль¬ ной суммы 5т., нетрудно проверить равенства t t h (т) dU (т) = § h (т) U (т) dx при t й> t. 0о t h (т) dU (т) = h (й) [17 (0 + 0) — U (й)] + to t + h (r) U (r) dx при t ft. to (6.10) Вернемся к равенствам (6.5). Поскольку функции hij [t, т] непрерывны, правые части этих равенств имеют смысл при любых функциях Uj (т) и Wk (т), имеющих на рассматриваемом отрезке [t0, • ] ограниченное из¬ менение var [Су], var [WFAJ. Поэтому можно принять, что и в таком более общем случае равенства (6.5) (или равенство (6.6)) задают движение x(t) системы, управляемой вектором dU (t) = = {dUj(t)} и подверженной возмущениям dW (t) = {dW!c (t)}. Можно проверить, что вектор х (t) благодаря свойствам фунда¬ ментальной матрицы XZ, £0] и свойствам интеграла Стилтьеса и тогда удовлетворяет условиям, определяющим фазовый век¬ тор х (£) (см. определение 2.1). Заметим еще, что правые части в векторном равенстве (6.6) следует трактовать как интегралы Стилтьеса от матричных функций Н и X по векторным функциям U (t) и W (t). При этом под интегралом Стилтьеса t(D \Н (0 dU (i) = д (Н = {Иц}, г = 1, . . • , n; 7 = 1, . . , , г) to будем понимать вектор д с компонентами со ? = 2 \ hi}{t)dU}{t) (i = 1,..., п). з=1 <*, Для того чтобы подчеркнуть, что для рассматриваемой линей¬ ной системы можно допускать управления dUj (t) (и возмущения dWk (t)), порождаемые функциями с ограниченным изменением, и избежать при этом громоздкой записи (6.5), будем в соответ¬
ОБОБЩЕННЫЕ УРАВНЕНИЯ ДВИЖЕНИЯ 47 § 61 ствующих случаях описывать систему не уравнением (5.1), а уравнением dx = A (t) xdt + В (t)dU + dW. (6.11) При этом запись (6.11) является лишь символическим указа¬ нием на то, что движение системы описывается равенствами (6.5), составленными по матрицам А и В в соответствии с формулой Коши, и в этих равенствах Uj (t), Wk (t) суть функции с ограничен¬ ным изменением. В таких случаях будем говорить, , что возможны обобщенные управления dU (t) и возмущения dW (t). Обсудим характер движений управляемых систем, описывае¬ мых уравнениями в форме (6.11). Сделаем это на примере уравне¬ ния dx = A (t) x-dt + b (/) dU (О, (6.12) где U (t) — скалярная функция и, следовательно, b (t) — n-мерный вектор. Рассмотрим управление частного вида. Пусть функция U (t) непрерывна при t0 t — ft и при й < t t^, и, кроме того, при¬ мем, что внутри указанных интервалов она непрерывно дифферен¬ цируема. При t = й примем U (й + 0) — U (й) = 1. Тогда для t G= [к0, Ф) или для t ЕЕ (й, О>1 имеем: п хг (t + Д° — xi(° — 2 [ху (£ 4- ДО О) — xv (0 Ml Xj 4- 3=1 t+At + — h(i) к 4- Д0 *1 dU (т) 4- t ■ t + J {/№ H + k^ t] — № [J r]}dU (?) t, (6.13) (л<‘> в, т] - 2 m() ObrCO» 1 =1 • • •> n; - Д>°)- j=i Разделив равенство (6.13) на kt и переходя к пределу при kt ->0, получим с учетом свойств фундаментальных матриц, как и выше на стр. 39, равенство ■77 = A (t)x + b(t)u, где u(t) = U (t). Таким образом, на интервале дифференцируемости U (т) движе¬ ние х (t) описывается снова дифференциальным уравнением (5.1).
48 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. Пусть, однако, t = О. Тогда, исходя опять из равенства (6.13) и опираясь на свойство (6.10) интеграла Стилтьеса, получим: xt (О + 0) - xt (fl) = bt (fl). Следовательно, при прохождении через точку t = А движущая¬ ся точка х (t) совершает скачок, причем величины xt (t) претер¬ певают разрывы Axt = bt (fl). . Аналогичное рассуждение можно привести и для г-мерного векторного управления dU (t) и для возмущения dW (t). В соответствии со сказанным движение х (t), задаваемое ра¬ венствами (6.5), оказывается разрывным, если функции Uj(t) и Wk (t) терпят разрывы в каких-либо точках t = О. Механичес¬ кое истолкование этого обстоятельства будет дано в следующем параграфе при рассмотрении понятия импульсной переходной функции линейной системы. Сейчас условимся лишь о следую¬ щем. Если не сделано никаких оговорок, то функции U}(t), Wk (t) предполагаются кусочно-непрерывными и кусочно-диф¬ ференцируемыми на отрезке t0 t ta, а в точках разрыва, ес¬ ли они есть, эти функции предполагаются непрерывными слева. Тогда движение х (t) (6.6) оказывается также непрерывным слева. § 7. Импульсная переходная функция объекта Введем важное для теории линейных управляемых систем по¬ нятие импульсной переходной функции. Пусть управляемый объект описывается векторным диффе¬ ренциальным уравнением X = A (t)x + b (t) ц, (7.1) где, как обычно, х — n-мерный вектор, А(£) — непрерывная матрица размерности п х п, ц — скалярная переменная, b (t) — непрерывный n-мерный вектор. Обозначим символом тр (t) функ¬ цию, определенную равенствами Пе (() = 0 при t<O и ( > е, т]е (t) = 1/е при е, (7-2) где е — некоторое положительное число (рис. 7.1). Рассмотрим уравнение (7.1) при ц = це (£ •— О) (А ( 0). Это равносильно предположению, что воздействие ц оказывает влия¬ ние на объект лишь в течение времени О ( t <С А + е. При этом независимо от А и 8 импульс р этого воздействия равен единице: а-Н Р [Пе] = 5 Пе (< — —Z = 1. а
§ 7] ИМПУЛЬСНАЯ ПЕРЕХОДНАЯ ФУНКЦИЯ ОБЪЕКТА 49 Предположим также, что до момента времени t = fl система (7.1) находилась в состоянии равновесия х = 0, и обозначим дви¬ жение х (£), порожденное воздействием^^ ='т]е (* — А), символом Х^ (t, fl). Согласно формуле Коши (5.6) имеем: Х(е) (ф f|) = О При t < fl, t Х^ (t, fl) = У > X [£, т] Ъ (т) dx при А > > <С А + е, а ^Ч-Е #(*0 (^ А) = А > X [/j т] Ь (т) dx при t > А + е. а (7.3) Потребуем теперь, чтобы е стремилось к нулю. Тогда вектор-функ¬ ция Хе> (t, fl) (7.3) при каждом t будет сходиться к некоторой век- тор-функции h[t, fl], причем h[t, А] = 0 при *<А, 1 Л П, А] = X [/, А] b (А) при t > А. ) Компоненты 1 ' > [Z, А] функции h [f, А] имеют, следовательно, вид (рис. 7.2) /г(г) [t, А] = 0 при t j А, /г|!) [Z, А] = 2 Хц >>> A) bj (А) при t > 7=1 где хи (t, ft) _ элементы фундаментальной матрицы X [Z, А] однородной системы z = Az, соответствующей системе (7.1). С другой стороны, согласно равенству (5.4) вектор-функция " 1 >> А] описывает движение объекта (5.2), который до момента
50 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ [Гл. 2 to = tt находился в состоянии равновесия z = 0, а в момент t0 =»= 0+ 0 сразу оказался в состоянии z (t0). = b (t0) = b (0) и даль¬ ше начал двигаться в соответствии с однородным уравнением (5.2). Вызвать такое движение х (t) = h [2, О] у системы (7.1) с помощью воздействия ц (t) из класса возможных управле¬ ний и (t) нельзя. Однако такое движение можно определить мате¬ матически строго, если воспользоваться понятием возможного обобщенного управления, введенным в § 6 для системы (6.11). Дей¬ ствительно, выберем обобщенное управление dU = dU [2 — О], порожденное функцией U k — ft] вида U\t — 0] = 0 при 2< 0, | (7 5) U {t — ft] = 1 при t ■ ft. J Тогда по известным свойствам интеграла Стилтьеса ([23*], т. 3, стр. 90—91), упомянутым в § 6, имеем: t х (t) = X {t, x]b (т) dU [т — ft] — 0 при t tt, ъ t x(t) = X [2, т] b(x)dU [т ■— ft] = X {2, ft] b (ft) при 2^>0. to Осуществить практически движение х (t) = h k, ft], очевид¬ но, невозможно, так как для этого надо было бы при t = ft мгно¬ венно перебросить объект из состояния х = 0 в состояние х = = b (0). Но реальные объекты обладают инерцией, исключаю¬ щей такой эффект. Однако выше мы видели, что функция h [2, ft] является пределом для движений ж<Е) (t, ft) при е ->0. Следо¬ вательно, данное обобщенное управление dU {2 — ft] можно рассматривать как математическую абстракцию для реальных воздействий вида т]е (t — ft), когда время работы воздействия ц пренебрежимо мало, но импульс этого воздействия р [т]е] являет¬ ся конечной величиной, равной единице. Такое обобщенное воз¬ действие dU U — ft] принято называть б-функцией и обозначать через dU [2 — ft] = 6 (t — ft) dt. В соответствии с этим обобщен¬ ное управление dU k — ft] (7.5), порождающее движение х (t) = = h [2, ft] (7.4) объекта (6.11), будем называть импульсным 6- воздействием и обозначать его символом dU = S (t — ft) dt. Введенное выше определение S-воздействия 6 (t — ft) dt бу¬ дем использовать для всех значений ta ■ ft ■ fy, где 2Я и t$ оз¬ начают границы промежутка времени, на котором изучается дви¬ жение управляемого объекта. При ft = t$ иногда будем определять б-воздействие несколько иначе. Примем, что 6-воздействие при
7] ИМПУЛЬСНАЯ ПЕРЕХОДНАЯ ФУНКЦИЯ ОБЪЕКТА 51 $ = — порождается функцией U [Z, ft] вида I U К, ft] = 0 при t< ft, U R, О] = 1 при t > О, и будем обозначать его черев dU~ = 6“ (t — t?) dt. Следовательно, в этом случае функция U [t — fy] предполагается в точке t = = tp непрерывной справа. В соответствии с этим и движение х ф = h [£, й] при й = 7р оказывается непрерывным по t спра¬ ва. Это движение х (t) можно рассматривать как предел движений я;<~Е)П, й], порожденных воздействиями ц(_Е) [£ — й] вида П(-е) [<, й] = у яри ft — е<7<йг Ц(_Е) [7, й] = 0 при £<й — е— 7>й. Построенную выше вектор-функцию h И, й] (7.4), описываю¬ щую движение х (t) системы (6.11) при 6-воздействии 6 (t — й) dt, называют импульсной переходной функцией объекта (7.1) (по воз¬ действию ц). В тех случаях, когда надо подчеркнуть, что речь идет о переходной функции по какому-то определенному воздействию, будем снабжать величину h [/, й] соответствующим индексом. Так, например, переходную функцию по воздействию Uj (t) бу¬ дем обозначать символом h К, й]р Тогда движение х (£) системы (5.1) согласно формуле Коши (5.6) и равенству (7.4) можно запи¬ сать в виде t г t x(t) = X [Z 70] X0 + 5 h I*' ТЬ ui (t)| X lb T1 w (r) dt. h J=1 ' to (7-6) Введем еще одно понятие. О^]ределение 7.1. Матрицу Н И, й], столбцами кото¬ рой являются векторы h [£, й]- (/ = 1,..., г), будем называть им¬ пульсной переходной матрицей системы (5.1) по воздействию и. В соответствии с этим формулу Коши (7.6) можно записать еще в виде t х (Ь to, аз0) = x [С 7°] + \{И [7, т] и (т) + x ф т] w (г)} dx. (7.7) to Заметим кстати, что матрицу X И, т] можно также рассматривать как импульсную переходную матрицу по воздействию w. Отметим, наконец, что матрицы Н К, т] и X [£, т] иногда называют функция¬ ми Грина системы (5.1). В дальнейшем будем предполагать, что для рассматриваемых систем известны все необходимые импульсные переходные функции.
52 СВОЙСТВА ЛИНЕЙНЫХ СИСТЕМ 1,Гл. 2 Эти функции можно вычислять, исходя из их выражений (7.4), через фундаментальную матрицу системы. Функции h[t, т]?- могут определяться и экспериментально по наблюдению движе¬ ния х (t) при кратковременном, но интенсивном воздействии цЕ (t — #) на объект или на его модель. При этом имеется в виду, что в соответствии с определением переходной функции h [t, ^In движение х (t) описывается приближенно функцией цЛ [£, '0'] когда на объект в момент времени t = $ подается кратковременное воздействие . . ■ (t — & с импульсом оо р[п(и)1= J 1l(i-'-(Z — О) di = ц. —ОО Следует еще всегда помнить, что Н [£, т] = О при ■ . т по смыслу этой матрицы. Поэтому во всех выражениях для Н U, т], которые встретятся ниже, надлежит полагать t > т, хотя это и не будет оговариваться. Впрочем, в соответствии с материалом на стр. 50, где было введено 6-управление, иногда удобно, однако, делать исключение, из сказанного, полагая при т = t = что Я'Е/р, Zg] = В (tp) == 0. Пример 7.1. В примере 5.1 воздействие и является скалярной величиной. Поэтому матрица Н [£, т] сводится здесь к вектору h [£, т]. Этот ' вектор имеет вид h[t, x] = г 1 АП (О sin о (t — т) 1 — cos .со (t — т) (»>*). что следует сразу из равенств (5.10) и (7.4). В заключение дадим механическое истолкование величины var [С(т))г^, введенной в предыдущем параграфе. Пусть сначала U (т) — непрерывно-дифференцируемая функция и U (т) = и (т). Тогда известно ([23*], т. 3, стр. 78), что *3 var[7(T)]3 = ^|u(T)|dr. (7.8) t« Если и (t) — сила, действующая на систему, то величину (7.8) следует истолковать как полный импульс этой силы за время [£а, ^]. Пусть теперь U (т) является кусочно-дифференцируемой функцией
§ 71 ИМПУЛЬСНАЯ ПЕРЕХОДНАЯ ФУНКЦИЯ ОБЪЕКТА 53 с конечным числом скачков U (т4+0) - U (tJ = у, в точках ти-.., хк. Тогда, полагая dU (т) — и (x)dx — u(1) (т) dx-\ u№(i) dx, к где z'' (т) — непрерыгная функция, а н<2) (т) =2 у1#(т — т»), имеем (см. § 6 и [23*], т. 3): к ■ var [t/]',' = $ | uW (х) | dx + 2 IT I- (7-9) “ ta »=1 Величину, стоящую в правой части этого равенства, тоже ра¬ зумно истолковать как полный импульс силы, действующей на систему. В соответствии с этим условимся величину var[t7]# и в общем случае трактовать как полный импульс управляющего воздействия, работавшего в течение времени [£а, #].
Глава 3 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ § 8. Эвристические соображения Пусть состояние управляемого объекта описывается некоторым n-мерным фазовым вектором х (t). Управляющее воздействие и (t) для простоты будем считать в этой главе скалярной ' функцией. В соответствии с формулировкой задачи 4.1 будем предполагать, что даны уравнения движения объекта х = A (t)x + b (t)u 4-ш (/), (8-1) отрезок времени ta ) t tp, начальное х* и конечное х& состоя¬ ния объекта. Требуется найти возможное управление и (t), пе¬ реводящее объект из состояния х (ta) = ха в состояние х (tp) = = х&. Предположим также, что известны импульсные переходные функции объекта (см. стр. 48) H[t, = ~hw [i, fl] ‘ _/г(п) [£, О]. XR, 0], (8-2) где символы t< * t обозначают, следовательно, в данном случае компоненты вектора Н R, О]. Воспользуемся формулой Коши (7.7). Полагая = ta, t = = tp, x )) = x“, x (tp) = x&, получим векторное уравнение относительно искомой функции и (t) Н [ t, , т] и (т) dr = с, (8.3) «а где известный вектор с определен равенством ч с = х$ — X [ [ * , £а] х» — $ X [<з, т] w (т) dx. (8.4)
§ 8] ЭВРИСТИЧЕСКИЕ СООБРАЖЕНИЯ 55 Запишем уравнение (8.3) в координатах: *8 ' hw т] и (т) dx — Сц, (8.5) й(п)[/ т] и (т) dx = сп. Для определения неизвестной функции и(х), т. е. для отыскания бес¬ конечного (числа неизвестных значений и (т), соответствующих все¬ возможным значениям т из отрезка ta ( т ip, мы имеем лишь п уравнений. Поэтому естественно предполсжгть, что уравнения (8.5), вообще говоря, не определяют функцию и (т) единственным образом. В то же время выполнение равенств (8.5) является необ¬ ходимым и достаточным условием для того, чтобы управление и (t) удовлетворяло требованиям задачи 4.1. Следовательно, можно ожидать, что в общем случае задача 4.1 имеет не единственное ре¬ шение. В этом параграфе приводятся эвристические соображения, ука¬ зывающие путь для определения одного из решений и (t) урав¬ нений (8.5). С этой целью сопоставим уравнениям (8.5) уравнения, аналогичные им в известном смысле, но составленные не для ис¬ комой функции и (т) (ta '< х ( £р), а для некоторого неизвестного нп-мерного вектора v = vm}. Для получения этих уравне¬ ний разобьем отрезок [ia, ip] на т частей точками /а = то < ... < < Xj ( Tj+i <Z ... < Хт — ip- Составим векторы gW = = {4/ • • •, gil’l, • • •• g(n) = <gn), • • ., g£>}, где [ip, x}] Ar3- (( = 1, . . ., m\ г = 1, .., re), At; = T— T-i. Интегралы *0 m $ /(г) [П>- t] u (r) dx заменим суммами 2 £/)у., гд^ следователь- *а i=i но, величины Vj заменяют значении u(xj). Поскольку при боль¬ ших т интегралы Ч Л(1)Пз, т] и (т) dx td приближенно представляются суммами т т 2 Л<г) Пр. Т;1 ДЧК (Т;) = 3 7=1 3=1 можно предполагать, что свойства составленных нами вспомога¬ тельных уравнений будут иметь много общего со свойствами
56 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 3 исходных уравнений (8.5). Поэтому изучение вспомогательных уравнений должно подсказать путь для решения уравнений (8.5) и для исследования полученных решений. Итак, . рассмотрим вспомогательные уравнения т т 3 4ПЧ = Сп- м 7=1 3=1 В дальнейшем для наглядности примем, что п = 2-. Тогда урав¬ нения (8.6) запишутся так: ^1 + . . . 4- ggVm. = Cl, | 42)у1 + ■ ■ ■ + g%vm = с2. J (8'7) Если m-мерные векторы gW и gT линейно зависимы, т. е. если существуют числа . и Z2, для которых ZjgW + Z2g(2> = = 0 при Zi + Z2 =/= 0, то можно подобрать ([3*], стр. 50—52) такие числа Сг и С2, что уравнения (8.7) будут неразрешимы (надо лишь для этой цели взять такими, чтобы /с1 + ^с2 4= 0). Поэтому будем предполагать, что векторы gg линейно независи¬ мы и, следовательно, в частности, ни один из этих векторов не равен нулю. Равенства (8.7) допускают полезную геометрическую интер¬ претацию. Левые части равенств (8.7) имеют смысл скалярных произведений векторов gW на вектор у, т. е. уравнения (8.6) мож¬ но записать так: g()' v = с (j = 1,2). (8.8) Величины а. = (g(')'f)/ || g(’) ||, гце И g(») || — модуль вектора gW, являются проекциями искомого вектора v на направления извест¬ ных векторов gg. Следовательно, уравнения (8.8) можно записать в виде Прй(о v -= at (i -= 1,2). Таким образом, задача состоит в следующем: требуется найти вектор у, проекции которого на заданные векторы gW и ga) должны быть равны заданным числам аг и а2 (см. рис. 8.1, где для нагляд¬ ности выбрано т = 3, т. е. векторы gW и g(2) предполагаются обычными трехмерными векторами). Очевидно, указанным условиям удовлетворяет любой вектор и, конец которого лежит на прямой I — I, являющейся пересе¬ чением плоскостей л1 и л2, перпендикулярных к векторам gW и gW и проходящих через точки Qj и Qj- Никакие другие векто¬ ры условиям задачи не удовлетворяют. Среди векторов р, удо¬ влетворяющих условиям задачи, можно выделит!, вектор и0, ле¬ жащий в плоскости векторов gg и gW. Этот вектор р° является
ЭВРИСТИЧЕСКИЕ СООБРАЖЕНИЯ 57 § SJ линейной комбинацией векторов gV и gl, т. е. . (8.9) Для вычисления чисел Z, и Z- подставим, выражение (8.9) для в уравнение (8.8). Получим систему двух линейных уравнений для двух неизвестных g g и Z-: <#11^1 "I ^12^2 = С1’ ^г!7! 4“ С2> где (Xij = gO'gj Определитель этой системы не равен нулю, если векторы ' g1 1 1 и g 12 1 линейно независимы (что мы и предположили выше), ибо &11Л12 = ОСцЛс2 <С12^21 — Л21<&22 = II II2 • II g(2) II2 - II Sw ||2 • Il g2 ||2 cos2 = II ||® . || g(2) II2 sin2 if, где 4» — угол между векторами g1) и д2>. Разрешая полученную систему уравнений, определим иско¬ мый вектор zA Эти рассуждения, относящиеся к определению вектора у0, очевидно, справедливы не только в рассмотренном нагляд¬ ном случае п = 2, т = 3, но и при любых п и т > п. Из рис. 8.1 следует, что вектор у° обладает одним замечательным свойством. Именно, каков бы ни был другой вектор у, удовлетво¬ ряющий условиям задачи, спра¬ ведливо неравенство (8.10) В самом деле, согласно рис. 8.1 имеем v = v°4- р. Но вектор р ор¬ тогонален к вектору р°. Следова¬ тельно, в прямоугольном треуголь¬ нике, составленном векторами р°, у, р, вектор v является гипотенузой, откуда и следует справед¬ ливость нерав енства (8.10). Итак, мы получили достаточно наглядное представление о свой¬ ствах решений вспомогательной задачи. Рассмотренная геометри¬ ческая интерпретация подсказывает нам определенные предполо¬ жения о свойствах решений и (t) исходной проблемы. Эти свой¬ ства мы выведем в следующем параграфе.
58 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОВ УПРАВЛЕНИИ [Гл. 3 § 9. Решение задачи Воспользуемся здесь понятиями, которые для функций, за¬ данных на отрезке Z« 1 т 1 t&, соответствуют скалярному про¬ изведению, модулю и свойству ортогональности конечномерных т векторов. Скалярному произведению двух векторов а-b = 2 al • Г==1 сопоставляется скалярное произведение (а, Р) двух функций а (т) и р (т) (Za 1 т 1 Zp), определяемое равенством (а, 0) = , а (т) 0 (т) dx. Величина 4з 1Д р [а] = [ а2 (т) dr] \ соответствующая понятию модуля m-мерного вектора а, назы¬ вается нормой) функции о(т). Две функции а(т) и р (т) Zp) называются ортогональными, если их скалярное произве¬ дение (а, р) равно нулю, т. е. если выполняется равенство *з ос (т) р (т) dx = 0. Не определяя здесь наиболее широкий класс функций а(т), Р (т), для которых целесообразно рассмотрение указанных понятий, ограничимся в этой главе кусочно-непрерывными функциями. Обсуждение вспомогательной задачи, приведенное в § 8, под¬ сказывает следующую гипотезу о решениях задачи 4.1. Гипотеза. Пусть функции hl'tli, т],..., •• [Zp, т] (8.2) линейно независимы, т. е. h (г) = • о [zp> т] Z + ■ • • 4" [ZP( Г]11пф 0 (9.1) при ta , х 1 Zp, /?+... + in =/= 0. Тогда задача 4.1 имеет реше¬ ние и (Z). Решение задачи 4.1 не является единственным. Среди решений и (Z) можно выбрать управление и° (Z), являющееся линей¬ ной комбинацией функций hh,, т. е. и° (Z) = Л(1) [ip, i] 1 + . . . + tin) [Zp, Л in (9.2) Управление u° (Z) имеет наименьшую евклидову норму р [u° (Z)] т) Чтобы отличать величину р[а] от других видов нормы, которые встре¬ тятся ниже, будем называть ее иногда евклидовой (обобщенной) нормой.
§ 9] РЕШЕНИЕ ЗАДАЧИ 59 среди всех решений u(t) задачи 4.1. Если и (t) — любое решение задачи, то разность > (i) = и (1) — u° (t) ортогональна к управлению u° (t). Числа l/,..., 1°п, определяющие решение u° (Z), удовлетворяют системе линейных уравнений. Проверим справедливость этой гипотезы. Будем искать упра¬ вление > (t) в форме (9.2). Подставив выражение (9.2) вместо и (т) в уравнения (8.5) и выполнив интегрирование, получим систему „ ,о ,о уравнений для определения величин Zj,..., п #1171 + - • • + ttlnln — Cl> “Ь • • • 4“ ®nn^n — Сп, (9.3) где коэффициенты >j определены равенствами — \ hM [Zg, т] • h(3} [ip, т] dx (г, / = 1, . . ., re). (9.4) Покажем, что определитель Д {а,,} системы (9.3) не равен нулю. Действительно, из (9.1) следует неравенство *8 (|3 \ /г2 (t) dx — \ {hw [iP, т] Zj. + -.. + Л(п) [ U > т] Z„}2 dx — = 3 при 2 1i=X=a. i, 3=1 i =1 Следовательно, при наших предположениях квадратичная форма Ф (Zli • • .> Zn) = 2 ai}hh i, 3—1 от переменных l является определенно положительной, т. е. она может принимать лишь положительные значения, когда I* -f- ... ...-|- Z„ =£= 0. Известно, однако, что коэффициенты и г > определен¬ но положительной формы удовлетворяют неравенствам Сильве¬ стра ([3*], стр. 248) # . . . а1п аи U> о, <#п#12 а815*22 = Д{ау} >0. Лцд ... апп
60 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 3 что и доказывает наше утверждение об определителе А системы (9.3). Итак, систему (9.3) можно разрешить, каковы бы ни были числа Ci (i = п). Этим самым устанавливается существова¬ ние управления u° (t) в виде (9.2) и определяется его величина. Покажем теперь, что разность гр (t) = и (t) — u° (t), между лю¬ бым решением и (Z) задачи 4.1 и найденным управлением u° (t) ортогональна к функции uQ (Z). Уравнения (8.5) удовлетворяются при и = и (t) и при и = u° (t). Поэтому справедливы равенства *з *3 /[(') [Zp, т] [и (т) — и0 (т)] dr = hw [Zp, т] ф (т) dr = 0. (9.5) Умножая равенства (9.5) соответственно на Z", складывая полученные соотношения и учитывая равенство (9.2), получим: «з н0 (т) zf (т) dr = 0, (9.6) *Х что и доказывает ортогональность функций и° (t) иф (Z). Нетрудно видеть, что и, наоборот, всякая функция и (t) — = u° (t) --г) (Z), где u° (t) — управление (9.2), а ц (Z) — произ¬ вольная функция, ортогональная к будет управлением, разрешающим задачу 4.1. Для того, чтобы убедиться в этом, до¬ статочно провести предыдущие рассуждения в обратном порядке. Так как всегда можно построить бесчисленное множество функ¬ ций 1] (Z), ортогональных к заключаем, что решение задачи 4.1 не является единственным. Теперь для полного подтверждения гипотезы осталось дока¬ зать минимальность нормы || ий || Докажем это. Пусть и (Z) ф u°(t), тогда <з J ф2(т)<7т>0. (9.7) Учитывая, что u(t) = (t) Ц-ф (Z0, имеем: (з «з и II’ = [« («)]’ dr = [и0 (т) + ф (т) ]2 dr = *3 *3 *0 [и°(г)]Мт+ j ['Z>Ct)]®dt + ’ J U0(T^rr)dT. (9-8)
§ 91 РЕШЕНИЕ ЗАДАЧИ 61 Последнее слагаемое в правой части равенства (9.8) вследствие (9.6) есть нуль, второе слагаемое вследствие (9.7) положительно. Следовательно, из (9.8) выводится неравенство Ml 2 >11 I2 ИЛИ II й II >11 и° ||. Таким образом, справедливость гипотезы полностью проверена. Следовательно, верна теорема. Т е о р е м а 9.1. Если импульсные переходные функции объекта feO) [Zp, t], - . ., Ы'1'1 [Zp, Z] линейно независимы, то задача 4.1 об управлении имеет бесчисленное множество решений. Среди решений этой задачи существует управление и° (Z), являющееся линейной комбинацией функций № Пр, Z] (Z = 1, . . ., п), т. е. управление вида (9.2), где постоянные l) определяются из алгебраической си¬ стемы линейных неоднородных уравнений. Среди всех возможных решений u(t) задачи (4.1) управление U (Z) имеет наименьшую евклидову норму || U ||. Функция ф (t) = и (t) — U (t) ортогональна к функции и° (Z). каково бы ни было другое управление и (t), решающее задачу 4.1. Приведем матричную запись управления и° (t) из теоремы 9.1. Пусть символ Q обозначает матрицу {ai7-} системы (9.3). Тогда си¬ стема уравнений (9.3) в матричной форме принимает вид Q-Z0 - с, где /о — вектор {Z?, . . ., /„}. Следовательно, /о = q-i.c. (9.9) Равенство (9.2) с учетом (9.9) можно записать в форме и0 (Z) = h' [Zp, Z] • Z0 = h' [Zp, Z] Q~r-c, где h [Zp, Z] — вектор {/i<1 [Zp, Z], . . ., Wn'> [ Zp, z]}. Наконец, заменяя вектор с его выражением (8.4), получим явный вид управления ип (Z) через краевые условия задачи: u° (Z) = h' [Zp, Z] — _1 {яЗ — X (Zp, Z«] x* — I) X [fy, t] w (r) d-rj . (9.10) Из равенства (9.10) следует, что найденное управление u° (Z) обладает также следующим важным свойством: управление и° (Z) зависит от краевых условий задачи х* и х& и от внешнего воздейст¬ вия w (Z) линейно.
62 предварительное решение задачи об управлении [Гл. 3 Выразим еще управление uQ (t) через одну только фундамен¬ тальную матрицу X 17, ф] однородной системы (5.2). Учитывая (7.4), окончательно будем иметь: u° (t) = V (t) • X' Пр, ■ ■ ( 1 X (2Э, ■ - ■ x* — X Пр, т] w (t) dt}. (9.11) §10. Вычислительная схема, моделирующая управление Опишем сначала еще одно интересное свойство управления u° (t). Прежде всего, напомним следующее равенство: X [t, 20] = X И, 21-X-1 и0, *а], которое получается из общего равенства (5.3) в частном случае Z (t) = X И, 2а]. Заменяя теперь t на tp, a to на t, получим: X[p, t] = X tp, М • Х_1П 2]. Учитывая последнее равенство, выводим из (9.11), что и° (t) = b' (t) [X- [t, 2П'А (10.1) где n-мерный постоянный вектор s° = {s1; . . ., sn} определен соот¬ ношением 'з s° = X' Пэ, 2а] Q-1 (х? — X [2р, ■ ■ х* — \ X Пр, т] w (т) dx}. (10.2) Далее, матрица S (t) = [X_1 И, 2а]]' удовлетворяет следующе¬ му матричному уравнению: 5 (0 = - A'S (t). (10.3) В самом деле, по определению матрицы X" 1[2,.21 шравелливо ра¬ венство X И, 2J.X-1 И, М = Е. Дифференцируя его по t и пользуясь известным ([3*1, стр. 372) правилом вычисления производной от произведения матриц, получим: X И, 21X-1 U, 21 + X И, 2IX-1 И, 2 1 = 0. (10.4)
§ iol СХЕМА, МОДЕЛИРУЮЩАЯ УПРАВЛЕНИЕ 63 Матрица X [t, • 1 удовлетворяет уравнению X U, • • • - A (t) X [Z, U по определению ее как фундаментальной матрицы. Подставляя X из последнего равенства в (10.4), найдем: АХ [t, М X-1 И, • 1 + X к, Z.1 X-1 U, М =• 0, т _ е. д _|_ X [£, М • X" [/, tal = 0, или, после умножения слева на А"1 [£, *<а 1 и транспонирования, получим: А' [X-1 к, М1' + [Х-] U, Ml ' = 0, что и доказывает (10.3). Умножив равенство (10.3) справа на вектор s°, получим теперь равенство s = - A's, s(Z) = S (t) s°. (10.5) Система, описываемая уравнением (10.5), называется сопря¬ женной к исходной системе X = Ах. Таким образом, управление u° (t) согласно (10.1) можно истолко¬ вать как скалярное произведение (0 = 6 (0 s (0 (10.6) вектора b'(t) на вектор s (t), являющийся решением уравнения (10.5). Заметим, что при t = t* справедливо равенство S(fa) = [X-i (^a)]'s0 = S° = = х M (>' — х [4(3, мХл— ^X [ip) tjw(t))fc|. (10.7) Итак, мы установили следующий результат. Теорема 10.1. Управление и° которое решает задачу 4.1 и имеет при этом наименьшую возможную норму р [иЯ], являет¬ ся скалярным произведением u° (t) = b' (0 s (0, где вектор s (t) — решение уравнения (10.5) при начальном условии (10.7). Свойство управления и° (0, отмеченное в теореме 10.1, указы¬ вает один из возможных, путей для построения вычислительной схемы, определяющей это управление. Схема в целом должна рабо¬ тать так, чтобы величина и° (t) вычислялась от момента ta до момен¬ та /ри подавалась по ходу времени на управляемшй объект. Сигна¬ лы, поступающие из вычислительной схемы, должны при этом
64 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 3 проходить через усилительное устройство, которое преобразовы¬ вало бы эти сигналы в соответствующие реальные управляющие силы. Вычислительную схему, определяющую u° (t), будем назы¬ вать системой управления. Опишем способ построения этой систе¬ мы, приняв для упрощения, что А — постоянная матрица. Как видно из равенства (10.6), для определения u° (t) как функ¬ ции времени необходимо знать векторную переменную $ (t). Для вычисления этой переменной следует сконструировать модель в виде такой$системы, фазовое состояние которой описывалось бы уравнением (10.5). Эта модель должна вычислять значения перемен¬ ного вектора s (t) от момента ta до момента t$. Работа модели долж¬ на происходить в истинном масштабе времени, т. е. в том масшта¬ бе, в котором работает исходная управляемая система под воздей¬ ствием управления u° (t). В качестве начального состояния в мо¬ мент ta для модели, вычисляющей s (t), следует принять величину s (t*) = s°, определяемую равенством (10.7). Для вычисления век¬ тора s° должно быть предусмотрено вычислительное устройство, причем . необходимое вычисление может быть произведено, если известна величина (10.8) (10.9) <3 z (ig) = X [ig, Za] хЛ + X [fg, т] w (т) dx. (Матрицу X'ltp, t a 1 Q-1 считаем вычисленной заранее.) Величи¬ ну z (£р) также можно вычислять на модели. Эта модель может быть системой, фазовое состояние которой описывается на отрезке вре¬ мени ta t т t tt уравнением Ъ = Az+w(x) с начальным условием z (ta) = хЛ. Однако оказывается желатель¬ ным произвести необходимые вычисления как можно быстрее (за время е (Zg — ta)) и так, чтобы их осуществление начиналось до начала управления, а кончалось в момент tx. Этого можно достичь, если в уравнении (10.9) выполнить замену времени t = ta — — e(Zp — т) и положить у (t) = z ^Zg -ф а . Тогда фазо¬ вое состояние системы, вырабатывающей величину у (t*) = z (£р), будет описываться уравнением е5т = Ау + v (Z), (10.10) где е — достаточно малое положительное число, р(/) = + —.
СХ НМЛ, МОДЕЛИРУЮЩАЯ УПРАВЛ1ЕН11Е 65 § lol Модель, описываемая уравнением (10.10), будет работать в 1/е раз быстрее, чем исходный объект (8.1). (Малость е обеспечивает бы¬ стродействие этой модели.) Задав теперь в момент t — ta — __ . (p — начальное состояние у (ta) — za и вводя по ходу времени от момента ta до момента Ц — ta сигнал v ()= w (($ , получим в момент t — Ц - - - 1а величину у (ta), определя¬ емую условием (10.8). Таким образом, система управления должна включать в себя модель I для определения у (ta), вычислительное устройство ВУ1 Рис. 10.1. для определения s (ta) = s°, модель II, вырабатывающую пере¬ менный во времени сигнал s (£), и вычислительное устройство ВУП, определяющее управляющий сигнал u° (£). Описанная вычисли¬ тельная схема приведена на рис. 10.1. Итак, работа модели I начинается в момент £а и происходит так же, как и работа объекта (9.1) при и — 0, но только в 1/е раз быстрее. Поэтому к моменту t — Za модель 1 вырабатывает вели¬ чину у (£а). В момент t- величины у (ta) и подаются в ВУ1, ко¬ торое подсчитывает величину s (Za) = s°. (Здесь мы предполагаем, что этот подсчет производится без задержки времени.) Величина 5 (£а) в тот же момент времени t - - - - поступает в модель II, где с этого момента начинает в истинном масштабе времени вырабаты¬ ваться вектор s (t). Значение переменной s (t), а также вектор- функции b (t) подаются на ВУП, так что с момента t — ta на выходе этого устройства начинает вырабатываться величина управляю¬ щего воздействия u° (t). Величина u° (t) при этом вырабатывается 3 Н. Н. Красовский
66 ПРЕДВАРИТЕЛЬНОЕ РЕШЕНИЕ ЗАДАЧИ ОВ УПРАВЛЕНИИ [Гл. 3 в форме сигналов такой физической природы, которая представля¬ ется удобной для конструирования моделей и вычислительных устройств. Обычно эти сигналы электрические. После преобразо¬ вания сигнала u° (t) в усилительном устройстве получается необ¬ ходимое воздействие уже в форме реально действующих сил. В слу¬ чае, если отдельные звенья описанной системы управления не могут срабатывать мгновенно, но выдают необходимые величины с за¬ паздыванием по времени, следует предусмотреть цепи упрежде¬ ния сигналов, которые по возможности компенсировали бы ука¬ занное запаздывание. Здесь, впрочем, необходимо отметить еще следующее неприятное обстоятельство. Если одна из рассматри¬ ваемых выше систем, входящих в систему управления, неустой¬ чива, т. е. если малые отклонения в начальных условиях приводят к большим отклонениям движений, то реализация описанной схемы наталкивается на серьезные практические трудности. Эти технические трудности должны преодолеваться дополнительной стабилизацией рассматриваемых движений (см. [17*]).
ЧАСТЬ ВТОРАЯ ТЕОРИЯ УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ОБЪЕКТАМИ §11, Введение Вторая часть книги посвящена подробному исследованию задач об управлении, сформулированных в § 4. В главе 4, открывающей данную часть монографии, движение управляемой системы интерпретируется как результат некоторой операции, выполняемой над объектом благодаря наложению на него управляющих сил. На этой основе конструируется расши¬ ренная математическая постановка задачи. Для понимания этой и следующих глав необходимо знакомство с простейшими понятия¬ ми из функционального анализа. Читателю, который не владеет этим материалом, рекомендуется перед изучением II части моно¬ графии прочитать Приложение в конце книги или обращаться к этому Приложению в процессе чтения основного текста. В послед¬ нем случае надлежит руководствоваться теми ссылками на необ¬ ходимый вспомогательный материал, которые делаются нами по ходу изложения всего основного материала. В следующей главе 5 показывается, что сформулированная нами задача является по сути своей так называемой проблемой моментов в пространстве функций. Отсюда извлекается решение исходной задачи об управлении и формулируется основное пра¬ вило минимакса, определяющее оптимальное управление. Читатель должен иметь в виду, что материал пятой главы яв¬ ляется в книге ключевым. В то же время этот материал составля¬ ет, по-видимому, наиболее трудную для чтения часть. Поэтому к нему следует отнестись с особым вниманием. Затруднения, кото¬ рые могут возникнуть здесь при первом чтении, не * должны осо¬ бенно смущать читателя, так как по мере разбора конкретных ситуаций в следующей главе оставшиеся неясности должны разъ¬ ясниться. Кроме того, читатель, не желающий углубляться в рас¬ суждения из глав 4 и 5, может ограничиться лишь ознакомлением с правилами решения 17.1—17.5 в § 17, рассматривая эти прави¬ ла как рецепты (см. замечание на стр. 115, с которого и следует тогда начать чтение этого параграфа, переходя затем прямо к ука¬ занным правилам). Глава 6 содержит приложение общего правила, данного в главе 5, к решению задач в конкретных случах основных типичных 3*
68 ТЕОРИЯ УПРАВЛЕНИЯ ЛИНЕЙНЫМИ ОБЪЕКТАМИ условий минимума интенсивности управления. Попутно определя¬ ются и изучаются важные для всей теории свойства полной управляе¬ мости и неособенности линейной системы. Здесь же, в § 22, об¬ суждается возможность распространения решений на некоторые задачи управления квазилинейными системами. Наконец, в за¬ ключение этой главы изучаются некоторые специфические черты, которые преобретает общая теория в частном случае управления движением голономной механической системы в окрестности ее рав¬ новесия. Последняя глава 7 данной части посвящена изучению задачи о предельном быстродействии. При этом сначала на основе теории, развитой в предыдущих главах, дается метод вычисления програм¬ много управления и (t), которое при заданном ограничении х [и] |1 осуществляет наискорейшее приведение объекта в за¬ данное состояние х (£р). Затем читатель знакомится со вторым ос¬ новным аспектом проблемы управления — с задачей о синтезе оптимального управления по принципу обратной связи. В рам¬ ках основной проблематики книги обсуждается связь между зада¬ чей о программном управлении и задачей о синтезе системы, ра¬ ботающей на основе обратной связи. Как и в других разделах мо¬ нографии, общая теория иллюстрируется на наглядных моделях. Некоторая особенность иллюстрирующих примеров, собранных в этой части, состоит, впрочем, в том, что здесь приведены и такие задачи, которые, несмотря на свою относительную простоту, по¬ требовали привлечения расчета на универсальных вычислитель¬ ных машинах. Благодаря этому оказалось возможным проиллю¬ стрировать на конкретном материале те вычислительные методы для решения задач об управлении, которые вытекают из общей теории, данной в этой части.
Глава 4 МАТЕМАТИЧЕСКАЯ ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ § 12. Движения управляемых систем и линейные операции Прежде чем переходить к задаче об оптимальном управлении, исследование которой составляет предмет этой II части книги, мы в настоящем параграфе дадим одну интерпретацию движения х (t) линейной управляемой системы. Именно, мы покажем, что движе¬ ние х (t) можно трактовать как результат некоторой операции, вы¬ полненной над объектом. Математически это выражается как операция ср^ порожденная функцией и (t) и выполненная над эле¬ ментами импульсной переходной матрицы Н [t, т]. Такая интер¬ претация сыграет важную роль в дальнейшем изложении и облег¬ чит исследование проблем. Поясним высказанную точку зрения на примерах. Рассмотрим задачу об управлении двигателем постоянного тока. Пусть в качестве управляющего воздействия и используется ток возбуждения. При весьма сильном упрощении уравнения движе¬ ния имеют вид [190] dxx dx*, /j п л \ ЧГ = *2, (12-1) Здесь ху — отклонение угла ф(£) поворота якоря от некото¬ рого фиксированного движения ф0(О), я = ф(^)—%(0—отклоне- ние угловой скорости, v — постоянная, пропорциональная не¬ изменному току якоря. Пусть ta = 0, x(ta) = = {0, 0}, и за время 0 ■ t t$ требуется перейти на новый режим так, что¬ бы в момент t = ■ .. выполнялось равенство x(t$) = х$ = {.z^, х^}. При этом естественно оценивать качество процесса той энерги¬ ей, которая рассеивается за счет выделения тепла в обмотке воз¬ буждения. Тогда за интенсивность х [и], которая характеризует ресурсы, расходуемые на управление, следует принять величину *3 1« (12.2)
70 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 измеряющую эту энергию. Составим выражение для ' х (t) в соответ¬ ствии с формулой Коши (7.7). Фундаментальная матрица системы (12.1) имеет вид X [t, т] = 1 t — т 0 1 0 Следовательно, импульсная переходная матрица Н здесь такова: 1 t — т 0 1 /г(1) [£ т] * = X [«, т] • Ь = h™ [«, т] Н R, Т] = V v ■ (t — т)" л, > (12.3) (12.4) и движение системы (12.1) описывается равенствами: t xi (0 = 1 ^(1) К, t 1 и (т) dx, о 1 хг (0 = ] ^(2) К, т] и (т) dr. о В частности, при t = t$ имеем: *3 Х1 (*з) = ) /(1) [/, Т1 и (т) dx, о г3 X2 (<з) = \ й<2) [*р, Г1 и (т) dx- о Теперь воспользуемся некоторыми понятиями, связанными с линейными операциями в пространствах функций. (Читателю, не владеющему этим материалом,мы уже порекомендовали во введении к данной части познакомиться предварительно с §§54—60 из При¬ ложения или читать эти параграфы по ходу изучения следующего ниже основного текста. В соответствии со сказанным в дальней¬ шем будем лишь напоминать основные необходимые факты- из тео¬ рии линейных операций, не разбирая их подробно, но указывая каждый раз соответствующие разделы в Приложении.) Рассмотрим функции hW Up, т] и 12> Up, т] от аргумента т (0 1 т 1 £р) как элементы h (т) функционального пространства ■2[o(2)pj, где норма р [h (т) 1 определяется равенством (см. § 57) '3 „ Р|/г(т)] = / № (т) dr] . 9
19] ДВИЖЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ И ЛИНЕЙНЫЕ ОПЕРАЦИИ 71 Напомним, что норма р [А (т)1 характеризует «удаление» функции h (т) от функции h (т) = 0 „ ' Известно, что каждая функция и (т), для которой интеграл \ и2 (т) dr <Z оо, (12.5) о порождает в пространстве линейную операцию Фи[/(т)] = T h(X)u(x)dr. (12.6) о При этом норма р*[фи1 операции фи [h (т) ], характеризующая, грубо говоря, «мощность» этой операции, в свою очередь выражает¬ ся равенством (см. §§ 58, 59) (3 , P’BPul = [j u2(T)dTJ Тт . (12.7) о Так как возможное управление и (т), очевидно, удовлетворяет условию (12.5), то на основании равенств (12.3), (12.4) приходим к выводу, что значения ах Up), Х2 Up) координат фазового вектора х (/) в момент t = t$ можно рассматривать как результат линей¬ ной операции сри . [А] (12.6), порожденной функцией и (т) и выпол¬ ненной над функциями few (т) = Ad) Up, т] = v Up — т), А<2)(т) = = Л(2) Up, т] = v. Более того, мы видим также, что выбранная нами из физических соображений интенсивность х [и] (12.2) в дан¬ ном случае как раз имеет смысл нормы р* [фи! (12.7) операции Фи lh (т)1. Чтобы получить это совпадение, мы и рассматривали здесь функции W1) (т) и А<2)(т) как элементы пространства Таким, образом, можно записать: <3 5 А(1) (т) и (т) dr = фи [Л(1) (т) ], О /3 $ hw (т) и (т) dr = фи [Л<2) (г)], о т- е. *1 (М) = Фи 1Ad> (т)], Х2 (*₽) = фи I Л(2) (т)1, где фи — линей¬ ная операция над функциями из
TL ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ |'Гл . 4 Перейдем теперь к более общему случаю. Пусть поведение управляемой системы описывается уравнением X = A (t)x В (t) и 4-ш (t). (12.8) Как и в рассмотренном выше частном примере, запишем за¬ кон движения системы (12.8) по формуле Коши (7.7): t t • xt (t) = iM' (t, ta) x (ta) + xM' (t, r) w (r) dx 4- § /г[1] И т] и (r) dx ta t* (i = l, . . .,n). (12.9) Здесь iJW (t, т) = [хи (t, t); j = 1, . . ., n} — i-я строка фун¬ даментальной матрицы X (t, т) системы (5.2); hW' [t, т] = {htj(t,x); / = 1, . . .. г} — i-я строка импульсной переходной матрицы Н [£, т] системы (12.5) (см. § 7). При t = t$ из (12.9) следует: Xj (Zu) = ХМ' (Zp, Q X (Za) + § (Zp, T) W (T) dx + *a + /z[l] г] и (т) dx (z = l,..,, re). (12.10) ta Векторные функции /гОЗ (т) = /zU—f/g, т], . . .. Мп1 (т) = Ып) [ t. т] от аргумента х будем считать теперь элементами пространства —Pa,tg] интегрируемых вектор-функций h (x) = {hj (т)} (’=!,..., г; Zx [ . < 3 с нормой (см. § 57) <3 г р th (т)] = {ЦЗ^(т)] dtp . (12.11) fa J=1 Напомним, что символ tsj избран нами для обозначения какого-либо нормированного пространства функций (см. § 57). Этот символ мы будем употреблять всякий раз, когда норма рас¬ сматриваемого пространства не фиксируется. или когда для рас¬ сматриваемого пространства с выбранной нормой нами не огово¬ рено стандартное обозначение (как в данном случае). Известно (см. §§ 59, 60), что каждая вектор-функция и(т) = = {и± (т), . . ., иг (т)}, для которой интеграл *3 г $ [3 ^(t/UtC.oo, ia 4=1 J (12.12)
12] ДВИЖЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ И ЛИНЕЙНЫЕ ОПЕРАЦИИ 73 порождает в операцию рассматриваемом пространстве S3[ta,t^ линейную 'а фи [h (т)] = \h' (t) и (т) dx . г (12.13) При этом норма операции фи [Д] выражается равенством <3 ■ г " 1 Р* [фи] = Р* [и(т)] = j .) ta 3 ul (X) U = 1 . dx (12.14) Напомним еще, что все те функции . и (т), которые порождают всевозможные операции Фи [Д] в каком-либо пространстве 33[ta,t3], составляют в свою очередь некоторое пространство В этом пространстве 53*, называемом сопряженным к исходному пространству 33, норма функций и (т) определяется равенством р* [и (т)] = р* [ф„1. Иначе говоря, норма функции и (т) в S3* принимается равной норме операции ф„ [h (т)], порожденной этой функцией. В данном случае из (12.11) и (12.14) следует, что нор¬ ма р* [и] в сопряженном пространстве S3* совпадает с нормой р [Д] в исходном пространстве S3. Из (12.13) заключаем, что последние слагаемые в равенствах (12.10) можно рассматривать как результат линейной операции Фи [h (т)1, порожденной функцией и (т) и выполненной над эле¬ ментами М1! (т), . . ., hW (т) из пространства 53[ца,^р. е. \ ДРГ (т) и (т) dx = фп [И*] (т)] (г = 1, . . . , п) . fa Кроме того, если интенсивность х [и] выбрать в виде ~г ~ х (и) = 'а 2 м« (т) _г = 1 _ dx то из (12.14) вытекает, что эта интенсивность х [и] может быть истолкована как норма р* [фм] операции Фи [Д] (12.13), т. е. Р* 1ф«1 = Р* Ы = х Ы1. Приведем теперь еще один, несколько более сложный пример. Рассмотрим снова систему (12.8), где будем полагать, что
74 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 и — скалярная функция. В этом случае равенство (12.10) прини¬ мает вид 1Р Хг (h) = ^ИГ (ip, i«) хл + iN' (/P , t) w (x) &Х + '« *P + \ A(i> Пр , т] и (т) dx (Z = 1, . . ., и), (12.15) где ><’> (т) = № Ир, т] = hi [/р, т] — теперь скалярные функ¬ ции х) (Z = 1, . . ., п; < *р). В отличие от предыдущего случая будем считать, что функции ft>> (т) являются здесь эле¬ ментами функционального пространства щ, где норма опреде¬ лена равенством 'р р [И*)] |/г(т)р^-т. (12.16) 'а Известно (см. §§ 57, 59), что каждая ограниченная и интегриру¬ емая функция и (т) порождает в пространстве ^pa,tp] линейную операцию 'з Ф«[Л(т)] = ) h (х) и (т) dx , ’<« причем норма этой операции определяется равенством р* [ф«1 = Р* [и] = sup | и (т) |. (12.17) Каждое возможное управление и (т) является и ограниченной и интегрируемой функцией. Поэтому из равенства (12.17) мы снова заключаем, что те слагаемые в выражениях (12.15) для x-t (£р), ко¬ торые зависят от и (т), можно трактовать как результат линейной операции фи [А] над функциями hW (т). При этом, если выбрать интенсивность х [и ] = sup \и (т)| (ia > т > £р), то из (12.17) сле¬ дует, что опять как раз р* [и] = к [и]. Итак, в приведенных выше примерах мы показали, что в выра¬ жениях для Xi (/р) слагаемые 'з ЛИГ рр , т] и (т) dx, (12.18) зависящие, от и (т), можно трактовать как значения линейной опе- х) В дальнейшем в тех слyчаях, когда ст роки /г* [л,., т] матрицы Н т] будут скалярами и когда это нужно будет подчеркнуть, будем обозначать их символом > > 1 [ф, т].
S l‘>] ДВИЖЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ И ЛИНЕЙНЫЕ ОПЕРАЦИИ 75 нации Ф lh (т)1 (12.13), порожденной функцией и (т) и выполнен- Ж^две'Хм'и W1 Up, а),. ...ЙИ Up, ф При этом в широком классе случаев, считая , функции лш (т) = — ДИ Пр, т] элементами подходящего функционального прост- о^нсва можно добиться того, чтобы интенсивность х [и] управления и (т), выбранная из физических соображений, имела смысл нормы операции. Теперь, однако, следует уточнить некоторые* детали. Вернемся к последнему примеру. Его разбор показал, что возможные управ¬ ления и (т) следует рассматривать там как элементы пространства интегрируемых ограниченных функций J). Действительно, именно это пространство, обозначаемое символом является сопря¬ женным к пространству .22*а’*з]' Но пространство Jvjj наряду с возможными управлениями и (т), являющимися кусочно-непре¬ рывными функциями, включает в себя еще и функции и (т) более общей природы. Поскольку мы будем трактовать выражения (12.18) как линейную операцию, а интенсивность х [и] управления и (т) как норму операции <pu [h (т)], то класс возможных управле¬ ний оказывается целесообразным распространять до более широ¬ ких множеств так, чтобы в каждом случае охватить все функции и (т), определяющие общий вид линейной операции в подбираемом функциональном пространстве S. Это, с одной стороны, удобно, так как позволяет привлечь к решению задачи аппарат функцио¬ нального анализа, а с другой стороны, не повредит первона¬ чальной постановке задачи, так как и в указанных более широких классах управлений, как правило, оптимальными управлениями u° (t) оказываются кусочно-непрерывные функции, т. е. возможные управления. В соответствии со сказанным условимся о следующем. Выше (см. § 2, стр. 18) мы определили класс возможных управлений как класс кусочно-непрерывных функций, исходя из реальных физических условий работы управляемой системы. Те¬ перь же для удобства решения задачи нам придется расширить класс рассматриваемых управлений и (т) так, чтобы функции и (т) составляли пространство, сопряженное к 33. Поэтому при¬ мем следующее определение допускаемого управления. Определение 12.1. Пусть интенсивность % [и] управ¬ ления и (т) в системе (12.8) может быть истолкована как норма Р* [фи1 линейной операции ф„ (12.13) на некотором функциональном х) Напомним, что ограниченность функции и (т) должна при этом, строго говоря, пониматься как ограниченность по существу (см. § 57). Однако в соответствии с нашей общей договоренностью (см. снова § 57) термин «по существу» будем, как правило, опускать. Однако читатель должен помнить, что речь будет идти именно о таком понимании свойства ограниченности * и (т). Точно так же и величину sup у [и (т)], где у — какая-либо норма вектора и, следует понимать всегда как максимум по существу.
76' ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 пространстве 3B{h (т)}. Тогда функции и (т), составляющие пространство ЗВ*{и (т)}, сопряженное к ЗВ, будем называть допус¬ каемыми управлениями. Здесь важно подчеркнуть еще раз следующее обстоятельство: класс допускаемых управлений и (т) определен нами так, что лю¬ бая линейная операция cpu [h (т)1 в рассматриваемом пространстве функций S3 {h (т)} записывается в виде (12.13), где и (т) — допус¬ каемое управление. ' Мы уже разобрали несколько примеров такого подбора про¬ странств ЗВ, при котором норма р* [и] в сопряженном пространст¬ ве ЗВ* имеет смысл физической величины х [и], оценивающей ре¬ сурсы, затрачиваемые на управление. Для того чтобы уметь это делать, исходя из заданной интенсивности х [zz], в других случа¬ ях, которые могут встретиться в приложениях, следует иметь представление об основных типах функциональных пространств 53{^(т)}и о соответствующих им сопряженных пространствах SB*{h (т)}. Эти вопросы подробно освещены в курсах по функцио¬ нальному анализу (см., например, [6*, 7*, 9*, 14*1). Некоторые соображения, облегчающие подбор пространства 53{й(т)}по из¬ вестной величине х [iz] = р* [п], можно найти в Приложении к этой книге, где описаны общие правила, связывающие способы построения норм р [/г] и р* [zz] в сопряженных пространствах (см. § 60). Кроме того, для ориентировки мы приводим в данном параграфе таблицу, содержащую сводку некоторых основ¬ ных пространств ЗВ и соответствующих им сопряженных про¬ странств ЗВ*, норма в которых р* [и] имеет вид интенсивности х [п], встречающейся в приложениях. При этом мы намеренно не акцентируем внимание на классе тех функций и (т) и h (т) (с точки зрения измеримости, интегрируемости и т. д.), которые составляют соответствующие пространства. Дело в том, что при решении задач по излагаемому нижеспособу (см. §17) приходится делать конкрет¬ ные выкладки лишь с непрерывными элементами h (т) = hW (т) из пространств ЗВ и для правильного выполнения этих операций не требуется знать все пространство ЗВ, а требуется знать лишь формулы для р [h (т)]. Кроме того, оказывается, как уже отмеча¬ лось выше, что решения и0 (т) задач об оптимальном управлении обычно содержатся в классе возможных, т. е. кусочно-непрерыв¬ ных управлений. Следовательно, в конкретных задачах простран¬ ство ЗВ, элементами которого мы считаем функции h— (т), и про¬ странство ЗВ* допускаемых управлений и (т) играют роль матема¬ тических конструкций, необходимых для строгого обоснования теории, но в процессе решения остающихся фактически все время за кулисами. В соответствии с этим мы и опускаем здесь подробное описание классов тех функций h (т) и и (т), которые составляют пространства 3B{h (т)}и ЗВ*{и (т)}. Это описание, не неся никакой
§ 12] ДВИЖЕНИЯ УПРАВЛЯЕМЫХ СИСТЕМ И ЛИНЕЙНЫЕ ОПЕРАЦИИ 77 Таблица 12.1 X [и] = Р ♦ [и] р [Л] I 5?(2) 1 U (т) — скаляр h (т) — скаляр (з t [ j и2 (Т) dr] Л L 'а [ j Л2 (т) йт] р <а 2 t С) [ J иа(тНт + »2(()р ‘а z3 [ ■ j Л2 (т) dx + hi (/3) У' «а 3 Общий случай (3 p (3 ( [ j «2 (Т) s [dr]]p [ j Л(т)а ■[dx]]'/r *ot «<а (б [С/]—мера на отрезке ра» ^]) II я sup |и (т) | ''=■ т 2~' *3 (строго говоря, р * [u] = vrai max |и (т)|) (3 § 1/(т)| dx ta III № / ( VU₽ t |aWl> \ «а -v т < tp <3 X jj |и(т)| dx} «а max ■ |h (т)| dx iip^OVy-.miny, j - «а] IV и (т) = {ui (т), . . . , иг (т)} — вектор h(x) = {hi(x)ЛОТ} — — вектор f $ЙиМгЛТ /а 2—1 [$ (3Ч т) лр <а iml V sup ГЗ“1(т)1/! Ia < т < J (р * [и] = vrai max ||и (Т)||) (< < х < (g [3 г j (2/|((Т)),/’ЙТ [а г=1
78 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 Таблица 12.1 (продолжение] х [«! = р • [и] P[h] VI SUP ГУ|«‘»(Т)|'| Г (Р » [и] = vrai max " у |U{ (т)| 1) \ (max |/ц (t)|) dr i 1 la VII sup [max lUj (т)Ц ta < т < fg i [u*imaxi^M-! vrai maxlU^i ('Т|У J \ i ’Ла<т«з L JI/ . r ? (3 im**)** 'a 1=1 VIII max | sup % $ ю)7'*}} 'a i-1 max A (2^- (T)) >dx A i^s"1 при 6(Д) = min ip — te] полезной информации для читателя, хорошо знающего функцио¬ нальный анализ, было бы практически мало полезным и для менее подготовленного читателя, лишь затрудняя для него понимание основных фактов. Заметим еще следующее. Читатель, ■ не интересующийся тонко¬ стями, для нахождения величины р [h (т) ], которая только и тре¬ буется для работы с данными ниже правилами 17.1—17.4, опреде¬ ляющими решение задачи 13.1, может поступать следующим обра¬ зом: проверив, что интенсивность х [и] имеет смысл нормы функции и (т), т. е. проверив для х [и] выполнение условий (56.1), надлежит искать выражение для p[h (т)] из равенства1) Ч р рг(т)] — max \ h' (т) и (т) dx (12.19) и J при ограничении к [и] <1¬ *) Соотношение (12.19) является «обращением» того соотношения (58.12), которое определяет норму р*(и) (см. § 58 и [6*] (стр. 77)).
-1 ПОСТАНОВКА ЗАДАЧИ. ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ 79 Таким путем, например, в случае и [u] = max |u (т)|, где и (т) — скаляр, сразу видим, что p[u] = |/i(r)|dr, ta ибо указанный выше максимум достигается, очевидно, при и (т) = = sign h (т). Итак, в первой графе таблицы 12.1 приведены типичные выра¬ жения для интенсивности х [и] возможных управлений. Во вто¬ рой графе приведены выражения, определяющие норму р \h (т)] в пространстве функций h (т) t таким образом, чтобы слагаемые в формуле Коши (12.10), зависящие от и (т), имели смысл линей¬ ной операции <pu [hl с нормой р* [<J = х [и]. § 13. Постановка задачи об оптимальном управлении В этом параграфе мы сформулируем задачу об оптимальном управлении, включающую условие минимума интенсивности х [и] управляющего воздействия и. Такая задача уже рассматривалась в § 4 (см. задачу 4.2). Однако здесь мы строго очертим класс рас¬ сматриваемых задач, предполагая, что интенсивность х [и] удов¬ летворяет некоторому дополнительному условию. Именно, в соот¬ ветствии с материалом § 12 примем, что величина х [и] может быть истолкована как норма р* [и] функции и (т) (ta t т t Р в некотором функциональном пространстве S3* {и (т)}. Итак, будем рассматривать линейную систему х = A (t)x А-В (t)u -t t (0) (13.1) и примем, что величина х [и], оценивающая ресурсы, затрачивае¬ мые на управление на отрезке времени ta 1t Zp, может трак¬ товаться как норма р* [<ри] линейной операции фи [h (т)1 = t h (т) и (т) dr, (13.2) ta порожденной функцией и (т) на подходящем функциональном пространстве S3 {h (т)}. Подчеркнем еще раз, что основанием для этого предположения является следующее обстоятельство, под¬ робно выясненное в § 12: в выражениях для х, (/) (12.10) члены, зависящие от и (т), можно рассматривать как линейные операции Фи IWO (т)] на вектор-функциях hW (т), являющихся строками им¬ пульсной переходной матрицы Н [7р, т]. Учитывая это, сформули¬ руем теперь следующую задачу об оптимальном управлении.
(13.3) 80 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 Зада ча 13.1. Пусть управляемая система описывается урав¬ нением. (13.1). Заданы отрезок Ss О t начальное х* и конеч¬ ное х* значения фазового вектора, х (t). Выбрана интенсивность и [и] управления и (t), которая может быть истолкована как норма р* [zz] функции и (т) в пространстве ЗВ*{и (т)}. Требуется среди допускаемых, управлений и (t) найти оптимальное управление иУ (t), переводящее систему (13.1) из состояния х (ta) = х* в состоя¬ ние х (/р) — х> и имеющее при этом, наименьшую возможную норму р* [zz0]. Приведем один пример такой задачи. Рассмотрим тяжелую ма¬ териальную точку, движущуюся в вертикальной плоскости (£, ц) и управляемую реактивной силой. Уравнения движения этой точ¬ ки имеют вид (3.10) (см. 3° Z о, ^2 — 1 = Х4, tl=U2—g. Пусть требуется перевести точку из начального состояния х (ta) = хл = {Т1, х2, Xi, хд} в конечное состояние х (I?) = х? = = {#1, х*, Тз, так, чтобы в процессе дди1ленню, не возникало больших дополнительных ускорений, обусловленных реактивной ’ силой. Это означает, что модуль вектора и = {zzt, zz2} по возмож¬ ности должен быть невелик. Поэтому в качестве минимизируемой интенсивности х [и] управляющей силы и = {щ, щ} в данном случае целесообразно выбрать величину х [tz] = sup {||zz (т) ||, ta < т < ^}. (13.4) т Таким образом, из реальных соображений мы приходим здесь к задаче 4.2 о возможном оптимальном управлении U (£), где ми¬ нимизируемая интенсивность х [zz] его должна выражаться ра¬ венством (13.4). Однако для того чтобы, подготовить полученную задачу для решения, надлежит перевести ее в форму задачи 13.1, удобной для математического исследования. Чтобы сделать это, нам следует убедиться, что величина х [zz] (13.4) может тракто¬ ваться как норма р* [zz] в подходящем пространстве функций ЗВ*{и (т)}, сопряжением к некоторому пространству ЗВ {h (т)}. Для этой цели обратимся к таблице 12.1, из которой следует, что нуж¬ ное пространство ЗВ подобрать можно, причем мы видим, что в ка¬ честве ЗВ {h (т)} следует выбрать пространство интегрируемых вектор-функций h (т) = {1ц (т), h (т)} с нормой Р lMt)] = 5 и (т) II "Г (13.5)
■§ 1,3 J ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ 81 Теперь для системы (13.3) можно сформулировать задачу 13.1 об оптимальном управлении следующим образом. Среди допускаемых управлений u(t) = {ur(t), u2(t)}, компоненты которых w(O являются ограниченными интегрируемыми функ¬ циями, требуется найти оптимальное управление и0(/), перево¬ дящее систему (13.3) из начального состояния x(ta) = xa в ко¬ нечное состояние x(t$) = x& и имеющее при этом ' наименьшую возможную норму р*[и°]. Подчеркнем еще раз, что для допускаемых управлений и = {щ, uJ величина р* [zz] имеет физический смысл максималь¬ ного дополнительного ускорения, порождаемого в системе (13.3) этими управлениями (или, иначе говоря, р* [zz] характеризует перегрузки, вызванные управлением и (t)). Разберем еще один способ выбора интенсивности х [zz] для этой же задачи. Потребуем, чтобы при движении точки не модуль век¬ тора дополнительного ускорения, а каждая компонента этого ус¬ корения была возможно меньшей по абсолютной величине. Тогда в качестве интенсивности х [zz] следует выбрать величину х [zz] = sup max {| zz; (т) |; Т z = 1,. 2}. (13.6) т i В этом случае приведениая выше формулировка задачи об управ¬ лении системой (13.3) полностью сохраняется. Отличие будет толь¬ ко в том, что теперь в качестве исходного пространства SB{h (т)} следует рассматривать пространство вектор-функции h (т) = = {/1 (т), ^2 (т)} с нормой Ч p[/z(T)l = § (| h (т) | + | h2 (т) |) dx, (13.7) «а так как согласно таблице 12.1 именно в этом случае норма функ¬ ции и (т) в сопряженном пространстве S3* {и (т)} выражается ра¬ венством (13.6). Для полноты изложения закончим разбор данного примера вычислением вектор-функций hth (т), на которых в этом случае оп¬ ределена линейная операция (13.2) в выражениях (12.10) для Учитывая, что система уравнений (13.3) распадается на две системы вида (12.1), имеем: 1 t — т 0 0 0 10 0 0 0 1 t — т 0 0 0 1
82 ПОСТАНОВКА ЗАДАВИ ОВ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 5 Up — t) Wx (t) dx, 4 (13.8) *0 , (Zp — T U2(r)dr ?(ip-i«)2 2 ’ Отсюда согласно (7.7) выводится, что вектор ж (/р) описывается равенствами: X1 {ip) = х 1 4_ «2 (Zp ^a.) + 4 *2(«р) = ^2^ 5 И^т)^ *зСз) = ж” -I- «£(/ — Q + ip ж4/р) = ж“+ $ u2(x)dx — ga — ta), * J из которых следует, что линейная операция cp„ [h (т) ], определяю¬ щая координаты Xi Up), выполняется в данном случае на вектор- функциях: ; аС1(т) = {«р — т, 0), /и'С)) = {1, 0), /гм(т) = {0, ip — т), Л[4]С)) = {0 ,1} которые и следует рассматривать как элементы векторного про¬ странства ) {h (т)} (h (т) = {h± (т), Д2 (т)}, /Ст<Ор^) с нормой (13.5) в случае, когда интенсивность х [и] определена равенством (13.4), или с нормой (13.7), если интенсивность х [zz] определена равенством. (13.6). Отметим теперь следующее важное обстоятельство. В рассмот¬ ренном примере мы считали, что элементы htj [/р,т] матрицы Н Up, т] суть элементы пространства ограниченных интегрируе¬ мых функций. Точно так же далее в тех или иных конкретных зада¬ чах будем предполагать, что функции hW Up, т] принадлежат пространствам ЩЬ (т)}, Ж {h (т)}, Ж2 {h (т)} (г = 1) или их вектор¬ ным обобщениям (при г >1) (см. § 57). Такое предположение о функциях №1 Up, т] вполне оправдано: указанные функции непре¬ рывны, а все непрерывные функции действительно охватываются каждым из упомянутых пространств. В задаче 13.1 мы предполагали, что заданы все координаты' Xi Up) конечного значения фазового вектора х (t). Однако возмож¬ ны ситуации, когда требуется привести к заданным значениям только часть этих координат xi} Up), • • -, xt, Up), a остальные
§ 13] ПОСТАНОВКА ЗА ДАНИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ 83 одинаты в конце движения могут принимать любые значения. В°таких случаях задача 13.1 может быть сформулирована следую¬ щим образ°м. _ Пасть управляемая система описывается линейным уравнением (13 1) Заданы отрезок времени /а t tp, начальное состояние Хх = х*} и избранные координаты {х£ , • , ■ Д.} конеч¬ ного состояния фазового вектора х (t). Указана, интенсивность х [и] управления и (£), которая может быть истолкована как нор¬ ма р* W функции и (т) в пространстве $*{и (т)}. Требуется среди допускаемых управлений и (t) найти оптимальное управление u° (Z), переводящее систему (13.1) из состояния {х\ , • . х*} в со¬ стояние {х? , • • Xik} и имеющее при этом наименьшую возможную норму р* [и0]. Приведем пример постановки такой задачи. Для этого вернем¬ ся к проблеме управления движением 13.3, рассмотренной в этом параграфе выше, где мы, однако, предполагали,что заданы все начальные и конечные фазовые координаты хг, . • х±. Допустим теперь, что заданы только координаты х± = £ и х3 = т] началь¬ ного и конечного положений, а также скорость точки х2 = х± = ц в начальном положении. Что же касается скорости ее в конечном положении, то мы будем предполагать, что эта скорость существенной роли не играет и может быть любой. В качестве ин¬ тенсивности х [и] управления и (t) по-прежнему будем выбирать либо величину (13.4), либо величину (13.6). Тогда задача об управ¬ лении системой (13.3) может быть сформулирована так: Среди допускаемых управлений — вектор-функций и (t) = = {и± (t), и2 (t)}, компоненты которых являются интегрируемыми ограниченными функциями, требуется найти оптимальное управ¬ ление и° (£), переводящее систему (13.3) из начального состояния х (<а) = ха = {х®, х2, я®, я®} в конечное состояние [хх (fp) = х&, х3 (£р) = Хз} и имеющее при этом наименьшую возможную норму Р* [и]. Подчеркнем теперь различие между сформулированными выше задачами. В случае задачи 13.1 в фазовом пространстве {%, . . . ■ • ., хп} системы (13.1) задается одна вполне определенная точка х&, в которую нужно привести эту систему в момент t = t$. В то же время в только что рассмотренной задаче задано множество конеч¬ ных состояний системы (13.1). Это множество является гиперпло¬ скостью в фазовом пространстве {хг, • • Хп}, определенной си¬ стемой уравнений xi} = x,j (7 = 1.., к). Исходя из такой точки зрения можно обобщить задачу 13.1, считая, что задано некоторое многообразие © конечных состояний 1 фазового вектора х (О- Та¬ ким многообразием @ могут оказаться некоторая достаточно малая
84 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 окрестность начала координат х = 0, некоторая гиперплоскость в пространстве {ад, . . ., хп}, некоторая кривая и т. д. В этом слу¬ чае задача об оптимальном управлении системой (13.1) формули¬ руется следующим образом. Задача 13.2. Пусть управляемая система описывается ли¬ нейным уравнением (13.1). Заданы отрезок tp, начальное состояние х* и многообразие @ конечных состояний объекта. Выбрана интенсивность х [и] управления и (t), которая может быть истолкована как норма р* [и] функции и (t) в пространстве $f*u}. Требуется среди допускаемых управлений и (t) найти опти¬ мальное управление и° (t), переводящее систему (13.1) из состояния х (ta) = х* в какую-нибудь точку х (£р) = х$ из заданного многооб¬ разия @ и имеющее при этом наименьшую возможную норму р* [и0]. Полезно заметить следующее. Как и обычно в вариационном исчислении, решение задачи 13.2 связано с решением задачи 13.1. Именно, если имеется решение задачи 13.1 при фиксированном х (tp) = х&, причем форма решения позволяет проследить зависи¬ мость этого решения 13.1 от х&, то переход к решению задачи 13.2 сводится лишь к дополнительному анализу зависимости решения задачи 13.1 от когда х& пробегает множество TL Таким обра¬ зом, типична ситуация, когда свойства решения задачи 13.1 составляют основной элемент решения задачи 13.2 (см. § 38).' По указанной причине в данной книге внимание уделено, прежде всего, именно задаче 13.1, решение которой определяет основные элементы решения задачи 13.2 и аналогичных ей задач с более сложными краевыми условиями для движения х (t). В заключение полезно еще раз обратить внимание читателя на центральный пункт нашего подхода к проблеме об оптимальном управлении. Предполагается, что в той или иной ситуации исходя из физических соображений получена задача 4.2. Подготовляя эту задачу для решения, мы переводим ее в форму задачи 13.1, удоб¬ ную для математического исследования. Таким образом, задачу 13.1 надо рассматривать не как изначальную проблему, но как первый шаг, направленный к решению исходной задачи 4.2. Об этом следует помнить и в тех случаях, когда мы будем исходить сразу из задачи 13.1. §14. Обобщенная задача Теперь нам надлежит распространить задачи 13.1 и 13.2 на случай обобщенных управлений вида dU (t). Пусть, следователь¬ но, поведение управляемой системы описывается уравнением (6.11), т. е. dx = A (t) xdt + В (t) dU + dW. (14.1)
85 ОБОБЩЕННАЯ ЗАДАЧА § Ш Подобно тому как это было сделано в предыдущем параграфе, при¬ мем и здесь, что величина х [fCZ, оценивающая ресурсы, затра¬ чиваемые на управление на отрезке £а t fy, может тракто- аться как норма р* [С7] функции U (t). Для того чтобы пояснить это общее предположение на конкретном материале, приведем следующий пример. Рассмотрим задачу об управлении движением материальной точки с переменной массой по горизонтальной оси g. Будем гово¬ рить, что реактивная масса расходуется непрерывно, если функ¬ ция т (t) дифференцируема. Тогда движение точки описывается уравнением Мещерского (3.8), которое в данном одномерном слу¬ чае принимает вид т (t) I — a (Z) т (t) = 0, (14.2) где т (t) = mQ + (£) — масса точки, т^ — неизменная часть массы, ?т (£) — запас реактивной массы, а (£) — относительная скорость отделяющихся частиц. Скорость a (t) будем считать по¬ стоянной по абсолютной величине и принимающей значения + а или — а в зависимости от направления отбрасывания частиц. Уравнение (14.2) запишем в следующей форме: d In т (t) dt или в виде системы dx± = x2dt, dx2 = ± ad In m (£), (14.3) где xv = I, x2 = £ Итак, пусть сначала частицы реактивной массы все время выбрасываются непрерывно, так что существует производная d In т (t)!dt. Введем функцию U (£), связанную с функцией In m(t) соотношением d In т (t) — dlnm (t) при a (t) = a, при a (t) = — a. Тогда система (14.3) может быть записана в виде dx± = x2dt, dx2 = adU(t). (14.4) (14.5) Допустим теперь, что наряду с непрерывным расходом массы mh (£) в отдельные моменты времени t = t* могут мгновенно отбра¬ сываться конечные количества реактивной массы Это вызы¬ вает импульсные усилия на движущуюся точку. Будем трактовать Данное явление как идеализацию непрерывного отбрасывания немалой массы, но за чрезвычайно малый промежуток времени. Иначе говоря, рассмотрим предельный случай управления вида
86 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 (14.4) на отрезке (t , t* + ДО ПРИ условии, что Д£ ->0, но при *,+Д4 t.+At этом интеграл ' | dU | = | а (t) din т (t) | = о;>0 есть постоян¬ ная. Вследствие малости отрезка Д£ положим еще, что при t Д Д + At величина а (0 остается постоянной. Тогда, привле¬ кая понятие импульсной 6-функции и понятие обобщенного управ¬ ления dU (0, введенные в § 6, мы можем и в окрестности таких значений t = t* записать уравнения движения снова в виде (14.5) , полагая, что при переходе через точку t = t* имеем: At/ (Д) - Д In т (tj при a (tt) = а, — Д In т (tJ при а(Д) = —а, (14.6) где Д In т (tj = In т (t* + 0) — In т (tj. Итак, мы видим, что здесь в качестве обобщенного управляю¬ щего воздействия dU (t) естественно принять управление, порож¬ денное функцией U (0, связанной с функцией In т (t) соотноше¬ ниями (14.4) и (14.6). Эта функция, с одной стороны, удобно описывает управляющие усилия, а с другой стороны, она явно.ха- рактеризует расход реактивной массы во времени. В самом деле, полное изменение функции U (t) на отрезке [Za, tp] выражается ра¬ венством (см. [23*], т. 3, стр. 78, а также выше в этой • книге см. равенство (4.4)) var[t/ (т)]£= |£/(T)|dT+ £ |ДС((Л.)| = ^п-Г’ (14.7) ta i =1 0 где tk — точка разрыва функции U (£). Отметим здесь еще следующее обстоятельство. Мы трактуем мгновенный выброс конечной массы как идеализацию непрерыв¬ ного выброса ее за исчезающе малое время и исходим при этом из уравнения Мещерского (14.2), которое выведено как раз в пред¬ положении, что реактивная масса изменяется непрерывно (см. [13*], стр. 110). В соответствии с этим предельный переход привел нас' к соотношению (14.6). Такая идеальная картина явления, видимо, удовлетворительно отвечает его реальному содержанию. Если же, однако, считать, что конечная масса отбрасывается мгно¬ венно, как единое целое, то уравнение (14.5) с функцией U (t), определенной соотношением (14.6), уже не получится. Действи¬ тельно, предположим, что в некоторый момент времени t = t* точ¬ ка имела массу т = т* + Д т1 и в этот момент времени мы отбро¬ сили сразу массу Дтх =/= 0. Тогда, пользуясь теоремой об измене-
ОБОБЩЕННАЯ ЗАДАЧА 87 § HJ нии количества движения системы ([13*1, стр. 102), мы получим: &i — ± а Am-i Очевидно, что Дт-rlm^ =f= Д In т. Это и подтверждает выска¬ занную мысль. Вернемся к уравнению (14.5). Определим закон движения точки в соответствии с обобщенной формулой Коши (6.6). При t — t$ будем иметь: ч (М = -а -Ь (3 — М ж” + 5 /г(1) Кз т] dU (тЬ «а х2 (t$) = а£ +5 Л(2) [£р’- т] dU (т)’ Здесь, как и выше (см. стр. 70), функции Лт (т) = А^) Кд, t] = а • (3 — г), (т) = hm [—- т] = а суть элементы импульсной переходной матрицы Н [fy, т] системы (14.5). Пусть требуется перевести точку из заданного начального поло¬ жения х (ta) — ха в заданное конечное положение х (tp) — х$ с ми¬ нимальным расходом реактивной массы Ti --- . При этом, как обычно, будем предполагать, что mi (tp) — 0, т. е. что запас реак¬ тивной массы в процессе управления полностью используется. Тогда в соответствии с (14.7) в качестве минимизируемой интенсив¬ ности х [dU] управления dU (т) следует выбрать величину (см. также § - 7, стр. 52) x[<^i^] — - | dU (т) | = var [ U (0] £ , (I4.8) 'а равную полному изменению var [U (3)]ip функции U (t) на отрезке t — t$. Итак, требование осуществить перевод точки из на¬ чального состояния х* в конечное состояние ха с минимальным Расходом реактивной массы т (t) (при заданной неизменной час¬ ти лг°) эквивалентно требованию минимума интенсивности х [dU] (14.8). Если теперь рассматривать функции — 1 - (т) и — - - (т) как элементы функционального пространства %>{h (т)} скалярных
88 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 непрерывных функций h (т) (ta 4 т 4 t$), где норма р [Л (?)] определена равенством (см. §§ 56,59) р [&(?)] = max | h (?) |, (14.9) т то величины 'а !з . $ hw [£(Ч, T dt7(r), 5 h{w [Z,3, т] dU (?) «а можно рассматривать как значения линейной операции фу [h] на элементах А(1>(т) и — 2 — (т). В самом деле, введенная нами функция U (т), описывающая расход реактивной массы, предполагается непрерывно дифференцируемой всюду, кроме отдельных точек tt, где сбрасываются конечные количества массы (t). Следователь¬ но, мы можем предполагать тем более, что U является функцией с ограниченным изменением. Но известно (см. § 59), что любая функция U (т) с ограниченным изменением на отрезке [ZK, — 1 как раз и порождает в пространстве <{h (т); ta т Zp} линейную операцию Фу 1М*)] = 5 h(x)dU(x), (14.10) <а причем 'а р* [Фф]= р* 1^1 = $ |<W)| = var [£(?)] £. (14.11) 'а Это и обосновывает наше утверждение. Итак, в данном примере мы видим, что можно записать: МП =«? + — t^) х* + фу [А<1) (т)], х (<р) = 4 ф-фу [А'2) (t)]. При этом замечаем также, что выбранная из физических сооб¬ ражений интенсивность х [<dU] (14.8) в данном случае имеет как раз смысл нормы р* [фу] (14.11) операции фу. Рассмотрим теперь более общий пример. Пусть в уравнении (14.1) U — скаляр и, следовательно, В (t) — вектор b (t). В качест¬ ве интенсивностях [dU] выберем опять величину полного импуль¬ са (14.8) управляющей силы. Находя снова закон движения
ОБОБЩЕННАЯ ЗАДАЧА 89 s I'd системы (14.1) по формуле Коши (6.6), получим при t = t$: 'з 'з д. = х&' (*р t°) х (Q + 5 хМ Ун т) dW (t) + 5 h(l} >>>>> xpdu(т) С 'a (i = l,..,,n). (14.12) Для того чтобы интенсивность х [dU] (14.8) можно было ис¬ толковать как норму р* [фу] операции фу, следует рассматривать функции № (т) = [«₽, т], . . ., Л(п) (т) = A(«) Up, т] > опять как элементы пространства c<§{h (т)} скалярных непрерывных функ¬ ций h (т) Ua > < т < £р) с нормой (14.11). Тогда, .как и в предыду¬ щем частном примере, последние слагаемые в равенствах (14.12) можно трактовать как значения линейной операции фу [Л], порож¬ денной функцией U (т) и выполненной над элементами № (т) (i = 1, . . ., и), т. е. я-! (t;) = х М' (ip Za) х (to) + ХРГ (<3’ х) dW W + Ч?Г [/^l) (т)] 'a (t = 1, . . ., и), причем опять выполняется (14.11). Соображения о целесообразности расширения класса воз¬ можных управлений dU (т) до управлений допускаемых, приве¬ денные в § 12 для случая системы (12.8), следует учитывать и здесь в случае системы (14.1). Поэтому, так же как и выше, примем сле¬ дующее определение обобщенного допускаемого управления. Пусть интенсивность х [dU] обобщенного управления U (t) мо¬ жет быть истолкована как норма р* [<ри] линейной операции (14.10) на некотором функциональном пространстве $?{Д(т)}. Тогда скажем, что функции U (т), составляющие пространство S3* (С7(т)}, сопряженное к S3 (Л(т)}, порождают обобщенные допускаемые управ¬ ления dU. Задача об оптимальном управлении может быть сформулиро¬ вана теперь следующим образом. Задача 14.1. Пусть управляемая система описывается обоб¬ щенным линейным уравнением (1-4.1). Заданы отрезок ta X t X Ц и начальное ха и конечное значения фазового вектора х (t). Выбра¬ на интенсивность х [dU] управления dU (t), которая обладает свойством нормы р* [С7] функции U (t) в пространстве S3* {U}. Требуется среди обобщенных допускаемых управлений dU(t) найти оптимальное управление dU° (£), переводящее систему (14.1) из со¬ стояния х (to) = ха в состояние х (t$) = х‘ и имеющее при этом наи¬ меньшую возможную норму р* [С7°].
90 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. /, П р и метание 14.1. В данном случае можно сформулировать также и задачу, соответствующую задаче 13.2. Мы, однако, здесь такую формули¬ ровку приводить не будем, так как она получается очевидным изменением условий задачи 13.2. В предыдущих примерах функции U (t) были скалярными. Однако все основные рассуждения имеют силу и в общем случае векторных * управлений dU (t). В соответствии с этим данное выше определение допускаемого управления и формулировку задачи 14.1 следует относить к общему * случаю векторного управления dU (/). Как и в § 12, приведем теперь табл. 14.1 с краткой сводкой . ос¬ новных пространств Зд {h (т)} и соответствующих им сопряженных пространств * * (?7(т)}, норма в которых р* [С7] имеет вид интен¬ сивности х [с?СЛ, встречающейся в приложениях. Таблица 14.1 X [<Ш] = р * [U] Р[А] I U (т)-скаляр /г (т)-скаляр j \dU (т)| =var[f T)]/p 'а а max |Л(Т)| < Т < II U (Т) = {U1 (т), . . . , иг (т)}-вектор /г (Т)= {h (т), .... Лг(т)}-век- тор $ (2 "S < *а. г—1 max (2л|(т)) * 2 III *3 г i=1 max (max * (t)|) <a < Т < (3 * IV #3 \ max ]<с/7г(т)| J i га (2 W>|) г=1 Для иллюстрации рассмотрим задачу о переводе материальной точки, движущейся в поле центральной силы, на некоторую круго¬ вую орбиту за время * — £а при минимальном расходе запаса ре-
ОБОБЩЕННАЯ ЗАДАЧА 91 § 14] активной массы mL (ta). Будем предполагать, что реактивная мас¬ са ад (U в процеоое управления полностью используется, так что (£₽) = 0. Уравнения движения точки, лежащей в одной плоскости с заданной круговой орбитой, имеют вид (см. п. 5° § 3) 1 =ra*/j\т' где т = т0 + тА (£), г — длина радиуса вектора точки, % — обоб¬ щенный импульс, соответствующий полярному углу гр; ar (f), a^(t) — проекции вектора относительной скорости отделяющихся частиц на направление радиуса и поперечное направление соответственно. Пусть ‘ тх , z2, Z3 — отклонения фазовых координат . от их зна¬ чений на круговой орбите, т. е. *1 = г — Го, zz из = % — %0. Здесь го — радиус заданной круговой орбиты, %о — значение обобщенного импульса % при движении точки по круговой орбите. Полагая запишем уравнения движения точки в первом приближении (см. § 3, уравнения (3.23)): dx± = x?dt', dx, = —Xid 4 xtflt' -I- -r=ar (f) — dt', dx3 = «Ф (t') — dt'. /v m Везде в дальнейшем для удобства записи инддесОпри t будем опускать, помня, однако, о том, что мы изменили масштаб времени. Будем считать, что реактивная масса тх (t) выбрасывается с относительной скоростью а, постоянной по модулю (|а| = |/а* + а* = = const), но переменной по направлению. Так же как и вы¬ ше (см. стр. 85), будем предполагать, что выброс массы происхо¬ дит непрерывно (так, что существует производная dm (t)/dt), за ис¬ ключением лишь отдельных моментов времени tk (к = 1, ..., I) из отрезка Ra, £3], в которые масса т± (t) может изменяться скач¬ кообразно. При этом мгновенный выброс конечной массы будем снова трактовать как предельный случай непрерывного выброса
92 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 ее за бесконечно малый промежуток, причем в течение этого про¬ межутка относительную скорость а отделяющихся частиц можно считать постоянной по величине и направлению. Тогда в качестве обобщенных управляющих воздействий есте¬ ственно выбрать функции dUt (t) и dU2 (£), связанные с массой т (t) соотношениями: dUr = ar (t) — dt = ar (t) d In т (t), dU2 = if)) —ctt^a^ (t) d In rn (t), когда существует производная m (t), и соотношениями: ДЦ\ = ar (tk) A lnm(^), AZ72 = Лф (£fc) A In m (tk), если в момент tk масса изменяется скачкообразно. Итак, окончательно получаем уравнения движения точки в первом приближении: dx± = Х2 dt, dx2 = — Xidt + x3dt —— dUь у V dx3 = t dU2. V v (14.13) Пусть требуется перевести точку из заданного начального по¬ ложения х (ta) = х) в заданное конечное положение х (£р) = х&=0 с минимальным расходом реактивной массы о (£а). Тогда в ка¬ честве интенсивности х [dU] управления dU (t) = [dUt (t), dU2 (t)} следует выбрать величину (см. § 60, где дано точное оп¬ ределение смысла интеграла (14.14)) 4i K[dU]= judt/coil. (14.14) Действительно, повторяя с незначительными изменениями до¬ воды, приведенные на стр. 86, можно снова убедиться в справед- mQ + т. (t ) ливости равенства х [J£7] = || а||In — .А тоо и онначает, что, минимизируя интенсивность х [dU] (14.14), мы осуществим перевод точки на круговую орбиту с минимальным расходом на¬ чального запаса реактивной массы тх (ta).
ОБОБЩЕННАЯ ЗАДАЧА 93 § И] Однако для того чтобы иметь право сформулировать проблему в форме задачи 14.1, нам необходимо быть уверенными в воз¬ можности подобрать пространство S3 {h (т)} таким образом, чтобы величинах [dU\ (14.14) имела смысл нормы функции U (т) в про¬ странстве S3*{U (т)}, сопряженном к $3{h (т)}. Для этой цели обра¬ тимся к таблице 14.2, из которой видим, что такой выбор S3 воз¬ можен, причем в качестве S3 {h (т)} следует выбрать пространство непрерывных вектор-функций А(т) = {Л (т), Л2 (т)} с нормой р[й(т)] = max || А (т) ||. (14.15) т Таким образом, для системы (14.13) можно сформулировать следующую задачу об оптимальном управлении: Среди допускаемых управлений dU (t) ={dUi (t), dU2 (£)}, компоненты которых dUt (t) порождены функциями Ut (t) с огра¬ ниченным изменением, требуется найти оптимальное управление dU° (t), переводящее систему (14.13) из начального состояния х (ta)= х?- = {xi, х2, хЗ} в конечное состояние х (tp) = х$ = {0,0,0} и имеющее при этом наименьшую возможную норму р* [С7]. В заключение для полноты картины найдем вектор-функции Д[’] (т) (i = 1,2,3), на которых вычисляется линейная опера¬ ция q>u в выражениях (14.12) для xt (t). Фундаментальная матри¬ ца и импульсная переходная матрица для системы (14.13) имеют вид cos (t ) a) sin (t — ta) 1 COs (t ta) X [t, ta] = sin (t to) cos (t ta) sin (t ta) 0 0 ) 1 H [«, r] = X [£, r]-5(r) = cos (t — x) sin (t — x) 1 — cos (t — t) —sin (t — r) cos (t — r) sin (t — r) 0 0 1 0 0 Гр д 0 Y V 0 2r0 -yv sin (t — t) У v (t — r) yv 0 y^(l — cos (t — r)) У v ■yV sin (« — t) У v 2r0 /v
94 ПОСТАНОВКА ЗАДАЧИ ОБ ОПТИМАЛЬНОМ УПРАВЛЕНИИ [Гл. 4 Следовательно, согласно (14.12) вектор х(/) описывается равен¬ ствами: X1 (Zp) , = х* cos (Zp — Za) + xX sin (Zp «p + Vv J sin (Zp — t) dUr (T) Za) -|-- X* (1 — cos (Zp — Za)) + (P + -/7 J (1 — cos(Zp — ХУ)<Ш2(г), te «2 Gp) — —X* sin (Zp — Za) + x* cos \tp — ta) 4- x* sin (Zp — Z«) + tp |p \ cos (Zp — r)dUi (т) + -/=Л sin (Zp — t) dU2 (th J V v J ta, *p = x+|% \U2(x). Из этих равенств следует, что линейная операция «3 Фи 1Л(Т)1 = $ h(x)dU (t), *« определяющая координаты Xt (О, выполняется в данном случае на вектор-функциях Л[1 (т) = ) Tj) sin (Zp — th — cos (Zp — т))} лИ (Т) = {}%rC0S — ' уТ sin ( (( — t)) , аМ ={°, 5%), которые и надлежит рассматривать как элементы векторного про¬ странства 33 {h (т)} (h (т) = {Лх (т), h2 (т)}, Za ) t ) .Zp) с нормой (14.15).
Глава 5 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ § 15. Задача об управлении как проблема моментов Наша ближайшая цель — дать общее решение задач 13.1 и 14.1. Предлагаемое решение будет опираться на математическую теорию, связанную с так называемой проблемой моментов. Поэто¬ му, прежде чем переходить непосредственно к решению задач об оптимальном управлении, мы сначала выясним связь, которая су¬ ществует между этими задачами и упомянутой проблемой. Итак, рассмотрим задачу 13.1. Подставляя краевые условия х (£а) = я и х (t$) = х> в равенства (12.10), описывающие движе¬ ние х (t) управляемого объекта, получим систему интегральных уравнений: ' [is, т] и (т) dx = Ct (z = l,..., n), (15.1) в которых функции h№ [£р, т] = h (т) и числа ct определяются со¬ гласно (6.1), (8.4) и (12.10) следующими соотношениями: п /Д1] ( h, т] = (т)} = { 2 Xik [''0> Т] b> i (T)I , . , <0 . , (1,5.2) Ci — Xi — x™ [Z₽, <в] xa — J x[1]' T] w (t) dx (i = 1,. . ., n). Важно обратить внимание на то, что вектор-функции hW [£р,т] и числа Ci ■ мы считаем по условиям задачи известными, а вектор- функции и (т) — искомыми. Кроме того, в соответствии с формули¬ ровкой задачи 13.1 вектор-функции МО т] надлежит рассмат¬ ривать как элементы некоторого функционального пространства (т); ta < т < а вектор-функции и (т), изображающие уп¬ равления, как элементы пространства функций®* {и (т); ia<A«C^}> сопряженного к ®[ta,tp]. Теперь, следовательно, задача 13.1 свелась к тому, чтобы разрешить уравнения (15.1) относительно
96 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ У ПРАВЛЕНИИ |Рл ■ ;i функций и (т) при условии, что р* [u] m min. (15.3) Если все числа ct равны нулю, то задача решается сразу, так как тогда достаточно принять, что и (т) m 0. Поэтому в дальней- п шем мы всегда будем считать, что 2 & == 0- г=^1 . Левые части равенств (15.1), как мы видели в §§ 12, 13, имеют смысл линейной операции сри [А], выполненной над элементами &W Пр, т]. Но тогда, суммируя сказанное, можно заключить, что задача 13.1, записанная в виде соотношений (15.1) — (15.3), све¬ лась к следующей проблеме, которую вследствие ее важности мы теперь специально выделим. Проблема моментов. Пусть . в пространстве 33 {h (т); t$} вектор-фу нкций h (т) с нормой р ]h] задано п п элементов hh ■ (т). Пусть также задано п чисел ct и С =f= 0. Тре- i=i буется найти линейную операцию ср [h (т)1, определенную на всем пространстве 33{h (т); ta т <4 £з}, удовлетворяющую на заданных элементах h№ (т) условиям ф[/гСг]('Т))=с (г = 1 . . .. п) (15.4) и такую, что норма р* [ср] операции ср [h] является наименьшей из возможных х). Операцию ф [h] = ф°, которая удовлетворяет условиям этой задачи, будем называть оптимальной операцией (для данной проб¬ лемы моментов). Итак, задача об оптимальном управлении по сути своей оказы¬ вается проблемой моментов. Здесь, однако, важно обратить внима¬ ние на следующее существенное обстоятельство. Наша задача — определить функции и (т), которые удовлетворяют уравнению (15.1). Истолковав выражение в левой части (15.1) как линейную операцию, порожденную функцией и (т), мы желаем теперь заме¬ нить задачу об определении функции и (т) проблемой моментов, х) Строго говоря, проблема моментов заключается в определении линей¬ ной операции (р, удовлетворяющей лишь условиям (15.4), а требование (15.3) о минимальности нормы ср является дополнительным требованием, которое выделяет среди решений ср проблемы моментов (15.4) оптимальную операцию <р0. Это дополнительное условие оптимальности (15.3) может заменяться ка¬ ким-либо другим требованием к (р. Однако в данной книге мы почти везде ограничиваемся лишь задачами, где условие оптимальности управления бу¬ дет приводиться к виду (15.3). В соответствии с этим мы и формулируем про¬ блему моментов как такую задачу, которая включает оба условия (15.3) и (15.4), (См. также § 47, стр. 383.)
§ 15] ЗАДАЧА ОБ УПРАВЛЕНИИ КАК ПРОБЛЕМА МОМЕНТОВ 97 т. е. задачей об определении операции ср [h (т)], удовлетворяющей условию (15.4). Но тогда, найдя эту операцию в результате реше¬ ния проблемы моментов, мы должны быть в состоянии (по крайней мере в принципе) вернуться к порождающей ее функции и (т). А это возможно лишь тогда, когда в свою очередь каждая линей¬ ная операция, имеющая смысл на функциях h (т) из 33{h (т)}, действительно порождается некоторым управлением и (т) в форме интеграла. Иначе говоря, необходимо, чтобы любая линейная операция с [Л], имеющая смысл на (т)}, могла быть записана в виде ф [Л] = T h' (г) и (т) dr, (15.5) где функция и (т) содержится среди рассматриваемых нами управ¬ лений и (т). До сих пор мы не акцентировали внимание на этом обстоятельстве. Как мог заметить читатель, в § 12, где впервые было использовано понятие линейной операции в связи с дви¬ жением х (t), мы опирались на эту связь между управлением и (т) и операцией фи [А], используя ее лишь в одном направлении — от и (т) к фи [Л]. При этом было отмечено, что соответствующие чле¬ ны в записи, определяющей движение х (£), можно истолковать как линейную операцию фи [А], порожденную возможным управле¬ нием и (т). Теперь же, как мы видим, для нас важен и обратный переход. Проблема моментов эквивалентна задаче 13.1 тогда и только тогда, когда линейные операции ф[Л], имеющие смысл на 3B{h (т)}, находятся во взаимно однозначном соответствии с рас¬ сматриваемыми управлениями u(t). Если бы мы ограничились лишь кругом возможных управлений и (£), то такого соответствия получить бы не удалось и наш переход к проблеме моментов был бы незаконным. Именно, в последнем случае не ' для всякой опера¬ ции ф [h\ можно было бы подобрать возможное управление и (т), которое определяло бы ее в виде (15.5). Однако мы уже услови¬ лись в § 12 расширить круг возможных управлений до множества допускаемых управлений. Это как раз и было сделано с той целью, чтобы обеспечить нужное соответствие между и (т) и ф„ [h (т)]: множество допускаемых управлений мы определили именно так, что любая линейная операция фи Ш, определенная на пространст¬ ве 3B{h (т)}, оказалась представимой в виде (15.5), где функция и (т) — допускаемое управление. Итак, если мы ищем управление и (т) среди допускаемых управлений, то задача 13.1 полностью эк¬ вивалентна проблеме моментов. Следовательно, для того чтобы найти оптимальное управление и0 (т), достаточно решить пробле¬ му моментов. Решение этой проблемы описано в следующем пара¬ графе. 4 Н. Н. Красовский
98 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 Задача 14.1 об управлении в форме dU (t) также может быть g сведена g к проблеме моментов. Для этого нужно лишь подобрать соответствующим образом пространство gg (т); g g т g Zp}. Вы¬ сказанное утверждение поясним, например, для случая скалярно¬ го управляющего воздействия, когда матрица Btt) в уравнениях (14.1) есть щросто вектор b(t). Интенсивность х [dU] управления dU (t) выберем в виде (14.8). Подставляя краевые условия х = = х* и х($) = х$ в равенство (14.12), получаем систему урав¬ нений Ч $ Л(,) [р т] dU (т) = Ci ,. = 1,...,п), (15.6) Ч где Ct определяются снова выражением (15.2) (с заменой w (т) dx на dW). Систему (15.6) следует теперь разрешить при условии, что р* [Z7] = min. В данном случае функции № Up, т] надлежит рассматривать как элементы функционального, пространства %{h (т); icgrg £р} непрерывных на Ua, £р] функций h (т), где норма р [h (т)1 = max | h (т) |. Пространством S3* {U (т); g g т g т g Zp}, определяющим допускаемые управления, будет тогда пространство функций U (т) с ограниченным изменением на UaUpl, с нормой р* [J7], равной величинех [dU] (14.8). Согласно материалу § 14 левую часть (15.6) можно рассматри¬ вать как результат линейной операции, производимой функцией U (т) над элементами hW Up, т] из $ {h (т); Za g т g Zp}. Таким образом, находим, что рассматриваемая задача сводится к пробле¬ ме моментов в функциональном пространстве Пользуясь случаем, подчеркнем, что и здесь задача 14.1 оказывается эквива¬ лентной проблеме моментов по той причине, что общий вид линей¬ ной операции фи [h\ на элементах Л(т) из $ра,*0] определяется равенством (14.10), где dU (t) — некоторое допускаемое уп¬ равление. Полезно заметить, что для задачи 13.1, которая сводилась к равенствам (15.1), функции g( 11 Up, т] нельзя было рассматривать в качестве элементов из В самом деле, общий вид линейной операции g ф[Л] в $Ра,*р1 задается формулой (14.10), а не форму¬ лой (15.5). Поэтому операция ф [А], решающая проблему моментов, соответствующую задаче 13.1 (если указанную проблему рассмат¬ ривать в пространстве функций ^^.д.]), может оказаться вовсе не представимой в виде (15.5). Такая операция не будет, очевидно, давать решение для задачи 13.1. Для системы с векторным управлением dU (Z) задача 14.1 во многих случаях также может быть сведена к проблеме моментов.
§ 151 ЗАДАЧА ОБ УПРАВЛЕНИИ КАК ПРОБЛЕМА МОМЕНТОВ 99 Мы не останавливаемся здесь на этом вопросе, так как всевозмож¬ ные случаи, сводимые таким путем к проблеме моментов, трудно обозримы. Для ряда конкретных случаев указанное сведение будет использовано ниже, в § 23, по ходу решения задач. Проблема моментов, к которой мы выше свели задачи об уп¬ равлении,— это весьма общая математическая проблема, возни¬ кающая из прикладных задач о распределении масс, усилий, вероятностей и т. д., обеспечивающем желаемые величины соответ¬ ствующих моментов (моментов сил, моментов инерции, вероятност¬ ных моментов и т. д.). В качестве иллюстрации ' к сказанному и желая ' расширить представление о содержании проблемы момен¬ тов, рассмотрим следующий пример физической задачи, отличной от задачи об управлении, но приводящей также к проблеме мо¬ ментов. Пример 15.1. Пусть на плоскости {g, ц} задана кривая, описываемая параметрическими уравнениями (15.7) Предполагается, что плоскость {g, Щ находится в однородном электроста¬ тическом . поле и расположена перпендикулярно к вектору напряженпости этого поля. Задача состоит в таком распределении зарядов вдоль кривой (15.7), при котором моменты 5^ и S„ сил электростатического взаимодействия относительно осей g = 0 и ц = О принимали бы заданные значения S = clt = с2. При этом будем считать, что распределение зарядов вдоль кривой характеризуется линейной плотностью и (т) этих зарядов. Рассмотрим эле¬ мент dx кривой (15.7) в окрестности точки g (т), р (т). Этот элемент несет заряд d& = и (т) dx. Составив выражение для статических моментов Sи 8^ получим два уравнения для неизвестной плотности и (т): где X — коэффициент пропорциональности, обеспечивающий совпадения размерностей. Предположим, что по условиям задачи величина max |и (т)| вдоль кривой должна быть по возможности наименьшей. Введя обозначения М (Т) = Л(1) (т), Xg (т) = /г(2) (т), получим следующую задачу: найти функцию и (т), удовлетворяющую урав¬ нениям - Ч такую, что (т) и (т) dx = c (i = l>2), (15.8) max (| и (т)| при ta < х < tp) = min. (15.9) 4*
100 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 Если условие (15.9) снова истолковать как условие минимума нормы р*[ы] функции и(т), рассматриваемой как элемент пространства т0 соотношения (15.8), (15.9) означают, что исходная задача опять сведена к проблеме моментов. При этом следует лишь предположить, что функции A(i) (т) являются элементами пространства § 16. Проблема моментов Цель настоящего параграфа — познакомить читателя с основ¬ ными теоремами, определяющими решение проблемы моментов, к которой, как мы только что убедились, сводятся задачи об управ¬ лении. Решение упомянутой проблемы связано с одной из важ¬ нейших теорем функционального анализа — с так называемой теоремой Хана — Банаха о распространении линейного функ¬ ционала. Мы, однако, не будем углубляться в изучение этой свя¬ зи, но выведем решение проблемы моментов, опираясь на те нагляд¬ ные представления, которые даны в Приложении. Итак, вернемся к уравнениям (15.4), т. е. ф [йм (т)] = Ci = 1,...,н), (16.1) где, следовательно, нам надлежит определить неизвестную опера¬ цию ср с наименьшей возможной нормой р* [ф]. Найдем сначала необходимые условия, которым должна удов¬ летворять любая операция ф, разрешающая уравнения (16.1). Пусть, следовательно, ф — некоторая такая операция. Рассмот¬ рим множество ^{h}, состоящее из всех вектор-функций h (т) вида п Й (т) = 3 (<« < т < (16.2) 1=1 где постоянные Ц стеснены условием п 3^=1. (16.3) 1=1 Вследствие (16.1) и по свойствам линейности операции ф на функциях h (т) из З имеем: Ф \h (т)] = 1. (16.4) В самом деле, п п п ф [А (т)] = ф Р3 /Л[г]1 = 3 ^ф [[[ ] = 2 lici = 1- 4=1 1=1 г=1 Обозначим теперь символом © {А} множество всех функций h (т) из совокупности 53(ta,<3] {h (т)}, которые удовлетворяют ус¬ ловию (16.4). Это будет множество более широкое, чем множество
§ 161 ПРОБЛЕМА МОМЕНТОВ функций S5 порожденное конечным числом параметров Ц. Соотношения (16.4) и (16.3) позволяют нам теперь оценить норму р* . [ф1- Напомним, что норма р* [ср] может быть легко вычислена, если в пространстве 33 {h} известно «расстояние» рф от «плоскости» где ср ]h] = 1 до «точки» h (т) = 0 (рис. 16.1). При этом (см. При¬ ложение, §§ 52, 58) р*1ф] = -Т-- г'ф (16.5) (Расстояние рф определяется как нижняя грань inf р [Л(т)1. когда h (т) пробегает все множество @.) Так как множество ЗР содержится в .. заключаем, что Рф<Р°, (16.6) где р° есть расстояние от точки h (т) — 0 до множества ЗР (16.2), (16.3), определенное, . следовательно, условием (см. рис. 16.1) р° == min р [Л] = mm р [2 ~ z Ь=1 J = Р «''''З р [Л°] ПРИ 3 Цс, = 1. (16-7) Важно отметить, что здесь, действительно, минимум достигает¬ ся. на некоторой функции Д° (т) = 2 й № (т), содержащейся в ЗР. Такую функцню h" (т) назовем минимальной
102 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 Докажем существование минимальной функции h° (т). Пусть сначала функции АО! (т) линейно независимы, т. е. пусть линейная комбинация их (16.2) может обращаться в тождественный нуль лишь при Zj = . . . = 1п = 0. Тогда по свойствам нормы р [Л] (см. § 56) имеем: у [Zlt . . Zn] = р Z./il’B >0 при Zx + . . . + 1=1 + 1%=I= 0 и, более того, limy [Zx, . . .. Zn] = оо при ZZ+- .. + Й -> оо. Кроме того, y[Zx, . . ., ZJ есть ' непрерывная функция от Z,-. Но тогда существование минимума у [Z?, . . ., Z„] есть следствие известных свойств непрерывных функций. Предположим теперь, что среди функций h№ (т) только к < п линейно независимых. Мы всегда можем выбрать нумерацию так, чтобы линейно независимыми были первые к функций hh (т) ( = к). Остальные функции hW (т) будут, 'следовательно, линейными комбинациями от hh (т): к Лм(т) =3 Хг/П(т). (16.8) 1=1 Но тогда рЙ *ХЯ1 = у [£ . ..,аа, (16.9) Li=l J Lj=l J где числа n + 2 i=*+l вследствие (16.3) и (16.8) стеснены условием к п к 3Х + 2 z(c-S cA.- = 1- (16Ю) j=l i=k+l 1=1 Величина у [Zx, . . ., Zj&] снова вследствие линейной независи¬ мости hhh (т) (/ = 1, . . ., к) будет непрерывной функцией от Ц-, причем lim у = оо при Z? + . . . + Z k -> оо. Отсюда опять выводится существование минимума у [Z*?, . . ., Z®] для этой величины. Тем самым снова устанавливается существование ми¬ нимальной функции Л° (т). Теперь из (16.5) и (16.6) получаем нужную оценку (16.11) Из этой оценки следует, прежде всего, что величина р° обя¬ зательно отлична от нуля, если только уравнения (16.1) имеют
ПРОБЛЕМА МОМЕНТОВ 103 § 1Л ешение в виде ограниченной линейной операции ф, а только та¬ кие операции пас и интересуют по условиям задачи. Ввиду важ¬ ности неравенства р° >0, как необходимого условия для раз- пешимости уравнений (16.1), подтвердим его еще непосредственно. G этой целью предположим, что задача имеет решение, но тем не менее р° = 0. Однако последнее означает, что Л0(т) = 0, т. е. (р [Л0 (г)] == Ф [0] = 0, а это противоречит условию (16.4), ибо до (г) содержится в 5S Подводя итог нашим рассуждениям, мы можем сформулиро¬ вать следующую лемму, которая указывает необходимый признак для разрешимости проблемы моментов (15.4). Лемма 16.1. Оптимальная операция <р° , ■ разрешающая проб¬ лему моментов, существует только тогда, когда выполняется нера¬ венство ро = р[до (т)] >0. (16.12) При этом необходимо выполняется условие Р*[ф01>^т- (16.13) (Напомним, что здесь р° — число, найденное из условия (16.7).) Лемма 16.1 дает оценку снизу для нормы р*[ф°]. Естественно поставить вопрос: является ли эта оценка достижимой? Иначе говоря, возникает вопрос о том, всегда ли можно построить опе¬ рацию ф°, разрешающую ' проблему моментов и такую, что Р’[ф°1 = ^. (16.14) Оказывается, что ответ на поставленный вопрос является поло¬ жительным и, следовательно, справедлив такой достаточный приз¬ нак разрешимости проблемы моментов. Лемма 16.2. Пусть число р°, определенное условием (16.7), положительно. Тогда проблема моментов (15.4) имеет оптималь¬ ное решение ф°, причем справедливо равенство (16.14). Докажем лемму. Прежде всего, заметим, что выполнение ра¬ венства (16.4) на функциях h (т) вида (16.2), (16.3) есть не только необходимое, но и достаточное условие для того, чтобы операция Ф доставляла решение уравнений (16.1). В самом деле, пусть усло¬ вие (16.4) выполнено. Покажем, что отсюда следует выполнение равенств (16.1). Пусть сначала при выбранном i = s имеем os Ч* 0. Тогда, пюлагая в (I6.2) 1„ = i/cs, р■ — 0 при i == s, т. e. полагая h (t) = ДМ (T)/cs) получим сразу из (16.4) Ф [/г (т)1 = ср [-1 | = ^-ф [Лм]] = 1 что и доказывает выполнение (16.1) при таком значении i = s.
104 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 1Гл. 5 Предположим теперь, что cs = 0. Если бы при этом, вопреки наше¬ му утверждению, не выполнялось равенство ср [MSI] = 0, то не могло бы выполняться и условие (16.4) для любой функции h (т) из З5. В самом деле, допустим, что ср [AW] = a ={= 0. По свойствам линейности операции <р имеем: п п ф[А(т)] = ф|"2 mW 1 + ls(f [АМ] =ф[2 1г1гМ I + ^а- (16.15) 4#=s J Li^s J Но при cs = 0 число ls в (16.2), (16.3) можно выбирать лю¬ бым без изменения других чисел /г, а это создает противоречие между (16.4) и (16.15). Итак, действительно, условие (16.4) обес¬ печивает выполнение (16.1). Теперь для доказательства леммы остается построить опера¬ цию ср0 [Л], которая удовлетворяла бы условиям (16.4) и (16.14). Сделаем это. Заметим, прежде всего, что множество 3P{h}, определенное усло¬ виями (16.2) и (16.3), есть множество плоское. Напомним (см. § 61), что множество М элементов h (т) из 33 {h (т)} называется плоским, когда «прямая» (т) = U(t) (т) + (1 — Х) /г(2) (т) (— оо < Х < °э), проведенная через любые две «точки» h(D и А( 2 ) из М, лежит всеми своими точками тх в М. Понятие плоского множества переносит, следовательно, в пространство функций понятие обычной плоско¬ сти трехмерного пространства (см. снова рис. 16.1, который, ко¬ нечно, имеет весьма условный смысл). Тот факт, что множество ЗР вида (16.2), (16.3), действительно, является плоским, проверен в § 61, куда мы и отсылаем читателя. Итак, нам надлежит построить операцию ф° [Л], которая на элементах h из плоского множества Зр принимала бы значение 1 и имела бы норму р* [ф0] = 1/р°, где р° — это как раз расстояние от ЗР до точки h (т) = 0. Для этого построения рассмотрим в простран¬ стве $?{А(т)} сферу §° радиуса р = р° с центром в точке h (т) = 0. Иначе говоря, рассмотрим совокупность всех функций h (т) из S3 {h}, которые удовлетворяют неравенству р [h (т)] т р° (см. рис. 16.1). Так как в пространстве 33 {h} расстояние от «плоскости» 3s до «точки» h (т) = 0 равно как раз радиусу р° сферы §°, то эта сфера и плоскость Зр «касаются» друг друга, и это касание проис¬ ходит в точке Д° (т), являющейся минимальной функцией. Подоб¬ ных точек касания может быть не одна, но это не важно. Важно то, что сфера §° не имеет таких своих внутренних точек, которые лежали бы на ЗР. Иначе говоря, важно то, что в соответствии с ус¬ ловием (16.7) в совокупности g{{h} нет функций h (т), для кото¬ рых р [А] < р°.
ПРОБЛЕМА МОМЕНТОВ 105 § 16] Теперь мы можем воспользоваться теоремой из функциональ¬ ного анализа о разделении выпуклого множества 8° и плоского мно¬ жества 3, которые не имеют общих внутренних точек. Согласно этой теореме, приведенной и разъясненной в Приложении и яв¬ ляющейся одной из геометрических форм фундаментальной теоре¬ мы Хана — Банаха [6*] (см. § 53 и § 61), можно построить опера¬ цию ф° lh], которая разделяет сферу §° и плоскость * поверхно¬ стью * , где ф° lh] = 1. Строгий аналитический смысл последнего геометрического оборота речи определяется условиями: Ф° [h (т)] =1 при h (т) из S’, 116.16) Ф° [h (т)] «С 1 при h (т) из S0.. 116.1)) Такая «разделяющая» операция ф° [А] и является искомой опе¬ рацией ф, разрешающей проблему моментов. Для доказательства этого утверждения вследствие (16.16) достаточно проверить лишь, что р* [ф°] = 1/р°. А для этого в свою очередь достаточно прове¬ рить, что расстояние рф от точки h (т) = 0 до плоскости @ равно р°. Проверим это. Так как 3 содержится в (* , то р<р * р°. Но рФ не может быть строго меньше, чем р°. В самом деле, в случае неравен¬ ства р<р <Z р° множество @ содержало бы точки h (т), у которых р lh (т)] <Z Р°, т. е. множество @ содержало бы внутренние точки из сферы §°, а это противоречит неравенству (16.17). Итак, нами построена операция ф° [А], которая удовлетворяет всем условиям леммы 16.2. На этом доказательство леммы завер¬ шается. Сравнительная простота приведенного доказательства не долж¬ на вводить читателя в заблуждение, так как основная трудность этого доказательства остается скрытой в использованной нами тео¬ реме Хана — Банаха о существовании гиперплоскости *, отделя¬ ющей множества §° и 3>. Эта теорема, имеющая ясный наглядный смысл, требует, однако, трудного строгого доказательства, которое можно найти в курсах функционального анализа [6*, 14*]. Резюмируя все предыдущие рассуждения, получаем следую¬ щую основную теорему о решении проблемы моментов. Теорема 16.1. Проблема моментов имеет решение ф° [h (т)] тогда и только тогда, когда число р° (16.7) положительно. При этом норма р* [ф°] оптимальной разрешающей операции ф° [h] определяется из равенства р* [ф°] = • Остановимся теперь на вопросе о том, как же фактически сле¬ дует искать операцию ф° [h (т)] при решении той или иной конкрет¬ ной проблемы моментов. Очевидно, тот способ, который мы
106 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 применили при построении ср0[А-] в доказательстве леммы 16.2, для этой цели совершенно не годится, так как он носит характер чисто¬ го математического рассуждения о существовании <>0. Поэтому сейчас мы укажем одно очень важное свойство максимума, кото¬ рым обладает оптимальная разрешающая операция ф° [h] и которое является сильным подспорьем при построении операции <р° в эффективной форме. При этом основную роль будет играть та минимальная функция п h° (т) = 3 />и (т) (16.18) 1=1 из семейства (16.2), на которой достигается минимум (16.7). Здесь числа 1° суть решения задачи (16.7). Полезно помнить, что по опре¬ делению функции h° (т) ее норма рД°] удовлетворяет равенству р[А°] = р°. Нужное нам свойство максимума выводится следую¬ щим образом. Разрешающая операция ср0 удовлетворяет равенству (16.4) Ф° [до (т)1 = 1, (16,19) причем р*[ф°] = 1/р°. Если теперь рассмотреть какую-либо дру¬ гую операцию ф, отличную от ф°, но имеющую ту ) же самую нор¬ му р*[ф] = 1/р°, то по известному свойству нормы (см. § 57) получим ф [А0] ) р* [ф] р [Л°] =—р° = 1. Следовательно, с учетом (16.19) имеем неравенство ф [А-0] ) ф° [Д°] = 1. Итак, справедливо следующее утверждение, которое в соответ¬ ствии с установившейся терминологией, назовем принципом мак¬ симума. П ринцип максимума. Оптимальная разрешающая операция ф° [h (т)], имеющая норму р* [ф°] = 1/р°, выделяется среди всех других линейных операций ф [h (т)] с той же нормой р* [ф] = 1/р° следующим свойством максимума на минимальной функции hQ (т): Ф° [h° (,)] = тахф [№ (т)] при р* [ф] = . (16.20) ф Р Подчеркнем, что после определения минимальной функции А0(т) в широком классе случаев принцип максимума позволяет обычно без больших затруднений найти явный вид операции Ф° [h (т)]. В этом читатель сможет убедиться из рассматриваемых ниже примеров (см. §§ 18—23). Однако, как мы увидим из этих же примеров, определение самой минимальной функции Л° (т) может доставлять немалые вычислительные трудности. Полезно еще от¬ метить, что в ряде случаев вместо чисел Z,, определяющих мини-
ПРОБЛЕМА МОМЕНТОВ 107 § 161 мальную функцию Л"(т), удобнее искать числа 1Л], доставляющие решение задачи: найти * v° = max 2 Kci (16.21) k i=l n при условии, что P°[S АДмДт)]<1. Числа к}, решающие задачу (16.21), будут связаны с числами определяющими минимальную функцию h (т) (16.15), равенствами к? — Z/‘/p0. При этом v° = 1/р°. (В случае р° = 0 получается п sup 3 AjCj = 00 •) Доказательство последних соотношений мы пре- 1=1 доставляем читателю в качестве упражнения. Функцию /га (т) = п = 2 ^-гга (*) = /г/(т)/р° назовем экстремальной функцией. 1=1 Пример 16.1. Теперь в качестве иллюстрации рассмотрим решение примера 15.1, опираясь на теорему 16.1 и принцип максимума. Пусть в этом примере кривая д = д (t), ц = ц (t) определяется уравнениями U6 = л (0 = (0 < t < 1), коэффициент X равен единице и • , = — с3 = 1. Тогда имеем следующую проблему моментов (15.3),• (15.4): 1 _ ти° (т) dx = 1, т) и° (т) dx = — 1, (16.22) о max | u° (т) | = min. (16.23) 0<т<1 Функции • • 1 • (т) = т, • 1 • • (т) = 1 — X линейно независимы. Согласно заключению, сделанному в_ конце обсуждения примера 15.1, проблему мо¬ ментов надо рассматривать • . здесь в пространстве X {h (х); 0< г<1}, где норма р определяется равенством 1 р[Л(т)] =^1Л(т)| dr. О Вычислим величину р° (16.7). Имеем: 1 р° = min | /it -р Z2 — h't | dx при li — /2 = 1 1 о пли при — оо</2<ос.
108 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 / / / Последняя задача имеет решение = 0,5 ® = — О,5, р° = V4. Это видно из рис. 16.2. Действительно, заштрихованная площадь, равная как раз минимизируемому интегралу, будет, очевидно, наименьшей при Z2 = 1% = = —0,5. Согласно теореме 16.1 норма р* [ср°] искомой операции ф° равна 1/р° = 4. Другими словами, имеем шах т \и (т)| < 4. Чтобы найти операцию ф°, т. е. чтобы найти функцию и°(т) в (16.22), (16.23), воспользуемся свойством максимума(16.20). Это условие максимума в данном конкрет¬ ном случае записывается так: 1 J (т — 0,5) и (т) dx = о шах и Рис, 16.2. 1 = 5 (т — 0,5) U0 (т) dt 0 при \и (т)| 4. Решение последней задачи, очевидно, дается функцией и0 (т) = 4 sign (т — 0,5), которая кусочно-постоянна и имеет точку разрыва при т = 0,5. Итак, в этом и предыдущем параграфах мы выяснили следую¬ щее. Задача об управлении имеет смысл проблемы моментов. При дополнительных условиях со свойствами выпуклости (каковым условием является как раз наше требование минимума нормы р* [и] = р*[ф-и]) упомянутая проблема разрешается операцией ср0 (линейным фукционалом) отделяющей выпуклое множество 3b{h} (16.2), (16.3) и сферу §° {h} (р [hl < р°). В заключение этого параграфа сделаем еще три полезных замечания. 1) Из теоремы (16.1) следует, что условие р°ф>0 есть необходимое и достаточное условие для разрешимости проблемы моментов. Но это условие обязательно выполнено, если функции Л^(т) ли¬ нейно независимы, ибо тогда р [S] >0 при + . . . + l\ =f= i =£= 0. Следовательно, линейная независимость функций hС t / (т) есть достаточное условие разрешимости проблемы моментов, ка¬ ковы бы ни были числа 2) Пусть функции h tt / (т) не являются линейно независимыми, но числа Ci в уравнениях (16.1) таковы, что р° >0. Тогда исход¬ ную проблему моментов можно свести к аналогичной проблеме, где, однако, будут фигурировать лишь линейно независимые функции h№ (т), выбранные из совокупности всех исходных функ¬ ций hitth (т). В самом деле, предположим снова, как и выше, на стр. 102, что линейно независимы лишь функции /hh (т)
§ пО ПРОБЛЕМА МОМЕНТОВ 109 = 1, . . *) и выполнены соотношения (16.8). Если р° = minp [3 /Л[<(т)] > 0 при = 1, (I6.24) г=1 г=1 то обязательно должны выполняться соотношения /с °i = 2 ci\ (^>к)- (16.25) 7=1 Действительно, в противном случае согласно (16.9) и (16.10) можно было бы ' выбрать числа Zj = 0 и 1• =• 0 так, • чтобы удовлетворить п равенству (16.10) (т. е. равенству 2 kci = 1) и получить р° = г=1 к = ] — О.Противоречие с (I6.24) и доказывает (1(3.25). Но 7=1 в случае одновременного выполнения (16.8) и (16.25), очевидно, достаточно удовлетворить лишь первым к уравнениям (16.1), ибо остальные п— к равенств выполнятся тогда автоматически. Таким образом, проблема моментов (16.1), действительно, сводится в данном случае к проблеме Ф(° ДОЛ] = Cj (7 =1, . . ., к), (16.26) р* [ф0] = min, (16.27) Важно подчеркнуть при этом, что число р°, которое мы найдем, решая в соответствии с теоремой 16.1 проблему моментов (16.24), (16.27), совпадет, конечно, с числом р°, которое получается при решении исходной проблемы моментов (16.1), (16.27). Это нетруд¬ но видеть и непосредственно, исходя из соотношений (16.9) и (16.10), учитывая, что вторая сумма в левой части (16.10) вследст¬ вие (16.25) есть нуль. 3) Проблему моментов (15.1), (15.3) можно трактовать как изопериметрическую задачу из вариационного исчисления (см. [4*], стр. 48), где надлежит определить минимум функционала р*, т. е. р* [и (т)] = min (16.28) при дополнительных условиях <3 7Д0(т) и (т) dx — сг (Z = 1,. . ., п). (16.29) Описанное в этом параграфе решение проблемы моментов трак¬ туется тогда как решение указанной изопериметрической задачи,
110 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 полученное, однако, не классическим путем, но методами функцио¬ нального анализа. Такой подход в случае задач управления по¬ лезен по следующим причинам. Во-первых, осуществляется воз¬ можность охватить такие случаи р [и (т)], когда вследствие недо¬ статочной гладкости функционала р применение классических теорем вариационного исчисления затруднительно. Во-вторых (и это важнее), решение, описанное выше, дает явное условие минимума (16.7), облегчающее решение и исследование краевой задачи, составляющей основную трудность проблем управления, особенно в тех случаях, когда требуется проследить влияние крае¬ вых условий на результат управления. Однако ясно, что характер решения и основные соотношения, определяющие его, являются аналогом соответствующих классических соотношений. Так, на¬ пример, величины Ц, фигурирующие в соотношениях (16.2), (16.7), можно трактовать как множители Лагранжа, используемые в вариационном исчислении при решении гладкой задачи вида (16.28), (16.29) на условный минимум. По причинам, указанным, в частности, во введении (см. стр. 15), мы не останавливаемся здесь на этом вопросе подробнее. В дальнейшем, в § 18, будет рассмот¬ рен конкретный пример нормы р* [н], когда указанная связь про¬ является особенно прозрачно. Читателю, который не удовлетво¬ рится упомянутым примером, мы рекомендуем обратиться к одному из курсов вариационного исчисления (см., например, [4*]), а так¬ же к курсам, содержащим обобщения классических понятий в ду¬ хе новых методов линейного и нелинейного программирования (например, [28*, 29*1). § 17. Решение задачи об управлении Вернемся вновь к нашей задаче 13.1 об оптимальном управле¬ нии. В § 15 показано, что эта задача сводится к проблеме момен¬ тов. В предыдущем параграфе мы изучили проблему моментов и сформулировали теорему 16.1 и принцип максимума, характери¬ зующие ее решение. Теперь, суммируя результаты § § 15 и 16, по¬ лучаем следующее утверждение. Теорема 17.1. Задача 13.1 имеет решение тогда и только тогда, когда для минимальной функции № (т), построенной соглас¬ но (16.7), выполняется, условие р [А°] = р° >0. Интенсивность оптимального управления х [и0] удовлетворяет равенству х [и0] = = 1/р°, и это управление обладает свойством максимума (17.1) при р*[и] = 1/р°.
§ 171 РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 111 Опираясь на эту теорему, мы дадим сейчас рабочее правило для решения задачи 13.1. Прежде всего, выпишем явное выражение для вектор-функций п /ЦТ) m 2^г1(Т), г=1 среди которых ищется минимальная функция . А (т). Вводя обо¬ значение /для вектора-столбца с компонентами lt (i = 1, . . ., п) и вспоминая, что ■ ■ (т) суть строки hW' [/р, г] матрицы Н Пр, т], получим для вектора-строки h' (т) следующую матричную запись: К (т) = VH Ир, т]. Далее, ■ согласно (6.1) имеем: Н Ир, т] = X Ир, т] В (т). Так как, наконец, X И, т] = X-1 [г, /], то окончательно получим: h (г) = 1Х~г [Т) /р] В (т). Транспонируя h' (т) по свойствам матричных произведений, най¬ дем: А(т) = В' (т)[-*"1 [т, ^]]'l. (17.2) Матрица ■ [X- [/, /р]]' является фундаментальной матрицей S [/, /р] для уравнения (см. § 10, в частности, уравнение (10.3)) s = — A' (t) s. (17.3) Следовательно, сомножитель s (т) = [X-1 [т, /р]]'7 = S [т, t$\l при заданном I есть не что иное, как некоторое частное решение уравнения (17.3), сопряженного к уравнению (5.2). Более того, при т = имеем s (/р) = [. Но тогда оказывается, что множество вектор-функций h (т) определяется равенством h (т) = В' (т) s (т), где вектор-функции s (т) суть всевозможные решения системы (17.3). Таким образом, задача вида (16.7) об определении мини¬ мального элемента /г° (т) формулируется теперь следующим обра¬ зом: найти ро — min р [В' (т) s (т)] = р \В' (т) s° (т)] (17.4) S при краевом условии cs (/р) — 1,
112 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 где с — вектор-столбец { g , сп} (15.2). Смысл задачи (17.4) за¬ ключается, следовательно, в том, чтобы из всех движений сопря¬ женной системы (17.3), стесненных краевым условием с's (Zp) = 1, выбрать минимальное движение s° (т), причем h° (т) = В' (т) s° (т). Таким образом, теорема 17.1 доставляет следующее правило для решения задачи 13.1. Пра вило минимакса 17.1. Для того чтобы решить задачу 13.1, следует построить систему (17.3), сопряженную к дан¬ ной, и рассмотреть вектор-функции hg (т) = В' (т) s (т), где s (т) — движения системы (17.3), стесненные условием с'э (tp) = 1. Среди этих движений надлежит найти минимальное движение s° (т), для которого выполняется условие (17.4). Задача 13.1 имеет решение тогда и только тогда, когда р [В' (т) s° (т)] = р° >0. При этом оптимальное управление и° (Z) имеет норму р* [н0] = 1 / р° и среди всех допускаемых■ управлений и (Z) с нормой р* [и] = 1/р° выделяется условием максимума (17.1) на минимальной функции h° (т) = В' (т) s° (т). Приведем еще одну формулировку правила для решения зада¬ чи 13.1. Как было отмечено в § 16 (см. стр. 107), вместо задачи (16.7) (или (174))) можно решать заменяющую ее задачу (16.21) п об определении экстремальной функции № (т) =2 h№ (т). г=1 Эта вторая задача в обозначениях настоящего параграфа выглядит так: найти v° = max c's (t^) = c's° (t$) (17.5) s при условии p (т) S (т)] «С 1. Движение sa (т), разрешающее задачу (17.5) и порождающее экстремальную (функцию h (т) = В' (т) s° (т), назовем экстремаль¬ ным движением. Напомним, что h (т) = h° (т) / р° и потому g° (т) = = s° (т) / р°. Таким путем придем к следующему выводу. Правило 17.2. Для того чтобы решить задачу 13.1, следу¬ ет построить систему (17.3), сопряженную к данной, и рассмот¬ реть вектор-функции h (т) = В' (т) s (т), построенные по всевоз¬ можным движениям s (т) системы (17.3) и стесненные неравенством р Щт)] g 1. Среди этих функций надлежит найти функцию h (т) — В' (т) s° (т) = В' (т) S [т, Zp] k°, порожденную экстремаль¬ ным движением s°(t), на котором достигается максимум (17.5). Задача 13.1 имеет решение тогда и только тогда, когда c's° (Zp) = v° <t oo. При этом оптимальное управление и° (Z) имеет норму р* [u°] = v° и среди всех допускаемых управлений и (Z) с нормой р* [z| = v° выделяется условием максимума на экстре-
§ 171 РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ ИЗ мяльной функции h° (т): (т) м° (т) dr = max - р° (т) и (т) dr = v° (17.6) *а U *а при р* [м] = V0. Примечание 17.1. Величина р [В' (т) s (т)] является функцией Ф У от переменных = sc (ip). Следовательно, задачи (17.4) и (17.5) суть обычные конечномерные задачи на условный экстремум. Пусть система (17.3) такова, что выражение р -[В' (т) s (т)] = == р [В' (т) 5 [т, £р] s (ip) ] обращается в нуль лишь при s (ip) = 0, иначе говоря, пусть вектор-функции Л<г) [у т] линейно независимы. Тогда величина р [В' (т) s (т)],"У рассматриваемая как функция от вектора k = s (£р), имеет смысл нормы, у■ [к] в n-мерном пространстве Рп {К}. Это обстоятельство естественно вытекает из того факта, что вели¬ чина р имеет смысл нормы в функциональном пространстве $?{h [т]}. Но в таком случае величину v = c's (£p) = С К можно рассматривать как зна¬ чения линейной операции, порожденной в пространстве &п{К} вектором с (см. стр. 398), а величину v°, определенную равенством (17.5), надлежит тог¬ да трактовать как норму у* [с] вектора с в пространстве сопряженном к пространству —п {&}. Итак, приходим к следующему выводу. Интенсив¬ ность р* [и0] оптимального управления и° (£), разрешающего задачу 13.1, равна норме у* [с] вектора с в пространстве -S^n, сопряженном к простран¬ ству & п {к}, где норма у (К) определена равенством у [Л] = р [В' (т) S [т,гр] Н Аналогичные замечания можно сделать и к следующему ниже правилу 17.4. Примечание 17.2. Пусть в задаче 13.2 многообразие @ {р } воз¬ можных конечных состояний х$ составляет гиперплоскость xi (tp) = х$ (i = 1,...,тп < п). Это означает, что краевым условиям — (ip) = — должны удовлетворять лишь первые т координатх) и что остальные координа¬ ты могут, следовательно, принимать в момент £р любые значения. Но тогда задача сводится к определению такого управления и° (£), которое удовлетво¬ ряет лишь первым т уравнениям (15.1) (значения q при i — т для нас роли не играют) и имеет при этом минимальную интенсивность х [и0]. Таким об¬ разом, в рассматриваемом случае получается проблема моментов для первых т функций Д— (т), для решения которой следует воспользоваться, уже из¬ вестными правилами. Читатель может самостоятельно сформулировать то правило минимакса, которое получается в этом случае. При решении задачи 13.1 уравнения (15.1) могут быть преобра¬ зованы следующим образом. Обе части векторного уравнения (15.1) Ч § Н [у т] м (т)<7т = с (17.7) х) Тот факт, что выбраны т первых коордипат, не ограничивает общности, ибо всегда можно ввести подходящую нумерацию.
114 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 умножаем слева на матрицу X-1 Пр, £а]. По смыслу величины Н Пз, т] = X Пр, т] В (т) = X Пр, ^а] Х~ х [т, /а] В (т) тогда получим \ X"1 [т, £а] В (т) и (т) dx = X'1 Пр, аа] с = е. Иными словами, уравнения (15.1) преобразуются тогда к системе $/п],(т) и (*) dx — ei (f = 1, . . ., п), (17.8) ‘а где [ [ (т) суть векторы-строки матрицы X-1 [т, £а]В (т) и *3 е = Х“1 Нн, £«] х^ ■— хх — Х_1 [т, £а] w (x)dx. (17.9) ta В ряде случаев может оказаться, что решать проблему моментов для уравнений (17.8) при условии х [u] = min удобнее, чем для системы (17.7). В частности, к уравнениям (17.8) удобно сводить задачу 13.1, когда w (t) = 0 и речь идет о приведении объекта в со¬ стояние х Из) = 0, так как тогда е = — ха. Решение задачи (17.8) проводится по известному нам плану, причем придется рассматривать функции п f(t) = W WJ (т)> г=1 заменяющие здесь функции (17.2). Рассуждая, как и выше, на стр. 111, убедимся, что .теперь h(x)=B' (т) S [г, t*]l. Отсюда выте¬ кает правило, которому надлежит следовать при решении задачи в последнем случае. Правило 17.3. Чтобы решить задачу 13.1 при w (t) = О и х$ = 0, следует рассмотреть вектор-фу акции h (т) — В' (т) s (т), где s (т) — движения, системы (17.3), стесненные условием s (fa) яа = - 1. (17.10) Среди этих движений надлежит найти минимальное движение s° (т), для которого выполняется условие р° — min р \В' (т) s (г)] = р [В' (т) s° (г)]. (17.11) S Задача имеет решение тогда и только тогда, когда р° >0. Оптимальное управление имеет норму р* [и0] = 1/р° и среди
§ ]7] РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 115 всех допускаемых управлений и (т) с нормой р* [и] = 1/р° выделяет¬ ся условием максимума (17.1) на минимальной функции h° (т). Заметим еще, что и здесь, как и выше, задача (17.10), (17.11) может быть заменена задачей об определении экстремального дви¬ жения s* (т). Тогда получим следующее Правило 17.4. Чтобы решить задачу 13.1 при w (t) = 0 и х? = 0, следует рассмотреть вектор-функцию h (т) = В' (т) s (т), где s (т) — движения системы (17.3). Среди этих - движений надле¬ жит найти экстремальное движение s° (т), для которого выполня¬ ется условие v° = max s' (Za) х* = s°' (Za) x* (17.12) s при ограничении p IB' (t) s (t)] 1. Оптимальное управление u° (t) выделяется условием максимума (17.6) на экстремальной функции ha (т) = В' (т) s° (т). Полезно еще обратить внимание на следующее обстоятельство. Читатель, не желающий углубляться в доказательства и рассужде¬ ния из §§ 12—16, может ограничиться правилами 17.1—17.4 как рецептами. Тогда надлежит, исходя сразу из задачи 4.2, найти в таблице 12.1 (или из соотношения (12.19)) по минимизируемой ин¬ тенсивности к. [и] выражение для р [h (т)] и затем перейти не¬ посредственно к одному из правил 17.1—17.4. Вернемся теперь к теореме 17.1. Из этой теоремы следует, что задача 4.1 об управлении при условии х [и] = р* [и] т^ р разре¬ шима тогда и только тогда, когда minzp [TH (t?, т)] = р»°> — при Тс = 1. (17.13) И Это соотношение полезно еще записать в форме, не содержа¬ щей явно величину р [h (т)]. Именно, учитывая (12.19), можно соотношение (17.13) представить в виде min( [maxu 0 l’H t t°, т] и (т) с?т] > — при Тс — 1 их [и] 1. Учитывая, далее, что х [Хи] = | Х| х [и], приходим к эквивалентному условию Ч maxu p' т Н [ip, т] и (т) ^т] > 1 (Г7.14) Ч при х [и] < р, каков бы ни был вектор I, стесненный условием Тс = 1. Запись (17.14) допускает простое геометрическое истол¬ кование. При этом нам понадобится одно новое понятие, которое
116 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 будет играть важную роль и в некоторых дальнейших главах (см. главы 9 и 10). Определим это понятие. Овределение 17.1. Пусть система (13.1) в момент t = to, находится в состоянии х = Xх и допускаемые управления и = и (t) (tx < t < t) (или обобщенные допускаемые управления dU (t)) стеснены условием х [iz] . p (х [CZ] . p,). Будем называть областью достижимости $ [х“, р, ta, < 1 процесса (13.1) множество всех тех точек х = <, в каждую из которых система может быть переведена к моменту t = t$ некоторым допускаемым управлением, стесненным заданным ограничением. Используя формулу Коши (5.6), мы можем, очевидно, сказать, что область достижимости $ [х“, p,, t&, 1.1 есть множество всех точек х вида С (3 х = X [ip, £а] хх + < X К,3, т] w (т) dx + < Н [ 1.. т] и (т) dx, (17.15) ta ‘а где и (т) — любое допускаемое управление, стесненное условием х [u] [ р. (В дальнейшем в этом параграфе речь пойдет все время лишь об управлениях и (t). Переформулировка утверждений на случай управлений dU (t) не должна затруднить читателя.) Справедливо важное заключение. Если х[и] = р* [и] (или х [С7] = р* [С]), то область достижимости $ [хх, р, ta, [ 1 есть выпуклое и замкнутое множество в пространстве 33п{х} фазовых векторов х. В самом деле, пусть х-t и rft) суть две точки из обла¬ сти 2? 1ха, р, ta, [] и пусть в эти точки система приводится соот¬ ветственно управлениями h 1 h (t) и h1 (t), удовлетворяющими ограничению p*[iz]<^p. Сфера p*[zz] <^p в функциональном про¬ странстве $B*{u (t)} является выпуклым множеством (см. Прило¬ жение, § 61). Следовательно, каждое управление и* (t) = XUt(t) + + (1 — X) Ut(t) (0 1 1) также содержится в этой сфере, т. е. ux (t) также удовлетворяет условию р* [izx] [ р. Из (17.15) выте¬ кает, далее, что управление и* (t) приводит систему (13.1) в точку х (t?) = хх =kxW + (1 — Z) х(2. А это означает, что все точки хх = %я(!) + (1 — X) rft из отрезка, соединяющего 1 1 1 и х^, со¬ держатся в области достижимости $, т. е. эта область действитель¬ но выпукла. Замкнутость области $ [х“, р, t*, t.] доказывается несколь¬ ко сложнее. Указанное свойство можно . было бы вывести, исходя из теоремы 17.1. Однако полезно сделать это несколько иначе по форме, используя сразу одно важное свойство сферы р* {и} ] р. Речь идет о так называемом свойстве слабой Si-бикомпактности, которой обладает сфера р* [iz] ] p в пространстве 53* {и} (см. [6*], стр. 459). Мы не будем характеризовать здесь 53-бикомпакт¬ ность подробно, отсылая интересующегося читателя к цитирован¬
§ 17] РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 117 ному курсу [6*]. Отметим лишь, что данное свойство аналогично (в несколько ослабленной форме) известному из курса математичес¬ кого анализа свойству ограниченных замкнутых точечных мно- жеств^ в n-мерных пространствах (см. [23*], т. 1, стр. 372): из любой бесконечной совокупности открытых «окрестностей», покрывающей целиком множество (&, можно выделить конечную систему этих ок¬ рестностей, которая также будет покрывать все множество В интересующей нас ситуации свойство fi-бикомпактности сферы р* [и] ) р проявляется, в частности, следующим образом, из любой последовательности функций U^ (Z) (k = 1,2, . . .), лежащих в этой сфере, можно выбрать подпоследовательность {'Ui} (/)} (i = 1,2, ...), удовлетворяющую условию lim )) Н [р, т] и®> (т) dx = ■, Н [р, т] и* (т) dx (17.16) при i ■ оо, где функция и* (г) также является допускаемым управ¬ лением, удовлетворяющим условию р* [гг^^р. Теперь замкну¬ тость области достижимости выводится как простое следствие из (17.16). В самом деле, пусть ж* — некоторая предельная точка для области $ [х*, р, i&, р]. Это озна¬ чает, что существует последова¬ тельность точек Х> из 2? , сходя¬ щаяся к точке ж*, т. е. lim х^ = при к ->оо. Из последова¬ тельности управлений Uk> (i), удов¬ летворяющих условию р* [и] 2 р и приводящих систему (13.1) в точ¬ ки х (t?) = выбираем подпо¬ следовательность 22) ) (i), удовлет¬ воряющую условию (17.16). Да¬ лее, из равенства (17.15) следует, что управление и = u* (i) приво¬ дит систему (13.1) в точку х (ip) = = ж*. Но это и означает, что точка стижимости $ lx*, р, 1а, р]. Так ж* содержится ■ в области до¬ . как такое рассуждение про¬ ходит для любой предельной точки х* области $, заключаем, что область $ [хл, р, /р] содержит все свои предельные точки и, следовательно, она действительно замкнута. Теперь мы можем перейти к обещанной геометрической интер¬ претации условия (17.14). Для этой цели рассмотрим в п-мерном пространстве векторов g ={gj какую-нибудь плоскость л: l'g =1, проходящую через точку g = с (рис. 17.1).
118 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 Пусть $ — есть совокупность точек g = {g;}, Ч g = J T)u(r)dr (г = 1,...,п), 'а получающихся, когда и (т) пробегает все множество допускаемых функций и (т), стесненных заданным ограничением х [и] ) р. Очевидно, эта область ) , изображенная на рис. 17.1- есть не что иное, как область достижимости ) [яа, р,, Za, Zil, смещенная, однако, для удобства рассуждений так, что «центр» ее (получаю¬ щийся при и (t) = 0) находится не в точке x° = X [Z-, Za] ха 4" + X [^з, т] w (т) Jr (см. (17.15)), а в точке g = 0. Иначе говоря, «X пространства {х} и {g} связаны преобразованием х — g + хо- Точка g = 0 содержится в области ) . Далее, неравенство (17.14), т. е. неравенство maxgZ'g ) 1 при gH3 ) , означает, очевидно, что область $ обязательно имеет точки, лежащие по другую сторону от плоскости л, нежели точка g = 0 (или, в крайнем случае в об¬ ласти 2? есть точки, лежащие на плоскости л), И это верно для любой плоскости л рассматриваемого вида. Кроме того, мы знаем, что область 2? выпукла. Если теперь опираться еще на известную нам замкнутость области Э, то из описанной картины нетрудно увидеть, что точка g = с должна обязательно лежать в области 2?. Действительно, если бы точка с лежала вне ) , то можно было бы провести плоскость л*: l*c = 1, не касающуюся границы $. По¬ следнее утверждение, ясное интуитивно, обосновывается строго в теории выпуклых множеств (см. Приложение, § 61, а также [7*], стр. 41). Но принадлежность точки с к совокупности 2? озна¬ чает, что существует управление и (т), стесненное условием х [и] ) ц и удовлетворяющее равенствам (15.1), а это и означает, что рассматриваемая задача об управлении, действительно, имеет решение. Условие (17.13) записывают часто и в такой эквивалентной фор¬ ме ([6*1, стр. 100): ]Z'c] ) цр [УН [Zp, т]] при всех Z, откуда подобно предыдущему получается следующее условие, ана¬ логичное (17.14): Ч р maxu (Z' И [^з, т] и (т) dx ) — Z'cc«> 0 (17.17) при всех Z. Итак, теореме 17.1 можно придать следующую форму.
§ 17] РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 119 С л о д с т в и о 17.1. Задача об управлении 4.1 при ограничении х [я] . р. имеет решение тогда и только тогда, когда справедливо- неравенство (17.17). Вернемся к приведенному выше геометрическому рассуждению. Фактически в нем существенны лишь два свойства области $ — ее выпуклость и замкнутость *). Поэтому следствие 17.1 сохраняет силу и для более широкого класса ограничений х [и] . р, когда уже х [и] не обязательно имеет смысл нормы р* - [zz]. Важно лишь, чтобы ограничение на и (т) выделяло выпуклое множество функ¬ ций и (т) и обеспечивало замкнутость области $ (см. по поводу та¬ кого обобщения в § 38 стр. 317 и в § 47 стр. 379). Таким путем получаем, например, следующее обобщение пра¬ вила минимакса 17.1, которое читатель может обосновать само¬ стоятельно, опираясь на приведенные выше геометрические сооб¬ ражения. Пусть выбрано некоторое множество © {и (т)} управлений и (т) (в частности, по причинам, указанным ниже, в примеча¬ нии 17.3, удобно выбирать @ {и} = SB {и}) и пусть минимизируе¬ мая интенсивность х [и] удовлетворяет условиям: (1) х [0] = 0 = = minx [и] при и из @ {и}; (2) при каждом р >0 ограниченное множество 22р. точек Ч g = § Я(Цт]и (т) dx, х [u] < р, WG© {и} Ч является замкнутым и выпуклым. Тогда решение задачи 4.1 оп¬ ределяется следующим правилом. L Пра вило 17.5. Надлежит рассмотреть движения s (t) системы (17.3), составить величину Ч ри [В' (т) s (т)] = max„ [ . s' (т) Ви (т) dr] при х[[] <]р «а и найти минимальное движение s* (т), для которого ри [£'(t) s(t)] = mins pp. [S's (т)] при ^s(lp) = 1. Пусть р° >0 — наименьшее из чисел р, удовлетворяющит условию рр. [B's- (т)] > 1 и рро [B'sp0 (т)] = 1. Тогда искомый минимум х [и] есть р° и оптимальное управление и0 (£) удовлетворяет усло¬ вию максимума 4 5 [«^(т)]' В® (т) dx = maxu при x[w]<^p°. Ч т) В нашем случае область & содержала еще точку g = 0.- Однако это условие не играет существенной роли, если пользоваться записью (17.17). Кроме того, указанное условие всегда можно выполнить, делая подходящую замену и (t) = и (t) — и0 (t).
120 ОБЩЕЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ [Гл. 5 Примечание 17.3. В случае, когда к [и] = р* [и], имеем, очевид¬ но, * [h (т)] = .рр [h (т)], и нужные свойства области * следуют тогда из свойств сферы р* [и] * ц в сопряженном пространстве * * {и}. В более об¬ щем случае, когда х [и] =f= р* [и], но @ {и} = * {и}, для выпуклости и замкнутости * областей * * достаточно выполнения условий (см. [6*], стр. 459): (1) множества х [и] * р выпуклы; (2) эти множества ограничены, т. е. р [и] при х * [и] * р, и (3) они «З-ззамкнуты», т. е. для любого h (т) из &{h (т)}, если lim (pu [h (т) ] = <рг(* [h (т)], то и х [и*] < р. Пос- и ледние два условия обеспечивают ка'к раз 33-бикомпактностъ (см. выше, стр. 116) совокупности допускаемых управлений и (t), стесненных условием х [и] * р. Наконец, если нет желания вникать в тонкости, связанные с априорной проверкой замкнутости областей &** можно воспользоваться правилом 17.5 без этой априорной проверки, а затем, найдя u° (£), можно проверить дополнительно, что и° (t) решает задачу об управлении, подстав¬ ляя найденную функцию и = и° (t) в уравнения (15.1). Полезно подчеркнуть также, что вектор s° (^), фигурирующий в правиле 17.1 (или 17.3, 17.5), есть не что иное, как вектор 1°, для которого плос¬ кость Р'с = 1, изображенная на рис. 17.1, «касается» области & = (при р = 1/р°). Поэтому правило 17.1, согласно которому (для и? (t) = 0, например) выражение при и = и0 (т) имеет равный единице максимум по и (т) при р* [и (т)] = 1/р°, означает, в частности, что вариация ди (t) управления и° (t) стесненная ус¬ ловием р* [и0 + би] < 1/р°, может отбрасывать точку каждый раз только в одну и ту же сторону от плоскости [S0(tp)]' X = 1 [50(tp)]' X [ , , [,[ Х\ т. е. такие вариации ди отсасывают точку х (ц) от точки х^ всякий раз в одну и ту же сторону. Это обстоятельство и определяет понятным образом оптимальность управления и0 (т). ||| Итак, в этом параграфе мы сформулировали и обосновали правила минимакса, определяющие решение некоторых типичных задач об оптимальном управлении. Читателю, интересующемуся подробнее путями обобщения этих правил, мы рекомендуем обра¬ титься теперь же к § 47 (стр. 386), где дан вывод сформулирован¬ ного там правила 47.1. Наконец, заметим еще, что все правила сформулированы в § 17 для класса допускаемых управлений и (t). Мы не будем в дальнейшем переформулировать все эти правила для обобщенных допускаемых управлений dU (t), так как после чтения следующего § 18 это, очевидно, не должно затруднить чи¬ тателя. Впрочем, отдельные замечания, относящиеся к такой пе¬ реформулировке данных правил, делаются ниже по ходу решения соответствующих задач (см. § 23).
Глава 6 СВОЙСТВА. ОПТИМАЛЬНОГО УПРАВЛЕНИЯ § 18. Управление с минимальной энергией Этим параграфом мы открываем изучение задачи 4.2 об опти¬ мальном управлении при некоторых типичных условиях опти¬ мальности. Начнем с наиболее удобного для исследования случая, когда процесс управления требуется осуществить при условии ми¬ нимальности «энергии» управляющего воздействия. Этот термин, имеющий, вообще говоря, условный смысл, будем употреблять всякий раз тогда, когда в задаче 4.2 потребуется минимизировать величину %[м] = [j 1 и (т) II2 ст] . (18-1) «а Оправданием для такого названия величины (18.1) служит тот факт, что в случаях электромеханических систем эта величина действительно может играть роль оценки энергии, затрачиваемой в процессе управления (см. простейший пример в § 12). Однако, говоря откровенно, мы должны сознаться, что интенсивность х [zz] (18.1) привлекательна не столько своим реальным содер¬ жанием, сколько тем, что в данном случае задача 4.2 решается наиболее удобно. Собственно, решение задачи 4.2 с интенсивностью х [и] (18.1) уже было получено и исследовано в I части книги, в §§ 8,9. Здесь мы, однако, повторим это решение с той целью, чтобы продемонстрировать на нем общий метод, предложенный в § 17, и тем самым подготовиться к применению данного метода в других, менее удобных для исследования случаях. Следуя нашему общему правилу, мы сначала должны были бы установить, что исходная проблема 4.2 может быть сформулирова¬ на как задача 13.1, т. е. следовало бы убедиться в том, что величи¬ на х [и] (18.1) имеет смысл нормы р* [и]. В данном случае этого можно не делать, так как указанный вопрос был уже решен ут¬ вердительно в § 12. Там же было выяснено, что исходная норма р [h (т)], фигурирующая в правиле минимакса 17.1, выражается
122 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 здесь равенством, аналогичным равенству (18.1), т. е. (18.2) причем множество кусочно-непрерывных возможных управлений и (t) .... расширяется до множества допускаемых управлений — интегрируемых вектор-функций и (Z), для которых конечен ин¬ теграл (18.1). Итак, рассмотрим задачу 13.1, где интенсивность х, (и] = р* [и] задана равенством (118.1). ; Согласно правилу минимакса 17.1 первый этап решения задачи 13.1 состоит в определении минимальной функции h° (т) (16.18). Следовательно, полагая известной фундаментальную матрицу S [т, fy] сопряженной системы (17.3) и имея вектор с (15.2), нам надлежит найти вектор Z0 = . . ., /„}, для которого вектор- функция h (т) = В' (т)5 [т, Zp]-Z (Гс = 1) имеет наименьшую нор¬ му, т. е. требуется решить задачу: найти р° = min р [5' (т) S [т, Zp] • Z] = р [В' (т) S [т, Zp] • Z0] • 1 ' при условии Гс = 1. Так как величина р (18.2) достигает миниму¬ ма одновременно со своим квадратом р2, то для определения функ¬ ции h° (т) = В' (т) S [т, Zp] • Z° можно решить следующую задачу на условный минимум: ‘з II В' (т) S [hr, Zp] • Z ||2 dr = min при l’c = 1. (18.3) ta 1 После вычисления интеграла в (18.3), получим квадратичную форму Ф (Zx, . . ., Zn) от переменных lt и таким образом придем к задаче: п п ф(/ь • • • UJ m 3 anlih = min при 3 kci = 1- (18.4) i, ;=1 1 i=1 Эта задача имеет простой геометрический смысл. В самом деле, пусть сначала функции ДМ (т), из которых конструируется функ- п ция Л(т) m 3 Z^c^(t), линейно независимы. Тогда форма Ф являет- i=1 ся определенно положительной и поверхности O(ZX,..., ln) = р2 m m const >0 суть эллипсоиды' в пространстве {Zlt . . ., 1п}- Следо¬ вательно, задача (18.4) состоит тогда в определении такого эллип- п соида O(ZX,..., ln)m (р0)2, который касается плоскости 2 kci = 1, 2=1 причем искомые числа Z- будут как раз координатами точки каса-
§ 181 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 123 ния в пространстве {1г, . - !п}. Если же функции №1 (т) линейно зависимы, то поверхности Ф = рг будут эллиптическими цилинд¬ рами. Тогда задача (18.4) состоит, следовательно, в отыскании цилиндра Ф = (р0)2, касающегося плоскости 2 Чс% = 1. Понятно, 1=1 Рис. 18.1. что во втором случае задача имеет решение не всегда, а лишь в та¬ кой ситуации, когда между числами Ct есть определенная зависи¬ мость, обеспечивающая параллельность данной плоскости с осью цилиндров. Именно таков геометрический смысл условия р° >0 в последнем случае (см. рис. 18.1,18.2).
124 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Решение задачи (18.-4) хорошо известно, оно дается в курсах математического анализа ([23*], т. 1, стр. 467) и не содержит никаких принципиальных трудностей. Поэтому первый этап реше¬ ния задачи 13.1 преодолевается в нашем случае без большого тру¬ да. Таким образом, можно предполагать, что минимальная функ¬ ция Д° (т) найдена, а вместе с тем определено и число р°=р [h° (т)] = = [Ф (j • •, Zi)]!2- Чтобы задача имела решение, необходимо предполагать, далее, что р° >0. Переходим ко второму этапу решения задачи. Теперь, имея в распоряжении функцию Д° (т), нам надлежит определить опти¬ мальное управление и0 (т), опираясь на принцип максимума (см. § 16). Следовательно, в данном случае, мы должны найти функцию u° (Z), удовлетворяющую условиям: *3 О Л0' (т) н° (т) dx = ma® . №' (т) и (т) dx = 1 (18.5) ¥ и. t 1<х la. при 'з $ |»(т)|»Л = (l/p°)8= (v0)2. (18.6) Таким образом, опять получается задача на условный экстре¬ мум. Однако в отличие от проблемы (18.4) теперь мы имеем вариа¬ ционную проблему, так как здесь придется искать уже не набор чисел Z°, . . ., Z), но необходимо определить неизвестную функ¬ цию и (т) (Za [ т [ Zp). Поэтому для решения задачи (18.5), (18.6) следует обратиться к курсу вариационного исчисления. Напомним одно положение, которое доказывается в руководствах по вариационному исчислению (см., например, [10*1, § 25). Пусть из числа вектор-функций у (т) = {ух (т), . . ., уп (т)}, удовлетво¬ ряющих условиям: о y(x))dt = сз (/ = 1,. . ., m), (18.7) а требуется найти вектор-функцию у° (т) = {у® (т), . . ., yQ (т)}, для которой функционал ь 3/(t))dr а принимает экстремальное значение. Такая задача вариационного исчисления называется изопериметрической. Оказывается, что справедливо утверждение. Если у° (т) — решение изопериметри¬ ческой задачи, то существуют постоянные числа . , . . ., Хт —
§ 181 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 125 неопределенные множители Лагранжа — такие, что кривая у° (т) является экстремалью для функционала Ь т Л [У (т)1 = 5 [Р (т- У (*)) + 3 лGi (*. У (*))] dx- a j=l Необходимым условием экстремума последнего функционала яв¬ ляется обращение в нуль его вариации где +t (т) — произвольные непрерывно-дифференцируемые функ¬ ции, достаточно малые по абсолютной величине. Из произвольности вариаций 6yt (т) и основной леммы вариацион¬ ного исчисления ([10*], § 9) вытекает, что функции у\ (т) являются решением системы уравнений т 5S +2 0 «■“! »)• (18.8) Добавляя к уравнениям (18.8) условия (18.7), мы получим п + т со¬ отношений для определения такого же числа неизвестных yj (т), . . . . . уП (т), %!, . . ., Кт. В нашем случае (18.5), (18.6) уравнения (18.8), очевидно, принимают вид й? (т) + 2Хм° (т) = 0 (Z = 1, . . ., и), где h°i и и[ — компоненты векторов й° и и0 соответственно. Отсю¬ да получаем единственным образом значение для и° (т): ""М —^о'1,т>- (18.9) Теперь остается вычислить постоянную X. Эта постоянная оп¬ ределяется из условий (18.5), (18.6) с учетом (18.9), откуда следу¬ ет, что — Х/2 = (v°)2 = 1/(р0)2. Таким образом, цо (т) = (v°)»5' (т) S [т, Zp] Z0. (18.10) Если теперь еще подставить в (18.10) значения величин Z?, разрешающих задачу (118.4), то после всех необходимых вычисле¬ ний окончательно получим: п = тт 3 ^сЛяЬ> *] (г = l,-.-,), (18.11) А /.=1
126 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. в где г D = det = 2 $ h* 1g, t] h*. [ g , г] dr, '■=1 '« hji — элементы матрицы S' [т, g 1 В (т) и Djk — алгебраические дополнения в D. Это управление и® (/) = {и[ (t)}, естественно, совпадает с тем управлением (9.10), которое было найдено в § 9. Важно отметить следующее: обе задачи (18.4) и (18.5), (18.6), с которыми мы встретились, допускают единственное решение ири условии линейной независимости вектор-функций h&Y (?), которые являются строками матрицы S' [т, £р] В (т). Однако, как мы уже знаем (см. §§ 16, 17), дело сводится обязательно к случаю линейной независимости функций h гЛ (?) (/ = 1, . . ., т), где m , п, если только задача 13.1 имеет решение, а для этого необ¬ ходимо и достаточно, чтобы р° >0. Отсюда следует, что исходная задача 13.1 при условии минимума интенсивности к [и] (18.1) име¬ ет единственное решение, если р° >0. Итак, справедливо следую¬ щее заключение. Оптимальное управление для задачи 13.1 при условии минимума. интенсивности к [и] (18.1) единственно и оно изображается век- mop-функцией и° (t) (18.9), непрерывной при всех значениях t g- Функция и0 (Z) пропорциональна минимальной функции h (t) и зависит линейно от координат х* и х%. Рассмотрим простой пример. При этом будем преследовать две цели. Во-первых, выясним на этом примере, как в действительно¬ сти определяется минимальная функция h° (т), а во-вторых, здесь будет найдено решение для задачи, которую мы решим в последу¬ ющих параграфах при других условиях оптимальности. Тем самым образуется наглядный материал, показывающий влияние выбора минимизируемой интенсивности и [и] на характер получающегося оптимального управления и соответствующего ему оптимального движения х° (t). Пример 18.1. Рассмотрим задачу об управлении материальной точкой, движущейся в вертикальной плоскости под g действием реактивной силы и силы тяжести. Будем считать реактивную силу управляющим воздействием. Перепишем из § 3 (п.3°) уравнения движения нашей точки J&1 = Х2, *g = и^г )з = #4, g = Нд £. (18.12) Пусть = 0, g = 1. Начальное и конечное состояния фазового вектора х = {xj, х^ ха, Xj) выберем такими1): х* = {— l,0,0,0}, х& = {0, 0, 0, 0}. 2) Мы не обсуждаем масштабы рассматриваемых величин, поскольку пример носит иллюстративный характер. Аналогичное замечание следует иметь в виду всюду в дальнейшем,
§ 18] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 127 Мы будем минимизировать величину */2 х [и] = Ц [«* (Т) + и* (Т)] <frj , 1 CL пе вдаваясь в физический смысл этого условия. Функции h (т) — В' (т)Х среди которых надлежит здесь искать минимальную функцию Д0 (т), получим, если воспользуемся результатами из § 13 • (см. стр. 81), где было показано, что II • • • • т] • -V т] В (т) — .S' [т, •• 1 В (т) - и, следовательно, /2 (т) — 1Г [^, т] I = В' (т) 5 [т, *3] • I = /з -Т 1 О О О О < т 1 h — т) + /2 /з (Z3 — Т) + h Нам потребуется еще вектор с материалу из § 13, имеем: (15.2). В данном случае, снова согласно — т О О 1 О О и • поэтому 1 О О 0- 0 0 Г °- Г 1 "1 0 0 0 0 dr = (0-U2 1 0 S • 2 0 1 ~—g - - О 1 — т о о . Таким образом, задача (18.4), если учесть, что ta = 0, — 1, сводится здесь к проблеме: найти 1 (аР— min j {[/, (1 - т) + Z2]2 -h [/3 (1 - т) + /4]2} dr = «(Л-/2 2_Z2 + /S,4_|.Z2) = min (18.13)
СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. В» 128 нри /1 + — 3 з Д0 = 1. (18.14) Для определения этого минимума воспользуемся методом множителей Лагранжа (см. [23*], т. 1, § 212). В соответствии с этим методом составим выражение Г — у ’ ) /2 + Z1Z2 + /2 + —у Z + 00 + ^4 + 1 (/1 + Z3 + — 1)» дифференцируя которое частным образом последовательно по l2, Z3, и Z4, получим для определения величин систему линейных алгебраических уравнений 2 у к + Z‘2 + 1 — 0, к + 2/2 — О у к -ф к “Ъ — О» к + 2/4 + gK 0. Эта система вместе с условием (18.14) достаточна для вычисления неизвест¬ ных I® и %. Проделав необ¬ ходимые выкладки, найдем: ;0 _ Д0 _ _ 6 к -* + 12 ' к - g2 + 12, /о — о /0 £— z3 - Z4-g2 + 12' Следовательно, в данном случае ,л ч 1 Г6-12т-| (т)_ S2 +12 J П[(р°)2 =fo« [ft0 (t)] - l/(g2 + 12). Обращаясь теперь к равенству (18.9), получаем явный вид оптимального управления/ и°(*) = 4(0 4 (О "6— 12/ _ g (18.15) Если найденное выражение для функций и° (t) и и® (£) подставить в урав¬ нения (18.12) и проинтегрировать эти уравнения при начальном условии я? (0) — х<* — { — 1, 0, 0, 0}, то получим оптимальное движение х® (t) тра¬ ектория которого в плоскости (а/, х3) выглядит весьма просто (см. рис. 18.3, где изображены также векторы управления w° (i), соответствующие различ¬ ным точкам пути). Такой вид движения + (t) объясняется тем, что в данном случае роль управления и® (/), как это видно из (18.15), сводится просто к компенсации силы тяжести. Закончив рассмотрение этого примера, подчеркнем еще раз, что вся процедура, включая вычисление минимальной функции h° (т), была проделана лишь с той целью, чтобы на конкретном материале
§ 18] УПРАВЛЕНИЕ, С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 129 проиллюстрировать общие соображения, приведенные в настоя¬ щем параграфе. Разумеется, поскольку мы обладаем формулами (18.10), определяющими здесь оптимальное управление w° (0 в яв¬ ной замкнутой форме, проходить этот путь каждый раз при реше¬ нии конкретных задач излишне. Более того, задачу 4.2 об опти¬ мальном управлении при х [и] вида (18.1) вообще нецелесообразно решать описываемым нами путем, так как она весьма просто ре¬ шается* сразу, исходя из классических методов вариационного исчисления. Пользуясь этим обстоятельством,мы рассмотрим ее еще раз здесь для иллюстрации связи этих методов с проблемой мо¬ ментов. Итак, ■ опишем решение задачи (15.1), (18;1), рассматривая ее не как проблему моментов, а как изопериметрическую задачу ва¬ риационного исчисления (см. стр. 124). Ограничимся для простоты случаем, ' когда управляющее воздействие и (т) является^скаляр- ной функцией. Тогда в соответствии с материалом, приведенным выше (см. стр. 124), полагая в уравнениях (18.8) F = и2 (т), Gj = №> (т) и(т), найдем: м°(т) = — у 2 м0) (т)- Это значение и0 (т) подставим в равенства (15.1); тогда получим систему линейных неоднородных уравнений для вычисления вели¬ чин § , . . ., Ап: п ' 2 aS == 1,..., ft). ;=1 Отсюда следует: п ^3 = — д- S Diici, 1=1 и окончательно получаем, что п М°(Т) = 77 3 А3-сЛ°’(т). ъ=1 Здесь величины Лц, Dtj, D имеют тот же смысл, что и выше. Срав¬ нивая этот путь вычисления uQ (т) с тем путем, который привел к выражению (18.10), мы видим, что числа l] . суть не что иное, как множители Лагранжа kj, умноженные на величину — (р°)а/2. Итак, мы убедились, что задача 4.2, при условии минимума «энергии» управляющего воздействия, решается достаточно эффек¬ тивно. При этом вследствие гладкости величины х[и] и линейности 5 Н. Н. Красовский
130 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. G тех соотношений, которые возникают в процессе решения задачи, выполнение краевых условий х (£а) = ха, х (£р) = уже не доставляет новых трудностей и для вычисления и° (т) оказы¬ ваются достаточными те соотношения (18.8), которые вытекают из необходимых условий экстремальности, доставляемых класси¬ ческими теориями об условном экстремуме. Это отличает данную задачу и задачи, ей родственные, от других проблем оптимального управления, решение которых в замкнутой форме оказывается за¬ труднительным. Если такие задачи, рассматриваемые, например, в §§21, 23, трактовать как изопериметрическую задачу, то нельзя уже вос¬ пользоваться классическими необходимыми признаками экстре¬ мальности, выведенными для гладких функций. Однако не это об¬ стоятельство, преодолеваемое, во всяком случае для задачи § 21, за счет применения принципа максимума Л. С. Понтрягина [1791 или соответствующих модификаций классических методов вариа¬ ционного исчисления [1456], является главным мотивом для при¬ влечения соображений, связанных с проблемой моментов. Этот главный мотив состоит здесь в том, что в таких случаях только необходимые условия оптимальности не доставляют уже нужную информацию для решения краевой задачи, т. е. для выполнения ус¬ ловий X (ta) = X^, X (fy) = Завершая тему данного араграфа, рассмотрим еще некоторые задачи, близкие к уже изученной. Прежде всего, следует отметить, что к разобранной нами задаче сводится сразу же задача 4.2 при условии минимума величины х [и] = \ со [и] dr] , где со [и] = 2 Pij (т) иг (т) Uj (т) — произвольная определенно г, j=l положительная квадратичная форма. Чтобы убедиться в справед¬ ливости этого утверждения, достаточно выполнить линейную за¬ мену v = Р (t) и, при которой форма со [и] принимает каноничес- п кий вид || v (t) ||2 = 2 у? • Существование такого неособого линей- г=1 ного преобразования доказывается в теории квадратичных форм (см., например, [3*], стр. 241). Везде в этой монографии разбираются задачи об оптимальном управлении при условии минимума величины х [и], зависящей в явном виде только от управления и (t). Правда, мы. рассматриваем ниже еще и проблему предельного быстродействия, где требуется
§ 18] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 131 минимизировать не интенсивность х [и], но время Т = ip — t*, за которое управляемый объект приводится в заданное конечное состояние (при типичных ограничениях на интенсивность управ¬ ления). Однако, как будет показано в § 27, эта проблема также сводится к задаче на min х [и]. Но надо прямо сказать, что задачи о минимуме величины х [и] составляют лишь частный класс за¬ дач, содержащийся в значительно более широком круге проблем оптимального управления, в которых требуется минимизировать величины х [и (т), х (т) 1, зависящие явно и от управления и (т) и от самого движения х (т) (t* <; т<урр). Общее исследование таких задач выходит за рамки этой книги. Однако некоторые из подоб¬ ных задач можно в конечном счете свести к проблемам, которые ре¬ шаются рассматриваемыми нами методами. Это сведение достигает¬ ся либо преобразованием исходной задачи к задаче вида 13.1, либо в процессе преобразований приходят к проблеме моментов, кото¬ рая составляет фундамент решения задачи 13.1. Тогда, начиная с этого этапа, решение исходной проблемы . следует по уже извест¬ ному руслу. Продемонстрируем сейчас высказанные соображения на примере одной задачи, родственной проблеме о минимуме ин¬ тенсивности х [и] (18.1). Пусть объект, описываемый уравнением х = A (t) х -|- b (t) и, (18.16) требуется перевести из заданного положения х (1Л) = х* в состоя¬ ние покоя х (£р) = 0, причем управляющее воздействие и (t) долж¬ но быть выбрано так, чтобы величина 1[и(х), ®(т)] = $ [|| и (х) ||2 + ||а: (т)||2] dx (18.17) была наименьшей из возможных. (Мы ограничиваемся случаем, когда управление и (t) является скалярной функцией лишь для упрощения выкладок.) Сформулированную задачу также можно трактовать как проб¬ лему оптимального управления при условии минимума «энергии» I [и, х] (18.17). Оправданием для этого термина могут послужить задачи об успокоении электромеханических систем, в которых не¬ желательными являются не только большие энергетические затра¬ ты в цепях управления, но и большие энергетические затраты в силовых цепях. В дальнейшем будем считать, что требуется мини¬ мизировать не величину I [и (т), х (т)] (18.17), а величину х = (Ли (т), х (т)1),/г. (18.18) Это удобнее. Приступим к решению задачи. Предварительно для Упрощения рассуждений трансформируем, ее, заменив течение 5*
132 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 времени на обратное, т. е. положив t' = — t. Тогда придем к зада¬ че о переводе объекта из состояния равновесия х (ta) = 0 в задан¬ ное положение х (fy). Однако, чтобы не вводить новых обозначе¬ ний и не проделывать неинтересных преобразований, предположим, что с самого начала имеем задачу о переводе системы (18.16) из положения х (£а) = 0 в положение х (£р) = ,, и при этом должна минимизироваться величина I [и, х] (18.17). Опираясь на форму¬ лу Коши для движения х (£), которая вследствие х ((«) = 0 прини¬ мает вид t x{t) = § X [/, т] 6(т) и (r)d't, сведем исходную задачу к проблеме минимума величины '3 II Т II 1/2 х]«] = | [|и(т)|2 + 1| $ X [т, ’’О] Ъ (О) и (О) сКПМйт} = min *Я *Я U (18.19) при условиях 4 = j h(i} (t) и (т) dx, (18.20) где символы № (т), как обычно, обозначают элементы hW [tp, т] импульсной переходной вектор-функции Н [£р, т] = X [£р,т]6 (т). Наша ближайшая цель — истолковать величину х [zzl как норму р* [и] функции и (т) в некотором подходящем функцио¬ нальном пространстве S3* {и (т); ,, , т , tp} и таким путем попы¬ таться свести задачу (18.19), (18.20) к проблеме моментов вида (15.1), (15.3). Оказывается, что такая цель достижима. Покажем это. Преобразуем сначала интеграл 'З у m у 2 5 К X [т fl] b {fl) и (f}) dfl ,, d- (18.21) для чего выпишем его в следующей форме: ш * 2 s К 'я 'я 1я i—I б]и (O') u (s) d&ds I dx. Если теперь поменять порядок интегрирования в этом тройном
§ 18] УПРАВЛЕНИЕ С, МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 133 интеграле, то величина (18.21) запишется так: *3 п г _ J 2 И ) h(i) [О, б] h{i} [0, т] и (б) dftds + f, i=l (а ~ *3 *3 + $ $ А'?) [ф, б] А”') [0, t] т о и (б) d$ do] и (т) dx. Договоримся о следующем обозначении: К(т, б) = «3 п 3 ^<г) [0, ° А(1) [ 0 , т] d& т i=1 ' *3 п j 3 А<1) [0, ° А<1) ] 0 , Ч d® при ТА>б, при Т<б Можно непосредственно убедиться в том, что функция К (т, о) является непрерывной по совокупности переменных, и, кроме то¬ го, симметричной, т. е. К (т, о) = К (о, т). Функция К (т, о) представляет собой неотрицательное ядро ([18*], стр. 100). По¬ следнее означает, что для любой функции и (0), принадлежащей (3 (3 пространству S32) [ta, А1, интеграл j j К(д, т) и (ft) и (т) d$ dx (а ta неотрицателен. С учетом проделанных преобразований, интенсив¬ ность х [и] (18.19) можно теперь выразить следующим образом: «3 *3 (з Х[п] = Н j К(Ч ф) и (т) и (ft) dxd0 + и2 (0)d0| \ (18.22) Положим, что в качестве пространства S3* {и (т)} выбрано мно¬ жество {и (т)} функций и (т) с интегрируемым квадратом, однако, норму р* [и] функции и (т) определим теперь не интегралом (18.1), а равенством р* [и] = х [и], где х [и] выражается форму¬ лой (18.22). Таким образом, мы получим некоторое новое простран¬ ство, которое будем обозначать символом №{и (т); ta j т j Этим новым пространством 3£ {и (т); Ч т является гильбертово пространство (см. Приложение, § 56, стр. 421) со скалярным произведением (uj (Z), и2 (t)) функций j (t) и и2 (t), за¬ данным в виде <3 «3 '3 (ut, и2) = . . К(х, fttu}(x)u2(()dxdft +$ и (т) и2 (т) dx. (18,23)
134 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Скалярное произведение указанного вида изучено кратко в § 56 (см. стр. 421). В частности, там показано, что выражение (zzn и2) (18.23), действительно, может служить скалярным произведением и что, следовательно, величина р* [zz] = х [zz] (18.22), обладает всеми свойствами нормы. Итак, мы нашли подходящее пространст¬ во 53* = Ж{и(т)}, в котором норма функции и (т) равна рассмат¬ риваемой интенсивности х [zz] (18.22). Теперь нам надлежит еще убедиться, что это пространство является сопряженным к некото¬ рому пространству 33{h}, и найти норму р [h] в этом пространстве. Однако пространство Ж {zz (т)}, будучи гильбертовым, является самосопряженным ([14*], стр. 198; см. также §59, стр. 435). Иными словами, соответствующее пространству Ж {и (т)} пространство 53 {h (т)} есть сновв^в {/z (t)}. Но тогда оказывается, что функцию и (т) можно трактовать как элемент пространства Ж {zz (т)}, опре¬ деляющий линейную операцию <pu [h (т)] над элементами h (т) из Ж {^ (т)}- Для того чтобы окончательно свести нашу задачу к проб¬ леме моментов, осталось еще истолковать левые части соотноше¬ ния (18.20) как результаты линейных операций на некоторых эле¬ ментах h (т) из Ж- Здесь возникает одно неудобство, вызванное тем, что интеграл вида 4 . J h (т) и (т) dx (18.24) 4 не определяет уже линейную операцию Фи [fz] над элементами h (т) из Ж, как это было раньше для пространств, сведенных в таб¬ лицу 12.1.Общий вид такой операции Фи [h (т)] для h (т) из Ж {К (т)}, как пояснено в Приложении (см. § 59, стр. 435), определяется как раз скалярным произведением функций h (т) и и (т), т. е. составлен¬ ным согласно (18.23) выражением 4 4 4 (h (t), и (т)) = § Ж h (^ ft) h (т) и (#) dx + Ж h (т) и (т) dx. . (18.25) 4 4 4 Постараемся поэтому преобразовать интеграл (18.24) так, чтобы его можно было представить в качестве нужного скалярного про¬ изведения. Составим интегральное уравнение 4 $ К(т ■)/>(<>)+ р(т) = л(т). (18.26) Уравнение (18.26) имеет решение при .любой функции h (ф) из пространства и это решение единственное. Указанный
УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 135 § 181 факт можно пояснить, опираясь на известную в теории интеграль¬ ных уравнений альтернативу Фредгольма ([18*], стр. 19). Соглас¬ но этой альтернативе либо неоднородное уравнение (18.26) имеет решение при любой функции h (т) из и это решение единственное, либо же соответствующее ему однородное уравне¬ ние, полученное при h (т) = 0, ■ имеет решение, не равное тождест¬ венно нулю. Покажем, что последнего обстоятельства в нашем случае быть не может. В самом деле, предположим, что существует функция рй (т), удовлетворяющая уравнению 'з § К (г, ■&) р° (О)df + р° (т) = о 'а и р0 (т) 0. Умножая тогда обе части последнего равенства на ро (т), а затем интегрируя его по т, находим, что • *3 ‘о *3 $ $ к f т) Р° f р0 (т) d$ dx 4- § р2 (?) dx = °. С (<х Ввиду неотрицательности ядра К (О', т), последнее равенство не¬ возможно, так как его левая часть положительна, а правая равна нулю. Таким образом, второй случай альтернативы Фредгольма для уравнения (18.26) • отпадает. Указанное уравнение имеет, следовательно, решение и притом единственное. Решение р (т) уравнения (18.26) можно при этом рассматривать как элемент про¬ странства • . Подставляя h (О) из (18.26) в интеграл (18.24), най¬ дем, что <з h (О) и (О) = ‘ а (3 (3 13 = S $ К (^ •б) р (т) 11 dti dx + $ р (й) и W dft = (р (т), и (?)■ *а (а (а Отсюда видно, что интеграл (18.24) определяет линейную опера¬ цию <ри, производимую функцией и, но не над элементом h (т), а над элементом р (т). Подставляя поочередно функции № (т) в правую часть уравнения (18.26), найдем, что каждой функции ^(г) (т) будет однозначно отвечать некоторая функция p(i) (т) — решение уравнения (18.26). Суммируя сказанное, окончательно получим, что исходную задачу (18.19), (18.20) можно сформулировать теперь так: найти операцию сри [р» (т)], производимую функцией и (т) из Ж{и (г)}
136 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 1Гл. в над элементами р■ ■■ (т) из Ж {р (т)}, удовлетворяющую условиям 1р(0 (т)1 = (P(i) и (С)) = Ci (t = 1> • • ■■ п) и такую, что р* [и] = (I [и, ж])’/з -= х [и] = min. и Но сформулированная задача как раз является проблемой момен¬ тов в пространстве Р{ р (т)}. Таким образом, наша цель достигнута. Само решение задачи может быть получено по правилам, которые даются теоремой 16.1 и принципом максимума. При этом согласно теореме 16.1 задача разрешима тогда и только тогда, когда р° = р [р° (х) ] = min (1р (т), Гр (т)) >0 при Гс = 1. Можно показать, между прочим, что последнее условие будет выполняться во всех тех случаях, когда для задачи (18.4) ' min Ф (Zn - . ., 1п) >0 при Гс = 1. Отсюда выводится, что задача (18.19), (18.20) разрешима тогда и только тогда, когда разрешима задача (13.1) при условии мини¬ мума и [и] вида (18.1). Пр имечание 18.1. Мы рассмотрели самый простой случай, когда х* = 0. Однако описанную выше процедуру решения задачи 4.2 с интен¬ сивностью (18.17) можно использовать также при хл =f= 0 и х? =/= 0. В са¬ мом деле, повторяя для этого случая изложенные выше выкладки и вводя в них соответствующие изменения, находим: ip «з <3 Х2[“]= *)»(T)w(O)<fcrdfr+ р u»(O)rfO+ / (О) и *а ^<х Здесь ^3 п п /Ф) =$ 3 2 a i=i j=i ^3 п п М 2 i* i=i j-i Иными словами, имеем выражение вида х2 [и] = (и, и) + (g, и) + (18.27)
§ 18] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 137 где символ («г, u2) означает по-прежнему скалярное произведение (18.23), а функция £ (т) является решением интегрального уравнения <3 J ДГ.ткОО^ + 5(т) = /(т). 4 Далее выражение для х [и] приводим к виду *’[«] = (и + (18.28) Таким образом, мы имеем теперь задачу о минимуме (18.28) при условии 4 A(i (t) u W ст. 4 '(18.29) Числа вычислены здесь, как обычно, по формуле (15.2). Нетрудно, однако, заметить, что искомый минимум по и величины х2 [и] будет достигаться на той же самой функции и0 (т), что и минимум выражения р2 (и+ ±£1 = •(«-!- 1 g u+ JL), 4-1 Zl £ при условиях (18.29). Последнее объясняется тем, что ни функция £(т), ни число X от выбора «о (т) не зависят. Но тогда, совершая замену и + — £ — = v, приходим к следующей задаче: найти минимум х [ у]=( v, v- при условии d. = г *3 Мг) (т) v (т) dr, где 1 <3 di = ci ’г ~2< TW °^’T' 4 Указанная задача полностью совпадает с уже решенной выше задачей (18. 19), (18.20). В заключение параграфа заметим следующее. Мы не ставим своей целью обзор всех задач, приводимых так или иначе к исследованию тем мето¬ дом, который развит в этой книге. Наша цель — познакомить читателя с существом этого метода, который, естественно, можно развивать в различных направлениях. Следует также иметь в виду, что осуществление удачного преобразования задачи к удобной проблеме в большой мере зависит от на¬ ходчивости исследователя. Ограничимся здесь одним только что разобранным примером такого рода. Подобные примеры можно было бы привести и в сле¬ дующих параграфах, где разбираются задачи об оптимальном управлении при условии минимума других типичных интенсивностей х [и], однако вряд ли это целесообразно. Читатель, разобравшийся в сути дела, всегда может сконструировать желаемое число таких задач. В качестве упражнения можно рекомендовать решить задачи из этого параграфа, опираясь на правило минимакса 47.1.
138 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 § 19. Управляемость линейных систем с постоянными параметрами В предыдущем параграфе мы начали изучение задачи 13.1 об оптимальном управлении для основных типичных видов интенсив¬ ности х [и] и рассмотрели первый такой случай (18.1). Теперь, прежде чем переходить к другим случаям, удобно сначала обсу¬ дить условия существования решения задачи 4.1 об управлении, так как эти условия понадобятся нам ■ в дальнейшем. Из материа¬ ла § 17 следует, что задача об управлении 4.1, равно как и задача 13.1 об оптимальном управлении разрешимы при данных краевых условиях х* и [ тогда и только тогда, когда выполняется нера¬ венство р [Д°] = р° > 0 (см. теорему 17.1). А это означает, что зада¬ ча 4.1 имеет решение при любых краевых условиях х* и х® тогда и только тогда, когда строки h' ' , (т) импульсной переходной матри¬ цы Н [Zp, т] системы линейно независимы. С этим обстоятельством мы уже встречались в I части книги (см. § 9) и в § 16. Однако такой критерий существования решения задачи неудобен. Чтобы им пользоваться, необходимо вычислять импульсную переходную матрицу рассматриваемого управляемого объекта. Между тем су¬ ждение о существовании решения желательно иметь, опираясь лишь на исходные данные задачи. Поэтому теперь мы выведем эффективные условия, позволяющие судить о существовании ре¬ шения проблемы по элементам матриц A (t) и В (t), не вычисляя матрицу Н [£р, т]. Вывод этих условий и составляет предмет на¬ стоящего и следующего параграфов. Дадим сначала следующее определение. Определение 19.1. Система Х (19.1) называется вполне управляемой на отрезке времени [£«, Z₽], если для этой системы может быть решена задача 4.1 об управлении, каковы бы ни были краевые условия х (О = ха, х (t₽) = х&. Иначе говоря, вполне управляемая на отрезке [Za, Z, ] систе¬ ма — это система, которая может быть переведена за время /р — Za из любого заданного состояния х (ta) = ха в любое другое заданное состояние х (t$) = х& подходящим выбором возможного управле¬ ния и (t). Наша ближайшая цель — установить критерий полной управ¬ ляемости линейной системы (19.1). В этом параграфе мы ограни¬ чимся случаем, когда матрицы А и В являются постоянными. При¬ мем следующий план изложения. Сначала дадим необходимые вспомогательные предложения, а затем докажем две теоремы, в которых сформулируем основные результаты.
§ 19] УПРАВЛЯЕМОСТЬ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 139 Итак, предположим, что элементы матриц А и В являются по¬ стоянными, и рассмотрим матрицу К = {В, АВ, . . Ап~1В}, (19.2) которая сыграет важную роль в дальнейшем изложении. Эта мат¬ рица имеет п строк и п-r столбцов. В частном случае, когда и —■ скаляр и, следовательно, В есть n-мерный вектор Ь, К будет квад¬ ратной (п X ^-матрицей. В дальнейшем столбцы матрицы К бу¬ дем рассматривать как некоторые n-мерные векторы и будем обоз¬ начать их символами кт (j = 1, ..., nr). Пусть ранг матрицы К равен т (т М п). Тогда среди векторов АМ можно выделить точ¬ но т линейно независимых (см. [3*], стр. 52). Лемма 19.1. Если ранг матрицы К (19.2) равен т, то т ее линейно независимых столбцов содержатся в матрице Кт = {В, АВ, . . ., А”*В}, (19.3) и любой столбец матрицы ASB линейно) выражается через столбцы матрицы Кт, каково бы ни было число s < т. Доказательству. Рассмотрим последовательность век¬ торов Ь(», АЬ®, . . ., An~lb(j), (19.4) где №) — /-й столбец матрицы В (J = 1, . . ., г). Пусть среди этих векторов имеется точно mj (mj < т) линейно независимых. Пока¬ жем, что линейно независимыми будут обязательно первые mj векторов М >, АЬ<т>, . . ., АттгтК Для этого рассмотрим последо¬ вательности Ь<?\ А№, . . ., Ai_1W (i = 1, . . ., п). Пусть при i < Hj эти последовательности состоят из линейно независимых векторов, а при i > м векторы АгЬт оказываются уже линейно зависимыми. При этом по предположению nj < mj. Может пред¬ ставиться два случая: во-первых, nj = mj и, во-вторых, nj < mj. В первом случае наше утверждение о линейной независимости пер¬ вых ' mj векторов (19.4) оказывается справедливым. Покажем теперь, что второй случай невозможен. В самом деле, при м М mj справедливы соотношения: nj Anib{jj = 3 i=l nj nj Ani+ib(j> = 2 ^а1ь® = 2 vrnA'-bm, i =1 i =1 An-ib(» = 2 V”'1’ » i=l
140 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 т. е векторы АпЩА,. . ., Ап 1 ggg являются линейной комбина¬ цией п, первых векторов 60), А№\ . . ., Ап^Ь^>, а это противо¬ речит предположению о том, что среди векторов (19.4) есть т, линейно независимых. Итак, действительно, второй случай невоз¬ можен. Следовательно, наше утверждение о линейной независимо¬ сти первых т, векторов bj Ab{3\ . . АтГ)и) из совокупности (19.4) доказано. Поэтому любой столбец матрицы АаВ при всех s < т является линейной комбинацией столбцов матрицы Кт (19.3), что и доказывает справедливость леммы. Предположим теперь, что ранг матрицы К (19.2) равен т (/7г g п), и обозначим какие-нибудь т линейно независимых век¬ торов этой матрицы К символами ДШ = {Д[Д}, /Л2! = {/J?1} , . . . . . ., ЛМ = Обозначим через gn векторное подпространство, порожденное этими векторами в п-мерном пространстве ААп. Как мы увидим ниже, подпространство gn играет основную роль при изучении свойства управляемости системы (19.1). Изу¬ чим поэтому некоторые важные для нас свойства паяного подпро¬ странства. Лемма 19.2. Подпространство Жт, порожденное векторами ДОП, /Л2!, . . ., ДО"!, образует инвариантное подпространство си¬ стемы (19.1), т. е. фаговый вектор х (t) этой системы остает¬ ся в СКт, если в начальный момент он лежал в этом подпро¬ странстве. Иначе говоря, любое движение {xt (t)} системы (19.1) с началь¬ ными условиями {xt (£«)}, удовлетворяющими равенству т ММ = 2 k’fcF1 (i = 1> . . .,п), (19.5) 7=1 при всех t имеет вид т м(О = 2 МО) № О = 1» •••> п)- (19.б) j=i Доказательство. Проверку утверждения леммы до¬ статочно провести лишь для т < п, так как при т = п подпрост¬ ранство g‘m просто совпадает совсем пространством )п , которому принадлежит вектор х (2). Запишем закон движения системы (19.1) по формууе Коши g 5.6): t x{t) = X К, £а] х (Za) + J X К, т] Ви (т) dx. (19.7)
§ 191 УПРАВЛЯЕМОСТЬ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 141 Известно ([3*], стр 373), что фундаментальная матрица X 17, М системы (19.1), имеющей постоянную матрицу Л, может быть пред¬ ставлена в виде матричного ряда (см. также стр. 39) X н, <«] — еА('' = Е + (t - £а) Л + • • • + Л As { ■■■, (19.8) сходящегося при всех t. Пусть векторы кМ — столбцы матрицы АаВ, так • что ASB = {/№,, . ., На основании леммы 19.1 имеем: № = vfW’1 + ... + У,(^[т] . (19.9) Учитывая (19.5), (19.8), .(19.9), запишем равенство (19.7) в следующем виде: т °°/\S t со г "й = 2 12 ; + йз ■ ' 3 , j=l Ls=o J t L s=O i=l 'a. m co ( \4 = 2(3^^л; + j=l 1 s=0 t co r m + \ [ 3 3 v?’»< (cl . *и=3 к <« s=° i=l J ' Последнее соотношение доказывает лемму. Теперь мы выполним одно линейное неособое преобразование х = Ту, (19.10) которое в связи с инвариантностью подпространства Жт облегчит исследование свойства управляемости системы (19.1). Матрицу преобразования Т = { — - } определим следующим образом: в качест¬ ве первых т столбцов -- - - = {dtj} (i = 1, . . ., т) этой матрицы возьмем линейно независимые векторы ДО1, . . ., Д[т] — столбцы матрицы К (19.2), а в качестве остальных (п — т) столбцов d^ (Z = т -{- 1, . . ., п) возьмем какие-либо векторы -- - (j = т + + 1, . . . , п), подчиненные лишь тому условию, чтобы все векторы - ( - - (Z = 1, . . ., п) оказались линейно независимыми. Если ранг матрицы К равен т < п, то такой выбор векторов dM может быть сделан бесчисленным множеством способов, если т = п, то матрица Т единственна. В новых переменных система (19.1) запишется так: у = Ру + Qu, (19.11) где Р = T-'AT, Q = Т-гВ.
142 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. в Справедливо следующее утверждение. Лем м' а 19.3. Матрицы Р и Q имеют вид Q = Qi о 1 где Р. — (т X т)-матрица, Р2 — т X (п — т)-матрица, Р3 — — (п — т) X (п — т)-матрица, Qx — (т X г)-матрица. При этом ранг матрицы N = {Qi, Р&, ■ Р'Ц} равен т. Доказательство. Докажем сначала первое утвержде¬ ние леммы. Заметим, прежде всего, что в новых переменных yt гиперплоскость У . = 0. ...,?/= О Jm+l ’ ’ (19.12) есть не что иное, как подпространство Жт. В самом деле, по выбору преобразования (19.10) для вектора у с координатами {z/1, . . ., ут, 0, . . ., 0} имеем как раз x = кыу1 + ■ ■ ■ + к™ут, где '—базисные векторы 'т . Согласно лемме 19.2 подпростран¬ ство 'т, а, следовательно, и гиперплоскость (19.12), есть инвариан¬ тное подпространство системы (19.11). Поэтому, если все yt (£0)=О» (Z>m-|-1), то при tft>tQ движение у (t) должно удовлетворять ра¬ венству у. (t) = 0 для всех i т -|- 1. Если, однако, вопреки лемме 19.3, принять, что либо рц == 0, либо qis == 0 при неко¬ торых i т + 1; у’ < т 4-1; s = 1, . . ., г, то можно было бы подобрать такое управление и (t) и построить такое частное реше¬ ние {у\ (t)} (i = 1, . . ., п) уравнения (19.11) с начальным услови¬ ем у\ (Za) = 0 (Z = т -|- 1, . . ., п), для которого в некоторый мо¬ мент t =f= ta выполнялось бы неравенство yos (t) =f= 0 при s >тп. Полученное противоречие доказывает справедливость первого ут¬ верждения леммы. Докажем теперь второе утверждение леммы. Для этого рас¬ смотрим матрицу Kft = {Q,PQ. .. PQ = = {Т~В, Т-'АТТ-'В, . . ., (Т-АТУТВ} = Т-'К. Как следует из доказанного уже первого утверждения настоящей
§ 1»] УПРАВЛЯЕМОСТЬ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 143 леммы, матрица К 1 1 1 имеет вид Kw = Qi, P1Q1, О, О, P™-Qi pVQi I . . . , О, . . о II Так как Т — неособая матрица, то ранг матрицы К К должен сов¬ падать с рангом матрицы.^ ([3*], стр. 60) и, следовательно, он дол¬ жен быть равен т. В. силу леммы 19.1 т линейно независимых столбцов этой матрицы содержатся в матрице K~(Q,PQ.. , Pm~ (?) = Qi, РiQii 0, о- , Следовательно, ранг матрицы N также равен т, так как первые т строк матрицы совпадают со строками матрицы 7V, а элементы остальных (п—т) строк суть нули. Лемма полностью доказана. Итак, мы видим, что преобразованием ' (19.10) система (19.1) при¬ водится к двум системам: yi — pi? 21 + + р1тУт Pi^m+1 Ут+1 + • • • + pinyn + + Vii «I + . . . + $4 (j = 1,. К 1. т), К ^ЛЗ) Уг = Pi'm+lJ/rn+l + • • • + РыУп (г = ГО + 1, . .. п), (19.14) причем управление и (£) не оказывает влияния на поведение пе¬ ременных z'j (t) при i >m. Перейдем теперь к обсуждению эффективных условий управля¬ емости системы (19.1). Согласно теореме 17.1, для того чтобы зада¬ ча 4.1 об управлении имела решение, необходимо и достаточно, что¬ бы выполнялось условие п п p° = minp[3 >0 при 2 Це1 = 1 ("Лб) 1 г=1 г=1 где вектор с определен равенством (15.2), т. е. в нашем случае С = Х1 — Х [/р, Za] X*. (19.16) п Выражение /г (т) = 2 (т) в (19.15) составлено из не- г=1 прерывных функций №1(т) (Za К т К t$). Поэтому норма р [h (т)1 и, следовательно, величина р° может обратиться в нуль лишь в том случае, если существуют такие числа К (i = 1, . . ., п), для кото¬ рых справедливо соотношение S 1 (т) = 0 при 3Кс = 1 г=1 Г=1
144 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 (19.17) или, в матричной форме, (I0)' Н [Zp, т] = 0 при (Z°' c = 1. (Мы не оговариваем здесь конкретный выбор нормы р. Для опре¬ деленности читатель может полагать, например, что величина р определена равенством (18.1).) Нам потребуется теперь еще одно вспомогательное предло¬ жение. Лемма 19.4. Тождество (19.17) выполняется тогда и только тогда, когда вектор с (19.16) не принадлежит подпространству Жт. (Напомним, что вектор с мы условились считать ненулевым.) Доказательство. Докажем сначала необходимость ут¬ верждения леммы. Для этого предположим от противного, что имеет место равенство (19.17) и ненулевой вектор с (19.16) при¬ надлежит 'т' Продифференцировав равенство (19.17) по т (п — 1) ’ X [Zp, т] В (см. § 6) и ~ , получим систему раз и учитывая, что Н [Zp, т] = dX- [Zp, x]/dx = — тождеств: X' [Zp, т] А (см. § 10) (Г°'Х [Z₽, т] В =0, (//^to. т] АВ =0, (Z0)' X to, т] А"’1 В = 0. В частности при т — Zp будем иметь: (Z®)' В - 0, (Z0)' АВ = 0, . . ., (Z®)' Ап~В = 0. Из этих соотношений вытекает, что ненулевой вектор Z® ортогона¬ лен ко всем векторам ' подпространства ,т, и, в частности, он ортогонален вектору с, который по предположению содержится в Жт, т. е. (Z®)' с — 0. Однако последнее противоречит условию (Z0°'c = 1. Полученное противоречие и доказывает необходимость условий леммы. i Докажем теперь достаточность леммы 19.4. Пусть ненулевой вектор с не содержится в пространстве, порожденном векторами /сО) — столбцами матрицы К (19.2). Поскольку с есть п-мерный вектор, то ранг матрицы К будет равен т, где т < п. Но тогда найдется ненулевой вектор Z0, удовлетворяющий условию (Z’/c = = 1 и ортогональный ко всем векторам к&, т. е. найдется вектор /0, удовлетворяющий условиям (l0)' ASB = 0. (19.18) При этом в силу леммы 19.1 соотношение (19.18) будет выполнять¬ ся при всех s. Рассмотрим теперь вектор-функцию £ (т) =
5 ‘9] УПРАВЛЯЕМОСТЬ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 145 ?=(layHltp,i;] = (Z0)' X Rp, т] В. Вычислим производные функции £ (т) при т = tp. Имеем: = <1УА‘В- (19.19) \ ат / т=<р Из соотношений (19.18) и (19.19) вытекает, что все производные функции £ (т) в точке т = tp равны нулю. Но из разложения (19.8) следует, что £ (т) является аналитической .функцией т. Из¬ вестно ([И*], стр. 73), что аналитическая функция, все произ¬ водные которой в какой-либо одной точке — нули,. тождественно равна нулю при всех значениях ее аргумента, т. е. £ (т) = = (/о)' Н Rp, т] = 0. Последнее и доказывает достаточность ус¬ ловий леммы 19.4. Итак, данная лемма полностью доказана. Сфор¬ мулируем теперь основной критерий управляемости. Теорема.19.1. Для того чтобы система, описываемая урав¬ нением (19.1), была вполне управляемой на отрезке Ra, Zp], необ¬ ходимо и достаточно, чтобы ранг матрицы К (19.2) был равен п. Доказательство. Меняя произвольным образом кра¬ евые условия х* и х&, мы будем получать всевозможные п-мерные векторы с (19.16), причем для любого вектора с всегда можно по¬ добрать подходящие значения х* и зР. Согласно теореме 17.1 си¬ стема (19.1) вполне управляема тогда и только тогда, когда для любого вектора с (19.16) выполняется условие (19.15). Однако из леммы 19.4 следует, что для выполнения условия (19.15) необходи¬ мо и достаточно, чтобы вектор с содержался в подпространстве ЗСт, порожденном столбцами матрицы Aj£(19.2). Отсюда и следует справедливость теоремы 19.1. В частном случае, когда и — скаляр и, следовательно, В — вектор Ъ, из теоремы 19.1 следует, что система] (19.1) вполне управляема тогда и только тогда, когда векторы Ъ, АЬ, . . ., линейно независимы. Заметим еще следующее. Если система (19.1) вполне управляе¬ мая, то задача 4.1 имеет решение при любых х* и х? и для системы х — Ах + Ви + w (1^), (19.20) подверженной воздействию w (Z). Проверка этого обстоятельства не должна вызывать затруднения у читателя, разобравшегося в предыдущем материале, и мы здесь ее опустим. Итак, для разре¬ шимости задачи 4.1 (а следовательно, и задачи 4.2) при любых х* и х& необходимо и достаточно, чтобы ранг матрицы К был равен п. Если от системы (19.20) мы перейдем к системе (6.11), где до¬ пускаются обобщенные управления dU (Z), то тем самым класс воз¬ можных управлений лишь расширится. Следовательно, линейная система, вполне управляемая в классе воздействий и (Z), являет¬
146 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 ся таковой и в классе управлений dU (t). Важно, однако, что спра¬ ведливо и обратное заключение. Иначе говоря, расширение клас¬ са управлений до обобщенных воздействий dU(t), включающих мгновенные импульсные усилия, не расширяет условий полной управляемости: если ранг матрицы К меньше, чем тг, то система (6.11) не может оказаться вполне управляемой за счет обобщенных управлений dU (Z). Это будет показано в § 23 при изучении соот¬ ветствующей задачи об оптимальном управлении.. Полезно за¬ метить, что указанная независимость свойства управляемости от класса допускаемых управлений есть важное свойство конечномер¬ ных управляемых систем. В более общем случае бесконечномерных управляемых систем аналогичное свойство не установлено. В заключение параграфа обсудим случаи, когда нет полной управляемости. Тогда полезно ввести следующее определение. Будем говорить, что система (19.1) управляема в некотором под¬ пространстве •' , , если для этой системы может быть решена зада¬ ча 4.1 об управлении, каковы бы ни были векторы т* и • из этого подп рост ранства. Из леммы 19.4 вытекает, что система (19.1) управляема в под¬ пространстве Жк тогда и только тогда, когда это подпространство содержится в Жт. В самом деле, если векторы та и т& содержатся в — m , то и вектор с (19.16) содержится в Ж, , ибо он есть разность векторов т& из Жт и X Ир, f«l т* из Жт. (Вектор X [Zp, содер¬ жится в Жт по лемме 19.2, так как это есть фазовый вектор т (Zp) системы (19.1) при и (t) = 0.) Напротив, если в Жк есть ненулевой вектор т0, не лежащий в Жт, то, выбирая Ж = тР и т^а = 0 и повто¬ ряя рассуждения из доказательства теоремы 19.1, подберем такой вектор Z, для которого I'с = 1'Т = 1 п р° [h (т)) = 0. А это будет значить, что задача 4.1 для таких краевых условий и т? реше¬ ния не имеет. Подпространство Ж ГЛ будем называть поэтому под¬ пространством управляемости системы (19.1). Наконец, отметим еще, что из сказанного вытекает полная управляемость системы У = + • • • + Ри^т + <$>В .1 + + CK (19.21) (г = 1, . . . , т). В конкретных примерах, когда ранг матрицы К меньше п, для выяснения свойств управляемости удобно привести систему (19.1) при помощи преобразования (19.10) к виду (19.11). Тогда согласно всем предыдущим рассуждениям система (19.11) управля¬ ема при краевых условиях ya и уР следующего вида: У* = • • -,У^ 0,. . -,0} и уЗ = {у₽, . . ., г/, 0, . . ., 0}, каковы бы ни были у* и yj (j , т).
§ !9J УПРАВЛЯЕМОСТЬ СИСТЕМ С ПОСТОЯННЫМИ ПАРАМЕТРАМИ 147 Пример 19.1. Рассмотрим систему (14.13) из примера 14.1. Запишем матрицы А и В: 0 1 0 0 0 Г0 — 10 1 , в = -т=- 0 1Й ‘ 2г0 ООО 0 Гй Составим теперь матрицу К = (В, ЛВ, Л’-В) = 0 0 Го /Й 0 0 го 0 0 2 7' о га /й ” /й 2го 0 0 Гй 0 0 2гэ /й 0 0 Первые три столбца этой матрицы линейно независимы, а последние три столбца являются линейной комбинацией первого и третьего столбцов. По¬ этому ранг матрицы К равен 3, и, следовательно, система (14.13) вполне управ¬ ляема. Точно так же можно проверить, что вполне управляема и систе¬ ма (3.7), так как в этом случае ранг матрицы К (19.2) равен 6. Проверку этого громоздкого условия мы предоставим читателю. В заключение данного параграфа отметим еще связь понятия полной управляемости линейной системы, изученного в этом па¬ раграфе, со свойством инвариантности координат этой системы. Общая теория инвариантности регулируемых систем имеет бога¬ тую библиографию, к которой и отсылаем интересующегося чи¬ тателя (см., например, [1226, 127, 171а, 1916]). Здесь же мы огра¬ ничимся лишь беглым замечанием по частному вопросу. Координата у() = р'х (t) системы (19.11) называется инва¬ риантной по воздействию , , если это воздействие не оказывает влияния на данную координату. Отсюда нетрудно вывести, что свойство инвариантности является в известном смысле свойством, обратным свойству управляемости. Обсудим этот факт. Пусть в системе (19.11) все воздействия ut (£), кроме выделенного воздейст¬ вия Uj (t), суть тождественные нули. , Тогда для координаты yi(t) имеем по формуле Коши: t yi(i) = р'Х [f <о] я0 + 5 P'h [£ t]j Uj (т) (hr to где h [£, т], = X И, т] ,, — импульсная переходная функция системы (19.1) по воздействию и7-, №> — /-й столбец матрицы В.
148 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Но для того чтобы воздействие Uj (т) не влияло на yi(t), необхо¬ димо и достаточно, очевидно, чтобы выполнялось тождество p'h И, т]7- = 0 при t0 • т <3. (19.22) В свою очередь для выполнения условия (19.15) необходимо и достаточно, чтобы выполнялись равенства pb{}) = 0, p'Ab(j = 0,. . ., р'Ап~Ь{» = 0, (19.23) которые выводятся дифференцированием по т тождества (19.22) подобно тому, как это делалось выше, на стр. 144, в аналогичных ситуациях. Отсюда вытекает, что система х — Ах + b^ij , может обладать координатами y.=p'x, инвариантными по воз¬ действию Uj тогда и только тогда, когда эта система не является вполне управляемой, ибо в противном случае векторы • • •, А№,. . . . . . , Ап~Ъ'д, как мы знаем, были бы линейно независимы и не существовало бы вектора р, который удовлетворяет условиям (19.23). При этом мы видим также, что инвариантными координа¬ тами будут те и только те координаты уг = р'х, которые определе¬ ны векторами р, ортогональными к подпространству управляемо¬ сти системы (19.1). § 20. Управляемость нестационарных систем Теперь мы дадим достаточное условие полной управляемости для нестационарной системы х = A (t) х + В (t) и. (20.1) Ограничимся здесь случаем, когда элементы матрицы A(t) и B(t) имеют непрерывные производные вплоть до (п — 1)-го по¬ рядка по крайней мере в окрестности некоторой точки t = t* из отрезка [£«, • ] (в точках t = t* или t = • речь идет, естественно, лишь о правых или левых производных соответственно). Будем рассматривать матрицы • • (t), определенные в окрест¬ ности точки • • следующими рекуррентными соотношениями: М(0 = ^(0, (0 = (А = 2,..., п). Справедлива следующая теорема. Теорема 20.1. Пусть на отрезке [£а, • ] можно указать точ¬ ку t = t*, в которой ранг матрицы К (t) = L (£),. . . . Ln (t)} (20.2) равен п. Тогда система (20.1) вполне управляема на отрезке (G, <₽].
§ 20] УПРАВЛЯЕМОСТЬ НЕСТАЦИОНАРНЫХ СИСТЕМ 149 Доказательство. Нам следует доказать, что при усло¬ виях теоремы справедливо неравенство р° = min р [В' (т)Х' [Zp, т] Z] >0 при 1’с = 1, (20.3) i т. е. доказать, что не может быть тождества (Z0)' X [Zp,r] В (т) = 0. (20.4) Предположим, напротив, что существуют числа /?, для которых это тождество выполняется. Тождество (20.4) продифференцируем по времени. Тогда при т — t* будем иметь: g (t.) Lt (Г) = = 0, _ ...,g' (Z„) Ln (/,) = 0. (20.5) Здесь ненулевой n-мерный вектор g (t*) определен равенством g (t,) = (Z)' X [t?, zl. Пусть j j a (Z) (/ = 1, . . ., nr) — n-мерный вектор, компонен¬ тами которого являются элементы /-й колонки матрицы K(t) (20.2). Так как при t — Zt ранг матрицы К (t) равен п, то среди векторов (Z.) имеется п линейно независимых АД1Д(,(, . . . .. !№ (tj. В то же время из соотношений (20.5) следует, что нену¬ левой n-мерный вектор g (Z) ортогонален ко всем векторам J№ (ZJ и, в частности, он ортогонален к п линейно независимым векторам АДО (£*, . . ., АД”! (О), чт0 невозможно. Полученное противоречие и доказывает теорему. Предложенные условия управляемости для нестационарной линейной системы, как мы видим, имеют более сложный вид, чем для системы с постоянными параметрами. Кроме того, эти условия включают производные от функций аj j (Z) и Ьц (Z), что не всегда удобно. Среди нестационарных систем, однако, особое место зани¬ мают линейные системы с периодическими матрицами A (Z) и В (t). В этом случае можно указать достаточные условия управляемости, которые выражаются довольно просто через матрицу X [по, 0], где (о — период функций ац (Z) и (Z). При этом мы ограничимся случаем, когда элементы аjj (Z) и j jj (Z) матриц A (Z) hB(Z) являют¬ ся аналитическими функциями времени. Справедлив следующий результат. Теорема 20.2. Пусть элементы а j j (Z) и bj (Z) матриц A (Z) и В (Z) в уравнении (20.1) являются аналитическими и периодиче¬ скими функциями времени t с периодом со. Тогда для того, чтобы си¬ стема (20.1) была вполне управляемой на отрезке [Za, ZzI, достаточ¬ но, чтобы ранг матрицы К (<0) = {В (Za), X [от, 0] В (Za), . . ., Хп^ [со, 0] В (Za)} (20.6) был равен п.
150 СВОЙСТВА ОПТИМАЛЬНОГО У’ИРАВЛЕНПЯ [Гл. 6 Доказательство. Предположим от противного, что ранг матрицы К (со) (20.6) равен тг, но система (20.1) не является вполне управляемой на отрезке [Za, Zp]. Как отмечено выше, это возможно лишь при условии, что существует ненулевой вектор Z°, удовлетворяющий равенству (20.4), т. е. g' (т) = (Z°)' Н [Zp, т] = (Z)'X [Z3, г] В (т) = 0 при (Z°)' с = 1, ta < т — Zp. (20.7) Элементы фундаментальной матрицы X^Zp, т] являются аналити¬ ческими функциями г ([12*], стр. 55), поэтому компоненты вектора g' (т), стоящего в левой части тождества (20.7), являются аналити¬ ческими по т. Но тогда вектор gf (т), тождественно равный нулю при всех т из отрезка [Za, Z3], будет нулевым вообще при всех — оо < т — 00 и, в частности, при т = Za, Za — со, Za — 2со, . . . Воспользуемся теперь тем, что фундаментальная матрица X [Zp, т] периодической системы (20.1) удовлетворяет условию ([19*1, стр. 152) X 1Л — А®] = X [ip, ia] Х [®, 0] (20.8) (к — целое число). Полагая (20.8) и венств: в (20.7) т = Za — к® (Л = 0, 1, . . ., п — 1) и учитывая;, соотношение В (Za + /о) = В (to), получим систему ра- (°)'А[С, ia]5(ia) = 0 (CfXpp ia]X®, 05(ia) = 0, (20.9) (Z)' A[ip, (iF'Vo, 0] 5(ia) = 0. Так как матрица X [Zp Za] — неособая, то вектор q = = (Z0)' X [Zp, Za] является ненулевым. Однако если ранг матрицы К (со) (20.6) равен п, то, очевидно, нельзя подобрать ненулевой вектор q, который удовлетворял бы условиям (20.9). Полученное противоречие и доказывает теорему 20.2. Подчеркнем теперь, что условие полной управляемости, сфор¬ мулированное в теореме 20.2 (20.1), является лишь достаточным, но оно не является необходимым условием управляемости. Покажем это на примере. Пример 20.1. Рассмотрим систему уравнений А — т2, .f2 = — т— -|- и. Эта система вполне управляема на любом отрезке [fa, fy] и, в частности, на отрезке [0, 2л], так как здесь
§ 201 УПРАВЛЯГМЮСТЬ НЕСТАЦИОНАРНЫХ СИСТЕМ 151 и векторы b = (0, 1), ЛЬ — (1,0) линейно независимые, т. е. выполнены ус¬ ловия теоремы 20.1. Однако условия теоремы 20.2 на отрезке [00,2л] не вы¬ полняются, так как X[2л, 0] — cos 2л sin 2л — sin 2л cos 2л = Е т. е. имеет ранг, и матрица К (2л), следовательно, такова: К (2л) — равный единице. В заключение отметим еще, что предположение об аналитичности эле¬ ментов матриц _| , (t) и _, (t) матриц A (t) и В (t) является существенным. Например, рассмотрим управляемую си¬ стему ± — — ф (t) [Е + ф (t) G]-1 Gx+ bu. (20.10) Здесь х — n-мерный вектор; Е — еди¬ ничная матрица; G — (п 1 /-матри¬ ца с постоянными и достаточно малыми элементами; b — n-мерный постоян¬ ный вектор; и— скалярная функция, описывающая управляющее воздействие; ф(£) — периодическая скалярная функция с периодом со — 1, график которой изображен на рис. 20.1. Будем предполагать, что векторы 6, (Е + G)-1^.., (Е + G)~-n‘_ 11 Ъ линейно независимы. Для системы (20.10) имеем: X [t,0] — [Е + ф (t) G-1, Н [1, /] — [Е+ G]-i (& + ф(0 Gb). (20.11) Из (20.11) вытекает, что справедливо тождество g' (0 — (р)' н u,d — о, (0 < t < 1), каков бы ни был вектор /0, ортогональный к векторам [Е + б?]“1& и [2? + G]~Gb. Отсюда следует, что система ^^Ю) не является вполне управ¬ ляемой. Покажем, однако, что условие, фигурирующее в теореме 20.2, вы¬ полняется. Действительно, в рассматриваемом случае матрица К (со) (20.6) имеет вид К (со) — {b, (Е + G~l ь,.., (Е + b}. Ранг этой матрицы по предположению равен п, и, следовательно, если бы теорема 20.2 была верна и для неаналитических aj (/) и Ьц_ (/), то по этой теореме система ^^Ю) была бы вполне управляемой. Однако мы только что установили, что этого нет. Итак, , действительно, предположение об ана¬ литичности функций t,, (/) и ),, (/) существенно для справедливости теоре¬ мы 20.2. В заключение этого параграфа введем еще одно понятие, кото¬ рое потребуется ниже. Как мы видели, для полной управляемости линейной системы требуется, чтобы функции h^ [/p, т] были на отрезке /а _ т _ t$ линейно независимыми, т. е. требуется, чтобы
152 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. в любая линейная комбинация S g t] [Z₽, г] при S Z? > о 1=1 г-1 не обращалась в нуль тождественно на всем отрезке [Z«, Zp]. Однако иногда желательно, чтобы функции hW [Zp, т] обладали более сильным свойством: именно, иногда важно, чтобы вектор-функция (16.2) не обращалась тождественно в нуль ни на каком интервале, лежащем внутри отрезка [Z«, Zp], и, более того, важно, чтобы эта функция могла обращаться в нуль лишь в отдельных, изолиро¬ ванных точках т. В таких случаях систему будем называть неосо¬ бенной (на отрезке [Za, ZpJ). Нетрудно проверить, что система (19.1) с постоянными параметрами ац и gi} неособенная тогда и только тогда, когда она вполне управляема. Если коэффициенты at, (Z) и b, (Z) суть переменные — положение сложнее. g Однако, во всяком случае, и такая управляемая система будет неособенной, если в каждой точке t = t* из отрезка [Za, Zp] выполняется условие, указанное в теореме 20.1. Наконец, мы будем использовать еще один термин: скажем, что управляемая система неособенная по воздействию и,, если линейная комбинация п п 3 Z^M [/р, gg g при 2 li >0, ==1 составленная из импульсных переходных функций системы по этому воздействию, может обращаться в нуль лишь в отдельных изолированных точках Z из [Za, Zp] . Система (19.1) с постоянными параметрами неособенная по и, тогда и только тогда, когда векто¬ ры Ы), АЫ, . . ., Л”_1Ь(^ линейно независимы. Здесь g-' g — /-й столбец матрицы В. Достаточным условием неособенности неста¬ ционарной системы (20.1) по воздействиям и, является линей¬ ная независимость векторов ZO) (Od) » • • •> Z(J (Z)(„) при всех Z из отрезка [Za, Z»l- Здесь № (Z)(t> — b{r>(t), . . ., № (Z)(j+i) = dllj\ldt — A (Z) Z(). Читатель, разобравший материал дан¬ ного и предыдущего параграфов, может доказать самостоятельно все высказанные только что утверждения, что мы и рекомендуем проделать в качестве упражнения. § 21, Управление минимальной силой В этом параграфе мы изучим один характерный и часто встре¬ чающийся тип задач об оптимальном управлении. Именно, рас¬ смотрим задачу 13.1, где интенсивность х [и] определена равен¬ ств ом x[w.] = max / [и (т)]. (21.1)
§ 211 УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 153 Здесь Y* [и] — какая-нибудь норма вектора и. Требуется, сле¬ довательно, построить управление и (т), переводящее систему (13.1) из состояния х (М == ха в состояние х (О) = х& и для ко¬ торого величина х[и] (21.1) принимает наименьшее возможное значение. В задачах управления функция и (?) зачастую имеет смысл обобщенной силы, а интенсивность х [и] (21.1) оценивает тогда наибольшее значение этой силы. Поэтому изучаемые в данном параграфе задачи мы назовем задачами об управлении минимальной силой. Начнем исследование со случая скалярного воздействия и (?). Интенсивность х [и] (21.1) имеет здесь вид x[u] = max | и (?) |. (21.2) Нам известно (см. ■ § 12), что величина х [и] (21.2) может быть истолкована как норма р* [и] функции и (?) в пространстве Л{и(х)}. В соответствии с общей методикой решения задачи 13.1 норме р* [и] = х [и] (21.2) сопоставляется норма р [h (?)], фигу¬ рирующая в правиле минимакса. ' Мы уже знаем из § 12, что р [h (?) ] =- \ 1 h (?) | dx (21.3) (см., в частности, справочную таблицу 12.1). Таким образом, функции h (?) мы рассматриваем как элементы пространства X[h (?); ta <^ ? <^ tp} интегрируемых функций, а допускаемые управления и (?) — как элементы пространства JL [и (?); t* ‘С ? М ограниченных интегрируемых функций. Прежде всего, следуя правилу 17.1, надлежит определить ми¬ нимальную функцию Л° (т). В рассматриваемом случае скалярно¬ го воздействия и (t) функция h° (?) есть h° (?) = Ъ' (?) S[?, Zp]Z0, где вектор Z° = {Zo^...^®} представляет решение следующей за¬ дачи на условный экстремум: найти р° = min \ | Ь' (?) 5 [?, Z3] 11 dx при Гс = 1. (21.4) Последняя задача может быть геометрически интерпретирована так: в пространстве {Zlt---, 1п} среди поверхностей т (°. • • • = $ I b (() s\\] id = р (21.5)
154 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 требуется найти ту, которая касается плоскости Г с = 1. Точка касания {/?,..., In} определит искомый вектор Z0. Определение чисел l°i (Z = 1,..., п) из (21.4) есть самое трудное место в про¬ цессе построения управления u° (/). Это объясняется тем, что поверхности (21.5) уже не являются здесь столь простыми по фор¬ ме и столь гладкими, как эллипсоиды или эллиптические цилинд¬ ры Ф(/п..., ln) = const (18.4), играющие аналогичную роль в § 18. Однако задача (21.4) хорошо решается численно. Пример такого решения показан в § 24. Напомним, что задачу (21.4) для удоб¬ ства вычислений целесообразно иногда заменять задачей об оп¬ ределении экстремальной функции Zia (т) = Ь' (т) S [т, £р] /с° = Ь (т) s° (т), где вектор k° = s° (Zp) находится из условия: v0 == max k’c = k°’c при [ | Ь' ((Г S [т, (/] ( | dx = 1 (21.6) к < (см. правило 17.2). При этом числа р°, v° и векторы /о, к связаны соотношениями р° v° = 1, k° = v°Z°. Итак, будем считать, что вектор /о тем или иным способом най¬ ден и, следовательно, известны минимальная функция *) h° (т) и число р°. Предположим, что число р° отлично от нуля. Как мы уже знаем, при этом и только при этом условии исходная задача 13.1 имеет решение. Согласно правилу 17.1 мы должны теперь определить искомое оптимальное управление и° (т), опираясь на условие максимума (17.1). Последнее принимает здесь вид *3 h° (т) н° (т) dx = max [ h° (т) и (?) dx = 1 (21.7) t и t при max | и (т) | = 1/р° или, иначе, при | и (т) I < 1/р°. т Максимум интеграла в правой части (21.7) будет, очевидно, достигаться в том случае, когда в каждый момент времени т по¬ дынтегральная функция й° (т) и (т) будет максимальной. Задача, следовательно, сводится к построению функции и° (т), абсо¬ лютная величина которой не превосходит 1/р° и которая обеспе- х) Все дальнейшие рассуждения в равной степени относятся как к ми нималъной функции h° (т), так и к экстремальной функции h° (т). Однако для определенности будем работать, как правило, с функцией h° (т).
§ 21] УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 155 чивает максимум произведения Л° (т) и® (т) , т. е. Л° (т) и® (т) — max Д° (т) и (т) при | и (т) \ < 1 /р° (Ze < т < t$). (21.8) и Будем предполагать в дальнейшем, что функция h® (т) обращается в нуль лишь в конечном числе изолированных значений т — т7-. Такие функции h° (т) будем называть неособыми. Из результатов § 20 следует, что указанное условие выполняется, если система (20.1) является неособенной. Итак, пусть функция Д° (т) неособая. Тогда ясно, что решение задачи (21.8) доставляется выражением M°(r) —4rsgnA°(T)’ (2L9) г причем функция и® (т) определена всюду, кроме конечного числа изолированных значений т — т_- где переменная № (т) обращает¬ ся в нуль. В моменты времени т — т,- значения и® (т,) силы и® (т) являются несущественными, и их можно, вообще говоря, выбирать произвольными из отрезка [—1/р°, 1/р°1. Однако, при этом мы должны исходить из нашей договоренности о непрерывности функ¬ ции и® (т) справа, так что в конечном счете воздействие и® (т) и в точках т — т, оказывается определенным однозначно. Итак, мы видим, что если минимальная функция h® (т) явля¬ ется неособой, то условие максимума (21.7) ((21.8)) определяет един¬ ственным образом оптимальное управляющее воздействие и® (т), имеющее вид (21.9). Управление u® (т) вида (21.9) принято на¬ зывать релейным по аналогии с названием технических устройств, которые могут находиться в двух состояниях. Заметим еще следующее. Если удается построить удобный алгоритм для решения задачи (21.4), то нетрудно указать вычис¬ лительную схему, моделирующую управление (21.9). Такая схе¬ ма строится так же, как это сделано в § 10 при решении за¬ дачи об управлении с минимальной энергией. Опишем здесь кратко работу системы управления, вырабатывающей величи¬ ну (21.9). Пусть к моменту t = tx в ВУ1 решена задача (21.4) и найдены, следовательно, величины s° (Za) = S Иа, Z₽] Z®, р° >0. Значение s° (Za) в тот же момент времени t = tx поступает в модель, фазовое состояние которой описывается сопряженной системой (17.3). С этого момента модель начинает вырабатывать вектор s° (Z). Зна¬ чения переменной s° (t) и вектор-функция b (t) подаются в ВУ11 так, что на выходе этого устройства, начиная с момента t = tx, вырабатывается минимальная функция h° (т) — 6' (т) s° (т). По¬ стоянная р° и переменная h° (т) поступают на вход релейного зве¬ на РЗ, на выходе которого при t О вырабатывается
156» СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЙ !Гл. 6 величина (21.9) управляющего воздействия и° (/). Сигнал uQ(t) преобразуется в усилительном, устройстве и подается на объект управления в форме реально действующих сил. Пр имечание 21.1. Обсудим теперь кратко те ситуации, которые возможны при нарушении условия о неособенности минимальной функции h (т). Если система (20.1) стационарная (т. е. матрица А и вектор b — по¬ стоянные), то из результатов § 19 следует (см. стр. 144), что задача 13.1 имеет решение тогда и только тогда, когда вектор с (15.2) лежит в подпространстве управляемости системы (19.1) (см. стр. 146). Но тогда нам достаточно Усилитель Рис. 21.1. рассмотреть лишь вполне управляемую часть этой системы, игнорируя ос¬ тальные координаты. Однако эта подсистема (19.21) является неособенной. Поэтому если задача имеет решение, то функция Д° (т) обязательно есть неособая. Следовательно, в стационарном случае задача 13.1 либо вообще не имеет решения, либо имеет единственное решение, определяемое равенством (21.9). В случае же переменных параметров системы может случиться, что хотя № (т) ф 0 на всем отрезке 0о] и р° > 0, но h0 (т) = 0 на каком-либо отдельном промежутке [<7, *8], принадлежащем отрезку [£а, fy]. (Полезно заметить, однако, что это возможно лишь тогда, когда А (£), b (t) — неана¬ литические функции времени t.) Пусть, например, такой промежуток [£у, г8] единственный. Тогда для всех т, не принадлежащих ему, управление и0 (т) следует определять согласно (21.9). Для моментов же т из промежутка [rY, J5] соотношения (21.7), (21.8) ужеще^работают. В этом случае произведение h° (т) и° (т) равно нулю на целом интервале [Y, f5] и утверждать, что управ¬ ление U (t) является релейным, и единственным, исходя только из условия максимума (21.8), мы уже не можем. Оказывается, однако, что и в самом общем случае управление U (т) всегда можно выбрать релейным, как это показано в специальных работах (см., например, [365а, б]), к которым мы и отсылаем читателя. Что же касается вычисления u® (t) в конкретных случаях, когда Л° (т) = 0 на отдельных интервалах времени, то здесь можно восподь-
§ 21] УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 157 зоваться предельным переходом от неособенного случая, подобно тому, как это описано ниже в других аналогичных ситуациях (см. стр. 199). Приведем теперь пример минимизации величины (21.2). Пример 21.1. Рассмотрим случай движения материальной точки т, описанный в п. 5° § 3, й обсудим задачу о переводе этой материальной точ¬ ки на круговую орбиту. В качестве управляющего воздействия будем рас¬ сматривать силу, возникающую вследствие выбрасывания реактивной мас¬ сы с постоянной по модулю относительной скоростью в направлении, пер¬ пендикулярном к радиусу-вектору точки. Уравнения движения в линейном приближении имеют вид (3.23): == #2, ^2 ~Ь Яд, *^3 == Н, (21.10) гдея4 суть . отклонения фазовых координат точки от их значений на кру¬ говой орбите. (Единичные значения коэффициентов в (23.10) получены за счет выбора соответствующих масштабов.) Будем решать задачу о постро¬ ении управления и°(т), переводящего систему (21.10) из состояния #(0) = = {#ю, #2о, #зо} в состояние # (Т) = {0, 0, 0} за время Т. Минимизация ве¬ личины х [и] (21.2) означает желание осуществить указанный перевод без больших дополнительных перегрузок. Сформулированная задача имеет ре¬ шение и0(т) при любом значении #(0), так как система (21.10) вполне управляема. Действительно, векторы 'О' ГО- т ь = 0 , АЪ = 1 , Л2& = 0 1 0. _0_ линейно независимы, и, следовательно, выполняются условия теоремы 19.1. Но тогда рассматриваемая система (21.10) является также и неособенной (см. §20, стр. 152) и, следовательно, решение u°(t) единственное и опреде¬ ляется равенством (21.9) Будем искать решение и0(т), опираясь на экст¬ ремальную функцию №(т) и исходя, следовательно, из условия (21.6). Фун¬ даментальная матрица S [т, Т] системы 51 = «?2, 52 = — S1, 5з = — $2, сопряженной к системе (21.10) (при и = 0), имеет вид S [Т, Г] = cos (Т — т) — sin (Т — т) 1 — cos (Г — т) sin (Т — т) 0 cos (Т — т) 0 — sin (Г — т) 1 Отсюда вытекает, что функция h (т) = Ьг (т) 5[т, Т]К, фигурирующая в (21.6), в данном случае равна h (т) = Кг [1 — cos (Т — т)] + К2 sin (Т — т) + К3. (21.11) Задача (21.6) может быть теперь сформулирована так: найти v° = max (fcjCi -f- К2с2 ф К3С3) (21.12) при Т | К! [1 — cos (Г — т)] ф К2 sin (Т — т) . К31 dx = 1, о
158 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 где компоненты q вектора с определяются равенствами: cl = (#<о — #ю) cos Т — #20 sin Т — z3o,) с2 = — (#зо — #ю) sin Т — #2о cos Т, / сз = — #зо- ' (21.13) Рассмотрим самый простой случай, когда Т = 2л. Введем обозначения: С1 = Сз — С], Р2 == — 42, С2 = — Сз, P3 = 11 + 7f2, | Су=С3. I (21.14) Тогда задача (21.12) сводится к следующему: найти v° = max (qpi -р- с2р2 - 3 с3рэ) р 2 л при Т(рь Рз, Р») = - I Vp? + фт(т + £) + p3 I = 1, о Вычисляя интеграл в (21.15), получаем: (21.15) где tg g = р^. = Y (Р1, Рз, Рз) = 4 Vpl + Pl - Рз + 4 1 Рз 1 агент |Рэ| Ур1 + р22 при | Рз I < ]Л^2 -Н р% 2л | рз | при |?з|> Vp2l + pI (21.16) Уравнение (21.16) определяет в трехмерном пространстве {рг, р2, которую поверхность В то же время равенство Рис. 21.2. <1Р1+ «2 Р2+гзРз = v при различных v задает в этом же пространстве семей¬ ство плоскостей 3, Таким об¬ разом, задача (21.15) сводится к определению той плоскости A Pl + С2 Р2 <3 Рз = (21.17) которая касается поверхности (21.16) и дляи которой v° > 0. Точка касания {р°, р£, р%} этой плоскости с поверхностью (21.16) j и определит искомый вектор ра = {р°, р£, р%). Из (21.16) непосредственно выте¬ кает, что поверхность 62, оп¬ ределяемая этим равенством, представляет собой поверхность вращения вокруг оси p3, симметричную относительно плоскости р3 = 0. Поэтому для суждения о характере поверхности 1 достаточно рассмотреть ее се¬ чение, например, плоскостью ра = 0. На рис. 21.2 изображена эта по- А = — къ 1 Л
§ 21] УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 159 верхность. Из этого рисунка нетрудно заметить, что если вектор С = {сп с2, определяемый начальным состоянием х (0) системы (21.10), направлен по оси рз (т. е. К = 0, ё = 0), то плоскость & (21.17) касается поверхности (21.16) по кругу, образованному вращением отрезка АВ вокруг оси р3. Ре¬ шение задачи (21.15) доставляет в таком случае, очевидно, любой вектор р° = = 1 К 1 Рг> РзЬ конец, К0Г0р0Г0 лежит на этом круге, т. е. вектор р° = = Р^ , где(р?)2 + (рг)2< (27) . При этом число v° = "/р» = — |с.|/2л, и тогда из соотношений (21.11), (21.14) следует, что экстремальная функция № (т) равна „ „ я 1 k° (т) = р° cost 4- р° sin т +4— sgn с3. Оптимальное управление и° (т) определяем теперь согласно (21.9), где сле¬ дует лишь заменить h° (т) на К (т). Учитывая при этом неравенство (р°)2 4, 4-(Рг)2< окончательно получаем: и° (т) = 1 сз- (21.18) Пусть теперь вектор С = {cx, ?2, q} не направлен по оси р3 (см. рис. 21.2). Из рисунка видно, что в этом случае плоскость & (21.17) касается поверхности $ в единственной точке N с координатами р°, р°, р°. Из рис. 21.2 получаем, что v° = ct р° 4" сгр% 4" сзр)> а из равенств (21.11), (21.14) находим экстремальную функцию h° (т): /г° (т) = р° cos т 4-р£ sin т + р£. (21.19) Тогда согласно (21.9) оптимальное управление равно и® _ v° sgn (pj cos т 4- р£ sin т 4- р)) . (21.20) Рассмотрим теперь задачу для некоторых конкретных начальных условий. Пусть в момент t = 0 скорость движущейся точки перпендикулярна к радиусу-вектору, а количество движения точки в этот момент равно ее количеству движения на заданной круговой орбите. Таким образом, пусть = 1, ^20 = 0, я.0 = 0. Из равенств (21.13), (21.14) находим, что q = 1, с2 = 0, с. = 0. Плоскость & (21.17) касается в этом случае поверхности й (21.16) в точке D (см. рис . 21.2) с координатами р^ = 1/4. р2 = 0. р°К = 0 . и, следовательно, число v° = 1/4. Из (21.20) получаем, что оптимальное управление u° (t) равно и0 (/) = sgn cos т. (21.21) Под таким воздействием точка сначала разгоняется в течение времени 0 К t < <Ji/2; в момент Т1=л/2 следует переключение управления, и при л /2^ т<Зя/2 точка тормозится; в момент т2 = Зл/2 следует новое переключение, точка снова разгоняется и, наконец, при т3 = 2л точка по касательной приходит на заданную круговую орбиту; в этот момент управление сбрасывает¬ ся (см. рис. 21.3). В результате точка оказывается на круговой орбите с тем
160 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 же количеством движения, которое она имела в начальный момент t = 0. Отметим, что в данном случае время разгона и время торможения оказались одинаковыми. Пусть теперь точка обладает в начальный^момент времени боль¬ шим количеством движепия, чем на заданной круговой орбите. Примем, например, х10 = 0,052, я2о = 0, х3о = — 0,145. Тогда из (21.13), (21.14) полу¬ чаем, что с = 0,197, с2 = 0, С3 = 0,145. В этом случае, плоскость & (21.17) касается поверхности (3 (21.16) в некоторой точке G плоскости р2 = = 0. Координаты этой точки лег¬ ко находятся графически по до¬ статочно точно вычерченному се¬ чению поверхности &. Это и было выполнено, причем получилось р° = 0,216; р° 0; Pl = 0,119. f Следовательно, число v° = 0,06. Согласно (21.20) ' определяем те¬ перь искомое оптимальное управ¬ ление: u°(t) = 0,06 sgn(0,216 cosj+ 0,119). Здесь, так же как и выше, точка вначале разгоняется, затем тормо¬ зится и, наконец, снова разгоняет¬ ся. Однако время разгона и тор¬ можения получается уже различ¬ ным. Перейдем теперь к случан/г-мерного векторного управления и (/). Снова в соответствии с общей методикой по норме р* [и] = = находим из таблицы 12.1 норму р [h (т)], фигурирующую в правиле минимакса 17.1. Имеем: Ч р[Л(т)] = $г[Л(<))<Л, (21.22) причем y [h (т)] — это как раз та норма в г-мерном пространстве векторов Л, для которой норма т* 1^1 является сопряженной. В частности, если ТО х [и] = max у* [и (т)] = max ||и (т) ||, м р[й(т)] = § ||/г (т) ||dr; (21.23) (21.24)
§21] УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 161 если же х [u] = max тах|и.Д т)|, (21.25) то 4 г P[Mt)] = |Zi<^(^))-^'V. (21.26) 1Я i=l И в векторном случае прежде всего надлежит определить мини¬ мальную функцию h° (т) = В- (т) S [т, tp] IQ где п-вектор 1° яв¬ ляется решением задачи *3 ‘я р° = ? Т [Л° (?)] dr = min • у [В' (т) 5 [т> М Z] dx (21.27) 4 1 4 при 1с = 1, Как и в скалярном случае, эту задачу для удобства вычислений иногда целесообразно заменять проблемой об определении ha (т). При этом в (21.6) вместо величины I Ь' (т) S [т, • ] к\ следует пи¬ сать величину у [В' (т) S [т, fy] к]. Так как этот этап решения задачи не имеет каких-либо существенных отличий по сравнению со скалярным случаем, то на его обсуждении останавливаться не будем, полагая далее функцию h0 (т) (ha (т)) и число р° извест¬ ными. Предположим, что число р° отлично от нуля, и, следова¬ тельно, задача 13.1 имеет решение. Мы должны теперь определить искомое оптимальное управле¬ ние u° (Z), опираясь на условие максимума (17.1), которое прини¬ мает здесь вид *3 *3 § &0' (т) и0 (т) dx = max • hQ' (т) и (т) dx (21.28) 4 и tx. при max у* [и (т)] = l/p° или, иначе, при y* lu (т)] 1/р°. Рас¬ суждая так же, как и выше — при переходе от (21.7) к (21.8), на¬ ходим, что подынтегральное выражение в (21.28) должно быть максимальным в каждый момент времени т, т. е. №' (т) uQ (т) = max й0' (т) и (т) , (21.29) и при у* [и (т)] < 1/р°. Пусть, в частности, Г* [гП = || и(х) |. (21.30) Предположим тогда, что величина || Д° (т) || обращается в нуль лишь в конечном числе изолированных точек т = Xj. В этом 6 Н. Н. Красовский
162 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. в' случае функцию Д’(т), как и выше, будем называть неособой. Так как функция А® (т) неособая, то условие (21.29) означает, что векторы /г° (т) и и9 (т) в каждый . момент времени т =h т7- должны быть кол¬ линеарны и норма т* [м] = || и0 (т) || вектора и° (т) при каждом т =/= т/должна быть максимальной, т. е. равной 1/р°. Таким об¬ разом, в случае (21.30) оптимальное управление и0 (т) является единственным и равным "•«Нт в любой момент времени т =/= ij. В моменты т = т7- значения и° (т-) воздействия и0 (т) снова являются несущественными, но мы долж¬ ны их выбрать во всяком случае так, чтобы функции Uj (т) явля¬ лись непрерывными справа. Рассмотрим теперь случай, когда ' Т* [= max | и (т) |. (21.32) i Предположим здесь, что уже каждая функция hj (т) (Z = 1,...,и) обращается в нуль лишь в конечном числе изолированных мо¬ ментов т = —-. (Это условие выполняется, если система (20.1) неособенная по каждому воздействию ut (т) (см. § 20).) Тогда из условия (21.29) заключаем, что искомое оптимальное управление и° (т) снова является единственным, и каждая его компонента u°t (т) определяется равенством и? (т) = 4-sgnfi (т) (21.33) в любой момент времени т =f= х^\ Суммируя результаты наших рассуждений, мы можем сфор¬ мулировать следующую теорему. Теорема 21.1. Рассмотрим задачу 13.1, где минимизиру¬ ется интенсивность к [и] вида (21.1). Пусть s° (t) — то из дви¬ жений сопряженной системы (17.3), стесненныт краевым условием c's9 (p) = 1, для которого порождаемая им функция hQ (г) = — В' (т) s° (т) удовлетворяет условию (21.27). Если число р° отлично от нуля, то задача 13.1 об оптимальном управлении имеет решение, при этом величина, р° и определяет как раз минимум х [и0 величины оптимальной управляющей силы и® (t), равный 1/р°. Искомая сила и° (t) находится из условия (21.29). В частности, если система неособенная по каждому воздействию Uj, то задача имеет единственное решение и° (t), причем величина Y* [zz° (т)] в каждый момент времени максимальна. В заключение параграфа приведем еще один конкретный пример.
§21] УПРАВЛЕНИЕ МИНИМАЛЬНОЙ СИЛОЙ 163 Пример 21.2. Рассмотрим движение тяжелой материальной точки в вертикальной плоскости, описанное в п. 3° § 3. Наша задача заключается в том, чтобы построить управляющее воздействие u° (t), обеспечивающее пе- гюбр°с точки из состояния хл = х (0) = {~1,0 0,О} в состояние = a(l) = = {0, 0,0,0} за время — Za = 1 — 0 = 1 при условии минимума интен¬ сивности (21.35) х[и] = max [и](т) + Wg (т)]1/г • (21.34) т “ Поставленная задача имеет решение м° (/), так как система (3.10) вполне управляема. Она является также и неособенной. Поэтому решение м° (т) един¬ ственное и определяется равенством (21.31): л 1 м°0= рО||/го(т)1| где минимальная функция h (т) = {h® (т), h® (т)} = {Zj (1 — т) + I® ](1 — т) + Z°} находится из условия (21.27). Функции h (т) = В' (т) $ (т), среди которых мы ищем hQ (т), уже вычислены выше, в § 18 (см. стр. 127). Таким образом, задача (21.27) сводится к следующему: найти 1 ро = min С {[Zl (1 - т) ф- Z3]2 ф. [Z3 (1 — т) ф Z^}2 dr (21.36) 1 S при h ф у /з ф gU = 1. (21.37) Непосредственное решение задачи (21.36), (21.37) затруднительно. Поэто¬ му числа' Z® (г = 1,..., 4) будем искать, используя дополнительно механи¬ ческие соображения. Заметим, прежде всего, что ввиду стационарности си¬ стемы (3.10) и симметрии силового поля при замене времени t = 1 — т ис¬ ходная задача трансформируется в такую же задачу, но при условии, что точка перебрасывается из состояния х (0) = {0, 0, 0, 0} в состояние х (1) = = { — 1, 0, 0, 0}, а не наоборот, как это было раньше. Отсюда в силу един¬ ственности управления м° (Z) (21.35) вытекает, что оптимальная траектория я (т) = (xj (т), ж® (т)} симметрична относительно прямой х± = — 1/2 в плоскости {хп х3}- Но тогда график составляющей и® (т) на плоскости {т, и2} также будет симметричен относительно прямой т = 1/2, а график сос¬ тавляющей uj (т) на плоскости {т,их} будет антисимметричен относительно этой же прямой. Из коллинеарности векторов и° (т) и h (т) следует тогда, что и графики функции Ztj (т) = Zj (1 — т) + Z® и h® (т) = Z° (1 — т) + Z4 явля¬ ются соответственно антисимметричным и симметричным относительно пря¬ мой т = 1/2 (на плоскостях {т, h®}). Указанное свойство функций h® (т) и ^2 (т) имеет место, очевидно, лишь тогда, когда Zj = — 2Z° Z® = 0. Учиты¬ вая эти равенства и условие связи (21.37), мы можем (выражая Z2, Z4 через li) сформулировать задачу (21.36), (21.37) так: найти “ S/ | \2 \2-| ’Л [Z* V2 - т) J d*’ <21 -38) 6*
164 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Решая эту задачу, положив g = 10, находим: = 0,1116; Ч =„(05558; 1° = 0; Z° = 0,0888; р° = 0,0944. Тогда из (21.35) получаем, что 0,0558(1 — 20 “0 /)) — г _ == ' 1 U 0,0944 У — 0,0124* 0,0120 п 0,0888 7П = - - ' 2 к 7 0,0944 /0,0124^ — 0,0124^ -р 0,0120 (21.39) На рис. 21.4 изображена оптимальная траектория х® (t} = {*с) (t), ((°)} точки. Для наглядности на этом рисунке представлено также управление ио = (и), 1(>, соответствующее раз¬ личным точкам пути. Кроме того, масштабы по осям - хг и х2 выбра¬ ны различными. § 22. Управление в случае квазилинейного объекта Содержанием настоящей монографии является иссле¬ дование задач об управлении линейными объектами. Общее исследование проблемы уп¬ равления в нелинейных си¬ стемах выходит далеко за рамки данной книги. Однако, чтобы отметить связь рассматривае¬ мых нами линейных проблем и используемых методов с задачами более общего рода, полезно обсудить возможный переход от на¬ ших случаев к нелинейным ситуациям. Первым шагом такого пе¬ рехода является исследование квазилинейной системы, урав¬ нения движения которой отличаются от уравнений линейных лишь малыми нелинейными добавками. Указанный квазилинейный случай и составляет предмет данного параграфа. При этом для определенности мы ограничимся лишь задачей, в которой ресур¬ сы управления оцениваются величиной х [и] вида (21.2). Именно по этой причине предлагаемый здесь материал следует сразу за § 21, где была изучена соответствующая линейная проблема. В других типичных случаях х [&] (или х [dt7]) переход от линейной ситуации к ситуации квазилинейной осуществляется по анало¬ гичному плану и поэтому на них мы далее останавливаться не бу¬ дем. Отметим лишь, что и в квазилинейном случае наиболее удоб¬ ной для конкретных вычислений оказывается величина х [и] ви¬ да (18.1).
§ 221 УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 165 Итак, пусть поведение управляемой системы описывается уравнением x = / (t, х) + g (t, х)и. (22.1) Здесь х = {xlt.. .,хп} — n-мерный вектор фазовых координат объекта; / (t, х) и g (t, х) — n-мерные вектор-функции; и — ска¬ лярное управляющее воздействие. Будем предполагать, что / (t, х) и g (t, х) непрерывны по t на рассматриваемом отрезке времени [ta, t₽l и являются аналитическими функциями' переменных xt в некоторой окрестности точки х = 0, т. е. примем, . что эти функ¬ ции разлагаются в сходящиеся степенные ряды со со / (*, *) = S /<") (*, *), g V, *) = 2 g™ (t, *), (22.2) 7т=1 т=0 где f(m) и gW) — . формы пг-го порядка по xt. Допустим, что вели¬ чины Xf (t) можно считать достаточно малыми (настолько во вся¬ ком случае, чтобы сходились рассматриваемые нами ряды). Ина¬ че говоря, в данном случае речь идет об управлении объектом (22.1) лишь в окрестности некоторого его движения, 'причем век¬ тор х (t) имеет как раз смысл отклонения фазового вектора от это¬ го движения, которое в координатах xt записывается таким образом в виде xt (t) = 0 (i = (см. по поводу составления таких уравнений в § 3). Нас будет интересовать выбор управления и (£), которое приводит объект к указанному движению (или к состоя¬ нию равновесия) х = 0. Мы ограничиваемся при этом скалярным управлением лишь с целью упрощения выкладок. Итак, сейчас для системы (22.1), (—.2) мы укажем простой способ последова¬ тельного построения управления и (£), которое оказывается близ¬ ким к оптимальному (в смысле задачи 13.1) при краевых условиях х (£а) = х* и х (ty) = = 0, когда интенсивность х [п] опреде¬ лена равенством (21.2) и начальные возмущения достаточно ма¬ лы. При этом будем опираться на известное нам из § 21 решение аналогичной задачи для линейной системы первого приближения х = A (t) х 4- b (t) и, (22.3) где А (О x = {/|1) (« х), ..fn} (t, ж)}, b(t)={gM (0,...,gW(t)}. Для дальнейшего удобно предъявить одно требование к мини¬ мальной функции h° (т), которая получается при решении указан¬ ной линейной задачи по правилу минимакса 17.1. Чтобы сформу¬ лировать это требование, предположим для определенности, что вектор с (15.2) удовлетворяет условию сп == 0, и, следовательно,
166 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 по (21.4) имеем: п—1 /„=-^-(1-2^). п 1=1 В этом случае задача (21.4) на условный экстремум сводится к проблеме безусловного минимума функции *3 П-— 7——'_ г|) (/b . . g g /п-1) = $ | 2 (т) + ± (1 - J ggg h™ (т) | dx. /а г=1 п 4 i=i ' Поэтому числа Z01T...Zn_i, определяющие h (т), будут удовлетво¬ рять системе уравнений 5?= S \к‘г'(t) - А<п) (t)] sgn [,2Т){g + г 1а г=1 + -у- (1 — 3 gggg h(n) (т)1 dx = О П ' г=1 7 J (f = 1.. .,n — 1). Упомянутое выше требование состоит в следующем: будем далее всегда предполагать начальные данные х* такими, что гра- 71 фик минимальной функции 1г (т) = 2 (т) пересекает ось т под 2=1 ненулевыми углами и якобиан д g g , . . ., ggg -j I д (Z^ . . g g Z^) отличен от нуля при Ц = Ц, т = tj, т. е. det II <4 11 ==0 при Z т = Tj (Z°) (Z, к 1, . . .,n 1, у 1, . . .,$). Здесь и символы Ту = X, (Z) (/ = l,..t,s) означают моменты времени, в п которые функция А(т) = 2 Zlh^ (т) обращается в нуль. Для нас . г=1 важно, что при указанном условии в окрестности g точки Z = Z0
§ 221 УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 167 существуют производные при 1± = 1^, . . ,,1п = 1п °‘1г (/ — 1, . . • • • ; к = 1,. . .,п), как это следует из известных теорем о неявных функциях (см., например, [23*1, т. I, стр. 447). Более того, при данном условии из той же теоремы о неявных функциях вытекает, что величины Z будут непрерывно-дифференцируемыми функциями величин с1,...,сп, по крайней мере при достаточно малых изменениях сг. Отсюда следует, что при • малых изменениях &х* и Да^, т. е. при малых изменениях Д • • , будут происходить малые изменения величин /?, причем будут справедливы оценки | ДЙСмИМ | Av0| — | Д-А|<Кы2|ДС||, (22.4) где о»! и (о2 — постоянные, зависящие лишь от исходных значений х* и Д, t$. Опираясь на эти оценки и используя те свойства оп¬ тимального управления и® (t), которые были найдены в § 21, не¬ трудно прийти к следующему выводу. Пусть мы изменяем исход¬ ные значения хл и х& настолько мало, что вектор с (15.2) также претерпевает достаточно малое изменение Дс. Тогда при всех т, за исключением, может быть, лишь значений, лежащих в некото¬ рых е7-окрестностях точек т7-, будет выполняться неравенство 1 Ди° (О | < (®& |Дс ||, (22.5) причем суммарная протяженность упомянутых е?-окрестностей (обозначим ее a[SeJ — а (@)) будет удовлетворять условию а (@) < ®4 || Де ||. (22.6) Здесь Дм° (t) — изменение оптимального управления, • выз¬ ванное изменениями Дя® и &х&, а величины со3, 0)4 — суть постоян¬ ные, зависящие лишь от исходных значений хл, Д и t$. Перейдем теперь к построению управления и (Z) для системы (22.1) , (22.2). Будем предполагать, что система первого прибли¬ жения (22.3) является вполне управляемой (см. §20). Пусть •• (t) — оптимальное управление, разрешающее задачу 13.1 при х [и] (21.2) для линейной системы первого приближения (22.3), и я(1 (я®, 0)2^2.з> — движение системы (22.3) при u=Ur>(t). При этом, как мы знаем, управление •1 • (t) определяется равенством (21.9). Из материала § 21 нетрудно вывести также оценку I ad) (® II (22.7)
168 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 и убедиться поэтому в том, что движение уI 1 I (яа, i)(22.S) удовлет¬ воряет неравенству ||^(1)(х , °(22-3) И *4 «М # ||> (22-8) где со5, ®6 — постоянные, определяемые лишь свойствами системы первого приближения (22.3). Предположим теперь, что управле¬ ние ( (t) приложено к нелинейной исходной системе (22.1). Это управление и = н(1> (t) приведет движение я^) (ха, i)(22.D данной системы (22.1) к некоторому состоянию 1 I (хл, /з)(22.1) — =y(2)(ip). Известно, что решения нелинейных систем дифферен¬ циальных уравнений (22.1) с аналитической по х правой частью можно разлагать в ряды по степеням начальных данных х* (при фиксированном и (/)). Опираясь на это свойство рассматриваемой нелинейной системы, можно проверить теперь, чтоу с точностью до членов второго порядка малости по [| хл || имеем ([12*], стр. 56, 174): t уМ (0 = $ X [i, г] z<2) (т) dx, (22.9) «а где . z<2) (Т) = /(2) (т Ж(1) («“, Т)(22.3)) 4- gw (Т, х<1) (ж“, т)(22.3)) и(1) (т). (22.10) Из (22.7) — (22.10) следует теперь, что Цз(2) (<°7 — coinst). (22.11) Рассмотрим снова задачу 13.1 в первом приближении о приведе¬ нии системы (22.3), но теперь уже не в точку х (ip) = 0, а в точ¬ ку х (ip) = — у(2) (ip). Пусть ( (i) — решение этой новой за¬ дачи. В таком случае вектор (15.2) определяется уже равенством с = — X [ip, ia] х* — уI(I (ip) и отличается от, аналогичного век¬ тора с для предыдущей задачи на величину Ас<2) = — у№ (£р). Поэтому в силу оценок (22.4) — (22.6), (22.11) будет справедли¬ во неравенство | Д-21 = | н<2) (;) _ (;) | [ (оз]| [ (ip) || < MMi'2 (22.12) при всех i, за исключением, может быть, у лишь- множества @2 значений i, лежащих на интервалах, суммарная протяженность (или мера) которых а (@2) удовлетворяет неравенству а (@2) = II уЫ (ip) |< 1 1 у |х ||2 . (22.13) Рассмотрим движение х(2) (хл, i)(22.D системы (22.1), соответ¬ ствующее управлению и = uWy). Можно проверить, что с точ¬ ностью до членов второго порядка по || хя || это движение удовлет¬
§ 22] УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ' ОБЪЕКТОМ 169 воряет краевому условию х(Xя-, t^^x) = 0. Если же теперь учесть члены третьего порядка по || х* то х- - (яа, £p)(22.i) = = У1'3') (О) и t yt(l)= J X (1, t] z<3) (t) dx, (22.14) где z(3) (t) = /(3) (Т, Ж(1) (Х*, t)(22.3)) + + 3 —>(*' '1gp,w,) Д4” (Л Т) + + gw (т, Дж(2) (хя, т)) u(1) (t) -f- gw (т, х(1) (ж’, т)(и 8)| + g(2) (Г, ж(1) (хя, т)(22.з)) и(1) (т). Здесь Дя<2) (x*, () — члены второго порядка по || ха || нии системы (22.1). Имеем: t Дх(2) (ха, t) = | X [£, т] (z<2> (т) + b'(т) Дн2 (т)) dx. Из (22.14) — (22.16) вытекает неравенство h(S) (0 II < ® 8 || Ха II3. >) Д«2 (t) + (22.15) в реше- (22.16) (22.17) Снова решим задачу - 13.1 в первом приближении, но уже направ¬ ляя теперь движение (22.3) в точку х (О) = — (t) — 33 3 (О)- Оптимальное управление, разрешающее! эту третью задачу, обозначим через u<3) ((). Теперь Де<3) = — у/(3) (о) и в силу (22.4) — (22.6), (22.17) будут справедливы оценки: |Д«3 (0)1 = I u<3) (0 _ м«) (0 I < ®3 || |Я (М) II < %3 II ха ||3, (22.18) о (@3) < «41 У™ (*р) || < м ( х II3. (22.19) Продолжая рассуждать аналогичным образом, получим на &-м шаге: к с = — Х [0Р, 0J Xя — S гу<}) (М, Ac(f‘> = — ут (М), 7=1 причем будет выполняться неравенство | Дв> (0) | = | (() - »<*-« (00 < о|| уМ (tf || < || х* р (22.20) при всех (, за исключением, может быть, множества | - значений
170 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИИ ИГи. 6 t, мера которого о (@fr) удовлетворяет неравенству При этом *(@»)C<Mh‘> GIK t у<м (t) = X p, т] zW (т) dr, (22.21) (22.22) к— 1 + 3 iS) (Т ж(1> (Ж“> т)(22.3)) Д^-s (Т) + I V V V V I 1 d(Q)g(m) (г,т(1> (га, т)(22>3)) + Zj 2 Z Zj \ б! дх. -...-дх. S=17П=1 а^1 к,...,го = 1 г1 го X SS|=S'—m-f-o X 3 ..... ье°} Ди,^ (?) . (22.23) Sp • • • ,Sq> 2 Здесь для удобства записи принято обозначение и 1 1 1 (Z) == = Д их(0и Дх(Р — члены s-го порядка по норме || гга || в решении нелинейной системы (22.1), причем Ax(s) = ] X т] (y(s) (т) + b (т) Aws (т)) dr. (22.24) 4 * Таким образом, оценки (22.4) — (22.6) обеспечивают постоян¬ ное повышение порядка малости вектора и 1 и1 (£р) по || ха ||, и, следовательно, управление и (т) можно построит^ так, чтобы привести систему (22.1) к заданному движению х = 0 с любой желаемой степенью точности. Рассмотрим теперь ряд и (<) = иц) (i) + 2 Хит («) (22.25) m=2 Управление и (t) (22.25) в случае сходимости этого ряда перево¬ дит нелинейную систему (22.1) из начального состояния х (t^) = = х* точно в нужное конечное состояние х (£р) = 0, как это сле¬ дует, очевидно, из способа построения ряда. Из соображений эко¬ номии места мы не будем подробно анализировать вопрос о схо¬ димости данного ряда. Отметим лишь, что, пользуясь оценками
§ 22] УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 171 (22.12), (22.13), (22.17) — (22.21), можно, действительно, доказать эту сходимость. При этом устанавливается, строго говоря, что ряд (22.25) сходится по мере ([9*], ч. 2, стр. 48), если только на¬ чальные отклонения х* достаточно малы. Тем самым вопрос о возможности построения управления и (t), которое приводит не¬ линейную систему (22.1) в положение х (Zp) = 0, решается ут¬ вердительно. Однако важно здесь подчеркнуть, что построенное управление и (t) (22.25), вообще говоря, не является оптималь¬ ным в смысле задачи 13.1 при х [и] (21.2). Из описанного спосо¬ ба определения функции и (t) (22.25) следует лишь, что это управ¬ ление и (t) является оптимальным для системы первого прибли¬ жения (22-.3) при переводе ее из начального состояния х (Za) = х* оо в конечное состояние x(l$) = — 2 (^)- При этом ряд 1—2 со и 00 II 3 у™ (^), конечно, также сходится и норма || 3 у(Л) (ip) || его 1=2 к =2 суммы имеет второй порядок малости по || ха ||. Пользуясь этим обстоятельством, можно показать, что управление (22.25) отли¬ чается от оптимального (для нелинейной системы (22.1)) на вели¬ чину второго порядка малости по || я*|. В заключение отметим еще одно важное обстоятельство. Будучи оптимальным управлением для линейной системы (22.3), функция и (t) = lim > (t) является релейной и имеет вид и (f) = v° (xa) sgn (S l°i (xa) h(i) ()) , (22.26) где v° и Z? — некоторые постоянные величины. Таким образом, справедлив следующий вывод: Если начальное отклонение х (Za) = х* от заданного положе¬ ния x(t$) — 0 достаточно мало, то можно построить1) ре¬ лейное управление и (Z) (22.26), переводящее нелинейную систему (22.1) из данного исходного состояния х (Za) = х* . в желаемое конечное положение х (Zp) = 0. Это управление строится в виде ряда (22.25) и отличается от оптимального управления на величину второго порядка малости по || х* Ц. х) Это утверждение установлено нами в предположении полной управ¬ ляемости системы первого приближения. Последнее условие является, сле¬ довательно, достаточным условием разрешимости задачи об управлении для нелинейной системы. Если оно не выполняется, то возникает ситуация, ко¬ торая в литературе изучена мало.
172 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Пример 22.1. Рассмотрим задачу о переводе материальной точки, дви¬ жущейся в поле центральной силы, на круговую орбиту заданного радиуса г0 при помощи реактивной силы, перпендикулярной к радиусу-вектору точ¬ ки. Уравнения движения точки при г0 = 10 имеют вид (см. п. 5° из § 3 и пример 14.1 из § 14): = х2, •^2 = ' х1 + хз + /2) (а1> хз) + •••> £3 = и + 0,1 хги, где /(2) (д^, Ж3) = 0,3 х% — 0,3 х3 + 0,05 х* Пусть нас интересует задача о построении управления и (4), переводя¬ щего эту систему из начального состояния х (tx) = х (0) = {0, 1; 0; 0} в конечное состояние х (t&) = х (2л) = {0; 0; 0} и имеющего при этом наи¬ меньшую возможную норму х [и] (21.2). В соответствии с вышеизложенным рассмотрим сначала такую же за¬ дачу для системы (21.10) первого приближения, т. е. найдем управление (t), имеющее наименьшую норму (21.2) и переводящее систему первого приближения (21.10) из начального состояния х (0) = {0, 1; 0; 0} в конеч¬ ное состояние х (2л) = {0; 0; 0}. Решение подобной задачи для системы (21.10) мы уже подробно разобрали в § 21. Поэтому здесь процедуру этого решения описывать не будем и укажем лишь результаты. В нашем случае , u(1) (t) = 0,О25 sgn (cos t). Определим движение xl:l''(t) системы (21Л0) первого приближения при и = i№ (t). Произведя необходимые вычисления, получим: ^(О = 0,1 cos t — 0,025 sin 4 4- 0,0254, 0^4^-^-, 0,05 cos t — 0,025 sin t—0,0254 + 0,07854, -jj- t -tj- л, — 0,025 sin t + 0,025i — 0,15708, f — 0,025 cos t — 0,1 sin t -J- 0,025, ®21 (4) = ■ — 0,05 sin t — 0,025 cos t — 0,025, — 0,025 cos t — 0,05 sin t + 0,025, Зя ' 2 2 л j л 0 — t — -2 , л 3 2 2 л, у л -1 — 2л, f 0,0254 xW(t)= ■ 0,07854—0,0254, 0,15708 + 0,0254, Л y, л 3 2 % 2"' л» 3 *2“ л < t < 2л.
S 221 УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫ1М ОБЪЕКТОМ 173 Вычислим теперь по формуле С22.^ (22.10) вектор _ ()р) — у(2) (2ч). Имеем: 2п ур (2л) — § [— /(8)М1) w. (т»sin т > о 4- 0,1х(1) (т) и(1) (т) '(1 — cos т)] rft — — О0128, 2п у<2) (2л) — [/(2) (Ц1) (тХ ХХ> (Т)) COS Т + о 4- 0,1;^41} (т) м(!) (т) sin т] dx = — 0,00075, 2п у™ (2л) — 0,1 _ xW (t) и(!) (т) dx — ■0,00049. О Найдем теперь управление и(2)(<), которое имеет наименьшую возможную норму х [/2/] (21.2) и переводит линейную систему ^l.W) из начального сос¬ тояния х (0) — {0, 1; 0; 0} в конечное состояние х (2л) — —у(2) (2л) — — {0,00128; ———°,00049}. Решение последней задачи имеет вид и(2) (0 — 0,02456 sgn (0,07776 sin t + 10,18093 cos t — 0,05183). Итак,,мы описали процедуру, которая позволяет построить управление и (t), приводящее нелинейную систему (22.1) в нуж¬ ное состояние х (ip) — 0. При этом, однако, данное управление и (t) не будет оптимальным управлением с точки зрения минимума величины х [и], хотя и будет близким к нему. Указанный недос¬ таток вызван тем обстоятельством, что для упрощения счета ап¬ проксимирующие управления _ ■ (i) мы выбирали все время, ис¬ ходя из одной и той же системы линейного приближения (22.3). Усложняя процедуру и вводя при этом на _ каждом шаге новую систему линейного приближения, можно построить последова¬ тельность управлений _ (i), которая уже будет сходиться к уп¬ равлению и° (i), оптимальному для исходной квазилинейной сис¬ темы. Наметим здесь совсем кратко этот способ построения u° (i), акцентируя внимание лишь на тех моментах, которые отличают его от описанной выше процедуры. Кроме того, для разнообра¬ зия мы опишем предлагаемый способ не для системы вида (22.1), но для квазилинейной системы х = A (i) х 4- ц / (i, х (t)) 4- b (t) и, (22.27) где малость нелинейной добавки / (i, х) определяется постоян¬ ным малым параметром ц. Таким образом, мы примем здесь, что / (i, х) — непрерывная по t и аналитическая по х функция, оп¬ ределенная при всех t из отрезка [ia, ip] и при всех х из области & пространства {х}. Число ц будем считать достаточно малым, за¬ то краевые условия х (t^) = х* и х (ip) — х$ мы можем теперь
174 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. в уже не стеснять требованием малости. Будем, следовательно, искать управление и° (£), которое переводит систему (22.27) из положения х )) = хл в положение х (£р) — х& и имеет притом наименьшую возможную интенсивность и [м] (21.2). Систему ли¬ нейного приближения (22.3), соответствующую системе (22.27) при р, = 0, будем снова считать вполне управляемой. Как и в предыдущем случае, начнем построение искомого уп¬ равления u° (t), исходя из управления h 1 1 (t), решающего ана¬ логичную задачу 13.1, но для линейной системы (22.3). Пусть это управление «(*) (t) мы нашли и пусть h1 1 (ха, оt) —порождае¬ мое им движение нелинейной системы (22.27). Это движение в момент t — t$ будет приходить в некоторую точку h (яа, /р), отличную, вообще говоря, от заданной точки ah Обозначим ДуЫ = — х(1) (ха, tf). (22.28) Важно заметить, что величина АуЧ разлагается в ряд по степе¬ ням р, причем это разложение начинается с члена не ниже, чем линейного по р, т. е. АуЧ = р ос*1) + ... Мы примем, далее, так¬ же, что минимальная функция h° (т), порождающая по правилу минимакса 17.1 управление uSl (Z), обладает тем свойством, кото¬ рое мы оговорили выше, в начале этого параграфа, когда изуча¬ ли систему (22.1) (см. стр. 166). Теперь, опираясь на движение х^ (ха, t), мы составим новую систему линейного приближения y = A®(t) у +b(t) v, (22.29) где элементы а$ матрицы А(1> (t) суть величины «£>(()<“ (« + рГ[<1’ (22.30) L Jx(l)(xa, i) причем hi (t) — элементы A (I) и символ [dft/dxjlxWct) означает, что частные производные dfi/dxj вычислены при xt = xt (ха, t). Если теперь в уравнения (22.29) подставить v = u<x) (t) и положить у (ta) = 0, то мы получим некоторое движение у№ (t) этой системы, которое будет в момент t = ] приводиться в ка¬ кую-то точку о (1) («). Определив указанным путем вектор уМ (ty), поставим перед собой следующую вспомогательную задачу 13.1: найти управление v = u<2) (£), которое, имея наименьшую воз¬ можную норму х [и] (21.2), переводит систему (22.29) из поло¬ жения у (£«) = 0 в положение у (t$) = уМ (ty) Ду(1), где ве¬ личина Ay(L) определена как раз равенством (22.28). Такую за¬ дачу решать мы умеем. Оказывается теперь, что управление u<2)(Z) приводит соответствующее движение х& (х*, t) исходной не¬
§ 22] УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 175 линейной системы (22.27) в положение х& (т“, £р), которое от¬ личается от заданного состояния х = х& уже на величину Ду(2) = х$ — я(2) (ж“, р), имеющую не ниже, чем второй порядок малости по pi. Высказан¬ ное утверждение, доказываемое на основании известных теорем о разложении решений системы (22.27) в ряд по параметру р1 (см. [12*], стр. 173), мы приводить не будем. Заметим лишь, что при этом учитываются также оценки, аналогичные ' оценкам (22.4) — (22.6), использованным выше в этом параграфе. Далее, отталки¬ ваясь от движения я(2>;яа, t), мы опять составляем новую систему ли¬ нейного приближения у=Аъ(1) У A-b(t) рит.д. Таким путем получа¬ ется сходящаяся последовательность функций u,c(t), аппроксими¬ рующая искомое оптимальное управление u°(t) для нелинейной зада¬ чи. Этим кратким описанием процедуры определения и° (Z) мы здесь и ограничимся. Отметим лишь, что при действительном ее осуществлении достаточно на каждом шаге вычислять все нужные величины (ДгД^), (ха, t),... ит.д) лишь с точностью до членов того же порядка по ц, что и номер к шага, или иногда на порядок выше. Способы такого вычисления всех этих величин (при изве¬ стном управлении Uk> (£)) подробно излагаются в работах по методу малого параметра, к которым мы и отсылаем интересующегося читателя (см., например, книги [12*], [15*], [17*]). Заме¬ тим, наконец, что предположение об анали¬ тичности функции / (t, х) и явное введение параметра ц являются также не обязатель¬ ными для возможности осуществления про¬ цедуры, подобной описанной. В последнем случае, однако, уже затруднительно . полу¬ чать аналитические выражения для движений хк (хЛ, t) и для других нужных величин и вся задача должна решаться численным методом. Пример 22.2. Рассмотрим задачу о вращении вер- Рис. 22.1. тикального стержня с лопастями, находящегося в сосуде с жидкостью и управляемого моментом v (рис. 22.1). Будем предполагать, что момент М силы сопротивления жидко¬ сти относительно оси вращения пропорционален квадрату угловой скорости Ф вращения стержня. Примем поэтому, что М = ре I ф2, где р — коэффици¬ ент пропорциональности, который в дальнейшем мы будем рассматривать как малый параметр; I — момент инерции вращающихся частей. Применяя теорему об изменении момента количества движения (см. [22*], стр. 157), получим: й^ф . . I “ЛГ = — iWsgn ф -|- v.
176 СВОЙСТВА ОПТИМА ЯВНОГО УПРА ВЛЕ НИЯ [Гл. 6 Отсюда находим уравнения движения *1 = х„, х„ = —ца-| - sgn х2 + и, где х± = ф; . 1 х2 = ф; и = у и. (22.31) Пусть в начальный момент времени t* = 0 стержень находился в покое и при этом x± ( (а ( = х± (0) = 0. Управление и (t) требуется определить так, чтобы за время и = 2 стержень повернулся на угол х± = х± (2) = 2 и его угловая скорость %2 (2) в этом положении равнялась нулю. При этом, как мы условились в этом параграфе, в качестве интенсивности % [и] выбе¬ рем величину (21.2). Примечание 22.1. Правая часть второго уравнения (22.31) не является аналитической функцией, так как она содержит величину sgn х2, неприятное влияние которой необходимо учитывать при вычислении после¬ довательных приближений. Однако, как увидит читатель ниже, при выб¬ ранных нами начальных я (0) и конечных х (2) условиях смены знака у скорости ф (t) = Х2 (t) в последовательных приближениях не появляется и все время Х2 (t) 0. Поэтому в дальнейшем величину sgn Х2 в уравнениях (22.31) мы игнорируем. Решим сначала аналогичную задачу для системы (22.31), но при р = 0, т. е. найдем управление иU U (£), переводящее систему ±х = Х2 ±2 = и (22.32) из заданного начального состояния х (t*) = х (0) = {0, 0} в заданное ко¬ нечное состояние х (*) = х (2) = {2,0} и имеющее при этом наименьшую' возможную норму х [и(1] (21.2). Эта задача сводится к проблеме безуслов¬ ного минимума функции 2 ф (/2) = 11 — -ф ^2 | dx. о Следовательно, мини- 1 (1 - т) и Величина ф ((^ достигает минимума при /2 ™ — 1/2. мальная функция hQ (т) в данном случае имеет вид h° (т) = поэтому и(1)(«) = 2 sgn (1 — «). (22.33) Перейдем теперь к определению управления Для этого найдем сна¬ чала движение я(1)(ха, t) квазилинейной системы (22.31) при и = (t). Произведя необходимые вычисления, получим: 4° W = a W + Н ai (0 + •••» 4° W = Р W + Р Pi (0 + — > где i2 2 — (t — 2)2 8 1 3 1 3 (z — 2)4 при 0 < t < 1, при 1 и t и 2; при 0 и t < 1, при 1 U t U 2; 8 3
§ 22] УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 177 и 2Z — 2(1 — 2) 8 4 , -у (г-23 при 0<3 <?1, при 1 — t < 2; при 0 < t < 1, при 1 — t — 2. Теперь составим новую систему линейного приближения (22.29). В нашем случае У1 = Уъ Уг = —2 рР(4)У2 + v- (22.34) Найдем движение у^ (4) системы (22.34) при v = (4) и начальном ус¬ ловии у (0) = 0. Имеем: (Г) = а W + Н а2 (О + ■■■. где УЦ (t) = Р (*) + Р ₽2 (t) + при О < t < 1, «2 (0 = ’ 16 16 2 1 3 з 1 з V-2)4 при 1 — t — 2; 8 -угз при 0 — t — 1, ММ) = 16 8 . 3 "З(* —2^')з при 1 < t — 2. Наконец, решим следующую вспомогательную задачу: требуется найти управление v = гУ(£), которое, имея наименьшую возможную норму х [и(22] (21.2), переводит ’ систему (22.34) из положения у (0) = 0 в по¬ ложение у (2) = у™ (2) -Ь Al/1» = (2) + х (2) - х(1) (2) = Г . 16 16 1 [8 8 1(8 8 ) -р —3-Ц - — 4 + {2’0} — {2~у * — -зр}=(-з-р, — ур • Импульсная переходная матрица Я [ - , т] = Н [2,т] системы (22.34) имеет вид где Н [2, т] = А(1) W _ Г2 — Т + нт (*) + ■ ■ .] Л(2) (т)] U+ НТ1 (т) + -• .J ’ Т(т) = 4 — 4 4т2 — у т8 у (г-)3 при 0<т< 1, (— 4 + 2т-2 I- 2 (т - 2)2 при 1 — т < 2; при 0 — т — 1, при 1 < т < 2. 7100 =
178 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Вектор с (15.2) здесь определяется равенством /8 8 \ с = У(2) = (2 - ур, — ур). Поэтому для вычисления u(2) (t) следует решить задачу (21.4) на условный экстремум, т. е. . найти 2 ф (У У = min . | (т) + W/2) (т) | dx о при условии / 2 а 8 h (2 — ур - у р7з = 1. (22.35) Числа Zj и Z2 ищем в виде ряда: 1 li = у + . “Ь И2а1 + . . 1 1-1 = — у + р& + р’А + . • . Подставляя эти выражения в (22.35), найдем: 1 4 , 11 — 2 + 3 ' ■’ 1 /з — — 2 + И& + • • • При этом для определения числа Ъ получаем равенство 2 у/ = J [у H2/t(1) W -г Р^(2> sgn [{у ,- 4 M—2b) hW (г) ■ ■ I- О + ( у + V’b'j Л<2) (T)J dx = 0. Из последнего равенства вытекает следующий способ вычисления числа Ь. Сначала найдем момент времени т = 1 + рД в который минимальная функция 7i° (т) должна обращаться в нуль, и, следовательно, управление (0 будет менять знак. Очевидно, что для этого следует удовлетворить равенству 1+М 2 [у рМ(1) (т) + рЛ(2) (T)j dx = [у Р,2Л(1) (т) 4- рЛ<2) (т)] dX. О 1+-Л 2 Из этого условия и находим, что d = Теперь можно определить величину Ь из равенства
Отсюда получаем, что имеет здесь вид где т2) = § 22] УПРАВЛЕНИЕ КВАЗИЛИНЕЙНЫМ ОБЪЕКТОМ 179 Ъ = 0. Следовательно, минимальная функция 7л° (т) /г» (т) = у (1 — т) + № М. 2 т — у т3 при 0 < т < 1, 4 2 - -3- + 4т —— Зт2 + у т3 при 1 < т — 2. Так - как р [/г° (т)] = 1/2, то управление —2 - (t) будет определяться равенством u(2) (Z) — 2 sgn 2— (1 — т) + № (т)] . (22.36) Как мы видим, управление и— (t) имеет ту же абсолютную величину, что и u(1) (t) да.33^ и разница только в том, что теперь управление u2\t) меняет знак не при г = 1, а при т = 1 + у ц. Управление и— (t) (22.36) перево¬ дит исходную квазилинейную систему (22.31) в заданное конечное состоя¬ ние ^(2,0) с точностью до членов второго порядка малости по р. Мы закончим этот параграф рассмотрением нелинейной систе¬ мы, описываемой уравнением х = f(t, х) 4— b(t) и, (22.37) для которой укажем необходимые условия оптимальности управ¬ ления и (7), разрешающего задачу 4.2 при условии шах -j и (7) || = min. (22.38) Итак, предположим, что функция и = U (£) доставляет иско¬ мое оптимальное управление, которое порождает оптимальное движение х° (7), причем max ||и (t) || = ц. Пусть 8х = A(t) 8х -|- Ь8и (22.39) есть система, описывающая в линейном приближении отклонения б х (t) от оптимального движения, вызванные варьированием 8u(t) управления u(t). В (22.39) элементы ац (t) матрицы A(t) опреде¬ лены равенствами ati (i) = Г-Д] • L^Jx=x»(/) Предположим, что для системы (22.39) при каждом t из от¬ резка [Za, — ] выполнено условие линейной независимости векто¬ ров &П1 (7) (см. стр. 148) или выполнено какое-либо другое
180 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 условие, которое обеспечивает линейную независимость функций A(i> Up, d на любом интервале (т, Ф) из отрезка U® Zp]. Составим вектор *3 с = h h Up, т] u° (т) dx. (22.40) Справедливо утверждение: Оптимальное управление u° (t) яв¬ ляется релейной функцией, которая удовлетворяет условию u°(t) = ц sgn Z>' U) S°(0, (22.41) где s°(t) — минимальное движение системы s — — A (22.42) стесненное условием = 1 (22.43) и разрешающее при этом задачу на минимум Ч ^|&' (t) s (t)|dt = min. (22.44) *a Наметим план доказательства, детальное проведение которого предоставим читателю. Предположим от противного, что некото¬ рое оптимальное управление u°(t) с max || u° (t) || = ц условию t (22.41) не удовлетворяет, причем естественно предполагается, что равенство (22.41) не выполняется по существу, т. е. оно не вы¬ полняется на множестве значений t из Ua, £р] ненулевой меры. Тогда из материала предыдущих параграфов выводится, что су¬ ществует управление и = v (t), удовлетворяющее равенству ч с = § т] у (т) (22.45) причем max || у О h Н — (22.46) и max | v (£) — u° (t) | < e, (22.47) где е — наперед выбранное произвольно малое положительное число. (В качестве v (t) достаточно выбрать управление v(t) =■ = (1 — е) u°(t) 4- е v°(t), где v°(t) — функция, удовлетворяющая
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 181 условию (22.45) и имеющая при этом наименьшую возможную норму р* [у] = max || v (t) ||. Нетрудно убедиться, что при пашем предположении р*[у°] = v < р.) В силу уравнения (22.39) изме¬ нение бя^1^) движения x(t),1 вызванное изменением управления 6u(t) = v (t) — uQ(t), определяется в линейном приближении равенством «3 бя(1) (ip) = § /i(ip,T] (р(т) —u0(т))<^■t, причем правая часть этого равенства вследствие (22.40) и (22.45) равна нулю. Отсюда с учетом (22.47) выводится, что рассматривае¬ мое варьирование управления и (t) приводит на самом деле лишь к изменению 8х (£р), которое имеет второй порядок малости от¬ носительно е. После этого, следуя схеме рассуждений, приведен¬ ной в этом параграфе выше (см. стр. 173), можно построить пос¬ ледовательность функций v (t) = (t) , v2 (t),.., сходящуюся к управлению и* (£), которое приводит движение х (t) (22.37) в заданную точку х (fy) = х$. При этом вследствие (22.46) и (22.47) при малом е >0 будет max||u* (t) || < ц. Тем самым приходим в противоречие с предположением об оптимальности управления u° (t). Полученное противоречие доказывает наше утверждение. Заметим, что аналогичные рассуждения проходят и в случае век¬ торного управления и (t), а также в случаях других норм р* [и]. § 23. Управление прц условии минимума импульса управляющего воздействия В этом параграфе мы рассмотрим задачу об оптимальном уп¬ равлении, включающую условие минимума интенсивности х [dU] управляющего воздействия, в случае, когда уравнения движения заданы в обобщенной форме (6.11), т. е. dx (0 = A (t)x (t)dt +B(t)dU + dW (t). (23.1) Напомним читателю (см. § 6, стр. 47), что запись (23.1) явля¬ ется лишь символическим указанием на то, что движение х (t) управляемого объекта описывается равенством t t х (0 = X [/, Z.J x* + н [С, т] dU + X r] dW (23.2) 'а 4 ^«^<*з; z(Z«=:ra; x(tp=x)
182 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Поясним сначала путь, который приводит нас к задачам, изу¬ чаемым в этом параграфе. С этой целью рассмотрим обычную уп¬ равляемую систему х (t) = A (t) х (t) -|- В (t) и -]~w (0 (23.3) и предположим, что величина и имеет смысл силы. Пусть нам тре¬ буется решить для системы (23.3) задачу об оптимальном управ¬ лении при условии минимума полного импульса силы и. В этом случае в качестве интенсивности управления х [и] следовало бы выбрать величину Ч % [и] = |u(r)|Jt, (23.4) если и — скаляр, или величину Ч к [w] = § Т* [и (т)] dt, (23.5) Ч если и — вектор. Здесь символ у* [и] снова означает какую-ни¬ будь норму вектора и. Однако на простых примерах можно убедиться в том, что такая задача не будет иметь решения не только в классе возможных управлений, но и в более широком классе допускаемых управле¬ ний. Именно, оказывается, что управляющие силы и (t), перево¬ дящие систему (23.3) из состояния хЛ в состояние х$ и имеющие наименьший полный импульс, содержат в качестве слагаемых мгновенные ударные воздействия, описываемые 6-функциями вре¬ мени. Указанное обстоятельство и вынуждает нас перейти от системы (23.3) к обобщенной системе (23.1) и рассмотреть для последней задачу 4.2. При этом интенсивности и*[и] (23.4), (23.5) заменяются соответственно следующими интенсивностями х [dU] обобщенного управления dU (см. Приложение, § 60): %[dU} = J (23.6) ч %[dU] = 5 r‘li]. (23.7) ч Учитывая данную физическую интерпретацию, мы уддем на¬ зывать интенсивности (23.6), (23.7) полными импульсами управля¬ ющего воздействия dU. Сказанное здесь и объясняет применение термина «импульс управляющего воздействия» в заглавии настоя¬ щего параграфа.
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 183 Существенно отметить, что все- рассматриваемые в этом параг¬ рафе задачи мы можем также объединить и по формальному ма¬ тематическому признаку. Именно, в соответствии с материалом § 14 заключаем, что величина х [dU], оценивающая ресурсы, зат¬ рачиваемые на управление на отрезке времени t- — t < tp, может трактоваться как норма р* [фу] х Wl = р* [С7] - р* [Фи1 (23.8) линейной операции фу lh (41 = $ h(x)dU (тХ 4 порождаемой функцией U (т) в пространстве ЗВ {h (т); Za 1 т <О₽} непрерывных r-мерных вектор-функций h (т) = {h± (т),... Д. (т)} с подходящей метрикой р[Л((Г]= max у[Л(т)]. (23.9) Примеры такого выбора нормы р [h (т)] для наиболее часто встре¬ чающихся в приложениях интенсивностей х [dU] указаны в таб¬ лице 14.1, которой мы и будем пользоваться. Сказанное позволяет сформулировать исходную проблему 4.2 как задачу 14.1. Выше, в § 15, показано, что эта задача сводится к проблеме моментов. При этом, однако, предполагалось, что сис¬ тема (23.1) подвержена скалярному воздействию dU и интенсив¬ ность этого воздействия х [dU] имеет вид (23.6). Аналогичные рассуждения можно провести и в случае векторного управляю¬ щего воздействия dU с интенсивностью (23.7). Мы на них, одпако, останавливаться не будем, так как никаких принципиально но¬ вых моментов по сравнению со скалярным случаем dU здесь не возникает. Условия разрешимости проблемы моментов, к которой сводит¬ ся, следовательно, задача 14.1, выяснены в § 16. Опираясь на эти условия, в § 17 мы сформулировали правило минимакса для ре¬ шения задачи 13.1. Этим правилом, несколько видоизмененным, следует пользоваться и при решении задачи 14.1. , Указанное видоизменение состоит лишь в замене условий максимума (17.1) и (17.6) соответственно условиями х) 4 4 $ №' (т) dU> = max $ hP (т) dU = 1 (23.10) 4 и ta !) В дальнейшем, работая с обобщенными управлениями, мы будем ссы¬ латься на правила 17.1, 17.2; однако читатель должен помнить, что при этом условия максимума (17.1), (17.6) заменяются на условия вида (23.10), (23.11). (См. также § 47, стр. 387.)
184 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 при и [df7] — 1/р° или J h\x)dU° — та х и Л0' (т) dU — v° (23.11) при х [d?7] — v°. Опираясь на правило минимакса 17.1, приступим теперь к решению задачи 14.1. Первый этап решения состоит, в определе¬ нии минимальной функции Д° (т) (16.15), порождаемой минималь¬ ным движением $°(т) сопряженной системы (17.3): hQ (т) — В-'(т)х X s° (т).- Как и прежде, это движение s° \т) мы ищем в виде1) $° (т) — S [т, Zp] - Z0, s' (Zp) • с = Р'-с = 1. Задача состоит, сле¬ довательно, в определении постоянного вектора Z0, для _ которого функция h° (т) — В' (т) S [т, Zp] • Z° является , решением задачи (16.8). _ Последняя формулируется здесь'следующим образом: найти р° — min max у {Б’ (т) S [т, Zg] -Z] — max _ [ _ (т) 5° (т)] (23.12) при l'c = 1. Каки в других случаях, здесь можно исходить из правила 17.2, работая с экстремальной функцией № (т) — В' (т) S _ [т, Zp] № = — В' (т) s0 (т), определяя ее теперь из условия v0 = max к'-с = ка-с (23.13) к при max у [5'(т) 5 [т, Zz]-&] — l. Задачи (23.12), (23.13), как и аналоги задач (16.8), (13.17), суть трудные проблемы, которые, к сожалению, не сводятся к классическим вариационным задачам. Однамо в настоящее время все-таки известны некоторые эффективные приемы их численного решения, связанныэ с методами линейного и выпуклого програм¬ мирования (см., например, работу [8*]). Заметим еще, что задачу (23.12) можно рассматривать также как проблему из теории приближения функций. Поясним это. Пусть для простоты U (т) — скалярная функция. Тогда, полагая для определенности сп == 0 и выражая 1п через l (Z _ п), сведем (23.12) к задаче на абсолютный минимум п—1 Р° — mrn max I 2 lig(i} (т) — g (t) | * 1=1 l) Или, когда это удобнее по правилу 17.3 в виде )° (т) _ S [т, tj zo, s' (^) х* = Ю' х* = -1.
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 185 где функции gW (т) и g (т) выражаются известным образом через функции -<’• (т), а числа - (i = 1,...,н) уже не связаны никакими соотношениями. Но последняя задача есть не что иное, как зада- п— 1 ча о выборе^ линейной комбинации h (т) = 2 h —•• (т), сос- г=1 тавленной из заданных функций gW (т) и приближающей наи¬ лучшим образом (в метрике пространства $) другую заданную функцию g (т). Таким образом, в (23.12) мы, действительно, име¬ ем типичную проблему наилучшего приближения функций в про¬ странстве ё. К сожалению, выяснение этого обстоятельства не очень помогает делу, так как, несмотря на глубокую математичес¬ кую разработку общих вопросов, теория приближения функций не изобилует вычислительными алгоритмами для эффективного решения конкретных задач, подобных задаче (23.12). Во всяком случае, будем далее предполагать, что минимальную функцию А (т) (или экстремальную функцию h° (т)) удалось тем или иным способом найти, а вместе с тем стало известным и число р°. Предполагаем, как всегда, что задача имеет решение, т. е. р0°>0. Для того чтобы последнее условие выполнялось при лю¬ бых х* и х?, необходимо и достаточно, чтобы Н' [Zp, т] -Z = = В' (т) S [т, Zp] • • — О при I =£= 0. А это условие в свою очередь эквивалентно условию полной управляемости, данному теоре¬ мой 19.1. Таким образом устанавливается, кстати, что использова¬ ние обобщенных управлений dU (Z) не расширяет свойств управляе¬ мости системы (см. замечание на стр. 145). Мы подошли теперь ко второму этапу решения задачи, когда, имея минимальную функцию А (т), нам надлежит определить оп¬ тимальное управление dU° (т), опираясь на условие максимума (23.10). ! Рассмотрим сначала случай скалярного управляющего воздей¬ ствия dU. Интенсивность управления х [dU] определяется в этом случае равенством (23.6) и поэтому (см. таблицу 14.1) р[/г(т)] = max |й(т)|. (2314) Будем предполагать, что функция £ (т) = | h° (т) | достигает своего наибольшего значения -р° (23.12) лишь в конечном числе точек Tj (/ = 1, . . ., т) из промежутка Za — т — Zp. Например, в слу¬ чае постоянных параметров системы (А = const; В = Ъ = const в (23.1)) указанное условие выполняется, если векторы Ь, АЬ, . . . . . ., АП-1Ь линейно независимы и матрица А неособая. В самом деле, если бы у функции £ (т) = | h° (т) | на отрезке [Za, Zp]j6imio беско¬ нечное число максимумов, то производная dh° (x)/dx имела бы на этом отрезке бесконечное число нулей. Но Д° (т) есть функция
186 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 аналитическая, и поэтому в таком случае она была бы по¬ стоянной. Однако при указанных нами условиях Л° (т) быть постоянной не может. Действительно, если предположить, что Ю (т) = b's° (т) = const, то выполнялись бы соотношения dh° ((;)/ dx = — {Ab}' s° (т) = 0,.... (Th j dx1 = (— 1)” {An&}'so(it), из которых в силу линейной независимости векторов b, АЬ, . . ., Аи^Ь вытекало бы равенство s° (т) = 0, которое невозможно вслед¬ ствие краевого условия c's° (£р) = 1. Покажем теперь, что функция U° (т), определяющая искомое оптимальное управление dU° (т), является кусочно-постоянной с разрывами непрерывности только в точках т7- ( = 1, . . ., т). Для этого достаточно показать, что полное изменение var [ U°] функ¬ ции U° (т) на любом отрезке [£х, £2], не содержащем точек т- равно нулю. Покажем это. В самом деле, если отрезок [ [ , t2] не содержит точек Xj, то max | А. (т) | < щах |А0(т) |. (23.15) С другой стороны, опираясь на условие максимума (23.10), мы можем записать неравенство max | h° (х) | • var = р [А0 (т)] • р* [£7° (т)] = *3 = \ Л° (т) dU° (т) , max | ИР (т) | • var + га 4- max | h° (т) | • var [ U0 [ [[ + max | h° (г) | • var*[LT°].₽ . (23.16) г] Очевидно, вследствие равенства var И4']/*' = var [f/0]£ + var + var (и°]^ соотношения (23.15), (23.16) могут одновременно выполняться лишь при условии var [U° (г))]* = 0. Это и доказывает наше утверждение. Пусть теперь управляющее воздействие dU — вектор и интен¬ сивность х [dU] этого воздействия определяется равенством (23.0). Как и прежде, мы будем предполагать, что вектор-функция £ (т) = у [Д° (т)] из (23.12) достигает своего наибольшего значе¬ ния р0 (23.12) лишь в конечном числе точек Xj (j = 1, . . ., m).
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 187 Тогда вектор-функция U° (т), определяющая искомое оптималь¬ ное управление dU° (£), является кусочно-постоянной функцией с разрывами непрерывности только в точках xj (/ = 1, . . т). Мы не будем здесь останавливаться на доказательстве этого ут¬ верждения, так как оно складывается из рассуждений, совершен¬ но аналогичных тем, которые мы привели выше в случае скаляр¬ ного воздействия dU. Таким образом, мы приходим к выводу, что искомая функция [7° (т), определяющая оптимальное управляющее воздействие dU°, имеет вид UQ (х) = qW = О при при тх < X < т2, (23.17) 2(т) при Хт < t <fg, если xm==tp, или вид ' g(°) = 0 при при t/x. Т, T1 << X Т2, /■"(Щ = q(m'~1) при Tn-i < Т < Хт, . qM при Tm = (23.18) есйи xm=^$ (предполагается, что T^tj-i)- Обозначим рО) = д(;) — д(;-1) (/ = 1, . . ., т). (23.19) Условие максимума (23.10) трансформируется теперь в условие /г°' (т) P(J) = max A°' (т) р при х* [р] = Y* [р0’) (23.20) р (7 = 1 .. .,т), причем Г* [р(1) + . . . + Г* [р») 1 = 1 /Р°. (23.21) Кроме того, векторы рЫ (7 = 1, . . ., т) должны удовлетворять уравнениям A[i]' Ti] • . + h,Y [if3, rm] • р^) =Ci (i = 1,. . .,n), (23.22) в которые превращается здесь система (15.6). В частности, если dU — скаляр, то условие (23.20) означает, что sgn р, = sgn^°(T7). Если же управляющее воздействие dU — вектор и у* [dU] = = || dU ||, то условие (23.20) означает, что векторы р, и hQ (т;) одинаково направлены,
188 СВОЙСТВА оптимального управления [Гл. 6 Используя понятие 6-функции (см. § 7), мы можем также ска¬ зать, что воздействие на систему (23.1) обобщенного управления dUQ (7), определяемого функцией С7° (т) (23.17), (23.18), экви¬ валентно воздействию на систему (23.3) импульсного управления т и (£), равного и (f) = ^Pp®b(t— т,). Здесь постоянные векторы . ;=! р® (23.19) характеризуют, следовательно, величину мгновенных импульсов и обладают свойством sgnpn =sgn — (т;) (А = 1, . . . , г; 7 = 1, . . . , т). (23.23) Итак, мы можем записать оптимальное управляющее воздей¬ ствие dU° в виде dt7° (t) = 2 p(i) 6 (t — T)) dt. (23.24) i=i Заметим, что при — = tm величину 6 (t — тт) в (23.24) следует понимать в смысле 6~ (t — хт) (см. § 7, стр. 50). Результаты наших рассуждений мы объединим в — следующую теорему. Теорема 23.1. Рассмотрим задачу 14.1. Пусть миними¬ зируется интенсивность х [dU] вида (23.7). Пусть s° (t) — то из движений s (t) сопряженной системы (17.3), удовлетворяющих крае¬ вому условию s0' (£р) — = 1, для которого максимум отклонения от нуля порождаемой им функции h° (т) = В' (т) -s0 (т) (измерен¬ ного в метрике у [А]) является минимальным. Здесь • с = х& — X [ - , t«| х* — - X [(, т] dW. Если указанное отклонение р° отлично от нуля, то задача 14.1 об оптимальном управлении системой (23.1) имеет решение, при¬ чем число р° и определяет как раз минимальное значение полного импульса и [dU°] оптимальной управляющей силы dU° (t), равное 1/р°. Это воздействие dU° (t) представляет собой последователь¬ ность мгновенных ударных воздействий, описываемых б-функциями р® 6 (t — Xj) (j = 1,..,т) и прилагаемых к управляемой системе в те моменты времени xj (j = 1,...,т), когда отклонение от нуля у [А° (т)] минимальной функции hQ (т) достигает своего наиболь¬ шего значения р°. В частности, если y*|dU] ~||с?7||, то у [А0] = — || Д° (т) || и направление вектора р® совпадает с направлением вектора h° (т,-)-
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 189 На основании этой теоремы мы можем указать следующую процедуру решения задачи об оптимальном управлении систе¬ мой (23.1). Для того чтобы решить указанную задачу, следует: 1) по заданной интенсивности и [dCZ] (23.7) выбрать метрику р (А(т)] (23.9) так, чтобы величина х [dU] имела смысл нормы р* [£7] (23.8); 2) найти, опираясь на условия (23.12), минимальное движение s°|(Z) сопряженной системы (17.3), определив тем самым мини¬ мальную функцию h° (т) = В' (т) s° (т) и максимум р° (23.12) ее отклонения у [А0 (т)] от нуля; 3) определить моменты времени t = т (/ = 1,..., тг),в которые это отклонение у [Л° (т)] достигает своего наибольшего значе¬ ния р°; 4) для определения оптимального управления dU° (23.24) вос¬ пользоваться условиями максимума (23.20), (23.21); если этого окажется недостаточно, то надлежит составить систему уравне¬ ний (23.22) и привлечь ее • к определению величин pW. Пункты 2) — 4) соответствуют правилам минимакса 17.1, 17.3, опирающимся на минимальную функцию Л° (т). Аналогич¬ ным образом - они строятся, если за основу выбирается экст¬ ремальная, функция — (т), фигурирующая в правилах 17.2, 17.4. В частности, пункты 2) и 3) формулируются тогда следующим образом: 2) найти, опираясь на условие (23.13), экстремальное движение sa (t) сопряженной системы (17.3), определив тем самым экстре¬ мальную функцию № (т) = В' (т) s° (т) и число v° (23.13), опре¬ деляющее норму оптимального управления dU0: x[dU°] = = р* [С70] = v°. 3) определить моменты времени t = Xj (/ =1...., m), в кото¬ рые отклонение у [Д° (т)] экстремальной функции h° (т) от нуля достигает своего наибольшего значения, равного единице. Теорема 23.1, на основе которой мы изложили процедуру ре¬ шения задачи об оптимальном управлении системой (23.1), уста¬ новлена нами в предположении, что отклонение у [Л°] от нуля минимальной функции h° (т) достигает своего наибольшего зна¬ чения р° лишь в отдельные изолированные моменты времени Ту (/ = 1,..., т). В случаях, когда это условие не выполняется (нап¬ ример, когда № (т) = const), для определения управления dU° необходимо привлекать дополнительные соображения. Не об¬ суждая этот вопрос подробно, отметим лишь, что и в таких слу¬ чаях управление dU° (t) следует искать в виде последовательности импульсов. При этом моменты времени t = Xj следует выбирать тогда из условия, чтобы ранг матрицы F {h;1-1 (т;)} (Z = 1, ..., п; k = 1,..., г; / = 1,...,тг) системы (23.22) был равен рангу ее
190 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 расширенной матрицы (F, с) и чтобы решение этой системыудовлет- ' воряло ограничению (23.21). Более того, на примерах, рассмат¬ риваемых ниже, можно убедиться, что число т моментов вре¬ мени t = Ту удается выбрать не превосходящим порядка п сис¬ темы (23.1). Мы не будем останавливаться на подробном общем разборе возникающей здесь ситуации, отсылая интересующегося читателя к специальной литературе [1106, д; 123а; 3896]. От¬ метим лишь, что определение моментов т7- может быть, например, осуществлено путем малой деформации параметров системы, начальных условий или вида интенсивности х [dU] с последую¬ щим предельным переходом (см. ниже конец этого параграфа, а также конец § 24). Перейдем к конкретным примерам. Пример 23.1. Рассмотрим задачу, поставленную в § 14 (стр. 90), о пере¬ воде материальной точки т на круговую орбиту, охватывающую центр масс М. Будем предполагать и здесь, что реактивная масса выбрасывается с постоянной по модулю относительной скоростью в направлении, перпен¬ дикулярном к радиусу-вектору точки. Уравнения движения точки могут быть тогда записаны в виде (см. (14.13), (21.10)) dxy = dt, \ dxv< = — xidt 4- хз dt, 1 (23.25) dx3 = dU. / В качестве интенсивности к [сШ], оценивающей ресурсы, затрачиваемые на управление на отрезке времени 0 & t & Л мы выберем величину (23.6) полного импульса управляющей силы dU. В § 14 показано, что минимиза¬ ция импульса (23.6) может быть истолкована как исполнение требования о наименьшем расходе реактивной массы (0). В соответствии с общей про¬ цедурой решения, прежде всего, надлежало бы определить по заданной ин¬ тенсивности х [dZ7] (23.6) норму р [h (т)] (23.9). Но мы уже знаем, что р [h (т)] определяется в этом случае равенством (23.14). Следуя правилу ф 17.2, найдем экстремальную функцию & (т), опираясь на условия (23.13)- Функция h (?) =В' (т) S [т, fg- &, фигурирующая в (23.13), вычислена уже в § 21 и определяется формулой (21.11). Запишем ее в виде h (т) = ki + ka ф /^ф fc® - sin (Т — т - £), (23.26) где tg £ = k—jk2. Задача (23.26) может быть теперь сформулирована так: найти v° = max (ci&i > cf^a ф сэ^) (23.27) к при max | к± -ф- к3 ф У /с? ф- /с?- sin (Т & т -а £) | < 1, где компоненты q векто¬ ра с определены равенством (21.13). Для наглядности рассмотрим случай, когда Т = 4л. Тогда нетрудно сообразить, что задача (23.27) сводится к следующему: найти V° = max [q%i 4- с2%2 -ф- с3%4 (23.28)
§ 23] УПРАВЛЕНИЕ С МИНИМ А .ЯВНЫМ ИМПУЛЬСОМ 191 при |Хз|-г /%1 -I- Х| = 1- (23.29) Здесь введены обозначения: -- k\, = kz, % = + Ад; c = £3о — *10, С3 — — #20( Сз — — *30« Равенство (23.29) определяет в пространстве {%г, %2, %3) поверхность & , сос¬ тавленную из конусов (рис. 23.1). Гео¬ метрически задача (23.28), (23.29) озна¬ чает, что среди всех плоскостей & & ка¬ сающихся поверхности ©, следует найти ту, которая ортогональна к вектору с; точка касания {%£ & &} этой плоско¬ сти с поверхностью & и определит иско¬ мый вектор Х° = <Хг Хг- Хз)- Из рис. 23.1 видно, что если вектор с ортогонален боковой поверхности & & то плоскость касается конической поверх¬ ности по образующей и, следовательно, задача (23.28), (23.29) имеет бесчислен¬ ное множество решений Если же вектор с не ортогонален к поверхно¬ сти & , то плоскость касается © лишь в одной точке и, следовательно, задача (23.28), (23.29) имеет единственное ре¬ шение Таким образом, видим, что решение Рис. 23.1. этой задачи доставляет вектор хс = {ci/у« +4- А/ у4 + 4. о}, '(23.30) если угол ф (см. рис. 23.1) таков: ф = - у — arccos | сз|/||с|| = — — arccos —7 — /(*30 — *10)2 + *20 + *30 или вектор (23.31) если Х° = {0, О, sgn Сз}, (23.32) ф = — arccos _. *3q1 .. . . . У О30 — *ю/ + ^2о + Предположим сначала, что выполняется условие (23.31). (23.26), (23.28), (23.30) получаем, что экстремальная функция деляется равенствами /г° (Т) =. — sin (Т + £) = У (ж30 — хм)® + х|0 •Л°(т), Г]О— *ПО = &_ (0<£<2«). (23.33) Тогда из № (т) опре- (23.34)
192 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. G Следовательно, отклонение от нуля у [Л° (т)] = | Л° (т) | минимальной фун¬ кции 7г° (т) достигает своего максимума) 1 ро = , ■ • = |/ (*зо — *ю)2 4 *2о (23.35) в моменты времени T = уН2/—^—0 = arctg (7 = 1.....4), -10 — *30) *20 / (23.36) если Я20 4 0, или в моменты времени т = я( — 1) ( = 1,..., 5),"j если я2о = 0. Условий максимума (23.20), (23.21) здесь недостаточно для полного определения всех величин р(;). Поэтому составим систему уравнений (23.22). В случае (23.31) при #20 =/= 0 эта система имеет вид (23.37) (1 — sin g°) р(1) 4 (1 4 sin £°) р(2> + (1 — sin g°) р<3) 4 4(14 sin £°)= — Хю, — cos £° + cos £°р(2) — cos S0^3) 4 cos £°р(4)=—*2о, р{1) __ р(2) __ р(3) р(4) = и результат ее разрешения при ограничении (23.21) I Р(1) I -I- I Р2> | + I Р(3) I + I Pi} I = У(*30 — *ю)2 + *2о следующий: р(1', р(2) р(3) р^4)— произвольные числа, стескснные I Р(1> I 4 I Р(3) 1= '41^(Z30 _ ^TJO^ + *2° — *30 Sgn *20J , Sgn = Sgn р<3> = | Р(2) I 4 I P(4) I = У { V(*30 — *1»)2 4 -20 + *30 s8n -so}, Sgn p(2) = Sgn p(4) = Sgn #20. При #20 = 0 система (23.22), соответствующая случаю (23.31), 0 • р(1) 4 2р(2) + 0 • р(3) 4 2р(4) 4 0 • р(5) = — я^ ' 0-р(1) 4 0-р(2) 4 0-р(3) 4 0-р(4) 4 0*р(5) = 0, р(1) 4 р(2) 4 р(3) 4 р(4) 4 р(5) — — *зо, . и результат ее разрешения при ограничении (23.21) I PW I 4 ... 4 | Р(5) I = V(*зо — Мо)2 -1- *20 — sgn (Г20, (23.38) условиям (23.39) имеет вид (23.40)
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 193 следующий: р1^ ^.^р^ — любые чиcла, стесненные условиями р(2) 4- Pw — — 4 д.м>. sgn р(2) = sgnp(4) = sgn (ж0 — Жо) р(1) + р(8) 4- р(5) — — Гд0 4— A Ж° sgn р(1) = sgn р(3) = sgn р<5) = — sgn (жо — Гю). (23.41) Таким образом, если начальные условия *р (i = 1, 2, 3) удовлетворяют соотношению (23.31), то оптимальное управляющее воздействие dU° (23.24) может быть представлено в виде: (при *20 =/= 0) dl/a (t) = |р<!>6 (t — -А- + g°) + р<2> 6 (t - у л + + +Р(8>в((—+ $)+Р4 6 (23.42) где р(г) (i = 1,...,4) удовлетворяют (23.39); (при ж° = °) dU° (<) = {р(1) б (0 + р2> б (t — л) + р(3) 6(t — 2л) + р(4) 6 (t — Зл) + + р(6) б" (t — 4л)} dt, (23.43) где р(г) (i = 1,...,5) удовлетворяют (23.41). Из (23.39), (23.41) следуеж что число импульсов р(г) б (t — т$) в (23.42), (23.43) может быть выбрано (и не¬ однозначно!) не превосходящим порядка системы. Предположим теперь, что начальные условия удовлетворяют соотно¬ шению (23.33). Тогда из (23.26), (23.28), (23.32) получаем, что минимальная функция h° (т) тождественна постоянной: л°(т) = --Д' (23-44) и, следовательно, отклонение | h° (т) | ее от нуля есть также величина посто¬ янная, равная |Л° (т) | = 1/ | *30 I = Р°. (23 45) Ограничимся для простоты случаем, когда вектор с (см. рис. 23.1) направ¬ лен по оси и %3, т. е. *20 = 0, *w = *30, и проверим, что оптимальное управ¬ ляющее воздействие dU° может быть здесь также построено в виде (23.24). Управляющее воздействие dU° ищем в виде dU° = {р(« б (t — t,) + р(2> б (t — та)) dt, (23.46) где тх, т2 — некоторые моменты времени из промежутка 0 11р 4л. Система уравнений (23.22) может быть представлена в виде рС) Cos Tj 4- р 1 cos т2 = 0, р(1) sin ж 4- р2> sin т2 = 0 р(1) _|_ р(2) = — хо. (23А1) Попробуем выбрать, например, тх = л, та = 4л. Разрешая тогда систему Уравнений (23.47) при ограничении (23.21) |р(1) 1 + 1 р<2) 1 = 1 1 |. 7 Н. н. Красовский
194 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 находим, что 1 Таким образом, оптимальное управляющее воздействие dU° (t) может быть выбрано равным dU<> (Z) = — {6 (t — л) 4- 6~(* — 4л)} dt. Приведенный пример показывает, что рассматриваемая в этом параг¬ рафе задача об оптимальном управлении • имеет, вообще говоря, не единст¬ венное решение. Пример 23.2. Рассмотрим задачу об управлении материальной точкой, движущейся в вертикальной плоскости под действием реактивной силы и силы тяжести. Эта задача уже изучалась в • • 18 и 21. Обобщенные уравнения движения точки могут быть представлены в виде dxi = xzdt, dxz = dUi, dxs = xtdt, dxi = dU2 — gdt. (23.48) Здесь величины dUt и dU2 вводятся точно так же, как и в примере 14.1. Мы будем минимизировать величину 1 к [rftf] = < Ус^Ц2[ 4- dU*. (23.49) О Это означает (см. § 14), что мы хотим осуществить перевод точки из состоя¬ ния х (0) == {—1, 0,0 0} в состояние х (1) = {0, 0,0,0} с минималь¬ ным расходом запаса реактивной массы (0). Прежде всего, пользуясь таб- лицей14.1, определяем норму р [h (т)] (23.9) по заданной интенсивности х [dZ7] (23.49): Р [Л(т)] = шах [А® (т) -К h* Будем исходить из правила 17.1. Минимальную функцию h° (г) будем определять из условия (23.12). Функции h (т) = В' (т) s (т) = B' (т) S X X [т, tg]-Z и постоянный вектор с из (23.13) вычислены уже в*§ 18 (см. стр. 187). В соответствии с этими данными задача (23.12) сформулируется так: найти ро = min max {[Zi (1 — т) 4 Z2Ja 4- [Zs (1 — т) 4- Z4]a},/2 (2Э50) I при Zi 4 Iз 4" gh = 1 . Нетрудно заметить, что при любом выборе Z наибольшим значением функции / (т, Z) = dZx (1 — т) + Z2]2 + [Z3 (1 — т) + Z1]2},/2 будет одно из йй значений / Z) = [(Zx + z2)2 + (Z3 + Z^)2]^
б 23] управление с минимальным импульсом 195 Зафиксируем значение функции X (Z) = / (1, Z): X (Z) = / (1,Z) = ц, и решим задачу: найти = min / (О, Z) £23.51) Z при / (1, Z) = Т, li + 2 h gh — 1. Для решения задачи (23.51) воспользуемся методом • неопределенных множителей Лагранжа (см., например, § 18). В результате получаем, что решение доставляют числа ю £2! 4 - /6*+4_ ' ,0 — О /О 9/0 Z2 - g lv Z3 — g2 + 4 ) (23.52) Подставляем величины (23.52) в выра¬ жение (23.51); найдем функцию £ = £(р): (23-53) Построим графики функций £ = £ (ц) и £ = ц (рис. 23.2). Так как число р° (23.12) равно минимуму наибольшей из величин / (0,Z) и / (1,/), то из рис. 23.2 заключаем, что этот минимум достигается в данном случае при условии, когда / <0, Z) = / (1 ZZ, т. е. при т] = т)° = 1/ У g2 + 4. Следовательно, Числа Z? (Z = 1,...,4) окончательно (23.52)): 1 2 определяются равенствами (см. (23.54) 4 + 2 Ч ”■ g2 + 4 ’ 2 2 g2 + 4. 2=0р=. (23.55) 4 g34*4 Ро = $ (П°) = по = и, следовательно, минимальная функция h° (т) равна Л0(Т)=[ лДт) ^(т) (23.56) Мы уже отметили выше, что отклонение у [А0 (т)] = {[А® (т)]2 + + [22 (т)]2},/2 этой функции от нуля достигает наибольшего значения в мо¬ мент времени t в 0 и t » 1. Теперь для определения оптимального управле¬ ния dUQ (23.24) следует найти векторы p{t) и р(2), исходя из условий (23.20), (23.21). 7*
196 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Векторы h° (0) и h° (1) равны соответственно Г 2 -1 Г “ 1 Ло(О) = g ■ . A'(l) = ?4-4 g g2 + 4 J g'+4 J Векторы р § 1 § и р § 2§ т. е. в данном случае коллинеарны h° (0) и h° (1); поэтому, учитывая (23.21), || + || р ( 2 > || = W + 4 ; (23.57) трудно сообразить, что Таким образом, искомое оптимальное управление dU° (23.24) имеет вид ■ 1 ' ' — 1" dUo(t) = £ 6 (t) dt + 8 _ 2 _ _ 2 _ 6“ (г — i)dt (23.58) и сводится, следовательно, к двум импульсам. Мы изучили сейчас задачу о перебросе в вертикальной плоскости тяжелой материальной точки, предполагая заданными ее положения и скоро¬ сти в начальный и конечный моменты движения. Рассмотрим теперь подоб¬ ную же задачу, считая, однако, заданными лишь начальное и конечное по¬ ложения точки и ее начальную скорость и не ограничивая ее скорость в ко¬ нечный момент движения (см. § 13). Итак рассмотрим задачу об управлении материальной точкой, движущейся под действием реактивной силы и силы тяжести согласно уравнениям (23.48) из состояния х (ta) = {я®}, = 0 в состояние х (&) = {0, х2 (^), 0, х± (fy)}, tу = 1, где на величины х2 (1), х± (1) не наложено никаких ограничений. Это движение требуется осуществить с минимальным расходом запаса реактивной массы т § (0). Поэтому в каче¬ стве интенсивности управления мы снова выбираем величину (23.49). Задача, следовательно, состоит в определении воздействия условиям (см. § 1): 1 \(1-т}){7« = i-x; = с, О 1 J(l-r)<h« = -f-^ = C2, О х [d Z^°] = min к [d UJ, удовлетворяющего I (23.59) Из результатов р § 15—17 вытекает, что при решении задачи (23.59), (23.60) мы можем в основных частях следовать указанной на стр. 184 процедуре. Особенность здесь состоит лишь в том, что минимальную функцию Л»(т)
£ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 197 необходимо определить среди функций h (т) вида (23.61) причем, как и прежде, р [h (т)] = max [hJ (т) + (т)]‘ Задача (23.12) принимает здесь вид: найти р° = min max [(1 — т)2 l* + (1 — т)2 /| ра l т ' при • -• - + с3 = 1. Совершенно ясно, что функция £ (т) = [(1 — т)2 Z- + +(1—при любых lit 13 достигает своего наибольшего значения при т = 0 и это значение равно (Z, + ф^2. °гсюда сразу следует, что и функция • h9 (т) имеет вид Таким образом, искомое оптимальное управляющее воздействие dU0 (Z) представляет собой единственный импульс в начальный момент движения dU9(t) = = 6 (Z) dt У (I-*')2 + (0/2-*“)2 ~г ^— 6 (Z) dt У((-х“)2 + (//2-^)* что, конечно, нетрудно было сообразить сразу из физических обстоятельств. Разберем еще один случай, когда минимальная функция А (т) оказывается тождественно постоянной и, следовательно, когда эта функция не доставляет информации о тех моментах времени t = ту, в которые должны прилагаться управляющие импульсные воздействия. На следующем ниже примере будет показано, как эти моменты можно определить, используя малую деформацию параметров системы (см. выше стр. 190). При этом мы ограничимся лишь,разбором простейшей конкретной задачи. Развитие описы¬ ваемых далее рассуждений и их обоснование в общем случае мож¬ но порекомендовать интересующемуся читателю в качестве полез¬ ного самостоятельного исследования. Пример 23.3. Рассмотрим материальную точку на прямой g. Пусть эту точку, массу которой т примем равной единице, требуется пере¬ вести из начального положения g (0) = gx = — 1 g (0) = £х = v (v > 1) в
198 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 состояние покоя £ (1) — — 0 £ (1) — ^ — 0 при условии минимума им¬ пульса управляющей силы и (t), т. е. при условии 1 1 | и (т) | dx =Л | dU (т) | — min. (23.62) 6 о Эта задача, конечно, решается сразу из физических соображений, от¬ куда выводится, что оптимальное управление uQ(t) можно выбрать в форме единственного импульсного воздействия и (Z) — —. о6 > (23.63) которое прилагается, следовательно, в момент t = тг — 1/о. Мы, однако, проследим здесь регулярный «научный» путь решения этой задачи с тем, чтобы проиллюстрировать на нем метод деформации системы. Составим уравнения движения в нормальной форме (23.1). Полагая 1 = 1 = __ получим: dxt — х% dt, ■ dx2 — dU. (23.64) Система, сопряженная к системе (23.64), имеет вид $1 — 0, $2 — — 51, (23.65) и ее фундаментальная матрица S [Z, Zo] такова: £ р 4 Я- (.- io) 0 Г (23'66) В данном случае = 0, ^ — 1, поэтому минимальную функцию hQ (т) в соответствии с ма¬ териалом на стр. 184—189 надлежит искать в виде где вектор Z° — (Zj, 1%) является решением задачи max | Z2 — ZiT | — min (0<т<1) (23.68) т I при условии Z'z® — (Z1, Z2) (23.69) Нетрудно проверить, что последнюю задачу (23.68), (23.69) разрешают числа I® —0, Z® — —1/о. Следовательно, минимальная функция 1 А° (т) — — — — const
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬНЫМ ИМПУЛЬСОМ 199 оказывается тождественно равной постоянному числу, и действительно, в данном случае эта функция не доставляет информации о момептах t == Tj, когда должны прилагаться импульсные воздействия. Составим вспомогательную задачу. Сопоставим системе (23.64) новую систему dxr = x2dt, dx2 = —8 Хг dt + dU, (23.70) где постоянная е > 0 — малый параметр. При е -> 0 уравнения (23.70) переходят в исходные уравнения (23.64). Рассмотрим снова задачу об управ¬ лении при условии (23.62), но теперь уже для вспомогательной системы (23.70), полагая, однако, снова х* = — l,v), = (0,0). Система (23.70) удовлетворяет условиям, указанным на стр. 185 —186. Поэтому минималь¬ ная функция Tig (т), отвечающая новой задаче об управлении системой (23.70), обязательно будет неособой и будет, следовательно, доставлять ин¬ формацию о моментах t = в которые должны прилагаться импульсные воздействия. (Напомним, что t == т( — это те точки, в которых функция ||Л°(£) II достигает своего наибольшего, , значения.) Вычисляя эти значения и рассматривая их поведение при е —> 0, мы и определим моменты х- = Птт!е) при е-—■О, (23.71) в которые должны прилагаться импульсные управления в исходной задаче об управлении системой (23.64). (Строгое .обоснование того правдоподобного утверждения, что величины (23.71), действительно, в общем случае достав¬ ляют нужные значения t = Tj, мы оставляем в стороне и ограничимся ниже лишь соответствующими выкладками, определяющими число тп уже извест¬ ное нам здесь в частном случае из физических соображений.) Итак, начнем решать задачу об управлении системой (23.70), опираясь на теорему 23.1. Система, сопряженная к системе (23.70), имеет вид s 1 $2, 52 (23 .72) и ее фундаментальная матрица Sz [г, £0] такова: COS 8 (Z — to) 8 sin 8 (— to) 1 • — — sin 8 (Z — to) COS 8 (t — to) Следовательно, минимальную функцию h® (т) надлежит здесь искать в виде h® (т) = B'SZ [т, 0] /(е) = /<£> cos 8Т - - - - — sin вт, (23.73) где вектор I--- = (l^, 1^) является решением задачи I - I ре = max | /2Cos8T — /i —- sin ет | = min (0«<т< 1) (23.74) при условии (23.69). Можно сообразить, что в данном случае при малых значениях е график минимальной функции — (т) (23.73) будет иметь вид, изображенный на рис. 23.3, причем
200 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. О где функции fa (е) уничтожаются при е -> 0. Для оценки этих функций мы ограничимся в выражении (23.73) лишь членами вплоть до второго порядка малости по малой величине т е. Функции Д (е) будем также аппроксимиро¬ вать многочленами по е, ограничиваясь лишь второй степенью е. При этом важно заметить, что члены с первой степенью е в разложении величин и 1^ должны отсутствовать, ибо в против¬ ном случае график функции h® (т) имел бы вид, изображенный на рис. 23.3 пункти¬ ром, а это для минимальной функции h® невозможно, так как max | h® т < шах | h° (т) |. Итак, будем искать т мальную функцию h® (т) в виде WM0 - № ~ Эта функция имеет минимум в /<е> т(е) ~ __ . 1 ~ вМ/<е) • Теперь для оценки числа т I I остает¬ ся вычислить величины и Т| I из усло¬ вий (23.74), (23.69). Таким образом, дело значений I т т и при которых величина __ 14 - “ I 2 е./«> + J = _Г1 ' ■ + , Л L 2 /<«> . еа + '• J достигает минимума. Искомые значения ТIе I , как легко подсчитать, будут /(е) ~ _L Ез Д1 — v2 ь * Отсюда и из (23.74), (23.75) = v + сводится к определению таких е2 (т^е02 I»(г?) | - -А” + /[е)т‘е> + /)■> — (Т) |< мини¬ точке (23.75) 9 Ф—-v - — * получаем окончательно: 1 1 о Ре “ V 2v3 е “I ' где /з (е) -> 0 при е -> 0. Но это и означает, что предел (23.71) доставляет нам искомую величину тх = 1/v. Подчеркнем, что описанная процедура определения моментов в общем случае годится, пожалуй, скорее лишь для теоретического исследования вопроса, так как практическое осуществление ее связано с большими тех¬ ническими трудностями. В заключение этого параграфа отметим следующее интересное обстоятельство, на которое обратил внимание автора Ю. М. Ре¬ пин. Пусть для простоты управление и (t) является скалярной
§ 23] УПРАВЛЕНИЕ С МИНИМАЛЬМЫМ ИМПУЛЬСОМ 201 функцией, а система (23.1) — стационарной. Импульсные управ¬ ления вида и (t) = 6 (t — ta) являются простейшими примерами обобщенных Можно теперь, обобщая еще понятие допускаемого управления, попытаться строить воздействия и (t) в виде линейной комбинации u (< = [ (t — Q 4- Р26<1> (t — t») + . . . +?n6(n_1) ( — ta), (23.06) где символы 6<’> (t — ta) обозначают последовательные обобщен¬ ные производные от б-функции. Тогда, желая разрешить задачу об управлении 4.1 за счет управления u(t) вида (23.06), мы долж¬ ны удовлетворить уравнению п с= j X 0 U , т] b (23.00) *« 4=1 J где вектор с определен равенствами (15.2). Вычисляя правую часть равенства (23.00) по известным правилам работы с обобщенными функциями, получим из (23.00) векторное уравнение q =Pi Ь + р^АЬ + ...+ pnA”-ib (q = ХЦ, ta]c), (23.08) из которого следует, что числа р, суть коэффициенты разложения вектора с по векторам b, Ab, ..., А”~1Ь и задача разрешима при лю¬ бых краевых условиях х* и х9 тогда и только тогда, когда эти векторы b, ЛЬ,..., Ап~1Ъ линейно независимы. Таким образом, мы снова приходим к условиям управляемости, выведенным в § 19. Само собой разумеется, что управление (23.06) является лишь абст¬ рактной математической конструкцией, ибо точная реализация обобщенного управления (23.06), очевидно, невозможна. Однако данное рассмотрение полезно для изучения задачи управления системой (23.1) в случаях, когда отрезок [£а, tx + в], на котором прилагается воздействие и (t), желательно иметь весьма малым, ибо в этом случае обобщенные воздействия №( — ta) можно ап¬ проксимировать обыкновенными функциями, полагая, например, 1 6(( — Q = — при <<£<£а + e, 6(« — <„) = 0 при £>£х + е 6(1) (t — Q = 0 при U u <<<£а+ у , 6 ’ (t — tx) = = П₽И *«+У<*<А + 8, 6а) (< — ta) — 0 при £ > £а + е, . . . и так далее. *) Мы предполагаем далее, что читатель знаком с простейшими понятия¬ ми теории обобщенных функций (см., например, [6*, 26*]. См. также § 40, стр. 380).
202 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 § 24. Численное решение задачи об управлении В этом параграфе мы опишем численный метод решения задачи об оптимальном управлении, основанный на той общей теории, которая была развита в предыдущих параграфах. Предлагаемый метод будет продемонстрирован на конкретных примерах, при решении которых выявятся основные особенности вычислитель¬ ной процедуры. Читатель, разобравшийся в предыдущем материа¬ ле книги и в решении приведенных примеров, сможет самостоя¬ тельно составить план вычислений и в других случаях, попадаю¬ щих под рассматриваемую или аналогичную схемы. Итак, обратимся к задаче 13.1. Если при решении этой задачи пользоваться правилом 17.1, то возникает проблема вычисления минимума п min р [B'S Hg, т] Z] = min р [2 (*)1 = р° (24.1) 4=1 J при условии п 3^1 = 1. (24.2) г=1 Именно эта задача на условный минимум и доставляет наиболь¬ шие трудности при решении кццкретных задач об управлении. В тех сравнительно простых примерах, которые были разобраны в § 18—21, задачу (24.1), (24.2) удавалось решить из элементар¬ ных соображений. В более сложных случаях приходится прибе¬ гать к численным методам. Одним из распространенных способов численного решения задач на минимум является метод наискорей¬ шего спуска и различные усовершенствованные его модификации. Подробно с этими методами можно познакомиться, например, по книге [8*]. Здесь же мы опишем лишь простейшую (в принципе!), вычислительную процедуру применительно к нашей задаче (24.1), (24.2). Будем предполагать, что система (13.1), для которой постав¬ лена задача 13.1 об оптимальном управлении, является вполне управляемой на заданном отрезке времени т "С h (см. §§ 19, 20) и, следовательно, функции UU (т), фигурирующие в (24.1), линейно независимы. Это предположение о линейной независи¬ мости функций U U (т) не уменьшает общности, так как в про¬ тивном случае дело сводится к проблеме, аналогичной задаче (24.1), (24.2), но с меньшим, чем тг, количеством функций № (т). Последние функции UU уже будут линейно независимыми (см. § 16, стр. 108).
§ 24 J ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 203 Рис, 24.1. Перейдем теперь к рассмотрению упомянутого численного метода решения задачи (24.1), (24.2). Рассмотрим n-мерное про¬ странство переменных ... . . . !п. Уравнение (24.2) определяет в про¬ странстве {ZJ некоторую гиперплоскость (л) (см. рис. 24.1, где для наглядности выбрано п = 3). Решение задачи (24.1), (24.2) состоит в определении на плоскости (л) такой точки Z° = {Zi,...,Zn}, в которой до¬ стигается минимум функции (24.1). (Таких точек, вообще говоря, может быть больше одной (см., например, §§ 23, 21), но это не вносит прин¬ ципиальных изменений в рас¬ суждения.) Величина п Р[ 221(T)J = Г Еь • • •. п 4=i J (24.3) в пространстве {Zn . . ., Zn} имеет смысл нормы вектора Z. Это нетрудно проверить, опираясь на линейную не¬ зависимость функций ЛМ (т) и учитывая, что величина р [Л(т) 1 есть норма в про¬ странстве ЗВ {Л (т)}. Такую проверку мы опустим, предостав¬ ляя ее читателю (см. также § 13). Теперь заключаем, что по¬ верхности уровня у [Z] = т], пересекаясь с гиперплоскостью (л), образуют семейство выпуклых замкнутых поверхностей, стяги¬ вающихся при убывании т] к точке /о. (В случае, когда решение задачи (24.1), (24.2) не единственно, такие поверхности при убы¬ вании т] будут стягиваться к многообразию точек {/о}.) Указан¬ ное обстоятельство определяет следующий способ вычисления координат точки Z0. Выберем на гиперплоскости какую-либо точку Z(1> = {Z(2, ..., Z(2} и будем двигаться от этой точки по ги¬ перплоскости все время в направлении наискорейшего убывания функции у [Z1?...,ZJ. В результате получим некоторую кривую £, примыкающую к искомой точке /о (см. рис. 24.1). Итак, задача поиска точки /о сводится к построению кривой £. Эту кривую мож¬ но, например, построить следующим образом. Пользуясь (24.2), исключим в выражении для у [Z1,...,ZnJ одну из переменных Z7.
204 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Пусть для определенности это будет Zn. Тогда получим некоторую функцию со ./„-J, где аргументы l уже не связаны никакими соотношениями. Введем вдоль кривой £ параметр Ф, трактуя его как время, отсчитываемое при движении точки {ZJ вдоль £ от точки Z(1) к ' точке Z0 Следовательно, на кривой £ величины Ц являются функциями от Ф, т. е. Z; = lt (й*). Тогда условие наи¬ скорейшего убывания функции со [Z1,...,ln_iJ вдоль кривой £ тре¬ бует, чтобы вектор скорости dlldft — {dlt/d#} точки Z (Ф), дви¬ жущейся по £, был все время коллинеарен вектору grad со = — {д(х/дЦ} (Z = l,...,n — 1), но направлен в противоположную сторону. Это условие дает дифференциальное уравнение l d® [Zp . . . , Z„_] dft dL (24.4) где е >0 — коэффициент пропорциональности, определяющий скорость движения по кривой С. Этот коэффициент выбирается из соображений удобства счета и в процессе вычислений его можно менять. Численное интегрирование уравнений (24.4), отправля¬ ясь от точки Z(1> и составляет в данном случае метод наискорей¬ шего спуска для проблемы (24.1), (24.2). В частности, если решать это уравнение методом ломаных Эйлера с шагом Дф, то для вы¬ числения последовательности точек Z Ы — I (у = 1, 2-,...)л сходящихся к точке Z0 получим рекуррентные соотношения <24-5) Описанный метод мы разберем теперь на следующих конкретных примерах. Рассмотрим задачу о приведении в меридиан гироскопического компаса с гидравлическим успокоителем собственных колебаний. Уравнения прецессионного движения этого гирокомпаса ХЛ — а12х2 Л13Х3 л, Хъ — «21^1, — аугРъ лзз*з, (24.6) взяты из книги [1936], где читатель и может найти пояснение ме¬ ханического смысла величин х±, х2, х3. Коэффициенты уравнений (24.6) суть постоянные величины, определенным образом выража¬ ющиеся через параметры системы. Эти параметры гирокомпаса таковы, что характеристическое уравнение системы (24.6)
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 205 при и = 0 имеет один вещественный корень & >0 и два ком¬ плексных сопряженных корня %2,з — а ± ф (а 0). Приведение гирокомпаса в меридиан, т. е. приведение его в состояние Xi = 0, после пуска в ход выполняется путем прило¬ жения к гирокомпасу добавочной внешней силы и (t). Таким пу¬ тем приходим к следующей задаче. Задача 24.1. Требуется выбрать закон изменения этой си¬ лы, исходя из требования, чтобы к моменту времени & = Т ги¬ рокомпас, описываемый уравнениями (24.6), был приведен из начального состояния х <(ta) = х (0) = х* в меридиан, т. е. в состояние х (Т) ™ х& —= 0. Удобный эффективный способ реше¬ ния этой задачи дан в цитированной книге • [1936], причем там искалось управление и (t) по возможности простой структуры и не стесненное требованием оптимальности. Здесь для сравнения мы решим задачу при тех же числовых данных, что и в книге [1936], однако будем искать такое оптимальное управление и° (Z), для которого максимальное значение модуля | u9 (t) | на от¬ резке [0, Г] есть величина, наименьшая из возможных, т. е. шах(|и0 (т)|, & & Т) = min. (24.7) т и Оптимальное управление и° (t), решающее задачу (24.6), (24.7), как показано в § 21, имеет вид п и° • • • = &■ sgn B &S [ •• • ТЧ° = & sgn ( 3 (0 = ?=1 = A sgn (ZZZ(1) (t) + (Z) + Z>(3) (Z)), (24.8) r где величины p° и Z® являются решением задачи на условный экс¬ тремум т з mm & 1 2 ^Л<!) (т) 1 dx — mm у [Z, Z2, Z3] = p° (24.9) 1 0 i=1 1 при Z.jZi + Ic + l3c3 = 1. (Напомним, что величины Ct определя¬ ются краевыми условиями я®, х& задачи, а функции & & & (т) вы¬ числяются известным образом по фундаментальной матрице сис¬ темы (24.6).) Для нахождения чисел Z®, при которых достигается минимум (24.9), применим описанную выше процедуру наискорейшего спуска по величинам Z,. Для этого исключим из выражения (24.9) для у [Zx, Z2, Z3] величину Z3. Это можно сделать, так как при избранных нами числовых данных оказывается, что с3=)= 0
206 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 (см. (24.12)). Получим функцию О Ui, М = jj | Z1 (л(1) (Т) — /г(3) (т)) + О + 12(/}(х)--№(х)) |dt. (24.10) т Производная дУд1 от величины £ = § |/ (т, /) | dx вычисляет¬ ся, как известно, по формуле - о о Поэтому производные ды/дЦ (i = 1,2) имеют здесь вид X = | [»<» « — i )h (.)] sgn [■ (»«> (Т) - —S— *<« «)) + + Z. (*“’«)——J А‘- (”) + '^]Л. 5— — J [ft<« W _ 2. *<•> (г)] sgn [I. ) h" 1 « — £*«(<)) + + Z (&ю (т) —J *“> (T>) + )] <Н, и, следовательно, дифференциальные уравнения (24.4), описы¬ вающие изменение величин Ц (ft) (i = 1,2) вдоль кривой £, принимают здесь следующую форму: = — 8 3 [л(1) ) h) - § A<3) (т)] sgn [Z (л<« ) h) — £ А3 (т)) + о + Z, (д(2) (т) — /г(3) (т)) + дх, Й = —8 J [А(2) <т) ~ Ih{3) W] 3§n pi Ю - i W) + 0 (24.11) + Z (л(2) (т) — —J A3 (t)) + дх.
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 207 Пример 24.1. Система (24.11) интегрировалась на ЭВЦМ методом ко¬ нечных разностей, т. е. дело сводилось к последовательному вычислению величин 12’) о = 1.2,...) из соотношений вида (24.5), составленных в соответствии с (24.11). Вычисления велись до тех пор, пока не прекращалось понижение значения со [Zx, Z2] в пределах выбранной точности. При этом в процессе вычислений интегралы в правых частях (24.11) также заменялись их приближенными выражениями через соответствующие интегральные сум¬ мы. Задача решалась при следующих данных: л(1) (0) = «<р ех,( + зИИ и U cos з* - Зи и U sin з*; № (Z) = а<« е1 + р<р cos pi - р<р eat sin pz;' h{>' (Z) = 1p eX1‘ + eal cos pi — ел{ sin pZ; a<i) = —0,4438; P<)) = р 1,4140; P*p = — 0,0572; a2p = —°,°2°7; pW = 0,0207; p<2) = 0,0559; a<» = 0,0503; P'P = -0,0503; P<g> =-0,0304; (24.12) Xi = — 0,8824-10-8; a = — 0.3088-10~3; 3 = 0,9481 - IO*; Г = 1800; X! (0) = 0,3; x2 (0) = хз (0) = 0,004. X1 (T) = x2 (T) = x3 (T) = 0; ci = — 0,0287; C2 = 0,0139; C3 = — 0,0101. Эти данные, как уже отмечалось, получаются в соответствии с их выраже¬ ниями (8.4), (15.2), если воспользоваться числовыми значениями для пара¬ метров (24.6) и для величин Т и xf, x^ указанных в книге [1936]. Интегрирование уравнений (24.11) было выполнено на цифровой вычи¬ слительной машине «Урал II», исходя из начального условия Z(1) = {0; —145 —298, 5643} с шагом ДО = 18. Получившаяся при этом последовательность Z(>> и и [Zy>] привела к величинам р° = lim со [№] = 2147,5177; Zj = lim Z<<> = 0,8397; 1% = lim = - 140,2842; ZZ° = lim ' = - 294,4653. j —>OO j —>0Ю Следовательно, минимальная функция hQ (т) в данном случае имеет вид h? (t) = — 12,2804е_°’8824’10~3( + 13,О951е-0,3088.1о-’( cos 0,9481 • IO"2/ — — 1,0618е—0,3088-10-ч gin 0,9481 • 10~8z, (24.13) а оптимальное управление и° (t) на основании (24.8) ио (Z) = 0,4657- 10"« sgn (— 12,28О4е_0’8824'1о_>* + 13,«951в—).зо®>•1о-•< х X cos 0,9481 -10-sZ — 1,0618е~°’3088 10-3< sin0,9481-10-3Z. (24.14)
208 СВО ЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 График этого оптимального управления приведен на рис. 24.2, где также представлены соответствующие кривые (t), х2 (t) и (t). Одновременно на рис. 24.3 изображены график управления и (t) и графики функций xt (t), т2 (0, х3 (0), отвечающие решению такой же задачи об управлении, данному в книге [1936]. Полезно сравнить управление -0,6501-10“3 при 0<т<000, и (т) = I 0,0>522*I0~3 при 600 <т< 1200, (24.15) —0,4377. Ю-з при 1200 <т< 1800,
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 209 найденное в книге [1936] и имеющее норму max | и (t) | = 0,6401*10 3 с опти- t мальным управлением (24.14). Как и следовало ожидать, мы видим, что max | и° (0 | = 0,4657-10-3 < max | и (t) | — 0,6401 -10’3. Однако разница между нормой оптимального управления u° (t) и нормой управления и (t), найденного в книге [1936] более простым способом, не столь велика (см. рис. 24.2, 24.3). Обсудим теперь более сложную ситуацию. Рассмотрим мате¬ риальную точку массы т, движущуюся в центральном поле сил тяготения, создаваемом другой точкой массы М(М* т), под действием управляющей реактивной силы, возникающей при выб¬ расывании реактивной массы по какому-либо направлению, ле¬ жащему в плоскости, где движется точка т (см. п.5° § 3). Пусть, как и выше, в примере 23.1, требуется перевести эту точку на заданную круговую орбиту Г° радиуса г0. Однако теперь мы несколько усложним задачу, предположив, прежде всего, что на¬ правление, по. которому выбрасывается реактивная масса, теперь не является фиксированным! (как это было в примере 23.1), но может изменяться в процессе управления. Тогда в уравнениях движения (3.23), к которым мы снова должны здесь обратиться, величины аг и Яф следует считать переменными. В соответствии с этим вместо одного скалярного управления и, которое фигурирует в уравне¬ ниях (3.23), введем теперь векторное управляющее воздействие {U1, щ} с компонентами и± = аги, и2 = а*и. Итак, примем, что движение точки т в линейном приближении описывается урав¬ нениями: = х21 . v 2 У vr о . •Ъ = Т *1 + —-у- *3 + ^1, ' о Х3 = Го«2. (24.16) Возвращаясь к постановке} задачи, потребуем еще дополни¬ тельно, чтобы добавочные ускорения, возникающие за счет управ¬ ляющих усилий, не превосходили наперед заданных пределов, причем сохраним пожелание о наименьшем расходе реактивной массы. Проблема перевода точки с исходной орбиты на орбиту Г°, сформулированная выше, трансформируется теперь в следую¬ щую задачу. Задача 24.2. Пусть движение материальной точки т описывается системой линейных дифференциальных уравнений (24.16). Требуется, найти управление и ~ {их, и} которое бы переводило систему (24.16) из начального состояния х (0) — х* в конечное состояние x (Т) = 0 за время Т и такое, чтобы при этом
210 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 импульс силы, был минимален т $ (Mi(T) + и2 (t))‘/2dt = mill, (24.17) о а величина управляющей силы не превосходила бы наперед заданного значения fx, m. е. [и* (t) + и* при всех t. (24.18) Задача 24.2 отличается от задачи, изученной нами в § 23, тем, что содержит дополнительное ограничение (24.18) *). Для ее решения рассмотрим сначала вспомогательную задачу ■ 13.1, где интенсивность выберем в виде хх [w] = max [max (uf (т) + и* (t))’/s, т (м? (т) + о Здесь % — пока еще неопределенное постоянное положительное . число, способ подбора которого будет пояснен ниже. Интенсив¬ ность ха [и] такого рода уже встречалась выше, в § 4, где и был пояснен ее смысл. Вспомогательную задачу можно решать спосо- • бом, описанным в этой монографии. Согласно таблице 12.1 (см. § 12) величина р* [и] = хх [и] (24.19) имеет смысл нормы р* [и] вектор-функции и (т) = {и± (т), и2 (т)}. Эта норма совпадает с нормой соответствующей линейной операции т фц[Л(т))1 = 5 /l'(T)M(T)dT,- о выполняемой в пространстве интегрируемых вектор-функций h (т) = {hy (т), h2 (т)} с нормой Р [h (т)1 = sup $ [Л? (т) + /г (Т)]'/2^г, ) д д ) (24.20) o(A)=min(l,T). ] x) В отличие от § 23 здесь не требуется переход к обобщенным управле" ниям, так как дополнительное ограничение (24.18) обеспечивает сохранение оптимального управления в классе обычных допускаемых управлений и (t), которые вследствие этого ограничения не могут вырождаться в импульсные воздействия, как это было в § 23.
2d ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ. ОБ УПРАВЛЕНИИ 211 Здесь символ Д означает систему промежутков из отрезка [0, 7], и, следовательно, в (24.20) максимум вычисляется по всем воз¬ можным системам таких отрезков с заданной суммарной длиной (или, точнее говоря, мерой а (Д)). Таким образом, имеем следующую вспомогательную задачу: среди множества интегрируемых, ограниченных на [0, 71] функ¬ ций и (t) = {и± (Z), и2 (t)} найти такую функцию и* (Z), которая обеспечила бы перевод системы (24.16) из положения х (0) = х* в положение х (Т) = 0 за время Т и которая имела бы при этом наименьшую возможную норму р*[п/| = хх [zzx] (24.19). За¬ метим, прежде всего, что данная задача, действительно, разреши¬ ма, так как ■ система (24.16) является вполне управляемой, в чем читатель может легко убедиться, проверив условия управляе¬ мости (см. § 19). Итак, задавшись некоторым числом % >0, об¬ ратимся для решения соответствующей задачи к правилу 17.3.. В соответствии с этим правилом надлежит решить задачу (17.10), (17.11). Обозначим символом &X(T) минимальную функцию, п h (т) = 5'? (т) = B'S [г, М ? (Q = B'S [т, М I = 3 ZVIiJ (т), г=1 отвечающую рассматриваемой задаче. Нам надлежит, следова¬ тельно, найти вектор Iх = {l\ 1%}, для которого вектор-функ¬ ция Дх(т) имеет наименьшую возможную норму (24.20), т. е. над¬ лежит решить следующую задачу на условный экстремум: 2 3 min max $ [ 3 (3 (г))2 * *]dx = = и2(У\А‘1«)Тл = |>‘ (24-21> 4=1 2=1 ' J при условии 1 о (ДХ = о (А) = min (^ г) , (24.22) 2=1 где Дг] (т) = </Х1(т)} — столбцы матрицы B>S [т, ct = = — xf. Для решения задачи отыскания минимума (2-4.21), (24.22) (при выбранном фиксированном X) применим процедуру опреде¬ ления /х и Дх методом наискорейшего спуска по величинам Составим функцию 2 3 т [А, В, Ы = max 4 3 ( 3 Л/П W)2 Г’dx (24.23) Л д f=l
212 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. О> и исключим из нее переменную Z3, пользуясь соотношением (24. 22), получим функцию со [Zn Z2] [Z1, Z2] = = m‘x., [ 2 [ 2 '• W - -/!” w) + V /?> (г)]1 Г dx = A k=i 1—1 — ( [З I— h + (24.24) A(0 A—1 i—l ' С3 • Теперь нам следует, исходя из какого-нибудь начального усло¬ вия {Z2X°} (/ = 1,2), спуститься в силу уравнений (24.4) по кри¬ вой £ до искомой точки (Zj'}, где со [Z*, Z2] = min. Уравнения (24.4) имеют в данном случае вид &—• . [2 (/!"«-.J/l’M X А(О К — I х (2 [2 ««(‘VW —w) + '’] Л. (24.25) к—1 j—l , Частные производные в правой части (24.25) получаются диффе¬ ренцированием по li как подынтегрального выражения в (24.24), так и всего интеграла по переменной области интегрирования Д (Z). Однако вследствие того, что при Д = Д (Z) правая часть (24.24) имеет максимум, оказывается, что последнее дифференцирование имеет результатом нуль. Здесь, впрочем, возникает дополнительная трудность спуска, которая состоит в том, что система отрезков Д(/) в правой части (24.25) зависит от значений I г (О). Следовательно, если мы будем решать уравнения (24.25), например, методом конечных разностей, т. е. будем использовать рекуррентные соотношения (24.5), кото¬ рые здесь принимают вид до J [3 (Л« (т)-А- (Т), х А(0 /—1 х 2 [ 2 ■ " -J К' О)) + ) г (24.20) а—1 г—1 то нам придется на каждом шаге пересчитывать систему отрезков Д (ДО), исходя из условия [( [2(2 2О’''Л - тах¬ А (!) *—1 г—1 Д (24.27)
§ 241 ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОВ УПРАВЛЕНИИ 213 Поясним один простейший способ приближенного вычисления системы отрезков легко реализуемый на цифровой вы¬ числительной машине. Ограничимся при этом случаем, когда <(Д) = 1/1 <С Т, так как в случае Д = [0, 71] в процедуре спуска по lt не встречается никаких особенностей по сравнению с пре¬ дыдущим примером, ибо тогда система отрезков Д ( ( ( ( ( ( = [О, Т| не меняется. Итак, пусть о(Д (Z^)) = 1/Х. Возьмем функцию »₽ (т /)={ 2 [ 2 ( ( (A,] (т- -gл31 (т))+(24.28) /=1 1=1 Ясно, что при каждом Z(P система Д(/0')) состоит из отрезков на [О, Т], где функция w (т, Z) принимает значения не меньшие, чем вне системы A(/0)). Отсюда следует такой способ определе¬ ния этой ( системы Д (Z^), отвечающий какому-либо набору чисел (Z = 162). Разобьем отрезок [О, Т1 на m, равных и весьма ма¬ лых частей точками ( ( = /Дт (Z —0, 1,,.../к). Заменим интеграл (24.24) соответствующей интегральной суммой и максимум ин¬ теграла (24.24) заменим также максимумом этой интегральной суммы. Последний максимум достигается на системе отрезков [•%. ч + Дт] ( ( = (24.29) Здесь символ Е [о(Д )/Д т] означает целую часть числа о (Д)/Дт. Суммарная длина этих отрезков, расположенных в области наи¬ больших значений функции w (т, Z) (24.28), равняется приближен¬ но величине 1/Х. Вычислим поэтому значения функции w (т^, Z) = = в точках деления ( ( и расположим полученные числа Wi в порядке убывания ((( > wti ... > w^. .Тогда приближенно искомая система, на которой достигается максимум (24.24), будет слагаться из отрезков [т^, т? + Дт] (q = (24.30) Значение функции со [ 1 ] определится теперь приближен¬ ным равенством <0 [/?■>, /£’■>] — Дт 3 w , (24.31) 9=1 q а уравнения (24.26) запишутся в виде ДтДФ, (24.32)
214 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 причем точность вычислений, естественно, повышается с увели чением числа т. Итак, теперь для определения чисел I* и системы отрезков Дх, исходя из каких-либо значений ( ( § , надлежит найти последова¬ тельности и Д ( ,,( . Тогда Zx = lim ,, при / —> оо . При этом, к сожалению, после каждого шага вычислений по формулам (24.32) приходится снова выбирать систему отрезков До>, где функция w (т, Z(Z) принимает наибольшее значение/ Найдя числа Z* и соответствующую систему Дх, мы можем оп¬ ределить и минимальную функцию Дх(т) = zZ/[1(t) + z£ /[2](т)-+ + Zj /[31 (т) и норму оптимального управления и\х), равную х[их] = 1/рх. После этого находим само оптимальное управле¬ ние, исходя из условия максимума г т Дх' (т) ux (т) dx №' (т) и (т) dx (24.33) = max \ и J О при т Ни (*) II < -4- * % g IIм (т) и . < • Р О Р Нетрудно сообразить, что управление их(т), удовлетворяющее условиям (24.33), будет отличным от нуля лишь на системе от¬ резков Дх, причем на этих отрезках функция их(т) удовлетворяет условию || их(т) || = 1/рх и, кроме того, выполняется соотноше¬ ние их(т) = £ (т)Ах (т) (см. аналогичный случай в § , 21, 23). Следо¬ вательно, теперь мы цожем записать; что их(т) = Ах (т)/рх || Ах(т)|| при т из системы отрезков Дх и их (т) = О при т вне Дх. Таким образом, задаваясь величиной X, мы можем решить вспомогательную задачу: найти функцию их (т), разрешающую' задачу о приведении системы (24.16) в состояние х (Т) = 0 и имеющую при этом наименьшую норму хх ^х] = 1/рх. Для того чтобы найти теперь решение исходной задачи, необходимо подоб¬ рать % так, чтобы удовлетворялось условие шах ||ггх(т)| = — = р. т р Легко сообразить, что с ростом к величина шах || их(т)|| растет, т причем можно проверить, что шах || их(т)|| есть непрерывная функция к и выполняется соотношение lim max||uX (Z) || = оо при к —>■ оо. Отсюда вытекает следующее заключение: исходная задача имеет решение, если существует такое значение , >0
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 215 параметра для которого выполняется условие max || и* (г) || = —ц. Т Р В таком случае решение задачи сводится к последовательно¬ му решению описанных только что вспомогательных задач, где величины % подбираются так, чтобы величина . max ||пх(т)|| = = 1/рх сходилась к р.. В частности, приближенное определение искомого значения % = Х° может быть сведено, например, к по¬ следовательному делению отрезка Х21, где 1/рх',<С И "С 1/рЧ Пример ■ 24.2. Описанным путем задача была решена на машине «Урал II», причем были выбраны следующие данные: го = Ю, v = 1000, Т = л/2, р = 0,34. (Числа были выбраны такими, исходя лишь из соображений удоб¬ ства счета.) Система (24.16) принимает тогда вид = х2, аз2 = — х1 -— 0,2хз «1> Хз = 10«2. (24.34) Допустим, что в начальный момент t = 0 система находилась в состоянии = {0, 2; 0;.0, 1}. Тогда вектор с = —— {Ж1} = {—0, 2; 0; —0, 1}. Система, сопряженная к системе (24.34), имеет вид 51 — $2, sa = — Ч, «з = — 0,2s2. Фундаментальная матрица ее такова: 5 [г, 0] = cos t sin t 0 — sin t cos t 0 0, 2 (1 — cos t) — 0,2 sin t 1 Учитывая, что матрица В' в данном случае имеет вид , II 0 1 0 в = II II О О 10 получим функции: ч /[2 (Т) = — sin г 2 — 2 cos т ■/I211 /‘21 cos т — 2 sin т Г/[зп 71 ■ 0' /[3] _ 2 . 10 При указанных исходных данных в результате вычислений на ЭЦВМ оказывается, что нужное значение параметра X = Х° есть ■ ~ 2,5465,
216 свойства оптимально го управления [Гл. 6 = —5; 1% = —3,3; Z Z = 0. При этом р° — 2,9738 и, следовательно, 1/р° = «= 0,3364 Z р = 0,34. Система отрезков А° = Ар получится такой: fo; 0,1885], [0,9739; 1,5708L а минимальная^ функция h° (т) = hx° (т) == = ZZ sinr — 3,3 cost; 6,6 sinr+ 10 cos т—10}. На рис. 24.4 приведен график функции w (т, /). Таким образом, оптимальное управление u° (t) для исход¬ ной задачи определяется выражениями: о/А 5 sin t — 3,3 cos t „ , ил (z) = : при t из в 2,9738 ||/z°(Z)|| системы отрезков А0, 6,6 sin t + 10 cos t — 10 2,9738 ||A°(¥)| при t из системы ' отрезков А°, Рис. 14.4. wk (t) = о (к = 1,2) при t вне А°. Этим и завершается решение задачи 24.2. Графики управления и° и соответствующие оптимальные траектории при¬ ведены на рис. 24.5—24.7. Рис. 24.5. Рассмотрим теперь снова задачу (обсуждавшуюся уже нами в §§ 21, 23) о перебросе материальной точки ' массы т в начало ко¬ ординат, но теперь при несколь¬ ко иных ограничениях, нежели те, которые были выбраны ра¬ нее. Именно, потребуем и здесь, чтобы при движении точки до¬ бавочные ускорения, возникаю¬ щие за счет управляющих реак¬ тивных сил, не превосходили заданных пределов и расход вы- 0 брасываемой массы т t был ми¬ нимален. Эту задачу мы рассмот¬ рим, опираясь на те соображе¬ ния, которые были приведены в § 21, но в качестве интенсив¬ ности х [и] выберем величину (24.19). Таким образом, решая задачу, исходя из правила 17.1, приходим к необходимости оп¬ ределить минимальную функ¬ цию № (т), которая находится здесь из следующего соотношения min max ([Zi (1 — т) + Z2]2 + [/3 (1 — т) + ^]2)I/? dx — px (24.35) l A
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 217 при условии h + + ltg = 1, 6 (Д) = min [4- , 4 • (24.36) Обратим еще раз внимание читателя на то, что интегрирова¬ ние здесь ведется не по всему отрезку [0,1], а по си¬ стеме интервалов, суммарная длина которых а (А) равна min [1/Х, 1]. Подобно тому как это было сделано в § 21, можно показать, что мини¬ мальная функция h имеет такое же строение, как и в задаче, рассмотренным в §21, т. е. на плоскости (£, h*) гра¬ фик функции -3 (т) является антисимметричным относи- тельно прямой т = а функция А^ (т) постоянна и положительна. Следует заме¬ тить при этом, что когда X взято из отрезка [0, 1], си¬ стема интервалов совпадает со всем просто получаем то же решение задачи, что и в § 21. При X >1 Рис. 24.6. отрезком [0, 1] и мы Рис. 24.7. система интервалов Дх будет соответственно следующей: - ■ *]}■
218 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Тогда, как и в § 21, определение минимальной функции 7? (т) сводится снова к задаче о вычислении единственного числа ZL, которое находится теперь из условия min [j (4—t)2 + (LTL)2]"</T + * о 1 + 1/ [C4-C+(WC-₽‘- 1-12А Управление и* (т) будет иметь вид U рХ II . (т)|| ) 1} (1 __ т) + % при т ИЗ Дх, при т вне Дх- и*(т) = О В том случае, когда мы придаем основное значение минимизации расхода реактивной массы, величина должна быть большой (при % —> оо приходим к им¬ пульсному управлению, рас¬ смотренному в § 23). В том же случае, когда основным фактором является величина управляющей реактивной . си¬ лы, % должно быть доста¬ точно малым и при X = 0 по¬ лучаем случай, уже рассмот¬ ренный в § 21 (см. пример 21.2). Для наглядности на рис. 24.8 — 24.10 показаны оптимальная траектория точ¬ ки и управления при различных значениях X. Пунктиром обозначено сво¬ бодное движение точки, по¬ времени, где u^t) = u2(t) = 0. лучающееся на тех интервалах _ Если потребуем, например, чтобы величина силы max || и (t) Ц не превосходила заданной величины ц, то среди указанных траек¬ торий надо выбрать ту, для которой р = 1/рх. В заключение обсуждения вычислительных процедур для ре¬ шения проблемы (24.1), (24.2), заметим, что конкретное осущест¬ вление метода наискорейшего спуска на вычислительной машине часто наталкивается на практические трудности, которые приво¬ дят к необходимости различных усовершенствований этого мето¬
§ 24] ЧИСЛЕННОЕ РЕШЕНИЕ ЗАДАЧИ ОБ УПРАВЛЕНИИ 219 да. В частности, откровенно говоря, такие усовершенствования мы были вынуждены использовать и при конкретном просчете тех примеров, которые описаны выше в этом параграфе. Однако здесь мы не будем останавливаться на этих модификациях метода и на подробном разборе прак¬ тических трудностей счета, так как это увело бы в сторону от основного материала книги. По¬ этому отсылаем интересующего¬ ся читателя к специальной литературе по вычислительной математике [8* 1. Рис. 24.9. Рис. 24.10. В заключение этого параграфа, пользуясь случаем, вернемся к вопросу об определении оптимальных импульсных управлений dU (/), изученному в § 23. Как уже отмечалось, условие макси¬ мума (23.20), (23.21) может оказаться недостаточным для вычис¬ ления величин , , , определяющих интенсивность оптимальных импульсных воздействий, прилагаемых в моменты t = Xj (см. стр. 189). Дело тем более осложняется в тех сомнительных ситуа¬ циях, когда минимальная функция h (т) оказывается тождест¬ венной постоянной и когда, следовательно, эта функция не дос¬ тавляет информации о моментах времени t = т- в которые долж¬ ны, прилагаться управляющие импульсы. Для выяснения картины явления и, в частности, для обоснования утверждения о том, что и в подобных сомнительных ситуациях существует импульсное оптимальное управление вида (23.24), можно воспользоваться следующим рассуждением, которое тесно связано с материалом данного параграфа.
220 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 Сопоставим исходной задаче об управлении системой dx = Axdt + BdU при условии 'з \ ||с?С7 (т) II = min Р и 1а задачу об управлении системой X — [Л + 61G] х Ви (24.37) (24.38) (24.39) при условии (24.40) >0 - образом, получаю- е; хЕ [u] = max ^2 шах || и (т) ||, || и (т)||cfrj = min (и при тех же краевых данных хл, х&). Здесь постоянные малые параметры, а матрица G подбирается таким чтобы соответствующая минимальная функция he (т), щаяся при решении задачи (24.39), (24.40) по правилу мини¬ макса 17.1, оказалась отличной от тождественной постоянной на любом интервале из отрезка Za т t$. Это обычно нетрудно сделать и притом бесчисленным количеством способов. Задача об управлении (24.39), (24.40) аналогична задаче об управлении при условии минимума величины х [и] (24.19). Для перехода от вели¬ чины хл [н] вида (24.19) к величине хе [и] (24.40) достаточно умножить (24.19) на 1/Х и положить е2 = 1/Л. Отсюда заключаем, что оптимальное управление и (t) для вспомогательной задачи (24.39), . (24.40) отлично от нуля лишь в окрестностях тех точек t = тр где функция л/£ > (т) = || he (т) || достигает своих наиболь¬ ших значений. Суммарная длина этих окрестностей есть е2. Ми¬ нимальная функция h (т) = В'$\(т) определяется при этом из условия (24.41) Я 1 I* max — \ || B'sz (т) || dx = min = ре, А е2 j S где $ (т) — движение системы, сопряженной к системе (24.39), стесненное условием se' (t$)c = 1. Здесь А — система интервалов из отрезка [£«, ^], имеющая суммарную длину а (А) = е2. Само оптимальное управление и* (т) там, где оно отлично от нуля, удовлетворяет равенству h‘(OlI = -V вор (24.42)
§ 25] УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ 221 Далее проверяется, что при е j ->0 управление U (t) сходится к импульсному оптимальному управлению исходной задачи. Та¬ ким путем, рассматривая предельный переход lim т* = е j и lim hz (т) =-• № (т) при еj ->0, определяем моменты т7- приложения импульсных воздействий и их величину для задачи (24.37), (24.38). Изучение и обоснование этого предельного перехода в общем слу¬ чае и во всех деталях выходят за рамки этой книги. Такое изуче¬ ние может составить предмет полезного самостоятельного исследо¬ вания для интересующегося читателя. При этом изучение данного вопроса можно начать с конкретного материала, распространив задачу, рассмотренную в примере 23.3, до нормы хс [и] вида (24.40). § 25. Управление механической системой в окрестности положения равновесия В предыдущих параграфах мы изучали задачу об оптималь¬ ном управлении и установили закономерности, характеризующие ее решение, рассматривая управляемые системы произвольной природы, поведение которых может быть описано в линейном приближении дифференциальными уравнениями (2.4), (6.11). В настоящем параграфе мы обсудим, какой вид принимают эти за¬ кономерности в конкретном случае управляемых механических систем, а также выясним влияние дополнительных сил различной природы на свойство управляемости этих систем. При этом огра¬ ничимся рассмотрением движений голономных консервативных систем [22*] в окрестности положения равновесия. Итак, пусть задана голономная консервативная механическая система с п степенями свободы, подверженная внешним управля¬ ющим воздействиям (t). Состояния такой системы характеризуются ее обобщенными координатами qt (г = 1,..., п). Предположим, что при Uj = 0 (/ = 1,..., г) система обладает по¬ ложением равновесия qt = 0 (f = 1,..., п). Уравнения Лагранжа ([22*], стр. 331), описывающие ее движения в окрестности точки qt = 0, qt = 0 (г = 1,..., п), в первом приближении имеют вид (см. § 3) Здесь г d /ато\ dt ( < ) п (г = 1,..,, п). (25.1) тЦ 2 п п» = 1 2 У-1 (25.2)
222 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 задачи задачу (25.3) — совокупности членов наинизшего (второго) порядка в разло¬ жениях кинетической и потенциальной энергий в ряд по q. и в окрестности положения равновесия; a$, b, с° — постоянные. Обсуждение задачи в линейном приближении (25.1) целесооб¬ разно по той причине, что решение линеаризированной распространяется, как мы видели в § 22, на аналогичную для исходной нелинейной системы d / ЫТ ) дТ , дП г, , ч -й\ыГ\ д<й ' 3 • С1п' U1' • 3 •’ и’^ (г = 1, . . ., п). п оо Здесь Т = у 2 аИ (,7ь • • •> 7п) .. . п = у3 п№> (71. • • •, 7п) — i, j=l k=2 соответственно кинетическая и потенциальная энергии системы, при этом функции q ; . — аналитические функции от обобщенных координат qt системы, а функции П№) представляют собой однородные формы А-го порядка от этих координат; = 00 = 3 h ?‘г) ■7’1‘ • • • qln-a1'. . . И—обоб- <14-. • . щенные силы, порождаемые управляющими воздействиями ии .. ., иг ln'k‘ Ar> = const; Ь(’‘ n' °’ ”q ’0) =0). Заметим, что в (25.2), (25.1) а?,- = ap(0, ..., 0), П° = П(2) (?ъ . .., <„), ,o ,(0 0; <»,...,k,, ...,0) Oij — bi . Запишем уравнения (25.1) в канонических координатах ([25*], стр. 97—99). Имеем: Г "i = -I- 3 dibj (z = 1, .. •, n). 7=1 Здесь переменные yt (канонические координаты) связаны с обоб¬ щенными координатами qt равенствами Qi — "г1У1 + • • •+ Ргпуп- Действительные числа удовлетворяют уравнению |4A + = о, (25.6) а действительные числа di} определяются соотношениями: (25.4) (25.5) п dM — 3 к-1 2 ■ ■ + cj Pn — 0. k-l ) (25.7)
§ 251 управление механической системой 223 Пусть задана интенсивность х[и] (или х [d/]), оценивающая ресурсы, затрачиваемые на управление системой (25.4) на отрез¬ ке времени ta П т П h- В соответствии с материалом §§ 12—14 мы считаем, что величина х [и] (или x[d7]) имеет смысл какой- нибудь нормы р* [u] (р* [С7]) функции и(т) (или функции Щт)). Ограничимся лишь задачей об успокоении системы (25.4), когда требуется перевести ее из состояния движения {уДа), У/ (£а)} в положение равновесия {yt (fy) = 0, #t (tp) = 0} с минимальной затратой управляющих усилий, т. е. при условии и [и] = min (x[d7] = min). Условия разрешимости этой задачи при любых исходных дан¬ ных {у (£а), y, (to)} указаны выше, в § 17, а в § 19 они сформули¬ рованы в эффективной форме. Выясним, что означают эти условия в нашем конкретном случае управляемой механической системы (25.4), (25.1). В соответствии с материалом § 19 составим матрицу К = (5, 4В — Л'П_1В) (25.8) для системы (25.4). С этой целью запишем систему (25.4) в нор¬ мальной форме, введя обозначения aan-i = Уь хц = Pi (( = 1,...> Получаем: г X^i-l — ^2i? i’2i — ^2.-1 4 j=l (г = 1,...,п). (25.9) Тогда А = 0 1. . . 0 0 X, 0 . .. 0 0 0 0. . . 0 0 • 0 0. . . 0 1 0 0. . • П п 0 ! 0 .. Си . . . 0 • dlr в = i 1 1 0 . . . 0 1 4п1 • • • dnr И 0 0 di^i^1 • • diiXi . .. dirA*X 0 . . . 0 , A-к J1B = 0 . . . 0 ■ • • dntKn ■ ■ dr,i-'iln 0 . . . 0 (25.10)
224 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [1'л.6 Задача об оптимальном управлении системой (25.9) имеет реше¬ ние тогда и только тогда, когда ранг матрицы К (25.8) равен 2п (см. § 19). Проверка этого условия является, вообще говоря, за¬ труднительной. В нашем случае механической системы (25.4) ус¬ ловия разрешимости задачи об оптимальном управлении можно сформулировать также в другой форме, которая иногда удобнее. С этой целью рассмотрим матрицу N О где du . . dlr, . ... d,.W~' ■ . dvir' • , • • • ? dni • • dnr, . (25.11) Нетрудно убедиться в том, что в силу равенств (25.10) матрица Кг получается из матрицы К (25.8) простой перестановкой строк. Следовательно, ранг матрицы К (25.8) равен 2п тогда и только тогда, когда ранг матрицы N (25.11) равен п. Но матрица N сов¬ падает с матрицей К, составленной для системы 9i = M + 3 (i = 1, ...,п). (25.12) j=i . Таким образом, мы приходим к заключению, что механическая система (25.4) вполне управляема тогда и только тогда, когда вполне управляема система (25.12), получающаяся из нее за¬ меной ускорений .на соответствующие скорости у^ Далее, предположим, что среди чисел Хх,...Лп будет к различ¬ ных, имеющих соответственно кратности Не нарушая общности, упорядочим все числа . так: ^1 = • • • = М1, ^й+1 = • • •= • • •> ^11+...+Ч(_1+1 == ’ ‘ ’ .. .= Ч,+_.. 1+9+1 (/ = 1, • • •» к 1). Составим матрицы du ■ . . dlr A, = dj,i • • • dhr > . . . Afc — di,+.. ,+iA„i • • • di,4_..r (25.13)
§ 25] УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ 225 Имеет место следующее утверждение. Теорема 25.1. Для того чтобы- механическая система (25.4) ((25.1)) была вполне, управляемой, необходимо и достаточно, чтобы ранги матриц Д1?... Дк (25.13) были равны соответственно Мы не будем останавливаться на подробном доказательстве этого утверждения, отсылая читателя к специальной литературе [51, 160а]. Отметим лишь, что справедливость его вытекает из структуры матрицы N (25.11), которая с помощью элементарных преобразований ([3*], стр. 110) может быть приведена к виду [160а] Дх 0 ... о о ... о М21 Д2 . . , . 0 0 ... 0 Ми MhI • • • Д/с о ... о Из теоремы 25.1 вытекает, в частности, что механическая система (25.1) ((25.4)), подверженная воздействию Ь и, где и — скаляр, вполне управляема этим воздействие-м тогда и только тогда, когда Х|——• при I1I1 и dx^=0 (Z, j = 1, . . п). (25.14) Последние соотношения имеют простой механический смысл, который можно уяснить из следующего примера. Пример 25.1. Рассмотрим движение тяжелой материальной точки т по гладкой поверхности z = f (х, у). Предполагаем, что система координат (х, у, z) ортогональная, оси х и у направлены по главным направлениям (направления экстремальной кривизны) этой поверхности ([22*], стр. 202) в точке {0, 0, 0}, которую считаем стационарной точкой функции z — = /(х, у), Iтак как полагаем состояние х = 0, у — 0 точкой равновесия; ось z направлена вертикально вверх. Пусть рассматриваемая материальная точ¬ ка подвержена управляющему воздействию и, имеющему неизменное горизон¬ тальное направление. Отклонение точки от положения равновесия {0, 0, 0} и скорость ее движения считаем малыми величинами. Выберем за обобщенные координаты движущейся точки ее декартовы координаты х и у. Тогда вели¬ чины Т°, П° (25.2) определятся равенствами: то = Ат(е + гъ 1=0 1=0 и уравнения движения точки в первом приближении (25.4) имеют, следова¬ тельно, вид х = \ х Д сЦ и, у — у + d2 и. (25.15) 8 Н. Н. Красовский
226 СВО ЙСТВА ОПТИМАЛЬНОГ О УПРАВ ЛЕНИЯ [Гл. 6 Здесь Xх = g (02f/dx2)x=u=iy К — g d — ax/m d --- ay/m — отношение направляющих косинусов (ц, ay силы и к массе точки. Условия (25.14) полной управляемости ' системы (25.15) означают, следовательно, что положение равновесия материальной точки {0, 0, 0} не является шаровой точкой (Хх =/= Х2) поверхности z = / (х, у) и управляющее воздействие не направлено по главным направлениям поверхности в точке {0, 0, 0} (dx =)= =/= 0, d2 =£= 0). Например, если материальная точка т движется по эллипти¬ ческому параболоиду (рис. 25.1) или гиперболическому параболоиду (рис. 25.2), то условие Хх ф Х2 здесь выполняется, и, таким образом-, условия (25.14) Рис. 25.1. Рис. 25.2. полной управляемости означают, что воздействие и не должно быть направ¬ лено параллельно плоскостям симметрии этих поверхностей в точке (0,0, 0}. Если же точка т движется по параболоиду вращения (в окрестности его вершины), то условия (25.14) здесь не выполнены, так как X х = Х2. Итак, в случае рис. 25.1, 25.2 мы всегда можем распорядиться силой и так, чтобы перевести материальную точку из любого начального положения (х (ta), у (ty)} в положение равновесия (х (^) — 0, у - - - - = 0} и зафикси¬ ровать ее там с нулевой скоростью. В случае же \ = Х2, напротив, для большинства начальных отклонений этого сделать нельзя, как бы мы ни выбирали управляющее воздействие п, имеющее неизменное горизонтальное направление. Вернемся к общей задаче. Предположим теперь, что условия теоремы 25.1 выполнены, и, следовательно, задача об оптимальном управлении системой (25.1) имеет решение. Рассмотрим, как тран¬ сформируется в случае механической системы (25.1) правило минимакса 17.1. Согласно этому правилу для определения оп¬ тимального управляющего воздействия u° (t) следует, прежде все¬ го, найти минимальное движение s° (t) системы, сопряженной к исходной системе (25.9) (при и = 0). Эта сопряженная система имеет вид — — 52;-1. Так как система (25.1) стационарная, то, не нарушая общности, (25.16)
§ 25] УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ 227 можно считать, что U = 0. Обозначим Ц = Ф. Искомое мини¬ мальное движение s° (t) мы должны искать среди движений s (t) системы (25.16), стесненных краевым условием (см. стр. 114) / (0) -х (0) = -1. (25.17) Сделаем в (25.16) замену времени t = Ф — т (0 U т U ft). Урав¬ нения (25.16) принимают вид dS2i(l Т)' = (♦ — т). (25.18) Будем обозначать через $ 2п-мерный вектор, получающийся из вектора s и= {sx, $2,...,$2n-1, s2n) перестановкой компонент с четными и нечетными номерами: s = {sx, s2,...,s2n, s2n-i). Тогда после вве¬ дения обозначения z (т) = s (Ф — т) мы можем записать систему уравнений (25.18) в виде (25.19) (25.20) а краевое условие (25.17) в виде з'(Ф)-с(0) == — 1. (25.21) Но уравнения (25.20) совпадают с основной частью системы (25.9). Таким образом, задача определения минимального движения s° (t) свелась к нахождению движения ~° (т) исходной системы ■ (25.9) (при и = 0), удовлетворяющего краевому условию (25.21) и имею¬ щего наименьшую возможную норму р° = p[z° (t))=min р [z (т)] z (см. § 17). После того как это движение z° (т) найдено, оптималь¬ ное управление следует определить из условия максимума (17.1), которое принимает здесь вид а в J B'z0 (Ф — t) u° (t) dt = max J B'z0 (ft — t) и (t) dt (25.22) при p* [u] = l/p°. Таким образом, мы приходим к следующему выводу. Теорема 25.2. Оптимальное управляющее воздействие и° (<), решающее задачу об успокоении голономной консервативной механической системы (25.1), определяемся правилом .минимакса 8*
228 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 17.1, где за минимальное движение следует взять движение s° (t) — — z° (ft—t), причем Z (t) — это движение той же самой системы (25.9) при и — 0, удовлетворяющее краевому условию (25.21) и имеющее ' минимальную норму р [s° (т)], при этом само оптималь¬ ное управление u° (t) определяется условием максимума (25.22). Обсудим теперь, какое влияние на управляемость консерва¬ тивной механической системы оказывают дополнительные силы, которые могут налагаться на эту систему, помимо 'управляющих воздействий. Рассмотрим при этом диссипативные и гироскопиче¬ ские силы. Ограничимся случаем скалярного управляющего воз¬ действия. Уравнения (25.4) имеют, следовательно, вид Уг = Куг 4- diU. (25.23) Предположим, что система (25.23) не вполне управляема воз¬ действием и. Это означает, что не выполнены условия (25.14). , Возникает вопрос: существуют ли такие диссипативные или ги¬ роскопические силы ([25*], стр. 102, 106), после приложения которых не вполне управляемая силой и система (25.23) становится вполне управляемой? При этом в соответствии с общеприня¬ той терминологией будем называть гироскопическими силами обоб¬ щенные силы Qi вида п Qi ~ ' Г = Т 3 ЧаУМ (Y = — Yi — const), г, J=1 а диссипативными — обобщенные силы п Qi — —у:, Л = у3 ацу^ (а — а,ц, аи — c^st^ Чг i, j=l форма R — знакоположительна. Прежде всего, выясним необходимые условия положительного решения этого вопроса. Справедливо утверждение. Если среди чисел Xi по крайней мере два равны нулю или если хотя бы в од¬ ном уравнении системы (25.23) dt = 0, X, = 0, то система (25.23) не может стать вполне управляемой воздействием и ка¬ ковы бы ни были дополнительные диссипативные или гироскопиче¬ ские силы, приложенные к этой системе. В самом деле, в указанных случаях хотя бы одно из уравнений системы (25.20) можно привести к виду & = 0. (25.24) Пусть на систему действуют дополнительно какие-либо дис¬ сипативные или гироскопические силы. Тогда ([25*], стр. 106)
§ 25] УПРАВЛЕНИЕ МЕХАНИЧЕСКОЙ СИСТЕМОЙ 229 уравнение (25.24) примет вид У] — ар + . . . + апуп (25.25) и, следовательно, величина Уз — (Чу!— . . . — апуп = const (25.26) является первым интегралом системы (25.23) при ' наличии дисси¬ пации или гироскопических сил, независимо от управляющего воздействия и. Но ясно, что при наличии интеграла (25.26), всегда можно подобрать такое начальное состояние {у (ta), у (£а)}, из которого систему (25.23) нельзя привести в состояние равно¬ весия. Это и доказывает наше утверждение. Пусть - теперь, наоборот, система (25.23) имеет вид Уг = *чУг + diU Уз = Kjyj где йг=£=0 \,;=/=0 (у = 1 (г = 1, . . .,к), | U = к + 1,. . ., п), J (i = 1,..., к), — 1, k + i,...,n). (25.27) (25.28) Тогда всегда можно подобрать такие диссипативные силы, ири наложении которых система (25.27) становится вполне управляе¬ мой. Мы не будем приводить здесь доказательства этого утверж¬ дения, отсылая читателя к работам [50, 51]. Покажем лишь, как осуществить необходимый выбор диссипативных сил в частном случае, когда [ = ...= кп = X =/= 0. Систему (25.27) запишем в форме (25.9): t2i-i = k:r2i + (Ци, x2i = x^t-i (z = 1, . . ., п), (25.29) где по крайней мере одно из чисел dj=f=O. Функция РелеяВ (см. [25*] стр. 102), порождающая диссипативные силы, имеет вид 27? = — S (25.30) г, j=l Нам необходимо подобрать коэффициенты этой функции так, что¬ бы система На-i = b*2j — ~ + diU, Zji = x2t- (г = 1,...,«) (25.31) OX2i стала вполне управляемой воздействием и. В данном случае это можно сделать следующим образом. Преобразуем систему (25.29) к виду Zsi-i = -Z2i + *2i = z2i_i, (3;г^ О) (25.32)
230 СВОЙСТВА ОПТИМАЛЬНОГО УПРАВЛЕНИЯ [Гл. 6 что, очевидно, всегда можно сделать. Функцию (25.30) выберем в виде 2R = § еЛ-1- (25.33) г = 1 Тогда система (25.32) будет описываться уравнениями = ^^21 “1“ ^2i = z2i-1 (г" = 1, . . ., п). (25.34) Опираясь на теорему 19.1, нетрудно убедиться в том, что система (25.34) становится вполне управляемой, если е. =/= efc при 1 == К (1, К = 1,..., п). (25.35) Приведем простой пример, иллюстрирующий это утверждение. Пример 25.2. Рассмотрим снова движение тяжелой точки по поверх¬ ности z = f (ж, у), описываемое уравнениями (25.15). Пусть точка {0, 0, 0} — шаровая,?. е. Х1=%2=%. Условия (25.14) полной управляемости системы (25.15) здесь, очевидно, не выполнены. Наложим, однако, диссипативные силы, порождаемые функцией Релея (25.33) 2R = еj ±2 + е2у2 и описывающие трение на поверхности, неравномерное по различным направлениям. Тогда система (25.15) при Х = %2 = X становится вполне управляемой воздействием и, если направление последнего не совпадает с главными осями «эллипса трения» ег х2 + г^У2 = с2 = const. Аналогичное утверждение справедливо и для гироскопических сил. Пример 25.3. Рассмотрим маятник с двумя степенями свободы из при¬ мера 3.4 (см. рис. 3.4). Уравнения линейного приближения для движений этого маятника в окрестности верхнего неустойчивого положения равнове¬ сия имеют вид (3.15). Проверим, ■ выполняются ли условия полной управля¬ емости маятника моментом и. Непосредственным подсчетом находим, что определитель матрицы К (25.8), составленный для системы (3.15), равен det К = — g nrt-.и « Следовательно, маятник вполне управляем моментом и тогда и только тог¬ да, когда со =f= 0, т. е. когда маховичок вращается. Это условие (со =/= 0) до¬ пускает наглядное механическое истолкование. В самом деле, рассматрива¬ емая система обладает двумя степенями свободы и момент и (при со = 0) влияет лишь на одну координату маятника (угол qt на рис. 3.4). Если же маховичок вращается, то при изменении qi (t) за счет воздействия на маятник момен¬ та. и, возникает гироскопический момент ([13*], стр. 346), который и пе¬ редает воздействие и на вторую координату маятника (угол д2).
Глава 7 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ § 26. Постановка задачи о предельном быстродействии Сформулируем теперь одну проблему, играющую важную роль в общей теории оптимальных процессов. Это — задача о предельном быстродействии. Важность данной задачи определяется ее тех¬ ническими приложениями. Как и везде в настоящей книге, ограничимся линейными систе¬ мами. Выше, при постановке задач 13.1 и 14.1, предполагалось, что промежуток времени ta t Ц, в течение которого система должна быть переведена из одного состояния х (ta) = х* в другое х ((&) = ,, определен заранее по условиям задачи. Однако не исключены ситуации, когда момент t = , окончания процесса не задан, но определяется по ходу решения проблемы в соответ¬ ствии с теми или иными условиями задачи. Например, одним из таких условий может быть требование осуществить процесс уп¬ равления в кратчайший срок. При этом, естественно, приходится учитывать ограничения на ресурсы органов управления, реализу¬ ющих управляющие воздействия (ограниченный запас энергии, недопустимость применения управляющих сил, превышающих определенные безопасные границы и т. д.). Если трактовать по¬ добные ограничения как требование ограниченности соответст¬ вующим образом подобранной интенсивности х [и] управления и (t) <3 tfi), то задача о предельном быстродействии мо¬ жет быть сформулирована так. Задача 26.1. Заданы уравнения движения управляемой системы х = A (t) х + В (t) и + w (£), (26.1) начальное хл и, конечное х? значения фазового вектора х (t) и ого¬ ворено ограничение на выбранную интенсивность х управления и («): х [и] <3 р.. (26.2) Требуется найти момент времени t = /3 и соответствующее ему
232 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 возможное управление u° (t) (ta «С i<C. t%), удовлетворяющее сле¬ дующим условиям: 1) управление u° (Z) решает задачу 4.1 об управлении при ta t < 2) выполняется неравенство х [и0] ( р. (26.3) 3) каковы бы ни были другой момент времени t = ip и возмож¬ ное управление и (t) (t* p t ip), решающее задачу 4.1 об управ¬ лении при условии (26.2), должно выполняться неравенство ip ip. Условия (26.2) и (26.3) нуждаются в некотором пояснении. Дело в том, что выражение для величины х [и] может зависеть от значения (р , которое само еще подлежит определению. Например, может быть (см. §18) *3 1/а x[w] ={ ( II и (т) ||2 dr} . <« В таких случаях, во избежание недоразумений, следует обозна¬ чить интенсивность х [и], например, символом х [и (т), ta <1 т < ip], а ограничение (26.2), строго говоря, надо записывать в виде х [и (т), ia ( т Н- (26.4) Однако для сокращения письма в случаях, не вызывающих недо¬ разумений, индексы ta и Ц в обозначении для интенсивности х будем опускать. В частности, условимся в дальнейшем в задаче о предельном быстродействии записывать ограничение н^ и (t) в форме (26.2), понимая эту запись, вообще говоря, в смысле (26.4). Если управляемая система описывается обобщенным (см. § 6) линейным уравнением dx = A (t) х dt + В (t) dU + dW, (26.5) то для такой системы задача о предельном быстродействии может быть сформулирована совершенно аналогично задаче 26.1, только нужное нам управление dU° (t) (tK p t p t$) надлежит тогда ис¬ кать в классе возможных обобщенных управлений. Управления и° (t) и dU° (t) (ia t ( ip), решающие задачу о предельном бы¬ стродействии для системы (26.1) и (26.5), будем называть опти¬ мальными по быстродействию, а число Т° = ip — ta, равное крат¬ чайшему времени перехода системы из начального состояния хЛ в конечное х$, назовем оптимальным временем переходного про¬ цесса.
§ 26l ПОСТАНОВКА ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 233 Желая привлечь к исследованию задач о предельном быстро¬ действии аппарат функционального анализа, который использо¬ вался выше, в § 17, мы будем опять-таки истолковывать х) интен¬ сивность управления х [и] как норму р* [гг] функции и (t) (ta t tp) в некотором функциональном пространстве ЗВ*{и (т)}. Тогда задача 26.1 и соответствующая ее модификация для систе¬ мы (26.5) очевидным образом переформулируется • для классов допускаемых управлений и (t) и обобщенных допускаемых уп¬ равлений dU (7). Поскольку переход осуществляется таким же путем, как и для задач об оптимальном управлении (см. §§ 13, 14), то здесь останавливаться на этом вопросе не будем. Следует лишь иметь в виду, что везде в дальнейшем мы ограничимся только такими величинами х [и (т), ta = р* [z(t), т<7<з1, для которых выполняется равенство р* [и (т), ta • т • о| = = р* [и (т), /а т Ф! Для всех функций и (т), удовлетворяю¬ щих условию и (т) = 0 при т > 1&. Здесь О’ и а — любые числа, связанные неравенством О’ • а. В дальнейшем мы встретимся еще со случаями, когда момент t = tx будет изменяться. Тогда символы р* [и (т), т • £с] будут обозначать величины р* [и (т), k О о • О] при любом О, какое только может оказаться моментом окончания процесса. В частности, ограничение р* [и• (т), т > £а] < р (26.6) будет означать, что в процессе управления могут использоваться любые функции и (т) (т > 7z), удовлетворяющие условию p*[iz (т), 7а • т й] "С И (прИ любом О >7а). Именно в этом смы¬ сле следует понимать также и запись ограничения (26.6) в какой- либо явной конкретной форме, например в виде ■°° ’А (т) li3 ' < р. (26.7) <« х) Таким путем можно охватить большое число реальных ограничений. Подобный вопрос уже обсуждался в аналогичном случае при обсуждении задачи 13.1. Добавим здесь еще одно новое соображение. Часто в задачах предельного быстродействия ограничения на и (t) имеют следующий несим¬ метричный вид aj — Uj — bj, причем, следовательно, aj == — by. Однако и в этом случае заменой переменных Uj на vj дело можно свести к ограничению вида р* [р] Для этого вание достаточно выполнить, например, преобразо- Н = и положить р* [р] = max sup { | vj (т) |}.
234 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 Символ оо выбирается при этом в качестве верхнего предела в интеграле (26.7) как раз с той целью, чтобы подчеркнуть, что момент t = t$ >»ta, когда окончится процесс управления, нам может быть неизвестен и мы на все будущее время t^ta обладаем ресурсом и управления, равным ц (ta). Аналогичное замечание следует иметь в виду в тех случаях, когда для записи оценки уп¬ равления и (t) при t^ta будет использоваться общий символ интенсивности х [и (т), т > С1. Заметим еще, что задача о предельном быстродействии может быть поставлена и для того случая, когда систему (26.1) или (26.5) требуется перевести в кратчайший срок из заданного состояния а; (£») = ха не в определенную заранее точку 1 фазового прост¬ ранства, а на некоторое многообразие @ конечных состояний ха Следует также иметь в виду, что вектор по условиям задачи мо¬ жет зависеть от . . Эта ситуация возникает в случае, когда тре¬ буется привести движение х (t) не в неподвижную точку х = х\ но требуется вывести его на заданное движение х = х& (/). Чи¬ татель, учитывая сформулированные уже задачи 13.2 и 26.1, может дать соответствующие формулировки самостоятельно. § 27. Решение задачи о предельном быстродействии Опишем решение задачи о предельном быстродействии, опи¬ рающееся на результаты из предыдущих глав. В соответствии с постановкой задачи 26.1 нам требуется найти управление и° (t), переводящее систему (26.1) из состояния х (ta) = х* в состояние х (t$) = ха за кратчайшее время T° = — ta при заданном ограничении х [и] р,. (27.1) Принимая во внимание правило минимакса 17.1, установленное в § 17, можно указать следующий путь решения задачи о предель¬ ном быстродействии. « Пусть >ta — некоторый фиксированный момент времени. Тогда может быть поставлена и решена задача 13.1 об оптималь¬ ном воздействии ит (£, переводящем систему (26.1) из состояния х (ta) = х* в . положение х (£3) = х$ за время Т = t$ — ta и имеющем при этом наименьшую возможную .норму р* [ит 1 = = х [uy] = min. Если теперь мы будем изменять момент времени Ар, то, полагая задачу 13.1 каждый раз разрешимой *), получим, что всякому fp u>ta, а значит, всякому числу Т > 0, будут со¬ ответствовать определенное оптимальное управление ит (0 и оп- х) Или, во всяком случае, разрешимой при значениях . из некоторого множества 1 . Изменения . потребные тогда в рассуждениях, очевидны.
§ 271 РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 235 ределенная его интенсивность х [иу], которая является, следова¬ тельно, функцией от Т. Обозначим х [ur] = ит и рассмотрим не¬ равенство хг < Н- (27.2) Очевидно тогда, что оптимальным временем переходного процес¬ са Т при ограничении (27.1) будет наименьшее из положительных чисел Т, удовлетворяющих условию (27.2). Сопоставляя это об¬ стоятельство с правилом минимакса 17.1, получаем следующий результат. Теорема 27.1. Пусть hr (т) (£а т Z = ta + Т) — минимальная функция, найденная согласно' правилу минимакса 17.1, так что Р UhT (т)1 = min р [В'$т (т)1 = рг, (27.3) где st (t) — движение сопряженной системы (17.3), удовлетворяю¬ щее краевому условию s't (?) с (Z) = 1. Тогда наименьшее из чисел Т = Ц — ta, удовлетворяющих соотношению Pr>V’ (27-4) будет оптимальным временем переходного процесса /0, а соответст¬ вующее этому времени оптимальное управление ит* (0 = и0 (t) (t* t tl = t* + T°) явится искомым, оптимальным по быст¬ родействию управлением. При этом, как следует из правила ми¬ нимакса, оптимальное по быстродействию управление будет иметь норму р* [и (т)] = 1/рго и будет выделяться среди всех допускаемых управлений и (т) (fa Z т Z с нормой р* [и (т)] = = 1/рго свойством максимума (17.1) на минимальной функции hT (т). Здесь с (Т7) — вектор (15.2). Сформулированная теорема указывает способ решения задачи о предельном быстродействии, который заключается в построении той или иной вычислительной процедуры, позволяющей опреде¬ лить наименьшее из положительных чисел Т, удовлетворяющих условию (27.4) или, что то же самое, условию (27.2). При этом процесс отыскания самого оптимального по быстродействию уп¬ равления следует изученному уже руслу, которое определено свойством максимума (17.1), содержащимся в правиле минимак¬ са 17.1. Если величина рг является непрерывной функцией Т (а это, действительно, имеет место в широком классе случаев), то для отыскания величины 7° вместо условия (27.4) удобно
236 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 пользоваться уравнением рг = min \В' (т) sT (т)] = — при St (tp) с (Г) = 1. (27.5) st И Наименьший положительный корень этого уравнения и даст оп¬ тимальное время переходного процесса Т°. Примечание 27.1. Учитывая, что выражение р [В' St (т)] одно¬ родно по вектору I — s ( t', неравенство (27.4) или уравнение (27.5) вместе с условием st (t&) с (Т) — 1 можно заменить неравенством min {— s' (t„) с (Г) -1- рр [В' (т) sr (т)]} > О ||8Т||=1 Р или соответственно уравнением min {цр [В' (т) st (т)] — (tA с (Г)} = 0, К 11=1 Р что подчас может оказаться более удобным для работы с этими соотношения¬ ми. Далее, учитывая равенство (12.19), уравнение (27.5) можно еще заме¬ нить соотношением, не содержащим явно р [й (т) ], *3 min max \ В' (т) sr (т) и (т) dr— s' (М с (Г)( = 0. 11 8т ||=1 Lx[u(t)]<p ] J ‘а Трудности реализации предложенного способа в виде вычис¬ лительного алгоритма не носят принципиального характера и касаются таких стандартных проблем численных методов, как, например, вопрос о выборе начального приближения или вопрос о скорости сходимости вычислительного процесса. При рассмот¬ рении определенных ограничений (27.1), а тем более'при решении конкретных задач эти общие трудности могут быть так или иначе преодолены. Допустим, например, что требуется решить задачу 26.1 при ограничении на энергию управляющего воздействия, т. е. при условии 00 ,/г X [и] = [ || и (т) ||2 < ц. (27.6) В этом случае задача о предельном быстродействии решается с наименьшими трудностями. Дело в том, что оптимальное управ¬ ление при условии минимума энергии находится в замкнутой форме (см. § 18) и поэтому удается, исключив Z? (Г) из соотношений (18.3), записать интенсивность хг оптимального управления, а следовательно, и величину рт = 1/ху, в виде явной функции
5 271 РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 237 времени Т. Действительно, принимая во внимание (18.11), полу¬ чаем, что п Ит (27.7) где с = с (Т) = {Cj (Т)} — вектор (15.2), а смысл обозначений D и Dik пояснен на стр. 126. Нетрудно непосредственно установить, что Хг (27.7) является непрерывной функцией Т, . если только D == 0. Но последнее условие выполняется во всяком случае, если система (26.1) вполне управляема. Тогда величина рг = 1/хг будет также функцией непрерывной и для определения T можно воспользоваться уравнением (27.5), которое примет вид п S CiencenDikCT-DT = о. (27.8) Таким образом, в рассматриваемом случае задача о предельном быстродействии сводится к нахождению наименьшего положи¬ тельного корня Т° уравнения (27.8). Само же оптимальное по бы¬ стродействию управление и° (t) определяется по формулам (18.10), в которых вместо t подставлено % = + TQ Приведем простой иллюстрирующий пример. Пример 27.1. Пусть материальную точку, движение которой описыва¬ ется уже хорошо нам знакомой системой дифференциальных уравнений (18.11) (см. пример 18.1), требуется перевести из положения ха = {—1, 0, 1, 0} при tа = 0 в положение о? = {°, 0 °, 0} наискорейшим образом. При этом должно удовлетворяться неравенство оо (27.9) Согласно избранному выше общему пути решения задачи находим функ¬ цию рг- Опираясь на равенство (27.7), получим: 1 (27.10) 2 и, следовательно, уравнение (27.8) записывается так: 74 _ тз + 24 = 0. (27.11) На рис. 27.1 изображен график функции рт (27.10). Как видно из этого графика, для того чтобы уравнение (27.11) имело хотя бы один положитель¬ ный корень, число р должно быть в меру большим, в противном случае
238 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 желаемое положение г8 = (0, 0, 0, 0) вообще оказывается недостижимым ни при каком Г, что ясно из физических соображений. Нетрудно установить, что величина р2 должна быть не мсшшю, чем 96 gVgl (72)3/\ Если р2 будет больше указанного значения, то уравнение (27.11) будет иметь два положи¬ тельных корня. Пусть Т° — наименьший из этих корней, тогда согласно формуле (18.10) оптимальное по быстродействию управление определяется соотношениями (г )=-20’ <^ = -^(T0~2^ + s из которых следует, что наискорейший спуск из точки {—1, 0, 1, 0} в точку {0, 0, 0, 0} осуществляется по прямой. Приведенный пример показывает, что, вообще говоря, функция рг не обладает свойством монотонности, которое может быть весьма полезным для численного определения Т из уравнения (27.5). Однако если в разобранном примере отбросить g, то функ¬ ция рг = (73/24)12 будет строго монотонно возрастающей (см. рис. 27.1), и тогда при каждом р >0 уравнение (27.11) будет иметь единственный положительный корень, который и доставляет оп¬ тимальное время переходного процесса Т(). Оказывается, что от¬ меченное свойство монотонности функции рг не является специ¬ фичным лишь для рассмотренного примера и при соответствующих предположениях это свойство имеет место в достаточно общем слу¬ чае ограничений (27.1) на интенсивность управляющего воздей¬ ствия. А именно, пусть в уравнении (26.1) w (t) = 0 и = 0. Тогда можно показать, что функция рг является монотонно не-
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕ.Й^СТВИИ 239 убывающей функцией Т. Для доказательства этого факта напом¬ ним, что величину рт можно искать из условия (см. правило 17.3 в § 17) * Рт = min р [В' (т) 5 (т)] = min р [В' (т) 5 [т, £а] I] (27.12) S I при s'(ta) х* — V х* — —1. Допустим, что для каждого Т . О найдены числа Z? (Т) — sf (ta) из условия (27.12). Тогда, при¬ нимая во внимание это условие, получим очевидное неравен¬ ство Рт+лт — Р [В' (х) S [х, ta]l°(T + ДТ), Za<x<Za + Т + Д^Т]> >р[В'(т)5[т, + дг), /a<x<Za + Т> > тгпр ^В (т) S [т, Za]Z, = рг, (ДГ>0). i (27.13) Таким образом, мы видим, что, действительно, переменная рт является монотонной, не убывающей функцией величины Т. Важ¬ но подчеркнуть, что во'многих случаях выбора интенсивности х [и] при условии полной управляемости системы (26.1) в соотношении (27.13)'будет выполняться строгое неравенство, т. е. функция рт будет строго монотонно возрастающей функцией Т. Так, напри¬ мер, в рассмотренном выше случае ограничения на энергию уп¬ равления (27.6) согласно (18.2) и (27.13) будет: Правая часть неравенства (27.14) строго положительна, если только система (26.1) вполне управляема, поскольку тогда вектор- функции №1 (т) — столбцы матрицы В' (т) S [т, Za] — линейно независимы. При ограничении на максимум управляющей силы (21.1) имеем: /3+дт Рг+дт- Т> \ Г {В' (Т) 5 [т, Za] Z° (Т + Д71)} dx, и правая часть этого неравенства при условии полной,.управля- емости системы (26.1) . . снова будет строго положительной. Но, например, в случае ограничения на ’ импульс управ¬ ляющего воздействия (23.5) величина разности рт+дг — Рт вследствие (23.10) является лишь неотрицательной и поэтому
240 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ Н’л. 7 соответствующая функция (23.12) рг = min sup у [В' (т) 5 [т, Za] Z] при 1'хл = — 1 (27.15) I т есть, вообще говоря, лишь неубывающая функция Т. Мы не будем задерживаться на анализе условий, обеспечиваю¬ щих непрерывность функции ру. Отметим лишь, что эта непре¬ рывность проверяется без особого труда при условиях w (t) = 0, х$ = 0 для широкого круга величин х [и], например, в слу¬ чае, отвечающем ограничению на энергию управления или на максимум управляющей силы, если система (26.1) вполне управ¬ ляема. Свойства строгой монотонности и непрерывности функции рг оказываются важными для решения задачи о предельном быстро¬ действии по следующей причине. Пусть существует хотя бы одно число , , для которого среди допускаемых управлений найдется управление г, (£), переводящее систему (26.1) из положения х* в положение х® за время , — Za = , при условии р* [иа>] = = х [и(1] j ц. Тогда будет справедливо неравенство рт, > l/p. Ес¬ ли функция рт является непрерывной и если справедливо соотно¬ шение^ lim рт = 0 при Т ->0,то можно утверждать, что сущест¬ вует наименьшее положительное число Г°, при котором выполняется равенство рт» = 1/р,. Если к тому же функция рт строго монотонна, го такое число Г0 будет единственным, т. е. при сделанных выше предположениях, обеспечивающих строгую монотонность непре¬ рывной функции рт, уравнение (27.5) имеет единственный положи¬ тельный корень Т = 710, который и определяет оптимальное время переходного процесса. Кроме того, опираясь на теоремы о неявных функциях, нетрудно проверить, что при условии строгой монотон¬ ности переменной рт величина Т° — корень уравнения (27.5) — за¬ висит непрерывно от координат х* и от параметров системы. Особенно полезны указанные свойства при ' решении ' задачи 26.1 в тех случаях, когда задача об оптимальном управлении при условии минимума соответствующей интенсивности не решается в замкнутой форме. Пусть, например, требуется найти оптимальное по быстродей¬ ствию управление при ограничении на интенсивность (21.1) вида х [zz] = sup max (| и,(т) |) р (/ = l,..,r, r>Za). (27.16) * J т) Это соотношение опять-таки выполняется с очевидностью в случае ограничения на энергию или на максимум управляющего воздействия и может не иметь места при ограничении на импульс управляющей силы. В послед¬ нем случае может оказаться Т° = 0.
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 241 Уравнение (27.5) для определения 7° в соответствии с результа¬ тами из § 21 принимает здесь вид (см. (21.27)) Рт (27.17) где htj (fy, т) — элементы импульсной переходной матрицы Я = S' [т, t$]B (т), а Z? (7) — числа, дающие решение задачи г min = рт (27.18) п при условии 2 Ц.сг (Т) = !• г=1 Как нам уже известно, задача (27.18) в общем случае не ре¬ шается, к сожалению, в замкнутой форме. Поэтому, определяя Т° из уравнения (27.18) каким-нибудь численным способом, мы вы¬ нуждены на каждом шаге численно (например, методом наиско¬ рейшего спуска, см. по этому поводу § 24) находить новые значе¬ ния величин Z$ (Г). Если . установлено, что функция рт непрерыв¬ на и обладает свойством строгой монотонности, то для отыскания T можно предложить следующую схему счета, реализующую простейший процесс последовательного приближения. Выбирая из разумных соображений некоторое число 7 х . определим мини¬ мальную функцию 77. (т); если окажется, что р [h^ (т)] = рт, Д> > 1/ц, то возьмем 7\, равное T-J2, а если выполняется неравенство противоположного смысла рт, 7 1/ц, то следует положить Т2 = = 27\. Итак, пусть Т2 определилось. Если для начального при¬ ближения Тг было рт, > 1/р и снова оказалось рт >1/ц, то по¬ лагаем опять Т3 = 72 2, и так поступаем' до тех пор, пока не при¬ дем к неравенству рт. 1/ц. Тем самым искомое число Т° оказы¬ вается захваченным в вилку Тj < <7 . Далее понятным образом составляем последовательность сжимающихся отрезков, содержащих У°. Если же было рт, <С 1/р и снова получили рг2 <С < 1/ц, то выбираем Т3 = 2Т2, и так поступаем до тех пор, пока не получится рт- >1/ц. Тогда 7° снова попадает в вилку Т <7 Т° <С 71; и т. д. Указанный процесс продолжим до тех пор, пока не будет выполнено с заданной точностью равенство р [Лтт (т)] — = 1/ц. В итоге построится последовательность чисел Т2,... ..., 7т,..., сходящаяся к 7°. Эта сходимость доказывается без
242 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 труда, если только задача, действительно, имеет решение, т. е. если llm рт > 1/р при Т . оо. После того как T° определено, .само оптимальное по быстродействию управление в случае (27.16) за¬ пишется согласно (21.32) формулой и?(0 = fsgnftjwi (t) + Т°, l = 1, . . ., г). (27.19) Понятно, что для нахождения нужного нам корня уравнения (27.5), помимо описанной наипростейшей схемы счета, могут быть применены и другие вычислительные процедуры,' эффективно решающие эту задачу. Одна из них такова. Допустим, напри¬ мер, ' что на /-м шаге процесса последовательных приближе¬ ний при Т = Tj реализовалось неравенство Р (т), ta . т . ?а + 4- Tj] = pTj <Z 1 /Р- Если следующее приближение Tj+i под¬ бирать из условия р[/^*т.(т), Т <4 ta +^j+lj = 1 / И, то Г;+1, будучи больше 2j, не превзойдет, однако, искомой величины Т°, поскольку р [hr .+1 (т), ta < т < t . + ГЯ1] ' = рт^ < р [Ьг .(т), **+ 7W = -Г-. Г Имея для найденного Tj^ минимальную функцию ^Г;+1(т), подберем Т^.2 снова из уравнения р [hrj+1 (т), t. . т . ta 4- Т.^] = = 1/|» и . т. д. Таким образом, начиная с Т = Tj, получается последовательность Tj, Tj+i, . . Tm, . . монотонно сходящая¬ ся к Г°. Удобно также решать уравнение (27,5) методом хорд. Конечно, при решении конкретных задач о предельном быст¬ родействии могут встретиться примеры, когда надобность в чис¬ ленном решении задачи отпадает. Но, к сожалению, такие случаи являются исключительными и, как правило, приходится решать задачу численно. Заметим, наконец, что весь счет можно вести, опираясь не на минимальную функцию h? (т), so используя экст¬ ремальную функцию hr (т) и решая, следовательно, не задачу (17.4) или (17.10), (17.11), но задачу (17.5) или (17.12). Приведем теперь два простых иллюстрирующих примера. Пример 27.2. Пусть движепие материальной точки (см. п. 1° § 3) описы¬ вается дифференциальными уравнениями - *1 — = —х± 4- и, (27.20) которые получаются из системы (3.5) при eg = Г, v = 0, т = 1, a (Z) = 1. Требуется перевести систему (27.20) из состояния х (ta) = х (0) = {2,1} в положение x(t£' = х (Т) = . {0, '0} за наименьшее возможное время Т° при ус¬ ловии, что | и (t) I <4 1. Будем решать эту задачу методом последователь¬ ных приближений, опираясь в процессе счета на правило 17.4. Система,
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 243 сопряженная к системе (27.20), имеет вид $1 = s2, ®2 = ' s1> и, следовательно, фундаментальная матрица S [т, (а! этой последней систе¬ мы такова: cos (/а — т) — sin (ta — т) sin (Za — т) cos (ta — т) Так как в (27.20) в(т) = Ь = [°, то, обозначая s (<а) = к и учитывая, что ta = 0, приходим к выводу: при каждом /р = Т задача (17.12), вытекающая из правила 17.4, превращается здесь в задачу: найти max [кхх® + к2х^] = (27.21) при условии т р [В' (т) s (Т)! = р [ГО [т, tj *] = -| *j/(1) (т) + W(2) (Т) |Л =1, (27.22) О где /(1\т) = —srn т, /2)(т) = cos т. (27.23) Для наглядности будем решать задачу (27.21), (27.22) для каждого фик¬ сированного Т графически. Числа (71), решающие эту задачу, определя¬ ются тогда как координаты на плоскости {к}, к2} точки касания прямой ktx* + к2х* = v® и кривой (27.22), уравнение которой, учитывая (27.23), можно записать в более простом виде: т-е ((^-i-^)*5- | | sinO|cH} = l, (27.24) где О' = т — е, tg е = к2/к±. Вид кривых (27.24) и соответствующие прямые при различных значе¬ ниях Tj, встречающихся по ходу счета, изображены на рис. 27.2. Выбирая в качестве начального приближения Т = 2л, определяем искомую величину У0 по схеме, подобной одной из описанных выше схем по¬ следовательных приближений. В итоге находим последовательности Тг = 2л, Т2 = л, Т2 = 3,5, У4 = 3,75 и 11 = 0,56, = 1,13, 4, = 1,07, , 1,05. Если | нас устраивает последнее приближение к решению задачи, то можно положить Т° = Ti = 3,75. Координаты точки касания к° = к° (3,75),
244 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 /с® = /с® (3,75) оказываются при этом такими: К° = 0,45, К° = 0,16. В таком случае, принимая h°Ti (т) = к° (Г4) /(1) (т) + к2 (Г4 /(’)(т) за экстремаль¬ ную функцию Л^о (т), находим приближенное оптимальное по быстродействию Рис. 27.2. управление (t) — 1,05 sgn ti^o (t) = 1,05 sgn [0,45 smi — 0,16 cos /]. Переходный процесс в системе (27.20) при и —— uQ (t), смоделированный на АВМ, представлен на рис. 27.3.
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 245 Пример 27.3. Рассмотрим задачу о наискорейшем приведении гироком¬ паса в заданное состояние при условии ограниченности величины управляю¬ щей силы. Ранее, в § 24, была решена задача 24.1 о приведении этого же гироскопического компаса в меридиан минимальной силой за выбранное заранее время Г=1800 сек. Там было найдено, властности, что шах | и (т) |= т = 0,47 -10"3. Теперь мы определим минимальное время, за которое можно перевести гирокомпас в заданное состояние при условии sup | и (т) | — р, . г причем для сравнения с примером из книги [1936] (стр. 21) интересно по¬ ложить р. = 0,64 «10-3. Выпишем еще раз уравнения, соответствующие прецессионному движе- нию гирокомпаса: . 1,53921 , 1,53921 0™ > #1 — ’ х-2 + ’ «0,62 - + и, 41,1368 41,1368 ±2 = 41,1368-10-6 хз = — 1,5-10_3ас.2 — 1,5-10_3хз. Пусть задано начальное состояние х* = {0,3; 0,004; 0,004}, Za = 0 и огра¬ ничение | и (t) | 0,6401 -10_3. Требуется перевести гирокомпас в положе¬ ние хР = {0; 0; 0} за наименьшее возможное время Т°. Для данного примера уравнение (27.17) примет вид Г Рт = Л I (— . (7\ т) + /°Л<2) (Г т) + /°А(3) (Т, т) I dx =. 103/0,6401 = 1562Д о (27.25) где U.U (Т, т) (i = 1,2,3) определены формулами, которые следуют из формул (24.12) при t = Т — т: Л(1) (Т, т) = ag>ex< (Г~Т) + з£1>е« (Т~т) cos 3 (Г — т) — З»)е« (Г-т) sin 3 (Т_ Т) ' Л(2) (Г, т) = а. еМ U 1 U + е“ . и -( cos Р (Г — т) — £<*-. - ( - " - sin Р ( U - т), /г(з) (^ т) = аН) еМ (Т-i) + ззу** (T~T)cos 3 (Т — т) —3 -—еа ( т— srn 3 (Т — т). Уравнение (27.25) решалось на ЭЦВМ способом последовательных при¬ ближений, при этом на каждом шаге решение соответствующей задачи (27.18) определялось методом наискорейшего спуска. В результате при Т± = 1800, Т = 1300, Т3 = 1250, Т4 == 1240 получилось, что р^ = 2147,5, рГг = 1651, рГв = 1583, рг, = 1562. Тогда можно положить Т° = Т,. При Т = оказа- лось, что 1° (Г4) = — 1,050, Z° (Г,) = —198,6, 1° (Л) = -498,5. Следовательно, Лу» (т) = /J (Т°) h(1) (Т°, т) + (7°) й(2) (Т°, т) + 103 (7°) h™ (Т°, т) = = — 20,49-eXi ( — ( + 19,48 - е“ - —- - ( cos 3 (7° — т) + 4 4,11 - е< (и — Sin 3 (то — т), 70 = 1240.
246 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 Эта функция в соответствии с (27.19) определяет искомое оптимальное уп¬ равление: [ — 0,6401 • 10~3 при 0 < t < 725, »(/)=■{ + 0,6401 • 10"» при 725 </ < 1066, ( — 0,6401 • КГ» при 1066 < t < 1240. Процесс наискорейшего перевода гирокомпаса в меридиан, просчитанный на ЭЦВМ, представлен графиками ' хх (О, х2 х3 (t) на рис. 27.4. работы и могут также потребовать от Итак, в случаях, когда уравнение (27.5) имеет единственный дей¬ ствительный корень, за¬ дача о предельном бы¬ стродействии всегда мо¬ жет быть решена доста¬ точно эффективно без больших помех в чис¬ ленной процедуре. При отсутствии же монотон¬ ности функции рт воз¬ никают дополнительные трудности, связанные с определением наимень¬ шего положительного корня уравнения (27.5). Эти трудности могут су¬ щественно увеличить объем вычислительной вычислителя определен¬ ного искусства. Отметим теперь еще следующее. Основное внимание в этом параграфе мы уделили обсуждению процедуры отыскания опти¬ мального по быстродействию управления. При этом не акценти¬ ровалось внимание на вопросах о существовании «ешения и на других подобных проблемах. Однако и такие вопросы разреша¬ ются здесь без труда, если опять же воспользоваться результата¬ ми из предыдущих параграфов. Таким путем можно получить большое число различных теорем о существовании решения за¬ дачи предельного быстродействия, о непрерывной зависимости его от начальных условий, от параметров управляемой системы и т. д. Читатель, разобравшийся в предыдущем материале, может с успехом сделать это самостоятельно. Приведем для примера лишь один подобный результат. Рассмотрим управляемую систему х = Ах + Ьи, (27.26)
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 247 для которой поставлена задача об оптимальном быстродействии из точки х (ta) — х* в точку х (t$) — 0 при условиях I « ((|< 1. (27.27) *3 |и(0О1<1. (27.28) Будем полагать матрицу А и вектор Ъ постоянными. Согласно общей процедуре решения, описанной в этом параграфе, данной задаче надлежит сопоставить задачу 13.1 об оптимальном управ¬ лении х (t*) -> х (S3) при условии минимума интенсивности *з и [и] = max "sup | и (т) ^| и (т) | Jt] (27.29) и рассмотреть величину рг = 1/хт (Т — Ц — £а), которая в дан¬ ном случае согласно материалу из § 24 определяется равенством рг = nun max Ц | b's (т) б [ Д] = nun (1 Г)] , (27.30) S А А где s (t) — движение сопряженной системы з ——A's, (27.31) стесненное краевым условием s'(ta)x« — — 1, (27.32) Справедливо утверждение. Пусть для заданного начального условия х (to) — х* выполня¬ ется соотношение Bm "mm max ' ' | b's (т) | dx ( ( ( 1 (s' (0) х* — — 1^ (27.33) Т-оо L s A 'J /-1 д тогда задача об оптимальном быстродействии имеет решение Шт (t) — и 0 (t), которое является функцией, принимающей лишь три значения: 1, —1 и 0, причем значения ± 1 принимаются на множестве © точек t, мера которого есть min (1, 71°). В самом деле, если условие (27.33) выполнено, то это, во вся¬ ком случае, означает, что при достаточно большом Т — t$ — tx для данного начального условия х (t„,) — хЛ имеем рг 1 0 и, следовательно, тогда разрешима задача 13.1 об управлении. Отсюда следует, что вектор ха принадлежит к подпространству управляемости 1т системы (27.26) (см. стр. 146). Но в таком
248 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ [Гл. 7 случае мы можем привести уравнение (27.26) к каноническому виду (19.13), (19.14) и решать задачу о предельном быстродейст¬ вии лишь для вполне управляемой части (19.3) системы, игнорируя прочие координаты, так как вследствие принадлежности X к Жт все эти координаты согласно материалу § 19 будут тождественны¬ ми нулями при всех Z X £а, как бы ни выбиралось управление и (t). Итак, не нарушая общности, мы можем считать рассматри¬ ваемую систему вполне управляемой. Но для такой системы ве¬ личина рг, определенная соотношением (27.30), есть непрерыв¬ ная, положительная и монотонно неубывающая функция при Т >0, удовлетворяющая условию lim рт = 0 при Т ->0. От¬ сюда и из (27.33) следует, что уравнение (27.5), т. е. здесь урав¬ нение рт = 1, имеет наименьший положительный корень Т = Т°, который и является оптимальным временем Т° ппедельного быст¬ родействия. Свойства оптимального управления u° (t). = ит° (t) следуют теперь сразу из материала § 24 (см. стр. 214). Если еще предположить, что минимальная функция . Ат° (т) — Ь' вТ° (т) от¬ лична от тождественной постоянной, то сразу же придем к вы¬ воду, что u° (t) есть кусочно-постоянная функция, а если при этом воспользоваться тем, что система отрезков Д° на [£а, ta + Т°], которая удовлетворяет условию Д 1 д |Ь'4.(т) |dx = 1, б [Д] = min (1, 710), (27.34) Д° единственна, то сразу убеждаемся в единственности оптимального по быстродействию управления u° (Z), как это следует из свойства максимума (17.1), которому при данном $*<> (t) должно удовлетво¬ рять каждое оптимальное управление ит° (t). Если отказаться от высказанных только что априорных предположений о свойствах минимального движения $т° (t), то для решения вопроса о един¬ ственности оптимального управления и° (t) (в случае Т° >1) нужен более детальный анализ, который можно предложить читателю в качестве упражнения. (Точно так ' же нужен допол¬ нительный анализ существования решения в случае, когда lim рг = 1 при Т -> оо .) В случае Т° X 1 единственность релей¬ ного оптимального управления (t) следует всегда сразу из свойства максимума (17.1). Наконец, если рассмотреть для системы (27.26) ту же задачу о предельном быстродействии, но лишь при ограничении (27.27), то сразу получим утверждение.
§ 27] РЕШЕНИЕ ЗАДАЧИ О БЫСТРОДЕЙСТВИИ 249 Теорема 27.2. Задача имеет- решение и" (t) тогда- и только тогда, когда т lim mi Т—>оо L s Оптимальное управление и° (t) единственно и является релей¬ ной функцией, принимающей два значения ± 1. Здесь анализ существенно упрощен по сравнению с предыду¬ щим случаем, поскольку сразу видно, что величина рт является строго монотонной возрастающей функцией от Г, и сразу видно, что минимальное движение ZZо (t) определяет оптимальное управ¬ ление uyo (t) из свойства максимума (17.1) единственным образом. Заметим еще, что в случае полной управляемости системы (27.26) для выполнения условия (27.35) при любом х* необходимо и дос¬ таточно, очевидно, чтобы ни один корень р t (i = 1,..., п) характе¬ ристического уравнения det (—4' — цЕ) = 0 системы (27.31) не имел отрицательной действительной части. А для этого необхо¬ димо и достаточно, чтобы все корни Zv f уравнения det (Л — ХЕ) = = 0 имели z неположительную действительную часть, так как из¬ вестно, что X} ~ (i = l,..,n). Итак, мы разобрали способ решения задачи 26.1, основанный на правиле минимакса. Во введении уже было указано, что весьма общие признаки оптимальности дает принцип максимума Л. С. Понтрягина. Посмотрим теперь для сравнения, как описанное нами решение связано с решением той же задачи на основе прин¬ ципа максимума. При этом ограничимся обсуждением данного вопроса на материале конкретной задачи. Именно, предположим, что задана система (27.26) со скалярным управлением и (t) и что для этой системы требуется решить задачу о быстродействии 26.1 при условии (27.27). Обратимся вначале к принципу максимума Л. С. Понтрягина. Пусть ф (t) означает решение сопряженной системы (27.36) совпадающей с (27.31). Тогда для сформулированной нами зада¬ чи принцип максимума читается следующим образом: для того чтобы управление и° (£) было оптимальным, необходимо сущест¬ вование такой ненулевой непрерывной вектор-функции ф° (t), удовлетворяющей (27.36), что для всех t, Е t = t* + Т функция Ж [ф (£), х (t), t, и] = ф' (t) [Лх + Ьи] (27.37)
250 ПРОБЛЕМА ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ (Гл. 7 переменного и достигает в точке и - = и" (£) максимума ио всем значениям и, для которых | U'C р = 1, причем max Ж [ф®, х, t,u] = Ж (, х, t, u°] = 1. (27.38) и Замечая теперь, что слагаемое ф' (t) Ах от и не зависит, находим, что функции ф° (t) -и и" (t) обязаны удовлетворять соотношению [ф°(()]ГМ° (0 = Я [ф0, И = = max — - [ф°, и, П- = max [ф°' (t) bu(ty] (27.39) и и при | и | ( р = 1. Управление u° (t) следует находить по вектору ф° (t) согласно (27.39). При