Текст
                    Etudes MalhemaLiques
Collection dirigee par P. belong
Controle optimal
do systemes gouvernes
par des equations
aux derivees partielles
J. L. Lions
Professeur a la Faculte
des Sciences de Paris
Professeur a l'Ecole Polytechnique
Dunod Gauthier-Villars
Paris 1968


Ж.-Л. ЛИОНС Оптимальное управление системами, описыв аемыми уравнениями с частными производными Перевод с французского Н. X. РОЗОВА Под редакцией Р. В. ГАМКРЕЛИДЗЕ Издательство «МИР» МОСКВА • 1972
УДК 517.54+ 517.94--519.3 Автор книги — известный французский математик, труды которого уже знакомы советскому читателю (Латтес Р., Лионе Ж.-Л., «Метод квазиобрагцетшя я его приложения», «Мир». 1970; Лионе Ж.-Л., Мадженес Э., «Неоднородные граничные задачи и их приложения», «Мир», 1971). В настоящей монографин тео- теория оптимального управления развивается применительно к уп- управляемым системам с распределенными параметрами. Благо- Благодаря подробному изложению и напоминанию всех необходимых фактов книга, написанная современным математическим язы- языком, с использованием функционального анализа и современ- современной теории уравнений с частными производными, доступна не только математикам, но и инженерам. Редакция литературы по математическим наукам 2-2-3 ИнД'Т7-72
ОТ РЕДАКТОРА ПЕРЕВОДА В настоящее время имеется немало книг по математической теории оптимального управления, однако все они излагают тео- теорию лишь для обыкновенных дифференциальных уравнений. Тео- Теория оптимизации для систем с распределенными параметрами, описываемыми уравнениями с частными производными, стала раз- разрабатываться ужо после того, как были получены основные результаты в теории оптимизации для обыкновенных уравнений, и в отличие от этой последней имеет, но вполне понятным при- причинам, гораздо менее завершенный характер. Предлагаемая в русском переводе книга профессора Париж- Парижского университета Ж.-Л. Лионса является первой математи- математической книгой, в которой систематически изучаются оптимальные задачи для уравнений с частными производными. В пей затронут довольно широкий круг вопросов теории оптимального управ- управления системами с распределенными параметрами. Наибольшее внимание уделено линейным эллиптическим задачам с квадратич- квадратичной минимизируемой функцией, решение которых сводится к так называемым односторонним граничным задачам, и задачам эво- эволюционного типа. Кроме того, рассмотрены вопросы существо- существования и аппроксимации оптимальных решений. Написанная крупным специалистом в области дифференциаль- дифференциальных уравнений, книга несомненно вызовет интерес всех, кто зани- занимается теорией оптимального управлепия и смежными вопросами. В процессе подготовки русского издания переводчик книги П. X. Розов исправил (по согласованию с автором) имевшиеся во французском оригинале отдельные неточности и учел измене- изменения, внесенные автором в английскую Персию книги (Springor- Verlag, 1971). Проф. /К.-Л. Лионе специально для русского издания прис- прислал список уточнений и ряд дополнений. Мне хочется выразить ему за это благодарность. Р. Гамкрелидзе
ПРЕДИСЛОВИЕ К РУССКОМУ ИЗДАНИЮ Русский перевод книги включает в себя несколько дополнений, отсутствовавших во французском издании. Мы попытались попол- пополнить библиографию свежими работами, особенно содержащими указания на все более и более многочисленные приложения тео- теории. Укажем также статью автора о неравенствах с частными производными и их приложениях, опубликованную в журнале «Успехи математических наук», 1971, т. XXVI, вып. 2 A58) (в номере, посвященном академику И. Г. Петровскому). Горячо благодарю Н. X. Розова, который внес весьма много- многочисленные улучшения в первоначальный текст. Благодарю также проф. Р. В. Гамкролидзе за внимание к изданию настоящей книги. Париж, сентябрь 1971 Ж.-Л. Лионе
ВВЕДЕНИЕ 1. Теория оптимального управления детерминированными системами строится на основе следующих исходных данных: 1) управления и, выбираемого по нашему усмотрению в пеко- тором множестве Ч1о (множество допустимых управлений); 2) состояния у (и) управляемой системы, определяемого для выбранного управления и как решение уравнения Ау (и) --=-- заданная функция от и, (*) где Л — оператор (предполагаемый известным), «представляющий» управляемую систему (Л называется «моделью» системы); 3) наблюдения г (и) как некоторой (известной точно *)) функ- функции состояния у (и); 4) функции стоимости J (и), опродоленпой с помощью неко- некоторой числовой функции z -»- Ф (z) ;> 0 на «пространстве наблю- наблюдений» по закону / (и) = Ф (г (и)). (**) Требуется найти (вариационная задача). Теория оптимального управления ставит своей целью: (i) получить необходимые (или необходимые и достаточные) условия экстремума; (п) изучить структуру и свойства уравнений, выражающих эти условия (в них, естественно, должна участвовать «модель» А); (iii) составить конструктивные алгоритмы, позволяющие чис- численно находить аппроксимацию управления и 6 lie, реализую- реализующего инфимум (это управление называется оптимальным). 2. Естественно, что построение теории существенным образом зависит от модели Л. Теория, изложенная в книгах Понтрягина, Болтянского, Гам- кролидзо, Мищенко [1] и Хестенса [1], посвящена изучению сфор- сформулированных выше вопросов (i) и (ii) для случая, когда Л пред- И этой книге рассматриваются только детерминированные задачи.
Введение ставляот собой обыкновенный дифференциальный (в том числе и с запаздыванием или интегро-дифферонциальный) оператор. В многочисленных приложениях из-за сложности управляе- управляемых систем приходится отказаться от только что указанной мате- математической модели и рассматривать в качестве А оператор с част- частными производными (по поводу примеров см. Бутковский 111, Вопг [1] и библиографию в этих работах). Именно этот случай мы и изучаем в настоящей книге 1). Иными словадш, мы рассматриваем системы, для которых состояние у (и) определяется как решение уравнения с частными производными (*); естественно, что к этому уравнению присоеди- присоединяются граничные условия2), а в случае эволюционных уравне- уравнений — и начальные условия. 3. Если мы не хотим ограничиваться чисто формальными результатами, то минимизация функционала (**) должна, оче- очевидно, проводиться в предположении, что граничная задача (*) поставлена и разрешима в точно определенном смысле. Факты, необходимые для этого, доказаны ниже для четырех различных видов оператора Л: эллиптического, параболического, гипербо- гиперболического, корректного по Петровскому. Чтобы не утяжелять изложение, мы ограничиваемся лишь достаточно простыми приме- примерами, которые, однако, продемонстрируют пути, позволяющие с помощью тех же технических приемов проводить рассмотрения в более общих случаях; относительно этих общих случаев см. Лионе и Мадженес [1, гл. 6]. Поскольку мы располагаем «хорошей» теорией решения урав- уравнения (*), остается получить и проанализировать необходимые (или, в «благоприятных» случаях, необходимые и достаточные) условия минимума функционала {**). На этом пути получаются многочисленные граничпые задачи, новые по своей постановке и имеющие интересные аналогии с «многофазовыми» и «односто- «односторонними» задачами механики (в частности, в теории пластичности). 4. Дадим беглый обзор содержания различных глав. В гл. 1 изучается, помимо других вопросов, минимизация поло- положительно определенных (положительно полуопредоленпых) квад- квадратичных форм, заданных на замкнутом выпуклом множестве в гильбертовом пространстве. Приводятся приложения к односто- односторонним граничным задачам, являющимся простым прототипом проблем, исследуемых в дальнейшем. ]) Добавим, что результаты, полученный во многих направлениях, носят пока еще весьма частный характер! -) Управление может входить и в граничные условия, что зачастую про- происходит в задачах, встречающихся на практике.
Введение 9 Глава 2 содержит теорию оптимального управления системами, описываемыми эллиптическими уравнениями, а гл. 3 и 4 посвя- посвящены случаям параболических, гиперболических уравнений и уравнений, корректных по Петровскому. В каждой из этих глав сначала рассматриваются линейные системы с квадратичной функ- функцией стоимости и изучаются соответствующие односторонние гра- граничные задачи. В гл. 3 и 4 подробно исследуются интегро-диффе- ренциальные уравнения типа Риккати, возникающие при рассмот- рассмотрении «систем с обратной связью». Затем приводятся теоремы существования .минимума функционала (**) в случае простых нелинейных систем (полученных до сих пор результатов о нели- нелинейных уравнениях для развития общей теории в этом направле- направлении недостаточно) и необходимые условия первого порядка. Наконец, в гл. 5 описываются различные приемы регуляриза- регуляризации, аппроксимации и метод штрафов. Все эти методы можно применить для численного решения рассматриваемых нами задач оптимального управления. Каждая глава закапчивается примечаниями, содержащими библиографические указания и перечисляющими нерешенные проблемы (которых немало) или аспекты, не затронутые в книге, но заслуживающие дальнейшего развития. Настоящая книга представляет собой изложение курса лек- лекций, прочитанных па факультете естественных наук Парижского университета в 1965/66 учебном году. В сокращенном виде этот же материал составил содержание летнего курса (организованного Л. В. Балакришнапом) в Калифорнийском университете Лос- Анджелеса в августе 1967 г. Я горячо благодарю П. Лолопа, любезно остановившего свой выбор на этой работе в качество первого выпуска выходящей под ого руководством новой серии книг по .математике 1). Я также благодарю А. Бенсуссана, замечания которого позво- позволили .мне улучшить изложение многих пунктов первоначального текста, и Ж. IT. Айро, сделавшего записи первого курса лекций. Считаю совершенно необходимым поблагодарить издательство DiiTiod за великолепное полиграфическое оформление книги. *) Речь идет о серии «fitudes Mathematiquos», выпускаемой парижскими издательствами Dunod и Gautliier Villars, которая выходит под руковод- руководством профессора Парижского университета П. Лелона,— Прим. перев.
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ х = {xi, . . ., хп} обозначает пространственную переменную; х изменяется в открытом множестве Q с Rn с границей Г. t озпачает временную переменную; как правило t ? (О, Т), Г < оо. Положим Q -- Q X (О, Г), 2 - Г X (О, Г). Управления обычно обозначаются через и, v,w, . . .; они выби- выбираются в пространство 11 (в общем случае — в гильбертовом про- пространство над R); множество 11 д допустимых управлений предпо- предполагается выпуклым и замкнутым в 11. Состояние системы обозначается через у (v); в эллиптическом случае (гл. 2) у (v) — функция переменной х ? Q, т. е. у (х; у); в эволюционном случае (гл. 3,4) у (v) — функция переменных х ? Q Hi 6 (О, Г),-т. е. ?/(х, t; у). Наблюдение обозначается через z (и) — Ci/ (у) (случай наличия шума но рассматривается). Функция стоимости (или критерий качества) обозначается через / (у). Управление (управления) и ? ^з» для которого (которых) будем называть оптимальным (оптимальными). р (v) обозначает сопряженное состояние. Осповныо используемые в дальнейшем функциональные про- пространства: Ck (Q) — пространство функций, к раз непрерывно диффероп- цируомых на замкнутом множестве Q; к >- 0 — целое число г); 3) (Q) — пространство функций, бесконечно дифференцируемых в области ii и имеющих компактные в Q носители, снабженное топологией индуктивного продела (Шварц [11); а) Аналогичное обозттачеиио сохраняется в случае, если вместо Q выбрано Q, Г, 2. Все рассматриваемые функции предполагаются действительными.
Основные обозначения 11 ?S'(Q) — двойственное к 3> (Q) пространство, т. е. простран- пространство распределений на Q1)', 3'{@, Т); X) — пространство распределений на (О, Т) со значениями в X, где X — банахово пространство (см. Шварц 12] и краткое описание в разд. 1.1 гл. 3); Z2(Q) — пространство (классов) функций, суммируемых в квад- квадрате на области Q; Hm{Q) — пространство Соболева [1] порядка т (т ^ 1 — целое число) в области Q, т. е. пространство таких функций <р(х), что Daq> 6 Щ&) Va, 0 ^ | а | ^ т, где д\ а\ .'... дхапп' а —¦ {й!, . . ., ап}, | а | = a,-i- • . .+ an, a* > О — целые числа; /да) = {Ф | ф e/im(Q),?>acp = 0 на Г для 0 ^ | a 1 ^ т - 1}; HS(Q) — пространство Соболева дробного порядка s в области Q, т. е. нространство сужений на Q функций из Hs(Rn), определен- определенных (с помощью преобразования Фурье) в разд. 3.3 гл. 1; L2 (S; Е) — пространство (классов) функций / на S (где S — локально компактное пространство, снабженное мерой ц ^> 0), принимающих значения в гильбертовом пространстве Е и та- таких, что J 11/BI1!^ц(г)<оо; s особепно часто будет использоваться пространство /ДО, Т; Е) (t) = dt; L°°(S; E) пространство (классов) функций / на S, прини- принимающих значения в Е и почти всюду ограниченных, т. е. таких, что II/(OIIe<II/ILl»(.s;je)<°° почти всюду; Ch(Q;E) — пространство функций, к раз непрерывно дифферен- дифференцируемых па Q и принимающих значения в Е, к >¦ 0 — целое число; //^Q;/?) — пространство Соболева порядка 1 функций, опредо- лепных на Q и принимающих значения в Е. Вообще X' обозначает пространство, двойстпешгое (сопряженное) к X.
г л л л л Минимизация функционалов и односторонние граничные задачи § 1. Минимизация коэрцитивных форм 1.1. Обозначения Пусть 41 — гильбертово пространство над полем действитель- действительных чисел R *); элементы этого пространства, как правило, будут обозначаться через и, v, w... . В приложениях, которые мы рас- рассмотрим в следующих главах, 41 будет пространством управлений. В настоящей главе символ || • [[ употребляется для обозначе- обозначения нормы в пространство 11; в случаях, когда могли бы возник- возникнуть недоразумения, норма в пространстве X записывается в виде || • ||А-. Предположим, что нам известны: (i) билинейная непрерывная на 41 симметричная форма и, v -*- л (и, v); л (и, v) = л (v, и) 4u,v ? 41; (ii) линейная непрерывная на 4L форма v-+ L (р); (ш) выпуклое замкнутое в 1L множество 41д. В приложениях 11 д будет множеством допустимых управлений. Рассматривается квадратичный функционал / (v) = я (v, v) — 2L (v), A.1) который требуется минимизировать на множество fig. 1.2. Случай коэрцитивной формы Говорят, что форма л коэрцитивна на 41, если я {v, v) > с || v ||2 \fv 6 41, е = const >0. A.2) Теорема 1.1. Если л (u,v) — билинейная непрерывная на 11 симметричная форма, удовлетворяющая условию A.2), то существует и притом единственный элемент и 6 4lg, для которого J{u)= inf J(v). ') Относительно случая гильбертова пространства пад полем комплекс- комплексных чисел С см. замечание 1.4.
14 Гл. 1. Минимизация функционалов Доказательство существования. Пусть {vn} 6 lie — минимизирующая последовательность, т. е. J(vn)-> inf J{v). A.3) Согласпо A.2), / (v) > с || v ||2 — c{ || v jl, Ci = const. A.4) Тогда из соотношений A.3) и (l/i) следует, что || vn |J < const. A,5) В силу A.5) из последовательности {vn} можно извлечь такую под- последовательпость {у^}, что v^ -> w слабо в 41. A.6) Так как 41 д — замкнутое выпуклое множество, то 11 д слабо замкнуто, а потому A.6) влечет за собой w e °ид. A.7) Но функция v —>¦ я (у, у) полунепрерывна снизу в слабой тополо- топологии в '?/, а функция v-^ L {v) непрерывна в слабой топологии. Поэтому функция v ->- / (v) полунепрерывна снизу в слабой топо- топологии и, следовательно, lim / {Vv) > / (к;). A.8) Тогда из A.3) и A.7) вытекает w е 11 д, J И < inf / (v). A.9) Таким образом, должно выполняться равенство / (w) — = inf / (v), так что для завершения доказательства достаточно положить и — w. Доказательство единственности. Так как функция v -у л (v, v) строго выпукла (т. е. при v± Ф v2 выполняется неравенство л(A — 0) vt -\- Qv2, A —В) vt +9гл,)< < A — 0) n(vi, vt) + 0л(у2, v2), где 0 6 @, 1)), то\и функция v —>- J (v) строго выпукла. Предположим, что минимум функционала / достигается на двух элементах щ и и2 из множества °Ug, т. е. J(u1) = J(u2)= inf J (v).
§ 1. Минимизация коэрцитивных форм 15 Поскольку множество 11 д выпукло,] то V2 (щ -j- щ) 6 Ид, а в силу строгой выпуклости функции у->- / (v) для Mi =^= м2 J ( 72 ) откуда следует, что должно быть щ — ы2. Единственность доказана. Пример 1.1. Пусть л (и, у) = (и, i% x) и L (v) = (g-, у)ж, где §• — фиксированный элемент пространства 11. Тогда и, следовательно, единственный элемент и 6 ^а» реализующий inf J(v), характеризуется тем, что \\g-u\ht<\\g-v\\y V^e^/a; таким образо.м, и — проекция элемента g на °Цд. Анализ условий теоремы 1.1 приводит к следующим заме- "чаниям: Замечание 1.1. Теорема 1.1 верна и в случае, когда билинейная форма п (и, и) определена на множестве Цд х Шд и удовлетворяет условию A.2) при любом v ? 11.д. Замечание 1.2. В доказательство теоремы 1.1 тот факт, что v-*¦ J (v) — квадратичная форма, нигде существенным обра- образом не используется. Пусть v-*¦ J (v) — такая функция Ид-*- R, что /(y)-v+oo, если || у ||-> -;- сх>, veil0; A.10) v-*-J(v) сильно полунепрерывна снизу. A.11) Тогда существует такой элемент и ?11 о, что /(«)= inf J(v). A.12) v?Wo Это замечание распространяется и на функции v-*J(v), определенные на 11 д с 11, когда в качестве 11 рассматривается, например, рефлексивное банахово пространство. Одних только условий A.10) и A.11) для единственности и может быть и недостаточно; если же считать функцию v-*¦ J (v) еще и строго выпуклой, то. утверждение о единственности и будет, очевидно, справедливо. -1) Через (и, v)q, обозначается скалярное произведение в <U.
16 Гл. 1. Минимизация функционалов Замечание 1.3. Условие A.10) используется только при доказательстве того, что всякая минимизирующая последова- последовательность ограничена (см. A.5)). Следовательно, оно становится лишним, если предположить, что множество Ч1д ограничено. 1.3. Характеризация минимизирующего элемента. Вариационные неравенства Теорема 1.2. Если выполнены условия теоремы 1.1, то ми- минимизирующий элемент и 6 Ug характеризуется тем, что л (и, v~ и) > L(v - и) \/ve<Ud. A.13) Доказательство. Пусть и ? 11 g — минимизирующий элемент, т. е. J(u) — inf J(v)\ Тогда для любых v ?<Ug и о е (о, 1) / (и) < / (A - 9) и -|- 9у), откуда ^ ( щ или, если можно перейти к пределу, limJ(* + Hv-u))-J(u) е-*о 9 Если предел A.15) существует, то /' (U).(U-U)> 0 VvdUg, A.16) а из определения функционала / (у) равенством A-1) легко видеть, что /' (u)-(v — и) = 2 [л (и, у — м) — L (у — м)], откуда и следует A.13) г). Обратно, пусть выполняется соотношение A.13) (а значит, и A.16)). Так как функция v -у J (v) выпукла, то при любом 0 € @, 1) 0 и, следовательно, если предел A.15) существует, то J (v) — J (w) > Г {w)-{v - w). A.17) х) В этом случае V2 /' (и) представляет собой линейную форму <р л (и, ф) — L (ф).
§ 7. Минимизация коэрцитивных форм 17 Полагая w — и и учитывая A.16), получаем j {v) - j (и) > о у» е ?/в, и теорема доказана. Неравенства вида" A.13) называют вариационными неравен- неравенствами. 3 а м е ч а н и е 1.4. Пусть 41 — гильбертово пространство над С (а не над R), а я (и, v) — полубилинейная эрмитова фор- форма, т. е. я (н, v) = л {и, и) Vu,y 6 "?/. Если выполнено условие A.2), то утверждение теоремы 1.1 остает- остается справедливым. Теорема 1.2 также остается верной, но только is ней надо заменить неравенство A.13) неравенством Re л (и, v — и) > Re /, (v — и) 4v ?4id A-18) (Re g — действительная часть числа ?)'. Замечание 1.5. Пусть 41 д ¦-- 41 J). Тогда в A.13) можно положить v - и + Ф, где ф — произвольный элемент из °U, и усло- условие A.13) принимает вид л (и, ф) = L(cp) Уф eft. 0-19) Это — уравнение Эйлера для рассматриваемой задачи. ' 3 а м е ч а н и е 1.0. Пусть 41 о — замкнутый выпуклый конус \ с вершиной в начале координат.) '"" Тогда A.13) равносильно соотношениям я (и, v) > L (и) W € "Но, я {и, и) = L (и). A.21) Действительно, подставляя в A.13) v -j- и вместо v, получаем первое неравенство, а если в A.13) положить v -- 0, то получим л (и, и) ^ Л (и), откуда я (и, и) -— Л (м). Обратно, из A.21) сразу следует A.13). Замечание 1.7. Пусть функция у—>- / (у) но обязатель- обязательно квадратичная. Тогда если она дифференцируема2), то с помо- помощью тех же рассуждений, что и при доказательстве теоремы 1.2, можно показать, что справедлива :) Ото соответствует случаю управляемой системы без ограничений на управления. 2) См. Дьедонне [1, гл. 8, пункт 1]. 2-1230
18 Гл. I. Минимизация функционалов Теорема 1.3. Пусть функция v ->- / (v) строго выпукла, дифференцируема и удовлетворяет условию A.10) (последнее усло- условие можно отбросить, если множество 41 д ограничено). Тогда един- единственный элемент и ? 41 д, ^ля которого J (и) — inf / (v), харак- ¦ теризуется тем, что /».(»-и) >0 Чи?Пд. A.22) 1.4. Модификация вариационных неравенств Результаты, приведенные ниже, очень удобны для применения. Теорема 1.4. Если выполнены условия теоремы 1.3, то неравенство A.22), характеризующее минимизирующий элемент, равносильно неравенству J'(v)-(v - и) > 0 V» 6 41 д. A.23) Доказательство. A.23) =4> A.22). Действительно, поло- положим в A.23) v ~~ A — 0) w -\- 9м, где w — произвольный эле- элемент из 41 g и 8 g @, 1). Тогда A — 9) /'(A — 9) w -\- Bu)-(w — и) > 0, или /'(A — 0) w + 0и) -(^ — м) > 0, откуда, переходя к пределу при 0^-1, получаем A.22). A.22) =ф A.23). Допустим, что справедливо следующее утверж- утверждение, важное и салю но себе (его доказательство мы приведем ниже). Теорема 1.5. Если v -v / (v) — выпуклая и дифференци- дифференцируемая функция 41 —>¦ R, то ее производная v -> J'(v), отображаю- отображающая °U в 41', монотонна, т. е. (J'(V) _ J'(W)) .(v ~ w) > 0 \/v, w ?41. A.24) Так как J'(v)-(v — и) = J'(u)-(v — и) + (J'(v) - /'(«))•(» — и), то из A.24) следует J'{v)-(v — и) > J'(u)-(v — и), откуда ясно, что A.22) влечет за собой A.23). Доказательство теоремы 1.5. Мы ужо видели, что при выполнении условий теоремы 1.5 справедливо неравен- неравенство A.17). .Меняя местами v и w в A.17), получаем J (w) — J (v) > J'(v).(w-- v), ¦ A.25) а складывая A.17) и A.25)/почленно, приходим к A.24).
\ § 7. Минимизация коэрцитивных форм 19 Замечание 1.8. Подводя итоги, можно сказать, что при выполнении условий теоремы 1.3 возможны следующие три экви- валсптные формулировки задачи: (i) /(ы)= inf J(v) (u?°Ud) в случае, если минимум дости- гается; (ii) J'{u) -{v - и) > 0 4ve<Ud(ue <U); (iii) J'(v).(y— и) > 0 VvtUoiutU). 1.5. Случай, когда J — сумма дифференцируемой и недифференцируемой функций Если предположить, что функция v-*- J (v) коэрцитивна, полу- полунепрерывна снизу в слабой топологии и строго выпукла, то суще- существует единственный элемент и ?11 в, для которого Очевидно, что в этом случае утверждения (ii) и (iii) замечапия 1.8 неприменимы. Однако их можно применять к «дифференцируе- «дифференцируемой части функции J». Точнее говоря, справедлива Теорема 1.6. Пусть J (v) = Ji (v) -f /a (v), A.26) где функции /4 (v) и /2 iv) непрерывны, выпуклы и полунепрерывны снизу в слабой топологии. Пусть, далее, функция J (v) строго выпукла и такова, что J (v) ~> + °° при || V || ->- ОО, V 6 ILg. Если при этом функция v —>- /i (у) дифференцируема, а функция ¦ v-^J2(v) не обязательно дифференцируема, то единственный элемент и ^1lg, удовлетворяющий условию J (и) = inf / (v), 11 характеризуется тем, что Jl(u)-(v — u)+Jz(v) — Jz(u)^O Vve<Ue. A.27) Доказательство. 1) Пусть и — такой элемент из <Ud, что Тогда для любых v 6 °Ид и 9 6 @, 1) / (и) < / (A — G) и + 9у) = = Ji (A — 0) и + Щ -|- /2 (A — 9) и + Qv),
20 Гл. 1. Минимизация функционалов а так как функция /2 выпукла, то Л(и) + /я(и) < /i((l - 9) м + ви) + A - 0) Jt(u) + Э/2(у), или + /а(г)/2(ц)>а 9 (Устремляя 9 к нулю, получаем A.27). 2) Пусть выполняется соотношение A.27). Так как справедли- справедливо общее представление / (v) — J (и) = Ji(v) — Jt (и) -|- /,(у) — /2(и) = то в силу A.17) J{v) - /(и) > yj(u) -(v - и) -|- /2(у) - J2(u) откуда с учетом A.27) заключаем, что J(u)= inf J(v). Замечание 1.9. Теоремы 1.3 и 1.4, очевидно, можно получить из теоремы 1.6, положив /2 — 0. Замечание 1.10. Пусть / (v) - /о (у) -f /, (v) + /2 (у), A.28) где Jt {i — 0, 1, 2) удовлетворяют условиям теоремы 1.6. Пусть фупкции /0 и /i дифференцируемы. Тогда единственный элемент и 6 ^а, па котором реализуется равенство / (и) — inf / (v), il характеризуется одним из следующих эквивалентных условий: Jo(u)-(v-u) + J'i(u)-(v-u) + Jz(v) - J2(u)^0 4v?Ud, A.29) /J(u).(y-u) + y;(y).(y-M) + /2(y)-/2(M)>0 Vue^/a. A.30) Замечание 1.11. Если существует (не обязательно един- единственный) элемент и, реализующий минимум функционала на мно- множестве <Ug, то любое из полученных вариационных неравенств характеризует подмножество элементов из 41 д, реализующих этот минимум. В приложениях к управляемым системам каждый элемент и 6 "Ид, реализующий минимум, называется оптимальным управ- управлением.
§1. Минимизация коэрцитивных форм 21 Замечание 1.12. Все сказанное выше переносится без изменения на случай, когда 41 — рефлексивное банахово про- пространство. 1.6. Случай, когда множество 41д не обязательно выпукло До сих пор мы считали, что множество 41 g замкнуто и выпукло. Однако можно получить простое необходимое условие, которому удовлетворяет минимизирующий элемент и ?4lg в случае, когда множество 410 предполагается только замкнутым в 41. Определение 1.1. Пусть множество 41 g замкнуто и и ?41 д. Зададим множество % D1 д; и) -= {w ) w ? 41; 3 такие элементы ип ?41д и числа А,п > 0, что ип ->- и и %п (ип — и) ->¦ w в4?/}. A.31) Не составляет труда убедиться в том, что %{^1 д; и) — замкнутый конус с вершиной в начале координат. A.32) Теорема 1.7. Пусть v -> / (v) — дифференцируемая функ- функция, аи — такой элемент (предполагается, что он существует) замкнутого множества 41 д, что J (и) < / (у) Уу 6 41д. Тогда J'(u)-w > О Vw e Щ11в; и). A.33) Прежде чем переходить к доказательству этого результата, убедимся, что условие A.33) в случае выпуклого множества 4lg эквивалентно условию A.22). A.33) =#> A.22). Пусть v ? 41 д. Так как множество 41 д выпук- выпукло, то ип - A - On) v -\- Qnu 6 41д, 0п 6 @, 1), 9n -v 1. Отсюда ип — и = V — U. [°Ug; и), а тогда из A.33) сле- A.22) =ф A.33). Если A.22) выполнено и w ?ЪD1д; и), то J'(u) -(ип — и) > 0, а потому XnJ'(u)-(un — и) > 0 при Хп > 0. Но это означает, что J'(u) -%п (ип — г*) > 0, откуда, переходя к пределу, получаем A.33). Следовательно, дует A.22). w — V ¦ 1 -е„
22 ' Гл. I. Минимизация функционалов Доказательство теоремы 1.7. Пусть и — мипи- мизирующий элемент из °11д и w ? % A1 д; и). По определению множества сё A1 д', и) (формула A.31)) / (и) ^ / (ип) — J (и + ип — и) = - / (и) -|- /' (и) .(и„ - «) + || ип - и \\.О A), т. е. /'(«)•(««-«) + II «п-и 11-0A) >0. Следовательно, при Кп > О /' (и).Я,„ К - и) + А* || ип - и ||.0A) > О, откуда, переходя к пределу, получаем A.33). Замечание 1.13. Условия типа A.33) являются необходи- необходимыми условиями первого порядка (в терминологии вариационного исчисления). 1.7. План дальнейшего исследования Отправляясь от задачи минимизации «найти inf / (v)», мы пришли к вариационным неравенствам вида /' (и) -(v — и) > 0 Vw 6 "Ив- Возникает следующий вопрос: если заменить У (и) оператором (не обязательно линейным) Л (и), то какие свойства этого опера- оператора Л обеспечивают существование у вариационного неравенства Л (u)-(v — и) > О V^ б^з по крайней мере одного решения в °lLg? Этот тип задач открывает возможности для многочисленных исследований; мы приведем (в § 2) лишь один простой пример такого исследования, отсылая за дальнейшими сведениями к биб- библиографическим замечаниям. Далее мы рассмотрим примеры, а затем изучим важный для теории оптимального управления случай, когда функция.J неко- эрцитивна. § 2. Прямое решение некоторых вариационных неравенств 2.1. Постановка задачи В соответствии с намечепнькм в разд. 1.7 планом займемся прежде всего решением вариационного неравенства A.13). Точ- Точнее, пусть л (и, и) — заданная па 1L билинейная форма, не обяза-
§ 2. Прямое решение некоторых вариационных неравенств 23 телъио симметричная; необходимо найти такой элемент и ? Ч1д,чгю я {и, v — и) > L (v — и) Vy <E 1Lg, B.1) где L — заданная на й11 линейная форма. Подчеркнем, что если форма л не симметрична, то неравен- неравенство B.1) не соответствует вариационной задаче — но крайней мере традиционной задаче отыскания экстремума функционала. Тем не менее неравенства типа B.1) мы будем называть вариацион- вариационными неравенствами. 2.2. Теорема существования и единственности Теорема 2.1. Пусть для билинейной формы л (и, v), не обя- обязательно симметричной, я (Vi — v2, Vi — v2) > с || Vi — v2 |j2 Vfi, v2 6 4a, B.2) где с — const > 0. Тогда в °Ug существует единственный элемент и, удовлетворяющий неравенству B.1). Доказательство единственности. Допустим, что в 11 g существуют два элемента мг и и2, для которых я (ии v — щ) > L (v — щ) Уи е 11 в, B.3) я (u2> v ~ гц) > L (v — и2) Уи 6 11д- B.4) Положим в B.3) v --- м2, в B.4) у — uj и слои;им получившиеся неравепства. Тогда —л (ut — м2, Ui — u2) > 0, откуда, согласно B.2), л (ui — u2, н-i — uz) — 0, т. е. ut — u2. Доказательство существования. 1) Приме- Применил: теорему 1.2 к случаю я (м, и) -—- (и, v)%. Тогда для заданного g 6 1L существует такой единственный элемент w --= S (g) 6 <Ua, B.5) что для всех v 6 11 a (w, v — w)v > (g, v — w)u — p [л (g, v — w) —L (v — w)], B.(\) где p — некоторая положительная постоянная. Ксли элемент и ^1i5 — неподвижная точка отображения 8 —>¦ S (g), то оп удовлетворяет неравенству B.1). Следовательно, теорема будет доказана, если мы убедимся, что можно выбрать постоянную р > 0 так, чтобы 1 ,„ ^ g-*- S (g) было сжимающим отображением на 11 э. ) ^
24 Гл. I. Минимизация функционалов 2) Так как форма ь>->- л (g, у) линейна и непрерывна на ^, то ее можно записать в виде x(g, v) = (fig, %, 5 6 ЗД ft/i) x), B.8) так что неравенство B.6) эквивалентно в этом случае неравенству (w, v — w)y > (g ~ pBg, v — w)% + pL(v — w) V^ ЧЧд. B.9) Пусть W\ -- = S (gi); тогда при w = wx и g = gi неравенство B.9) принимает вид (wuv — Wi)%>(gi — i)Bgl,v—w1)% -t pL(v — iL\Lv ?<Ud. B.10) Положим в B.9) v — wu в B.10) v = w и сложим получившиеся неравенства. Тогда — || w — wt ||^ >—((/ откуда II и> - ^ Наг < II G ~ Рд) (8 ~ 8i) \\п- С другой стороны, а согласно B.8), (В^, g)^ —- л (g, g). Заменяя gHag- gu при- приходим к неравенству Отсюда, считая, что g, gi g 'Z/a> и используя формулу B.2), полу- получаем что вместе с B.11) дает B.12) Выбирая р > 0 так, чтобы выполнялось неравенство 1 -Ь -+- р2 || В ||2 — 2ср ¦< 1, завершаем доказательство. Замечание 2.1. Пусть 6 (и, v) — билинейная симметрич- симметричная и коэрцитивная форма, определенная па 41. 1) Через S6(X\ Y) обозначается пространство нопрерынных линейных отображений топологического векторного пространства X в топологическое векторное пространство Y.— Прим. перев.
§ 3. Примеры 25 Допустим, что для заданных g ?41 и р > 0 элемент w = = $ь (s) множества 41 д удовлетворяет неравенству Ъ {w, v — w) > Ъ (g, v — w) — р [л (g, v — w) — L (v — w)} W € Ua. B.13) Тогда при подходящем значении р отображение g—> Sb (g) будет сжимающим на 11 д и его единственная неподвижная точка будет искомым элементом и. (В предыдущем доказательство было Ъ {и, v) -= (и, v)%.) . Можно указать эффективный способ аппроксимации и, напри- например, применяя метод последовательных приближений для реше- пия неравенства B.13). Для этого достаточно знать одну форму Ъ {и, v), для которой известно, как эффективно (хотя бы прибли- жеппо) решается следующая задача: b (и, v — а) > 'М (и —и) Уу 6 "Чо- Замечание 2.2. Можно сформулировать апалоги замеча- замечаний 1.5 и 1.6. Если, в частности, 41q -— 41, то из теоремы 2.1 вытекает, что если л (и, v) — билинейная (не обязательно симметричная) непрерывная па 11. фор.ма, удов- удовлетворяющая неравенству я {v, v) > с || о ||2, О 0, Vv 6 41, } B.14) то существует единственный элемент и ? 11 для которого л (и, v) — L (у) Vtf ? 41. Этот результат хорошо известен под названием «лемма Лакса — Милырама» (см. Лаке и Мильграм [1], Випгик [1]). Замечание 2.3. Как и в разд. 1.4, неравенство B.1) мож- можно заменить эквивалентным неравенством л {v, V— и) > L (v — и) 4v?ilg. B.15) § 3. Примеры 3.1. Функциональные пространства на й Пусть Q — открытое множество в R'1, а Г — его граница. В дальнейшем всегда будем считать, что Q — ограниченное открытое множество, а его граница Г — бесконечно дифференци- дифференцируемое многообразие размерности п — 1, причем множество Q расположено локально но одну сторону от Г. Эти предположения
26 Гл. 1. Минимизация функционалов можно ослабить в каждом из примеров, рассматриваемых в настоя- настоящей книге, но мы этого делать не будем. В дальнейшем используются следующие обозначения: 3 (О.) — пространство бесконечно дифференцируемых в обла- области Q функций ф, принимающих действительные значения и имею- имеющих и Q компактный носитель (свой для каждой функции ср); это пространство снабжено топологией индуктивного предела (Шварц [1]). «Псевдотопология» в 3) (Q) определяется так: последователь- последовательность {ср„} ? 3 (Q) сходится к нулю, если: (i) все функции ц>п имеют носители в фиксированном компактном подмножестве в Q; (ii) <р„ ->- 0 при п ->- оо (в обычном смысле) равномерно на Q вме- вместе со своими производными любого порядка. / 3' (й) — пространство распределений (обобщенных функций) на Q, т. е. нрострапство линейных непрерывных функционалов на 3 (Q); если / ? 3' (Q), то производная df/dxt — единственный элемент пространства 3' (Q), определяемый равенством где через (•, •) обозначено скалярное произведение элементов, взятых соответственно из 3)' (Q) и 3 (Q). Мы будем обозначать распределения так же, как и функции; если / ? 3' (Q) и ср ? ? i# (Q), можно записать Например, если а ? Q, то б-фуыкция Дирака в точке а обозначает- обозначается через б(х — а) и определяется равенством (б [х — а), ф) = \ б (х — а) ф (х) dx = ф (а), и Lr'(^) A ^ р ^ оо) —пространство (классов) функций/, изме- измеримых на Q и таких, что (a;)[<cx) при р = оо- В частности, Ll (Q) (т. е. р — 2) — гильбертово пространство, которое мы будем отождествлять с его двойственным. (Следует иметь в виду, что все остальные гильбертовы пространства функ- функций на Q нельзя так отождествлять с их двойственными.)
§ 3. Примеры 27 Сопоставляя с каждой функцией / ? № (Й) распределение (обобщенную функцию) /: получаем линейпое непрерывное и взаимно однозначное отображе- отображение / -v / пространства LP(Q) в SE' (Q). Можно отождествить / с/, что мы и будем делать. Тогда после естественного отождествле- отождествления элементов из 3 (Q) и Lv (Q) получим ?? (Q) с Lp (Q) с= 55' (Q). C.1) Учитывая C.1), можно определить обобщенные производные для каждой функции / 6 U' (Q). (Зообще, для / 6 SB' (Q) положим (Д'/,ф) = (~ II9'(/»/>'ф> V9ea)(fi), C.2) где g = {$fi, . . ., gn}, ] q ] = gi + . . . + qn, qt > 0 — целые числа, а dxf II"l(Q) (m > 1 — целое число) — пространство Соболева порядка т в области Q: Hn(Q) = {v\DgveL2(Q) Vq, 0<|g|<m}. C.3) Для функций ы, у 6 Ят (Q) зададим скалярпое произведение (И, У)лт@)= У (Я*И, Д9РI.«@). C.4) <1 p Припи.мая во внимание, что отображение / -у 3qf простран- пространства 3>' (Q) в себя *-слабо непрерывно (непрерывно в слабой двой- двойственной топологии; см. Шварц Ш, Хорват [1], Иосида [1]), легко убедиться, что справедлина Теорема 3.1. Пространство Ilm(Q), снабженное скаляр- скалярным произведением C.4.), является гильбертовым пространством. 3.2. Функциональные пространства на Г Аналогичным образом вводятся пространства <5?(Г), LV(Y), 3j'{T), Hm(Y) на многообразии Г с мерой dY (индуцированной мерой dx). Если многообразие Г компактно, то <29(Г) совладает с про- страпством бесконечно дифференцируемых функций на Г (без условий на носители). В этом случае производные определяются с помощью локальных карт, и так же определяется пространство #т(Г).
28 Гл. 1. Минимизация функционалов 3.3. Подпространства пространства Hm(Sl) Один из наиболее полезных в приложениях результат — тео- теорема о следах для пространств Нт (Q). С каждым элементом и ? IIm (Q) .можно сопоставить следы на Г элемента и и его нор- нормальных производных дки/дпк J) для i ^.к ^.т — 1 и таким путем охарактеризовать образ пространства Нт (Q) при отобра- отображении *" *"¦"}. C.5) дп дп Для этого на.м понадобятся пространства Соболева дробного поряд- порядка, которые мы сейчас и введем. Рассмотрим сначала пространство Нт (й) при Q — Rn. Мы будем пользоваться преобразованием Фурье2) Jf. / -»- SFU &1 (I) = J ехр (- 2nlxl) f (x) dx, C.6) ЦП (где хс - x\\i + ... -j- xn%n), устанавливающим изоморфизм пространства L? (R") на себя, причем || ,^/ || ;2(Rn) == || / || ;.2(Rn). Отображение ,^г~1, обратное к <f, определяется равенством ^~7 (х) = I exp Bnixl) / (I) dl. C.7) Отобра/кепия jr и t^" продолжаются по непрерывности на пространство медленно растущих распределений (Шварц [1]). Оказывается, что Vi7e?2(R"), C.8) а отсюда следует, что Hm(Rn) = {v\t4.!FveL2(Rn)Vg, 0^\g\^m}, C.9) где \q — \\i . . . Нз". Нетрудно убедиться, что равенство C.9) можно заменить эквивалентным ему равенством Hm(nn) = {v\(l + \l\y/\<FveL2(Rn)}. C.10) Если u,v?Hm(Rn), то билинейная форма (A +1i\Y'2&u, A + \l\T/2^v)LHRn) (з.и) ') дЬ/дпЬ — нормальная производная порядка к; для оиределешюсти будем считать, что нормаль к границе Г области Q направлена наружу. ') Если / g L2 (Rn), то интегралы в C.6) и C.7) являются пределами (в смысле 1?Ып)) 'функций \ охр (^2я!х|)/(|)^|при М ->¦ оо. 1 liisj'Ar
§ 3. Примеры 29 определяет скалярное произведение, эквивалентное заданному формулой C.4). Тот факт, что в формуле C.10) т — целое положительное чис- число, не имеет значения. Поэтому для любого s ? R можно опреде- определить пространство H*(W) = {v\(l + \l\2y/\<FveL2(Rn)}, C.12) которое становится гильбертовым после введения скалярного произведения (и, v)Hsain) = (A + 11 \2f% ри, A -f 11 \Y2 &v)b4W*y C-13) Ото скалярное произведение при s -- т, т. е. при целом положи- положительном s, эквивалентно (но не тождественно) скалярному произ- произведению C.4). Можно показать (см. Лионе и Маджепес [1, гл. 1]), что если <р 6 3) (Rn), то и —>- (fie — непрерывное линейное отображение пространства IIs (R") в себя. Это в свою очередь позволяет определить (с помощью локаль- локальных карт) пространства tP (Г). Пример 3.1. Пусть Й — круг | х \ < 1 в R2. Тогда Г — окружность | х | — 1, т. е. Xi ~ cos 0, х2 -- sin 0, 0 6 Ю, 2л). В этом случае утверждение / ? Hs (Г) эквивалентно соотношениям /= 2 ^еы\ '? (l + «2)S|/,J2<°o. C.14) Отождествляя пространство L2 (Q) (соответственно L2 (Г)) с его двойственным, можно отождествить двойственное пространство к ТГ (Rn) (соответственно к Hs (Г)) с П~* (Rn) (соответственно с Я-8 (Г)). }3ообще, если обозначить через X' пространство, двойствен- двойственное к X, то (tf^R^'^tf-^R11) Vs?R C.15) и = Я"8(Г) VsgR. C.16) Теперь мы в состоянии сформулировать теорему о следах (ее доказательство см. Лионе и Мадженес [1]): Теорема 3.2. Для каждого элемента и 6 Нт {Q) можно однозначно определить его следы , ди и\Г, дп дпп
30 Гл. 1. Минимизация функционалов При этом оказывается, что -й-1/2(Г)) o<fc<m-l, C.17) I дпк г а и —>- {dhu/dnk | г, 0 ^ к ^ т — 1} — линейное непрерывное сюръ- т—1 ептивное отображение из Нт (й) на Г] Нт 1/"(Г). Справедлива также Теорема 3.3. Ядро отображения C.5) *) совпадает с замы- замыканием пространства 2) (Q) в Пт (Q). Обозначим это ядро (подпространство пространства Нт (Q)) через Я™ (Q): дп =0 У/k, 0<fc<m-l}. C.18) Так как ,25 (Q) плотпо в //™ (Q), то пространство, двойственное к Я™ (Q), можно отождествить с некоторым подпространством пространства 3' {Щ. Положим C.19) тогда Я™ (Q) c= L2 (Q) с: П~т (Q). C.20) 3.4. Примеры граничных задач Пусть atj (i, j = 1, . . ., n) — задапные на Q действительные функции, причем почти всюду па Q. Далее, пусть а0 ? Ь°°(п), ао(х) > а Для u,v ]) То естг 6 i/J(Q) поло 1 п , совокупность аи й+. EL (Q), • • + ?n)t « Г причем > 0 почти всюду жим таких /„ ¦ ar -f элементов цg на Q. - I aouvdx. а IIm{Q), что —— C C C C г .21) .22) .23) .24) = 0, 0 < к < m — 1.
§ 3. Примеры 31 Тем самым определена непрерывная билинейная форма на II1 (Q). В силу C.22) и C.23) n{v,v)^a\\v Iftift» Vv 6 /У1 (й). C.25) Выберем « пространстве IP (Й) (в обозначениях изложенной в § 2 общей теории) множество 41 в -- Ж, — замкнутое подпространство пространства Л IP (й) (снабженного введенной нордюй), причем > C.2G) U => Щ (Й), J и пусть L — линейная непрерывная на °IL форма. C.27) По теореме 2.1 (см. B.14)) существует единственный элемент мрй, для которого л (и, v) ¦=-. L (у) Vven. C.28) П р и м е р 3.2. Пусть L (v) ^ [ fv dx, f 6 L2 (й). Тогда Q уравнение C.28) эквивалентно уравнению Щ, C.29) где it J—* О ОС i \ ОСС j / Действительно, если Щ, ¦-- Н1 (Q), то C.28) эквивалентно урав- уравнению я (и, Ф) --= L (Ф) V<p 6 равносильному уравнению C.29) по самому определению обоб- обобщенных производных. Задача C.29) является задачей, Дирихле. Пример 3.3. Пусть Ш —- IP (й), а коэффициенты пц, а0 регулярны в й (например, atj ? С1 (й), а0 6 С0 (Й)). Пусть линей- линейная форма L (v) ладана и виде L(v) = [ivdx+\gvdl\ /6L2(Q), geiri/2(V). C.31) а г Заметим, что C.31) действительно определяет линейную непре- непрерывную форму па IP (Q) ¦-- '21, так как но теореме 3.2 v -> v \ г есть непрерывное отображение Н1 (й) -> Н1/2 (Г). В рассматриваемом случае уравнение C.28) можно интерпре- интерпретировать так. Возьмем сначала v ¦-¦¦ ср ? 3j (й); тогда Аи = / в й. C.32)
32 Гл. I. Минимизация функционалов Дальше будем рассуждать формально х). Умножим обе части равен- равенства C.32) на v и применим формулу Грина2): UAxi)udx=— \ (—) vdV + n(u, v) = \fvdx; а г\dvAJ a здесь г) ^ Я ^L ? аи-^ cos (n, xt) ш Г, C.33) i dX dvA i,j=\ a cos (n, xt) — это i-й направляющий косинус впешней нормали п к границе Г области О. Согласно C.28), л (и, v) = J jv dx -f- \ gv dT, и г откуда г V dvA и, следовательно, dvA Таким образом, мы доказали (считая, что формула Грина обо- обоснована) существование и единственность функции и ? II1 (Q), удовлетворяющей соотношениям . . „ ди Au = f в У; = g на 1. л dvA (б.б'и Задача C.34) является задачей Неймана. Замечание 3.1. Для функции и ? IP{Q), для которой Ли ? L2 (Q), можно единственным образом определить du/dvA на Г, и при этом du/dvA ? Н'1/2(Г) (см. Лионе и Мадженес [1, гл. 2]). , II р и м е р 3.4. Пусть 4L ¦- II1 {Q), а коэффициенты аи разрыв- разрывны. Точнее, пусть Q --- QxljQnljS (рис. 1) и причем функции a\j и a\j регулярны в областях Q, и Q2 соответ- соответственно, но не совпадают на поверхности S. Пусть линейная фор- 1) Это рассуждение можно полностью обосновать; см. Лионе и Маджо- нес [i, гл. 2]. 2) Ее-то и нужно было бы обосновать.
§ 3. Примеры 33 ма L {и) задана в виде llhvdx, fh ?L2(Qh), к = 1,2. а 2 Мы снова должны интерпретировать уравнение C.28). В рассматриваемом случае это можно сделать так. Если взять сначала v = ц> 6 3i(Qi), а потом и --= ц> ? _25(Q2), то можно Рис. 1. доказать, что и удовлетворяет соотношениям АъУ = fk в Qft, А; = 1, 2, где -Aftioss— 2 — (a)j— ) + ahow, Л = 1,2.. C.35) Положим и — щ в Йй, /г = 1, 2. Далее, взяв функцию у ? #X(Q) тож-дественно равной нулю в Q% и в точках области Qb ло/кадщх в окрестности поверхно- поверхности S, можно убедиться, что, как и в примере 3.3, ^- = 0 на 1\. C.36) Аналогично получаем, что ди2 = 0 на Г2. C.37) Пусть, наконец, функция v ? 3)(Q) отлична от пуля на S. Из уравнений Akuh — fh следует, что I vdx-\- \ (Л2м2) vdx~ \ ftvdx+ \ f2vdx. 52 j Q2 Hi Q2 Применим формулу Грина к левой части этого равенства: s dvAi в dvAl 3—1230
34 Гл. 7. Минимизация функционалов где d!dvAh определяется аналогично C.33), причем на S выби- выбирается нормаль, направленная наружу области Qft. Следовательно, s \dvAl д\Аг откуда dvAt dvA2 Таким образом, функции щ 6 Я1(Й0 и м2 6 Я1(О2) удовле- удовлетворяют уравнениям C.39) 2, J условиям C.36) и C.37) на 1\ и Г2 соответственно, а также усло- условиям сопряжения ul = uz на S, II р и м е р 3.5. Пусть Q — двусвязпая область (рис. 2). Рис. 2. (Положим 1 Пусть фор.иа я («, v) та нее, что 1г в предыдущих примерах (см. C.34)), а линейная форма имеет вид L (v) = yVdx+l god\\, g6Я~1/2(Г2), /е L2(Q). В этом случае уравнение C.28) приводит к соотношениям C.41) Au = f в Р., и = 0 на Г„ ди „
§ 3. Примеры 35 Это смешанная граничная задача: на одной части границы задано условие Дирихле, а на другой ее части — условие Ней- Неймана. 3.5. Односторонние граничные задачи *) (I) До сих пор общая теория § 2 применялась к примерам, в кото- которых не было ограничений на управления, т. е. когда было 11д = 11 (см. C.26)). Возьмем теперь ту же, что и в разд. 3.4, форму к (и, v) (см. C.24)), а в качестве °Ыд выберем выпуклое замкнутое подмноже- подмножество в 11. Пусть сначала 11 — Н1 (О.) и &e = {v I v е %, v |г > 0}. C.42) Лемма 3.1. Множество <Ud, определенное равенством C.42), является выпуклым замкнутым конусом в пространстве °U, = = II1 (Q) с вершиной в начале координат. Доказательство. Очевидно, что 1lg — выпуклый конус с вершиной в начале координат, и нужно лишь доказать, что 11 g — замкнутое множество. По это следует из непрерывности отоб- отображения у-> v |г пространства Н1 (Q) на Я1/2 (Г) (теорема 3.2). Выберем теперь линейную форму L, как и в примере 3.3Г в виде C.31). Так как в рассматриваемом случае применимо заме- замечание 1.6, то существует единственный элемент и ?°11д, для кото- которого л (и, v)>L(v) Vv?1l0, C.43) л (и, и) — L (и). C.44) Соотношения C.43), C.44) интерпретируются следующим обра- образом. Пусть v — ±ф, ф ? 3) (Q) (так что v ?_Ид); тогда я (и, Ф) - L (Ф) УФ € 3) (Й), и, следовательно. Аи ¦--= f в Q. C.45) Умножая равенство C.45) на v ? <Ug и применяя формулу Грина (формально; о возможности ее обоснования мы уже говорили в нримере 3.3), получаем ди [ v dT + я (и, v)= \ fv dx. v dvA a В оригинале problemcs aux limites unilateraux.— Прим. перев. 3*
36 Гл. 1. Минимизация функционалов Отсюда в силу C.43) вытекает U~-g)vdT^0. C.46) г \dvA / Фигурирующая в соотношении C.46) функция v принадлежит мно- множеству <Ua, а значит, v > 0 на Г; поэтому неравенство C.46) эквивалентно неравенству х) •Л >0 Г ( ссе Л~1/2 ?> на Г (в смысле Л~1/2(Г)). C.47) dvA Кроме того, в силу C.44) из C.46) вытекает, что г\dvA Это равенство с учетом C.47) и того, что и > 0 на Г, дает I du А- \dvA :0 па Г., C.48) Таким образом, в пространстве Н1 (О) существует единствен- единственная функция и, удовлетворяющая уравнению C.45) и граничным условиям и^О на Г, 1 ди ^ „ п g>0 на Г, I dvA [ C.49) *L-g) = 0 на Г. ,dvA ) Замечание 3.2. Соотношения C.49) называются односто- односторонними граничными условиями. Согласно последнему из условий C.49), существует подмноже- подмножество Го границы Г, на котором и = 0; тогда ~ — g = 0 на Г — Го. Разумеется, Го заранее не известно, так что речь идет о задачах, имеющих некоторую аналогию с задачами со свободной границей (см. также разд. 3.6). !) Согласно Шварцу [1], неотрицательное распределение есть пеотрица- тельная мера. Следовательно, ди1д\А — g есть мера на Г, неотрицательная и принадлежащая пространству Я~1/2 (Г),
§ 3. Примеры 37 Замечание 3.3. Отметим, что задача C.45), C.49) — нелинейная, хотя А — линейный оператор. Вообще, если множе- множество допустимых управлений само не является векторным простран- пространством, то соответствующая граничная задача нелинейна. 3.6. Односторонние граничные задачи (II) Возьмем снова ту же форму п (и, v), что и в разд. 3.5. Пусть U - Нх (G) и 11д = {р | v ? °ll, v > 0 почти всюду в Q}. C.50) Можно непосредственно проверить, что °Ид — выпуклый зам- замкнутый конус в пространстве 41 с вершиной в начале координат. Считая, что линейная форма L задана так же, как и в разд. 3.5, мы можом утверждать существование и единственность элемента u^iig, удовлетворяющего условиям C.43), C.44). Вопрос об интерпретации условий C.43), C.44) в рассматривае- рассматриваемом случае более тонкий (подробное исследование этой задачи проводили Брезис и Стамиаккья [1]). Разобьем область О, на два множества: й0 = {х \х?п, и(х) = 0}, /orj4 C.51) Q+ = {¦? ! х ? Q, и{х)> 0}. Схематически это разбиение представлено на рис. 3. Подчерк- Подчеркнем, однако, что О0 заранее не известно и, вообще говоря, не из- известна «степень регулярности» «границы» S, разделяющей множе- множества Qo и Q+. Пусть функция ф ? 3} (Q) имеет компактный носитель в Q+- Для достаточно малых е функции v ~ и ± Щ принадлежат мно- множеству 16g (так как и > 0 на й+), а тогда из C.43) вытекает л (и, ф) = L (Ф) Уф € 2 (Й), и, следовательно, и = 0 в йо, Аи == / в й+, и > 0. C.52)
38 Гл. 1. Минимизация функционалов Далее, как и в разд. 3.5, J*L-g^O, u(—-g) = 0 па Г+ C.53) dvA \dvA / (смысл обозначения Г+ ясен из рис. 3). Так как и ? Н1 (Q), то и = 0 на S C.54) (предел при приближении к S по множеству Q+). Наконец, можно показать (см. Брезис и Стампаккья tU), что в некотором вполне определенном смысле ди ovA = 0 C.55) (предел при приближении к S по множеству Q+). Односторонняя граиичная задача C.52) — C.55) есть задача со свободной границей; поверхность S (входящая в число неизвест- неизвестных) является свободной поверхностью. Замечание 3.4. Главная трудность рассмотренной зада- задачи заключается в исследовании регулярности решения (см. Бре- Брезис и Стампаккья [1]). Многие задачи такого типа пока остаются нерешенными. Это относится, в частности, и к некоторым задачам, встречающимся в следующих главах. 3.7. Односторонние граничные задачи (III) Возьмем в качестве п (и, v) ту же форму, что и в разд. 3.5 и 3.6. Пусть U = Н\ (О) и °М-д = {*> I I ?>га^ v (х) | ^ 1 почти всюду в Q}. C.56) Легко убедиться, что йЦд — выпуклое замкнутое ограниченное подмножество пространства Е\ (Q). Пусть линейная форма имеет вид l J(Q). C.57) Тогда существует, и притом единственный, элемент и ? °Цд, для которого n(u,v — u)^L(v — u)='\f(v — u)dx Vv?il3. C.58) u Этому соотношению можно дать следующую формальную ; интерпретацию. Разобьем область Q на два множества: Q, = {х | |grad«(a:) | = 1}, Q2 = {х | |grad u(x) |<1}.
§ 3. Примеры. 39 Тогда Аи = / в Qs. C.59) Главная трудность состоит в изучении регулярности решения на границе, разделяющей множества Qi и Q2 (см. Брезис и Стам- паккья [11). 3.8. Односторонние граничные задачи для систем уравнений Все предыдущие рассмотрения можно распространить на си- системы. Ограничимся одним простым примером. Пусть U = IIх (й) X В1 (Q); C.60) тогда элемент и 6 ^ имеет вид и = {щ, м2}, щ б//1^)- Рассмотрим в пространстве 1L множество <Ug = {v | v =¦ {vi, v2}, vi > 0 на Г, v2 > 0 на Г}. C.61) Как и в jjeMAie 3.1, cUd — выпуклый замкнутый копус в про- пространстве U с вершиной в начале координат. Пусть л (и, v) = § grad «j grad vt dx -f- \ grad u2 grad v2 dx + 5 dx; C.62) dY+ ) g2v.,dl\ C.03) где /t 6 Ьг (Q), g* € //1/2 (Г), t - 1, -2. Так как л(у, у) — )| vt \\%ца) Jr || v2 ||hi(O). to применима общая теория и, следовательно, существует единственный элемент «• 6^3' удовлетворяющий условиям C.43), C.44). Этим соотношениям можно дать такую же интерпретацию, как и в разд. 3.5. Именно получается система а) — Ащ + «!— u2 = /t в Q, n x) Здесь А = У!
40 Гл. 1. Минимизация функционалов с односторонними граничными условиями Ui^O на Г, дщ т (dui \ n г • ¦—¦ — gi ^ 0 па Г, щ I gt I = О на I, i дп \ дп / = 1,2. C'65) 3.9. Эллиптические операторы порядка выше второго Во всех рассмотренных до сих пор примерах получающиеся дифференциальные операторы были второго порядка. Сейчас мы приведем очень простой пример, в котором будет эллиптический оператор 4-го порядка. Пусть <U = {v.\v?L* (Q), Av e L% (Q)}. C.66) (разумеется, Ay понимается в смысле распределений на Q). Для и, v ? 1С зададим скалярное произведение формулой (и, v)n = (u, v)l4q) + (Au, Av)L2(Q); легко видеть, что тогда Ш будет гильбертовым пространством. Моншо показать (Лиопс и Мадженес [1, гл. 2]), что для каждого v 6 41 однозначно определяются следы г; ]Г, ^- " Ъ~п <t'|r, — г есть непрерывное отображение I дп Т) C.67) Возьмем множество дп Замечание 3.5. Условия v I г > 0 и тг- 1 дп C.68) > 0 пони- понимаются в смысле пространств //~1/2(Г) и П~3/2(Г) соответственно. Следовательно, у|г и — —положительные меры.
§ 3. Прим.ерЫ 41 Легко проворить, что 41 а — выпуклый замкнутый конус в про- пространстве 41 с вершиной в начале координат. Пусть я (и, v) = ) at (х) Аи Av dx 4- ) aouv dx; ao,ai 6 L °°(Q);' ° U }C.W) a0 (x)^:a^> 0, at (x) ^ a > 0, почти всюду в й. Очевидно, что п (v, v) ^ a || v \\\. Наконец, положим i-bgdr, C.70) где В силу C.67) линейная форма v—>- L (v) непрерывна яц %. Следовательно, существует единственный элемент u^flg, удовлетворяющий условиям C.43), C.44). Осталось интерпретировать условия C.43), C.44); м;ы сделаем это формально J). Прежде всего, возьмем v = ±(p, ф 6 3)({1) (так что v?<Ud). Тогда в силу C.43) A (ciiAu) + аои = f в Q. C.72) Если считать функцию ai достаточно гладкой в Q, то можно показать (Лионе и Мадженес [1, гл. 2]), что и ?Ш, а C.72) дает возможность однозначно определить следы дп е#~7/2(Г). (з.73) Умножим обе части равенства C.72) на v ? <U9 и применим (формально) формулу Грина; получим {-drSai^vdV~ ^diAu — dr + niu, v) \ что в силу C.43) и C.70) эквивалентно неравенству g^dT — Д— {aiA^-gA vdV^O. C.74) Согласно C.44), левая часть неравенства C.74) обращается в нуль при v = и. *) Нам неизвестно, как можно было бы строго обосновать проводимые формальные вычисления.
Гл. /. Минимизация функционалов Итак, найдены односторонние условия на границе Г: и > 0, ^ (^Ди) - gz < О, к ^ (в! Дм) - g2j == О, Замечание 3.6. Как мы уже отмечали, предыдущие вычисления формальны. Действительно, папример, и \г в H~i/2 (Г) г Н~1/2(Т), а произведение и (у- г. не опре- определено. Для строгой интерпретации нужно было бы воспользо- воспользоваться замечаниелг 3.5. 3.10. Недифференцируемый функционал Проиллюстрируем на примере применение теоремы 1.6. Пусть Q — открытое ограниченное множество в R'1 и 41 — = Н\ (О). Рассмотрим функционал / (v) = /t (v) + /2 (у), C.76) где /j (у) = a j | grad v f dx — 2 J /у dx, Л Si Й j . / — заданный элемент UiH~i(Q), I C.77) ) J2(v)=2$\\gvadv\dx, p = const >0. C.78) a Легко видеть, что в этом случае теорема 1.6 применима х). Отметим также, что функция v -> /2 (v) педифференцируема. Пусть 11 д = <Ц (ограничений на управления нет). Тогда един- единственный элемент и ?11, для которого / (и) — inf / (v), харак- ¦OZ.U теризуется неравенством /i(w).(i; —м) + /2(у)—/2(it)>0 Vw6«. C.79) Для упрощения записи положим я (и,1 у) = a J grad и- grad и dx; C.80) J) Так как множество п ограничено, то существует такая константа с, что I v* dx < с I | grad у |2 dx Vy ? Я1 (Q). и о
3. Примеры 43 тогда C.79) можно переписать в виде п(и, v — и) — j) / (v — и) dx -^ ^ ^\gY&dv\dx — ^ а а а Обозначим X (u, v) = я (и, v) — $ jv dx + р $ f grad у | dx; C.81) тогда C.79) примет вид X (и, v) > X (м, и) Vv e<U. C.82) Заменяя здесь v на Яи при X > 0, получаем XX (u, v) > X (и, и) Vy 6 ^, VX > 0. C.83) Если % -— 0, то X (и, и) ^ 0. Поэтому неравенство C.83) выпол- выполняется лишь в том случае, когда X (и, у) >0 Уу 6^, а отсюда следует, что X (и, и) > 0. Таким образом, минимизирующий элемент и ? Ш для функ- функционала J (v), заданного соотношениями C.76)—C.78), харак- перизуется тем, что X (и, v) > 0 Уу 6 U\ X {и, и) = 0, C.84) где форма X (и, v) определена равенствами C.81)-и C.80). Убедимся теперь, что справедливо Предложение 3.1. Для того чтобы соотношения C.84) удовлетворялись при и — 0, необходимо и достаточно, чтобы выполнялось неравенство l] C.85) й ?2 Доказательство. Соотношения C.84) можно запи- записать в виде п(и, v) — р ^ | grad v | dx ^ J jv dx Уи^Ш, п (и, и) -f- р | | grad м i dx = j /u dx. Й ?2 Если u = 0, то первое из соотношений C.86) превращается в C.85). Обратно, если выполняется неравенство C.85), то, применяя его в случае v — и, получаем из второго соотношения C.86), что я (и, и) ^ 0, а, следовательно, и = 0. Если же неравенство C.85) не выполняется, то и Ф- 0, / (и) < <С 0 и минимизирующий элемент и характеризуется соотноше- соотношениями C.86). См. также § 19 гл. 3.
44 Гл. 1. Минимизация функционалов § 4. Теорема сравнения 4.1. Общий результат Рассмотрим билинейную (не обязательно симметричную) фор- форму я (u, v) на гильбертовом пространстве 41, удовлетворяющую условию х) n(v, v)^c\\v\\2 Vv?<U, D.1) где с = const >• 0. Пусть 41 д и 41% — два выпуклых замкнутых множества в пространстве 41 и L — линейная непрерывная на 41 форма. По теореме 2.1 существует единственный элемент и ?41д (соот- (соответственно и* ?41%), для которого п(и, и — u)^L(v — и) Vv?4lg D.2) (соответственно я (и*, v — u)^ L (v-u*) Vv 6 41%). D.3) Докал<ем следующую теорему (примеры ее применения приве- приведем в разд. 4.2). Теорема 4.1. Если выполняется неравенство D.1) и можно нд/йти такие элементы w ?4lg и w* ?41%, что w -|- w* = и + и*, D.4) я (w — и*, w — и) = 0, D.5) то w = и, и>* = и*. D.6) Доказательство. Положим v — w в D.2), у = w* в D.3) и сложим почлепно получающиеся неравенства; тогда в силу D.4) л (и, w — и) + л (и*, и>* — и*) > 0. Так как в силу D.4) w* — и* — — (w — u), то а (и — w, w — и) -f- л (w, w — и) — я (и*, w — и) > ' , ИЛИ —я (и> — и, w — и) -\- я (w — и*, w — и) > 0. Это неравенство в силу D.5) принимает вид —л (w — и, w — и);>0, откуда, согласно D.1), w = и, а потому и w* = и*. J) Мы ограничиваемся этим условием для простоты. Можно было бы рас- рассматривать более общее условие B.2) и аналогичное неравенство, выполняю- выполняющееся на 11%.
§ 4. Теорема сравнения 45 4.2. Приложение Вернемся к задаче, рассмотренной в разд. 3.5; минимизирую- минимизирующая функция и (х) удовлетворяет соотношениям C.45), C.49). Пусть Г4 — измеримое подмножество границы Г; положим Ua (I\) = {v | v 6 Я1 (Q), v = 0 почти всюду на 1\}. D.7) Это замкнутое векторное подпространство пространства 41 =» = Н1 (QI). Если взять 41% = 41 а (Г^), то соответствующая мини- минимизирующая функция и* равна uri (х), где AuTl=f в Q, иг=0 на Г„ -g = 0 на С помощью теоремы 4.1 можно доказать, что справедлива Теорема 4.2. Если и удовлетворяет соотношениям C.45), C.49), а иг, — соотношениям D.8), то и (х) = supuTl (x) для почти всех x?Q, D.9) г, где Ti пробегает семейство измеримых подмножеств границы Г. Доказательство. 1) Так как, согласно C.49), и = = иГ1 при соответствующем множестве 1\, то sup uTj (x) ^ и (х). D.10) Следовательно, остается доказать, что справедливо неравенство, обратное к D.10). 2) Пусть множество 1\ фиксировано, 41% = 4la (TJ и ггГ1 = = и*. Достаточно убедиться, что и* ^ и почти всюду в Q. D.11) Определим u> = sup(i/., ы*), w*^inf(?i, и*J). D.12) Равенство D.4), очевидно, выполняется. Покажем, что выполняет- выполняется и равенство D.5). Полагая и — u* = ojj, получаем я (и> — и*, и; — и) = л (sup (и — и*, 0), sup @, и* — и)) = - -n(sup(ijj,O)f inf (яр, 0». J) Строгое включение Ч1д (Г4) с 11 имеет место тогда и только тогда, когда мера множества Ti положительна. 2) Отметим, что если и, v ? //'(^Ь то sup {и, v) ? #'(&) и inf (к, у) ? m ) ? аналогичное утверждение для пространств //m(Q), m ~^> 2, неверно).
46 Гл. 1. Минимизация функционалов Если {фп}— такая последовательность функций из Сг(?}), что т])„ -> 1|з в смысле пространства Hl (Q) *), то , 0), inf (if, 0)) = lim я(зир(г1зп, 0), inf ($„, 0)) П-fOo и л (sup (i|;n, 0), inf (ф„, 0)) —0; отсюда и следует равенство D.5). Таким образом, можно применить теорему 4.1 и заключить, что w =•-- и, т. е. что выполняется неравенство D.11). Замечание 4.1. Доказательство теоремы 4.2 аналогично доказательству принципа максимума для решений эллиптических уравнений. Действительно, пусть / — заданная функция про- пространства Н\&), причем />0, D.13) а и ? II\ (Q) — решение уравнения гф, у) = $/уАс VveHi(Q),- D.14) ?2 где форма я имеет прежний вид. Тогда и>0. D.15) В самом дело, положим w = sup (u, 0). Легко видеть, что w 6 ? III (^) 2) и Л (w\w — и) — 0 (как в предыдущем доказатель- доказательстве). Тогда из DЛ4) с учетом D.13) получаем Л (и, W — li) — J / ((?> — U) ??Х ^ 0, откуда л (и, и? — и) — и (w, w — и)>-0, или —п (и> — и, w — и)^0, а значит, w = и, и неравен- неравенство D.15) доказано. По поводу более точных результатов; касающихся вопроса, затронутого в замечании, см. Стамнаккья [2]. § 5. Некоэрцитивные формы 5.1. Выпуклость множества решений Рассмотрим непрерывный выпуклый функционал v-^-J(v), полунепрерывный снизу в слабой топологии. Обозначим через X множество таких элементов и ^41 д, что J{u)= inf J{v). E.1) 1) Такая последовательность существует; см., например, Лионе и Мад- женес [1, гл. 1]. а) Ото справедливо только в пространствах Соболева первого порядка.
5. Некоорцитивиые формы 47 Множество X может быть и пустым, но, если, например, мпо- жество Ч1д ограничено (а также в коэрцитивном случае; см., напри- например, теорему 1.0), то X не пусто. В любом случае справедлива Теорема 5.1. Множество X замкнуто и выпукло в °Ud. Доказательство. Замкнутость множества X очевид- очевидна. Для доказательства выпуклости возьмем ui,u2?X; тогда Если 0 6 @, 1), то J (A __ 9) щ + 0ы2) < A - 9) / (щ) -J- 0/(и8) < / (v) а потому A _ 0) щ + 0и2 6 X. Ото свойство распространяется и на вариационные перавеи- ства, которые не обязательно соответствуют вариационной задаче (см. разд. 2.1). Например, справедлива Теорема 5.2. Пусть л (и, v) ¦— билинейная непрерывная (не обязательно симметричная) форма на 1/,, удовлетворяющая условию я (v, y)>0 Vv еш. E.2) Тогда множество X таких элементов и ? <?/<?, для которых л (и, v — ы)>/, (у — u) , V^ 6 %а. E.3) амкнуто и выпукло в 41 1). Доказательство. Неравенство E.3) эквивалентно (см. разд. 1.4 и замечание 2.3) неравенству л (v, v — u)^>L(v — и) Vv ?Ш0. E.4) Легко видеть, что если элементы щ и и2 удовлетворяют неравен- неравенству E.4), то и и -—- A — 0) щ -|- Эи2, где 8 ? @,1), удовлетворяет этому неравенству. Замечание 5.1. Дальше мы покажем, что если множе- множество 41 q ограничено, то множество X, о котором говорится в тео- теореме 5.2, не пусто (это очевидно в случае, когда форма л симмет- симметричная). !) Это множество может быть и пустым.
48 Гл. I. Минимизация функционалов 5.2. Теорема об аппроксимации Рассмотрим множество X, о котором шла речь в теореме 5.2, и предположим, что оно не пусто. Пусть Ъ (и, v) — билинейная непрерывная форма на 11, ) не обязательно симметричная, но коэрцитивпая, > E.5) т.е. b(v, у)>р || w |р Vw6^, P>0; J М — линейная непрерывная форма на 11. E.6) По теореме 2.1 существует, и притом единственный, элемент Щ 6 X, для которого ' Ъ (щ, v ~ цо)>Ж (v — и0) Vv?X. E.7) Пример 5.1. Пусть b (и, v) = (и, v)% и М(v) = (g, v)n. Тогда (см. пример 1.1) и0 — проекция элемента g на X. E-8) Теперь паша цель состоит в описании эффективного способа нахождения и0 (множество X не предполагается известным!). Основпая идея этого способа заключается в замене формы л (и, v) «регуляризованпой» формой ns(u, v) — п (и, v) + eb (и, v), е > 0. E.9) Согласно E.2) и E.5), ae(w,i;)>ep||i;|^. E.10) Полагая Le = L + &М E.11) и применяя теорему 2.1, устанавливаем существование единст- единственного элемента us ^'Uq, для которого ле {ие, v — иЁ)^>Ье (v — ue) \fv ? 1Сa- E.12) Для каждого е > 0 обозначим через щ решение неравенства E.12), а через и0 — решение неравенства E.7). Теорема 5.3. Пусть выполнены условия E.2) и E.5). Если Множество X решений неравенства E.3) не пусто, то Us ->- и0 в 1С при г ->¦ 0. E.13) Доказательство. 1) Положим v = и0 в E.12), v — ие И и — uq в E.3) и сложим получившиеся неравенства; тогда —я (и — и0, us — ц0) + еб (ыЕ, и0 — ws)>8ilf (u0 — ue). В силу E.2) отсюда следует b (иг, и0 — Ue)>M {щ — ие). E.14)
§ 5. Лекоэрцитивные формы 49 Пользуясь условием E.5), находим из E.14), что C || Щ |||; < С\ + С2 \\ Пг \\у] CU Сг = COUSt. Таким образом, II "е \\% < с3) с3 =- const. E.15) 2) Итак, из множества {ме} можно извлечь такую подпоследо- подпоследовательность (ее мы также обозначил! {г^е}), что иЁ —у w слабо в 41. Так как множество 41 д слабо замкнуто, то w ? У,д. Легко видеть, что функция v —>¦ л (v, v) полунепрерывна спизу в слабой тополо- топологии пространства %L. Следовательно, в E.12) можно перейти к пределу. В результате имеем л (и;, v — w)^L (v — w) Vv ? <Ub, E.16) а ото и значит, что w ^ X г). Переходя к пределу в E.14) (функция Ь (v, v) полунепрерыв- полунепрерывна снизу в слабой топологии), получаем Ъ (w, u0 — н>)>М {ио — и>). E.17) Так как w ^ X, можно положить н E.7) v — и>. Складывая полу- получающееся неравенство с E.17), имеем —Ь (w — и0, w — u0)^>0. Таким образом, w --- и0, и потому заключаем, что ns -> и0 слабо в 41. 3) Остается показать, что ме -ч- и0 сильно в 11, т. е. что Ъ (иЁ — и0, us — и0) -> 0. E.18) Согласпо E.14), Ъ (и8 — uQ, us — и о) < М(и& — м0) — Ь(н0, Щ — Wo), откуда и следует E.18). Замечание 5.2. Если множество 41 g ограничено, то Хф 0- Действительно, пусть последовательностгз {иЕ} обладает свой- свойством E.13). Так как ик 6 X и X — ограниченное множество, то выполняется неравенство E.15). Л из него в свою очередь следует, что X Ф0. Замечание 5.3. Множество X может быть непустым и в случае, когда форма rt не коэрцитивна, а множество %а не ограничено, если только L имеет специальный вид (см. Лионе и Стампаккья [1]). г) Но отсюда пе следует, что.Х ф 0; мы использовали это предположение. 4—1230
50 Гл. 1. Минимизация функционалов Замена и и с 5.4. Применяя описанную процедуру E.12) при Ъ и М тех же, что и в примере 5.1, получаем последователь- последовательность {ие}, аппроксимирующую проекцию элемента g на множе- множество X (причем знание самого этого множества не требуется). Замечание 5.5. Пусть <Ш — гильбертово пространство и сё 6 & (%! 36)\ предположим, что я (и, v) =¦ Щи, %v)se и L{v) = (h, Щде, h 6 SB- Тогда, если X Ф 0, то X = (и + Kcr%)(]<Ud, E.19) где и — некоторый элемент множества X, а Кег 98 — ядро ото- отображения %, т. е. Кег % = {v\v ?11, %v = 0}. Справедливость равенства E.19) сразу следует из того, что X — это множество, на котором функционал достигает своего минимума, и / (у -f- z) = / (у) Vz 6 Кег %. Примечания Теорема 2.1 принадлежит Стампаккья [1]; приведенное в тексте доказа- доказательство дано Лпонсом и Стампаккья [1]. Неравенства типа B.1) изучались многими авторами: (i) В эллиптическом, или стационарном, случае (когда время явно но фигурирует) эти задачи возникают в механике; их рассматривали Пра- rep и Синьоршш, а для уравнений теории упругости изучал Фиксра [1]. Некоэрцитигшый случаи рассматривали Лионе и Стампаккья [1], [2], а случаи, когда п (и, v) не является билинейной формой, исследо- исследовали Хартман и Стампаккья [1], Браудер [1], Брезис [1], Минти 11} (см. также библиографию в этих работах). (н) ^Шлюциониые неравенства (которых мы не касаемся в этой книге) в случае «параболических неравенств» изучали Лионе и Стампаккья [1], Брезис [1|, [21, а в случае «гиперболических неравенств» — Бре- Брезис и Лионе [1]. Обзор можно найти в работах Браудера [3] и Лиоп- еа [13]. 15 последующих главах мы еще много раз будем встречаться с повымн типами вариационных неравенств. В неравенстве A.27) член J[ («)-(у — и) можно заменить на л (и, и — и), где л обладает указанными в теореме 2.1 свойствами (Лионе и Стампаккья [1]) или «монотонностью но и» (Брезпс [1]). Вопросы, связанные с топологией пространств 3j (Q) и 3j' (Q), кроме книги Шварца [1], можно найти у Хорвата [1J. Разделы 3.1—3.3 содержат наложение некоторых основных фактов тео- теории пространств Соболева [1]. Доказательства этих фактом и много дополни- дополнительных результатов приведены в книге Лионса и Маджепеса [1]. Другие
Примечания 51 пространства Соболева и некоторые их свойства мы рассмотрим в следующих главах. Естественно, в наши цели ни в коей мере не входит изучать здесь много- многочисленные граничные задачи. Именно поэтому число примеров таких задач сведено к минимуму, необходимому для понимании последующих глав. Тео- Теория эллиптических граничных задач изложена, например, в книге Лиопса ц Маджспеса |1] (см. также библиографию в этой книге). Односторонние граничные задачи рассмотрены в разд. 3.5 и в следующих разделах. Как мы увидим дальше, изучение оптимального управления систе- системами, описываемыми уравнениями с частными производными, приводит к многочисленным задачам, подобным односторонним граничным задачам. Изложение и разд. 3.0 и 3.7 носит формальный характер; строго исследовали эти вопросы Брезпс и Стампаккья [i]. Задача, поставленная в разд. 3.7, воз- возникает в механике (теория упру го-пластичности); см. Линии [1], Ланшон [1], Лаптоп и Дюво [1], Тинг A]. В разд. 3.8 и 3.9 приведены примеры (наиболее простые из возможных) односторонних граничных задач для систем уравне- уравнений и для операторов порядка выше второго. Очевидно, что подобных задач бесчисленное множество: можно рассматривать односторонние граничные задачи для ква.шэллиптических операторов и т. п. Все ути вопросы мы здесь ие затрагиваем. Ситуация примера, рассмотренного в разд. 3.10, возникает в теории вязконластнчпости; см. Мосолов и Мясников [1], где проведены дальнейшие исследования. Одна задача из физики (теория фильтров), приводящая к близким воп- вопросам, изучалась Бсрковидем и Поллардом [1], [2]. Теоремы 4.1 и 4.2 принадлежат Огазо [1], указавшему также и некоторые их приложения. Теорема 5.3 получена Лионсом и Стамнаккья [1]. Описанная процедура аппроксимации применима и в случае, когда я {и, v) не обладает свойством линейности во в — см. Брезнс и Сибопи [1], Браудер [1]. Другие общие результаты (двойственность, множители Лагранжа и т. д.) приведены в гл. 3 (§ 12, 13); но этому поводу см. Моро [1], Рокафеллер [1] — [4]. Задачи аналогичного типа (отличающиеся техническими деталями) воз- возникают в теории выпуклой аппроксимации — см. Лоран [{] п указанную там библиографию. Относительно необходимых условий экстремальности в гораздо более общих ситуациях см. Дубовипкий и Милютин [1], Гамкрелидзе [1], Халкин [21, Халшш и Нейштадт [1], Нейштадт [1], Пшеничный [3], Варейя [2]. 4*
Г Л А В А & Управление системами, описываемыми уравнениями с частными производными эллиптического типа § 1. Управление в эллиптических вариационных задачах 1.1. Постановка задачи Пусть V и // — два гильбертовых пространства над R *). Обозначил! соответственно через || • |] и | • ) нормы в V я II, а через ((•,•)) и (•, •) — соответствующие скалярные произведе- произведения. В случаях, когда возможны недоразумения, будем добавлять индекс V или // (например, || • || v). Пусть V cz II, вложение V-*- II непрерывно 2), V плотно в Я. ' Отождествим пространство II с двойственным к нему простран- пространством. Обозначим через V пространство, двойственное к V. Тогда Н можно отождествить с некоторым подпространством в V: VcHaV', A.2) причем каждое пространство плотно в следующем и соответствую- соответствующие вложения непрерывны. Пусть, далее, а (и, и) — билинейная форма на V, непре- ] рывная и коэрцитивная, т. е. > A.3) a (v, v) > а || v ||2, а > 0, \fv 6 V. ) Форма а(и, v) не обязательно симметричная3). Наконец, пусть L — линейная непрерывная форма на V. В силу A.2) L{v) - (/, у), ftV, A.4) где череп (/, v) обозначено скалярное произведение элементов / 6 V'iu v ? V (оно совпадает со скалярным произведением в //, если / е И) 4). 1) Вес результаты легко перенести на комплексный случай. 2) Следовательно, существует такая константа с, что I у | < с|| у [|. 3) Если V — Н — V — конечномерное пространство, то а (и, и) = = (Аи, у), где А ~ матрица. Условие коэрцитивпости в этом случае эквпва- лептпо неравенству A -j- А * >- 2а1, где / — единичная матрица. 4) Иначе говоря, (/,v)~ значение функционала / ? Vim элементе v ? У,— Прим. перев.
§ 1. Управление в эллиптических вариационных задачах 53 Положим °Ц — V, я (u, v) = а (и, v), a в качестве L возьмем линейную форму A.4). С помощью теоремы 2.1 и замечания 2.2 гл. 1 можно доказать, что справедлива Теорема 1.1. Если выполнено условие A.3), то для задан- заданного / ? V существует единственный элемент у ? V, для которого а (У, ф) = (/, ф) V^ e F. A.5) Ниже мы объясним, почему в A.5) изменены обозначения. Уравнение A.5) допускает следующую интерпретацию: так как форма v -> а {и, v) линейна и непрерывна на V, можно напи- написать а (и, v) = (Аи, v), Аи ? V, A.6) а это определяет оператор Ad%(V; Г). A.7) Следовательно, уравнение A.5) эквивалентно уравнению Ау = /, у. 6 V. A.8) Примеры задач, решаемых с помощью теоремы 1.1, рассматри- рассматривались ужо в § 3, 4 гл. 1; еще ряд таких примеров приводится ниже п § 2. Теперь мы можем сформулировать первую задачу оптималь- оптимального управления. Пусть заданы пространство управлений — гильбертово про- пространство 41 (как в гл. 1) и отображение В ??(Ч\ V). A.9) Пусть некоторая' система (физическая, механическая и т. д.) описывается известным нам оператором А из X' (V; V ) (см. A.7)). Для каждого управления и ^41 состояние у системы определяется как решение уравнения Ау = / + Ви, у е V. Очевидно, у зависит от и; поэтому мы будем писать у (и). Тогда Ау («)=/ + Виу у (и) е V. A.10) Согласно теореме 1.1, уравнение A.10) однозначно определяет состояние у (и). Кроме того, задано наблюдение z (и) = Су (и), A.11) где С ? X (V; 3&), SS — некоторое гильбертово пространство.
54 Гл. 2. Управление эллиптическими системами Наконец, имеется положительно определенный эрмитов опе- оператор (Nu,u)v>y\\u\g, v>o, v«e^. J AЛ2) Каждому управлению ц ff соответствует значение функции стоимости J (и) = || Су (и) — z,A |||g, + (Nu, u)%, A.13) где~2д — данный элемент пространства 38 • Пусть множество °Ид выпукло и замкнуто в Ш. A.14) Задача оптимального управления состоит в том, чтобы отыскать inf J {v). A.15) Замечание 1.1. Мы будем также рассматривать случай N = 0. 1.2. Предварительные замечания Согласно A.Ю), и -> у (и) есть аффинное отображение °Ц -*¦ V. Перепишем / (и) в виде / (и) = || С (у (и) - у @)) + Су @) - гд Hip + (ЛГ«, и)ж. Если'положить я (и, и) - (С (у (и) - у @)) , С (? И - г/ @)))да + (ЛГ«, %, A.16) L (v) = (гд - Cj/ @)), С (г/ (v) - у @)))да , A.17) то ^ A.18) Здесь~п (и, v) — билинейная непрерывная форма на °11. Очевидно, что \\]С (у (v) — у @)) || Ъе > 0, и потому в силу A.12) n{v, y)>v|| у|||; V^G^- A.19 Таким образом, условия, позволяющие применить теорему 1.1 гл. 1, выполняются. Следовательно, справедлива Т е о р е м"а 1.2. Пусть выполнены условия A.3) и A.12), а состояние системы определяется как решение уравнения A.10). Тогда существует единственный элемент u^Ug, для которого J{u)= inf J(v). A.20)
§ 1. Управление в эллиптических вариационных задачах 55 Определение 1.1. Элемент и (z°llд, удовлетворяющий условию A.20). называется оптимальным управлением. Случай N — 0. Если N = 0, то, вообще говоря, из A:16) вытекает только, что х) я (v, »)>0. A.21) Итак, можно применить теорему 5.2 и замечапие 5.2 гл. 1 и дока- доказать, что справедлива Теорема 1.3. Пусть выполнено условие A.3) и N — 0. .?Ъш множество Шд ограничено, то существует такое непустое под- подмножество X cz'Ug, что J(u)= inf J(v) \fueX; A.22) vVUd при этом X замкнуто и выпукло. Определение 1.2. Совокупность всех и ? X называется множеством оптимальных управлений. Замечание 1.2. Теорема 5.3 гл. 1 дает способ аппрокси- аппроксимации лишь одного элемента и0 6 X (например, проекции эле- элемента g ?Ш на X). Замечапие 1.3. Все сказанное выше есть всего лишь непосредственное приложение результатов гл. 1. Единственное отличие от гл. 1 состоит только в том, что там / (v) задается непо- непосредственно как функционал от о, а здесь определяется с помощью двух операторов: (]) оператора и -> у (и) перехода от управления к состоянию (этим и объясняется изменение обозначений в A.5)); ¦ (И) оператора у (и) -> Су (и) перехода от состояния к наблю- наблюдению. План дальнейшего исследования. Теперь нам предстоит решить следующие задачи: (i) найти соотношения, определяющие оптимальное управле- управление и (случай теоремы 1.2) или множество оптимальных управ- управлений (случай теоремы 1.3); (ii) исследовать эти соотношения, получив из них максимум информации об оптимальном управлении (или о множестве X). Разумеется, более трудную — и интересную — задачу (ii) можно решить лишь в некоторых копкретных случаях. Может оказаться, что выражение \\С (у (v) — у @)) \\ffg коэрцитивно.
об Гл. 2. Управление эллиптическими системами 1.3. Совокупность соотношений, характеризующих оптимальное управление Если и — оптималыюе управление, то J'(и) .(v — и) > 0 Vv?-fld; A.23) верно и обратное (теорема 1.3 гл. 1). Так как А — изоморфизм пространства V на У (см. A.7) и теорему 1.1), то равенство A.10) .можно записать в виде у (и) = A~1{f + Bu), откуда у'{и)-ty — Л~х#ф, а значит, и у' (и) -(и — и) = А~ХВ (v — и) ¦-= у (v) — у (и). Таким образодМ, неравенство A.23) эквивалентно (после сокраще- сокращения на 2) неравенству {Су {и) - 2„, С (у {v) - у (и)))да + (Nu, v - и) % > 0 Vy ? Ua. A.24) Пусть Ш' — пространство, двойственное J) к S6 и Л — Л^—канонический изо.чорфизм из <^ на Ш' 2). A.25) Тогда если С*^Х{<Ш'\ V) — оператор, соиряженпый к С, то (С*ЛСя1), ф) - (ЛСИр, Сер) --= (Сф, Cy)^, Ф, яр ? F, так что неравенство A.24) можно переписать в виде Преобразуем теперь неравенство A.26) с помощью сопряжен- сопряженного состояния. Пусть Л*6 ^(^; F') — оператор, сопряженный к Л; он свя- связан с билинейной формой (Л*ср, я|>) =-- (ф, Лф) -= а (ф, ф), ф, if e V, и представляет собой изоморфизм пространства F па F'. Для управления v ?Ш сопряженное состояние р (и) 6 У определяется уравнением Л*р (и) ^ С*Л {Су (о) — гд). A.27) ') Можно, конечно, отождестпить цростраистна &S' и &6, но в случае, когда &е с: V, это приводит к дополнительным трудностям, так как мы уже отождествили Н с двойственным к нему пространством. -) То есть отображение Л: &€ ->- 5№', при котором каждому элементу h ? &6 ставится в соответствие элемент Ah ¦- (h, •) да ё &6'• Иначе говоря, (Ah, g) — (h, §)да yh, g g &6, где (ЛЛ, g) — значение функционала Л/г на элементе g.~ Прим. перев.
§ 1. Управление в эллиптических вариационных задачах 57 Учитывая равенства A.27) и A.10), получае.м (А*р(и), y(v) - у (и)) - (С* А {Су (и) - 2д), у (v) - у (и)) = = (р (и), Ay (v) - Ау (и)) - (р (и), В (v - и)) = ¦¦= E*р (м), у — и)у, где В* (z? {V; 41') — оператор, сопряженный к В, а 41' — про- пространство, двойственное к 41. Пусть \гц — канонический изоморфизм из 41 на 41'¦ A.28) Очевидно, (г|;, В v) = {B% v) = {AgB% v)v, v 6 U, ф €,F, так что неравенство A.26) эквивалентно неравенству . A%B*p(u)-\-Nu,v — u)v>O4v?4lo, A-29) или (В*р (и) + AnNu, v — и) > 0 УиеШо1) A.30) (скобки здесь обозначают скалярное произведение элементов, принадлежащих соответственно 11' и 41). Полученные результаты можно сформулировать в виде сле- следующей теоремы. Т е о р о м а \Л. Пусть выполнено условие A.3) и функция стоимости задана формулой A.13). Для того чтобы элемент и ?41д был оптимальным управлением, необходимо и достаточно, чтобы удовлетворялись следующие соотношения: Ау («)=/+ Ви, A.10) А*р (и) = С*А (Су (и) - гд), A.27) (А%В*р(и) -f Nu, v — и)% >0 Vv?<U0. A.29) Если оператор N удовлетворяет условию A.12), то оптимальное управление единственно (т. е. соотношениям A.10), A.27), A.29) удовлетворяет единственный элемент и?41д). Если N = 0, а множество 41 g ограничено, то соотношениям A.10), A.27), A.29) удовлетворяет по крайней мере один элемент х) Одновременно неявно показано, что V2/' (и) — В*р (и) -L Л« Nu
58 Гл. 2. Управление эллиптическими системами и ? ЯСq. Множество этих элементов соответствует совокупности оптимальных управлений, образующих выпуклое замкнутое под- множество X с 11, q. Замечание 1.4. Неравенство A.29) эквивалентно утверж- утверждению (Ау*В*р (и) + Nu, u)v = inl (А^В*р (и) + Nu, v)v. A.31) Задача теперь состоит в изучении системы A.10), A.27), A.29). Этим мы и займемся в следующих разделах. Замечание 1.5. Пусть °Ид —¦ выпуклый замкнутый конус с вершиной в начале координат. Тогда (см. замечание 1.G гл. 1) неравенство A.29) эквивалентно соотношениям 1В*р (и) + Nu, vU > 0 \fv ? Шб, I § 2. Непосредственные приложения 2.1. Система, описываемая задачей Дирихле; распределенное управление1) Начнем с наиболее простого (по не тривиального) случая. Пусть (ср. § 3 гл. 1) V - Щ (Q), II - I? (Q) 2); B.1) 'а(ф, 40- S Sa^l^lfdx-H'^^dx, B.2) г", j=.-l S3 "^ СЖ/ q где (ср. § 3, 4 гл. 1) аи, a^L°°{Q); ) &i+ ••• + ?»), ! B.3) . з1 j,ji сх>0, V?gR" почти всюду в Q; а0^(х)^>-а^>0 почти всюду в Q. Определим эллиптический оператор Л второго порядка: ' v д ( д \ г, j-=l (tej- \ OXj I Лф1— Z., г" i "-«у"" т I "т "-от- B 4) J) В оригинале controle distribno.— Прим. перев. 2) В этом случае V ¦--- Н (Q).
§ 2. Непосредственные приложения 59 Положим (Ц _ Jf __ ?2 (P)f  тогда Л^ — тождественный изоморфизм. J \ • ) В этом случае управление называют распределенным (в Q) г). Далее, пусть В — тождественное отображение; B.6) С — вложение пространства V в И (SS — II, ,п 7ч так что Л — тождественный изоморфизм). ^ ' ' Замечание 2.1. Условие B.7) означает, что состояние у (и) мы наблюдаем на всей области Q, а это практически нереаль- нереально. Но дальше мы рассмотрим случай — математически даже более интересный,— когда состояние у (и) наблюдается только на части области Q или па ее границе Г. Итак, состояние у (и) определяется как решение задачи Ди- Дирихле: Ау (и) — / -|- м, \ Г9 S4 у (и) 6 НЦп) (следовательно, у (и) = 0 на Г). / к ' Требуется найти inf J(v)= inf j I [y(v) — Zj$dx-\- (Nv, v)}2), B.9) где <Uо — выпуклое замкнутое подмножество в 1L. Замечание 2.2. Решение у (и) задачи B.8) представляет собой функцию, определенную на Q: х-+у(х\ и). Следовательно, функционал / (v) в B.9) можно записать так: J(v)=l[y (x; v) - гд (x)f dx + J {Nv (x)) v(x) dx. a n R силу B.3) можно применить теорему 1.4, и система A.10), A.27), A.29) примет вид Ay{u)=j + u в Q, у(и)=0 на Г; ) (и) = у (и) — гл в Q, p(w) = 0 на Г; \ B.10) [р(и) -\-Nu](v—u)dx^>-0 Vv?<Ud. ') Б протпвоноложлость случаю, когда ynpajwojino выражается фупк- цирй, ладанной на границе или на части границы (тогда управление назы- называется граничным). Как мы увидим далее, случай граничного управления гораздо пнтереспее как с практической, так и с теоретической точек зрения. 2) (Nv, v) - (Nv, v)^, так как <U = Н.
60 Гл. 2. Управление эллиптическими системами Пример 2.1. Пусть ILg = °И (случай отсутствия ограниче- ограничений на управление). Тогда последнее из соотношений B.10) при- примет вид р (и) -f Nu ^ 0. Итак, можно исключить и (именно, и -- — N^p), так что опти- оптимальное управление находится по следующему правилу: (i) решить граничную задачу для системы уравнений с част- частными производными J) Ay + N~*p=f в Q, у'=0 на Г; 1 . . А*р-у = -гД в Q, р = 0 па Г;/ К* } (И) найти оптимальное управление и = — N~lp. B.12) Замечание 2.3. Регулярность оптимального управле- управления. Пусть в выражении B.4) для оператора Л коэффициенты регулярны в Q. Тогда решение граничной задачи Л*р = у — гд, р | г = 0, как это следует из теорем о регулярности решения эллиптических задач (см., напри.мер, Лионе и Маджснес [1, гл. 2J), таково, что р е и2 (Q). B.13) Легко убедиться, что если оператор N~l отображает простран- пространство Н2 (Q) в себя, то оптимальное управление и принадлежит Н2 (Q) (тогда как мы его искали в пространстве I? (Q)). Этот результат о регулярности оптимального управления, как мы увидим, не является общим. Пример 2.2. Пусть 11a = {v I v > 0 почти всюду в Q}. B.14) Согласно замечанию 1.5, тогда почти всюду в Я, р (и) + 7Vw>0 почти всюду в Q, I B.15) и (р (и) + Nu) = 0 почти всюду J в Я,-» в Q, I в Q. J 2) Отметим, что мы употребляем термин «система» в двух разных смыс- смыслах: а) исследуемая физическая система (состояние у (и) системы) и б) систе- система уравнений с частными производными.
§ 2. Непосредственные приложения 61 Можно исключить и и рассмотреть следующую задачу: B.16) Ay-f>0, p + N(Ay~f)>Q в Q, (Ay-f)[p +.N(Ay-f)] -= 0 в Q, Л*р — у = — zH в Q, 2/1 г -О, р\г =- 0. Тогда и ^ Ay — f. Из B.15) ясно, что или и --- 0, или р -j- #и — 0, или выпол- выполняются оба эти равенства одновременно. В последнем случае Ау ~- / ы У = 2Д, откуда Лгд — /. Таким образом, если нредпо- - ложить, что ЛгД Ф / почти всюду в Q (очевидно, это общий случай), то имеются только две возможности: (i) и = 0 и р > 0 в Qo; (ii) и > 0 и р + Nu =- 0 в Q4 (где Qo и Qi определены с точностью до множества меры нуль). Для дальнейшего упрощения предположим, что Л^ = v/, v >0. B.17) Тогда из (i) и (ii) следует, что 1 и = inj(O, p) почти всюду в Q. B.18) V Отсюда получаем следующий вывод: оптимальное управление и находится из равенства B.18), где р определяется как решение {нелинейной) граничной задачи 1 1 Ay + — ini@, p)=f, J/|r = 0; g^ A*p — y = — zR, p |r = 0, J причем и 6 Щ(&) (регулярность оптимального управления). B.20) Пример 2.3. Пусть °^д = iv I ^o [x) ^ v (x) ^gj (x) почти всюду в Q; 1о и ?i — данные функции из IJ° (Q)}. B.21) Легко видеть, что °llg — замкнутое ограниченное выпуклое подмножество пространства % = Ьг (Q). B.22)
62 Гл. 2. Управление эллиптическими системами Из третьего соотношения в B.10) (относительно общего слу- случая см. разд. 2.5) легко получить локальные условия [р (х; и) + Nu (x)] (I-и (х)) > 0 1 VE 6 Но {х), Si {х)\ почти всюду в п. J \ -1 ) Для простоты предположим еще, что справедливо равен- равенство B.17). Тогда из B.23) находим, что (i) р (х; и) -|- vu (х) > 0 =^> и (х) — Ео (ж), (ii) р (х; и) + vu (х) < 0 =^> и (х) -. %t (x), (iii) р (х; и) -\- vu (х) — 0 =Ф и (х) — —v~3p (x; и). В ы в о д. Вообще положим для g ? /TJ (Q) Г 1 1 — — g (х), если go (•*)< — — ? (ж) ^ ?i (ж), Ф(Ео, ii, v)g = { go, если -lg(х) < |0(х), B.24) ! gj, если — — Тогда оптимальное управление « получается из решения нелиней- нелинейной задачи и равно и = Ф (go. ii, v) p. B.26) В этом случае (нелинейный) оператор Ф отображает прострап- ство Hl(Q) в L2(Q) и (вообще говоря) невозможно сделать ника- никакого заключения относительно регулярности оптимального управ- управления. Заметим только, что если |г- ? L°° (Q) fl И1 (Щ, ? = 0, 1, то Ф(Е0, ?i, v)p eH^Q). 2.2. Случай отсутствия ограничений на управление Ситуация, рассмотренная в примере 2.1, носит общий харак- характер: если Ч1д ••¦¦- 6И, то соотношение A.29) принимает вид ЛуВ*р (и) -'-г N (и) ^--0 и, выра/кая отсюда и, получаем, следующее правило определения оптимальпого управления:
§ 2. Непосредственные приложения 63 (i) решить граничную задачу (для системы операторных урав- уравнений) (ii) найти оптимальное управление и ... _ N-ЧЗ*р. B.28) (Решение вопроса о регулярности и — см. замечание 2.3 — зави- зависит от конкретной ситуации.) 2.3. Система, описываемая задачей Неймана; распределенное управление Пусть (ср. § 3 гл. 1) V -- Н1 (Q), И -- L2 (Q), B.29) а форма а (ср, г|)) задана соотношениями B.2), B.3). Необходимо иметь в виду следующее: если Q — открытое огра- ограниченное .множество в IIй, то пространство 3) (Q) не плотно в V (замыкание пространства 3> (Q) в II1 (Q) есть собственное подпро- подпространство III (^)i и потому, поскольку пространство Н — L'z (Q) уже было отождествлено со своим двойственным, пространство V нельзя отождествить ни с каким подпространством в 3)' (Q)). Приведем типичные примеры линейных непрерывных форм на V х): /,4 (ф) = $ mp dx, h^ L2 (Q), B.30) a ^№ = kt«I\ gen-U2(Y), B.31) г и, разумеется, их линейные комбинации. Дадим вариационную интерпретацию изоморфизма А про- пространства V на F': для линейной непрерывной на V формы / существует единственный элемент у ? V, для которого а) а (У, i|0 = / (Ю V-ф ? У. B.32) Предположид1 сначала, что (как и в разд. 2.1) °U = Н = L2 (Q), -В — тождественное отображение; С — вложение пространства У в 7/ (т. е. SB --= Я). Возьмем в качестве элемента / ? У в уравнении A.10) функ- функционал Ас + J ^ ЙГ, А 6 // (Й), g ?///2 (Г). B.33) а ]) Более полно этот вопрос пяложон в книге Лионса и Маджонсса \\, гл- 11. Для наших целен вполне достаточно того, что упоминается здесь. ') / D-) =~ (/> 4') — значение функционала / на элементе гр.
04 Гл. 2. Управление эллиптическими системами Тогда состояние у (и) определяется как решение уравнения а (у (и), я|5) = / fa) + J ш|; dx V-фе//1 (Й); B.34) это уравнение можно интерпретировать (см. § 3 гл. 1) как задачу Неймана: „а Г. 1 <25> 0 v Л Функция стоимости ./ (у) задается так же, как и в B.9). Сопряженное состояпие определяется как решение сопряжен- сопряженной задачи Неймана: A*p(u) = y{u) — z,A в О., ) | B.36) Оптимальное управление и ^41$ характеризуется соотноше- соотношениями B.35), B.36) и ](p(u) + Nu)(v — u)dx^0 ¦ 4v?<it.g B.37) а Легко привести примеры, аналогичные рассмотренным в разд.2.1; для этого достаточно заменить там условие Дирихле условиями Неймана. 2.4. Система, описываемая задачей Неймана; граничное управление :) Пусть U = //-I/a (Г); B.38) оператор -В каждому элементу и ? 41 ставит в соответствие эле- элемент Ви ? V', определяемый равенством (Ви, t) = J иЦ dF; B.39) г С — вложение пространства V в Н 2); форма / задана, как в разд. 2.3. Тогда состояние у (и) определяется как решение уравнения а (у (и), Ч>) = / (ф) + J иф ЙГ Vi|> € Я1 (Q); B.40) г х) В оригинале controle frontiere.— Прим. перее. 2) Иначе говоря, управление граничное, по наблюдение по-прежнему «распределено в Q». Дальше мы рассмотрим случай, когда наблюдение также граничное.
§ 2. Непосредственные приложения 65 ото уравнение можно интерпретировать как задачу Неймана = П в Q,} = * + » Ha Г. dvA Функция стоимости У (v) задается так же, как и в B.9). Сопряженное состояние определяется как решение зада- задачи B.36). Оптимальное управление и ? Шд характеризуется соотноше- соотношениями B.41), B.36) и (А^В*р(и) + Nu, v — u)#>0 Vv^Ug. B.42) Для интерпретации неравенства B.42) 1) нужно найти явное выражение оператора А$В*. Воспользуемся оператором Лапла- Лапласа — Бельтрами —Аг на Г, для которого можно определить сте- степень (—Аг)а. гДе а ? С. Зададим в пространстве 41 скалярное произведение 2): (и, v)u=\ (- Ar)'1/4u-(~ АГГ1А vdx=z \ (- AT)~i/2uvdx г г (можно показать, что такое определение законно, см. Лионе и Мадженес [1, гл. 1 и 2]). В этом случае Лда'ЯЧ = (- АгI/2 (ф |г), - tp ? Я1 (QK). B.43) В самом деле, г = {( - АгI/2 (гр 1г) (~ Дг)~1/2«^Г -- ((- ДгI/2 (ф |г), и)^, откуда и следует B.43). Тогда неравенство B.42) принимает вид ((-Дг)»/2 (р (и) |г) 4- ,Vu, v - u)^ > 0 V^ € ^*, B.44) или J 1/2VvtUg. B.45) J г Пример 2.4. Пусть <&в --¦ {у | у>0 па Г, у 6 //-1/2 (Г)}. B.46) J) Чтение этого материала для понимания дальнейшего не обязательно. 2) Скалярное произведение надо ввести с самого начала, ибо в выраже- выражение для функции стоимости входит {Nu, и)сц. 3) Иначе говоря, ф|г — элемепт ггростраггетва //1/2 (Г), подвергающийся действию оператора (_ЛгI/2. 5 — 1230
66 Гл. 2. Управление эллиптическими системами Тогда оптимальное управление и шениями dvA в Q, характеризуется соотно- соотноА*р(и) = и) на Г; = 0 на Г; на Г, B.47) и [р (и) + (— Дг)~1/2 Ни] = 0 на Г. Как известно, такая граничная задача (типа односторонней граничной задачи; см. гл. 1) допускает единственное решение. Замечапие 2.4. Некоторая громоздкость примера 2.4 объясняется тем, что мы взяли 41 ¦= П~^2 (Г) (это приводит к дробным степеням оператора —Аг). Задача упрощается в случае (более реальном), когда U = L2 (Г). B.48) Неравенство B.44) тогда принимает вид l(p(u)-\-Nu){v — u)dT^}Q Vv^Ug, B.49) г а остальные соотношения остаются без изменения. Пример 2.5. Пусть Uо = {v I v>0 па Г, veL2(V)}. B.50) Тогда оптимальное управление и ?41д характеризуется соотно- соотношениями ду{и) Ау(и)=П в Q, dv> на u>0, др(и) = 0 па Г; B.51) dvA p(u)-\-Nu^0 на Г, = 0 па Г. Таким образом, в каждой точке границы Г выполняется одна из следующих трех возможностей: 1) и -- 0, р = 0; 2) и >¦ 0, р -•- Nu = 0; 3) и = 0, р > 0. Было бы интересно- изучить свой- свойства трех участков границы, соответствующих каждой из возмож- возможностей. Такая задача, насколько пам известно, еще не рассматри- рассматривалась.
§ 2. Непосредственные приложения 67 ¦ 2.5. Локальные и глобальные ограничения на управление Пусть S — открытое множество в пространстве Rm или доста- достаточно гладкое многообразие в пространстве Rm *), снабженное мерой dS; пусть, кроме того, Е — гильбертово пространство. Обозначим через Ьг (S; Е) пространство (классов) функций s-+ f (s), отображающих множество S в Е, измеримых и таких, что JII/(s)IIe dS <C оо. Такое пространство, снабженное скаляр- s ным произведением $(/(*), g(s))BdS, S становится гильбертовым пространством (см. Бурбаки [1]). Положим 41 = L2 (S; Е). B.52) Будем говорить, что выпуклое замкнутое подмпожество <Ua с: сг Щ, задается локальными ограничениями, если <Ud = {v\v?<U, v (s) ?K для почти всех s?S}, B.53) где К — выпуклое замкнутое подмножество в Е. Если же под- подмножество <Ud задается как-то ипаче, например, !<Ж} B.54) s или где К — выпуклое замкпутое подмножество в Е, и-т. д., то будем говорить, что оно задается глобальными ограничениями. Докажем, что справедлива Теорема 2.1. Пусть множество <Ud задано локальными ограничениями (см. B.53)). Если обозначить + Nu = Z, B.56) то неравенство A.29) эквивалентно неравенству A(8), к-и (8))в>0 -VA 6 К B.57) всюду на множестве S, кроме, быть может, подмножества меры нуль. х) Эти предположения, Которые можно и ослабить, вполне достаточны для наших целей. ; 5 *
68 Гл. 2. Управление эллиптическими системами Замечание 2.5. Соотношение B.57), разумеется, можно переписать в виде (?(*). u(*))B=inf (?(*), k)E. B.58) Доказательство теоремы 2.1. B.57) =ф A.29). Если v^ilg, то у (s) ? if (почти всюду). Следовательно, соглас- согласно B.57), почти всюду (?(*), » (.9) - и (s))E > 0. Интегрируя по S, получаем неравенство A.29). A.29) =Ф B.57). Пусть ?0 — совокупность точек множества S, являющихся точками Лебега для двух функций (векторной и скалярной): s->?(s) и s->- (? (s), u (s))E. Тогда для фиксированной точгки s0 ? So существует такая после- последовательность окрестностей {Oj} (с диаметрами, стремящимися к нулю), что -— J (Щ, u(s))EdS -+ &(s0), u(so))E, 10,1(9,. /-« где через |0у| обозначена мера множества ©у. Известно, что дополнение к So в множестве S имеет меру нуль. Следовательно, для доказательства утверждения теоремы доста- достаточно показать, что неравенство B.57) выполняется на множе- множестве So. Пусть к — некоторый фиксированный элемент множества К, s0 — фиксированная точка из So, а окрестности О] точки s0 удовлетворяют условиям B.59). Положим vj = X/* + A ~ Ху) и, B-60) где X/ — характеристическая функция множества Oj. В силу выпуклости множества ILg (см. B.53)) функция v}-, определенная равенством B.60), принадлежит множеству Шд, так что можно в A.29) взять и = vj. Тогда или, после деления на \ Oj |, -i- $ ¦ (? (*), к - и (s))E dS-^0. B.61)
§ 2. Непосредственные приложения 09 Используя B.59), переходим к пределу в B.61); в результате получим неравенство (? (s0), к - u_(so))E > 0. Так как оно верно для любого s0 ? So, то теорема доказана. Замечание 2.6. В примере 2.3 мы применили частный случай доказанной только что теоремы. 2.6. Система, описываемая системой дифференциальных уравнений х) Рассмотрим один очень простой случай системы дифферен- дифференциальных уравнений того же вида, что и в разд. 3.8 гл. 1. Пусть состояние системы у (и) — {yi (и), у2 (и)} определяется как решение задачи 2) — Дг/i (и) + г/i (и) — г/2 (") = /i + "i> 1 -Ay2(u)-\-y2(u) + yl(u) = f2 + u2, } B.62) г/i (и) = 0 на Г, у2(и) = 0 на Г, J где и = {u,, u2} e U = />2 (О) X La (Q). B.63) Употребляя те же обозначения, что и при изложении общей теории, положил: V = Н\ (Q) X ^ (Q), II = L2(Q) X L2 (Q), ^ = Я; {—АФ1 + Ф1 —ф2, — АФ2 + Ф2 + Ф1}; В — тождественное отображение; С — вложение пространства V в Н. Далее, функция стоимости пусть равна J iv)=\ [(Vi iv) — 21дJ + {Уг (v) — 22ДJ] dx + (Nv, v)^, B.64) Q где 2Д — {г1д, г2д} — данный элемент пространства Н. Сопряженное состояние определяется из уравнения А*р (и) = — У {и) — 2Д, т. е. как решение задачи — Api (и)' + Pi {и) + р2 (и) = yi (и) — z)H, ^ — Ар2 (и) + р2 (и) — р,^ (и) = у2 (и) — г2д, [ B.65) Pi (и) = 0 па Г, р2 (и) = 0 на Г. *) Как уже отмечалось, слово «система» употребляется в двух разных смыслах. 2) Мы ограничиваемся здесь случаем распределенного управления.
70 Гл. 2. Управление эллиптическими системами Тогда оптимальное управление и в^в характеризуется соот- соотношениями B.62), B.65) и 1 i (и) (vt — щ) -f Рг (и) (v2 — u2)] dx + (Nu, v — u)% B.66) Пример 2.6. Пусть N — диагональный оператор, т. е. N {uu u2} = {NiUi, N2u2}, и пусть U a = {и | щ 6 L2 (й), и2 > 0 почти всюду в Q} B.67) (следовательно, нет ограничений на компоненту ui управления). Тогда неравенство B.66) эквивалентно соотношениям Pl (и) + NlUl = 0, ^ рг (и) + iV2M2>0, u2>0, \ B.68) щ [р2 (и) + Nzu2] = 0. J Таким образом, если выполнено условие B.67), то оптимальное управление и получается из решения задачи - Дг/i + ft — 2/2 + iVT'pi = /ь — Аг/2 + г/2 + 2/1 — /г > 0, B.69) P2 + ^2 (— Д2/2 + 2/2 + У1 — /2) > О, (— Aj/2 + 2/2 + 2/i — /2) |>2 + N2 (— A2/2 п г I 2/i = 2/2 = Pi ===P2^ и IIa * 1 J а именно ui = — jY^pi, u2 = — Ay2 + j/2 + 2/1 — /2- B.70) Замечание 2.7. Ясно, что возможно бесконечное число вариантов, если изменять: —граничные условия; —характер управления (распределенное, граничное); —характер наблюдения; —исходную систему дифференциальных уравнений. 2.7. Система, описываемая дифференциальным оператором четвертого порядка1) Рассмотрим дифференциальный оператор 4-го порядка Ац> = = Д (а4Дф) + аоф, введенный нами в разд. 3.9 гл. 1. Положим V = {ф | ф € L2 (Q), ДФ ? L* (Й)}; Н - L2 (Й). ') Чтение этого раздела для понимания дальнейшего не обязательно.
§ 2. Непосредственные приложения 71 Как и в разд. 2.3, пространство V нельзя отождествить ни с каким пространством распределений на Q. Положим (см. C.69) гл. 1) а (ф, ijj) = $ «! Аф Аг|; dx + $ «оФ'Ф *&> B-71) где а0, й1 6 ^°°(^)> «о (ж)>а > 0, ai (ж)>а почти всюду па Q. Возьмем Г) х нт (Г), B.72) и пусть состояние у (и) определяется как решение уравнения ll^l . B.73) Это уравнение заведомо имеет единственное решепие; состоя- состояние у (и) удовлетворяет эквивалентной системе Ay(u)=f в Q, ai&y(u)=ul на Г, . . д , д , Чч п ' ' — (а</ли (и)) = и? па 1. an Если считать С по-прежнему вложением пространства V в //, то сопряженное состояние р (и) определяется как решение урав- уравнения а(р(и), i|;)= l(y(u) — z^tydz \f^EV, B.75) а или как решепие задачи Ap{u) = y(u)-zR в О, ах Ар (и) = 0 на Г, )=0 на Г. Напомним, что соотношение A.29) получено эквивалентным преобразованием неравенства A.23) с использованием сопряжен- сопряженного состояния. Если начальных условий много, то проще непос- непосредственно преобразовывать A.23) (т. е. вычислить неявно Д^5*), а не искать А%В* специально. В рассматриваемом случае неравенство A.23) имеет вид ^[y(u) — z^(y(v) — y(u))dx + (Nu, v — u)%^0 Vv?<Ud. B.77) Умножая первое из уравнений B.76) на у (v) — у (и), применяя формулу Грипа и принимая во внимание граничные условия из
72 Гл. 2. Управление эллиптическими системами B.74), получаем \ [У (") — гя][у(и) — у (и)]dx = а = $d?[aiAy(v)-aiAy(u)]dr- ? = l? (vi — ид <ЯГ - \р (v2 - u2) dF. Г ОП Г Следовательно, неравенство B.77) эквивалентно неравенству $¦/(vt — Mj) йГ — Jp (y2 — Mz)dP + (TVm, у — u)u >0 Чо?Шд. ' B.78) Пусть N -- {Ni, N2} — диагональный оператор, и пусть ска- скалярное произведение в 41 задано формулой (см. разд. 2.4) (u, v)v = J (- ЛгK72^! dV + J (- ArI/2u2v2dl\ B.79) г J J г г Тогда неравенство B.78) можно переписать в виде д. B.80) г В ы в о д: оптимальное управление и^ 41 о определяется как решение задачи B.74), B.76), удовлетворяющее условию B.80). 2.8. План дальнейшего исследования Рассмотрим подробнее следующие случаи: (i) случай (еще не рассматривавшийся), когда наблюдение граничное; (и) другие случаи, когда управление граничное (мы уже разо- разобрали два таких примера (разд. 2.4, 2.8), но они пе охватывают задачу Ау (и) --- / в Q, у (и) — и на Г, требующую, как мы увидим, дополнительного исследования). Прежде чем приступить к исследованию этих задач, остано- остановимся на случае, когда N = 0, а множество °llg не обязательно ограничено.
§ 3. Примеры для случая N — 0, множество 41$ произвольно 73 § 3. Примеры для случая JV = O, множество Iln произвольно 3.1. Общий случай Рассмотрим сформулированную в § 1 задачу, считая, что % = У'; В — тождественное отображение; C.1) С — вложение пространства У в У (т. е. Ш = V). C.2) Тогда Л — канонический изоморфизм из У на У'.- C.3) Пусть, далее, состояние у (и) системы определяется как реше- решение уразнения Ay(u) = f+u, у (и) 6 V, C.4) а наблюдение z (и) есть г/ (м) g У 1). Функция стоимости, если счи- считать N = 0, илюет вид (см. A.13)) -z;i\\l, C.5) где 2Д — данный элемент пространства У. Теорема 3.1. Если выполнены условия C.1) — C.5) и A.3), то существует единственный элемент и ?Шд (оптимальное управление), для которого J(u)= inf J{v). Это оптимальное управление и (i6Ug характеризуется соотноше- соотношениями C.4), А*р (и) ¦-- Л {у (и) - 2д), р (и) 6 F, C.6) (р (и), v — и) > 0 Vy 6 ^ в. C.7) (Скобки здесь обозначают скалярное произведение элементов, принадлежащих соответственно пространствам У и У.) Доказательство. Билинейная форма A.16) в рас- рассматриваемом случае принимает вид я (и, v) = (y(u)-y@), у(и)~у@))г = (Л~1и, А^и)г, откуда я (v, v) = \\A-lv\fv^c\\v\\2v. (так как А есть изоморфизм из У на У). Следовательно, общая тео- теория применима, несмотря на то что N —- 0. ') Так как V сг Л, то наблюдение у (и) в пространство V янляется част- частным случаем наблюдения в пространстве У/ (ситуация примеров § 2).
74 Гл. 2. Управление эллиптическими системами 3.2. Приложение (I) В условиях разд. 3.1 возьмем V = Н\ (Q) х), а в качестве А выберем дифферепциалышй оператор, определенный в разд. 2.1. Таким образом, состояние у (и) определяется как решение задачи Ау (и) = / + и в Q, у (и) |г = 0, C.8) и требуется найти оптимальное управление и, минимизирующее функцию стоимости 2 ^(y()!l))] C.9) Оператор Л в рассматриваемом случае равен —A-f-/2), и потому сопряженное состояние определяется как решепие задачи A*p(u)---(-A + I)(y(u)-zR), р(и)\г = 0, C.10) а неравенство C.7) принимает вид \p{u){v — u)dx^0 Vve<Ug. C.11) и Пример 3.1. Пусть Шд — 41 (случай отсутствия ограниче- ограничений на управление). Тогда из неравенства C.11) получаем р (и) = — 0, и потому у (и) ¦— 2Д. Впрочем, это и так ясно: достаточно взять и — Агж — /. Пример 3.2. Пусть Шд -- {v | у € И'1 (Q), у>0 в Q 3)}. Тогда, как мы уже видели в § 2, неравенство C.11) эквивалентно соотношениям u,>0, p (u)>0, up (и) ¦-= 0 в Q. C.12) Таким образом, оптимальное управление и получается из реше- решения задачи (типа односторонней грапичной задачи) А*р - (- А + I) У = А2д - 2д в Q, ^ Ay-f^O, p>0, (Ay-f)P = O в Q, } C.13) а именно и = у!г/ — /. х) Норма в пространство V = Л] равна 2) См. A.25). Так как по определению (—A/i, g) = {Ah, kg), то легко убедиться, что ((—A -f /) /i, g) —¦ (h, g)HJ-— Прим. перев. 3) Следовательно, и — неотрицательная мера.
§ 3. Примеры для случая N = О, множество 11$ произвольно 75 Здесь опять интересно было бы получить информацию о свой- свойствах тех частей области Q, где 1) и = 0, р — 0; 2) и > 0, р = 0; 3) и = 0, р > 0. Эта задача, по-видимому, еще не решена. 3.3. Приложение (II) Применим Теперь результаты разд. 3.1 в случае, когда V = = Я1 (Q), состояние у (и) и сопряжепное состояние р (и) опреде- определяются как решения соответствующих вариационных задач а (У (и), ф) = (/ + и, ф) V^ 6 Я1 (Q) C.14) а* (р (и), ф) = (у (и) - 2д, ф)у V^ 6 Я1 (Q) C.15) (здесь а* (ф, г|)) = а (ф, ф) Уф, г]з ? V), а оптимальное управ- управление и^Шд характеризуется соотношениями C.14), C.15) и (р(и), р—u»0 yveila- C.16) Пример 3.3. Пусть Тем самым определено замкнутое векторное подпространство про- пространства Я'2 (Г). Действительно, если Vi — фиксированный элемент простран- пространства Я~1/2 (Г), то функционал v ? V, определенный соотношением (v, \р) = I v{ty dT, имеет норму г || v \\v, — sup Но *д (Q) = {и11;6Я1 (Q), (- А + I) v = 0}, IMIv= sup • (З-18) Поскольку ч|) ->- г|) |г есть изоморфизм пространства Н\ (Q) на Я1/2 (Г), равенство C.18) определяет норму, эквивалентную II v IL/2 > откуда и следует наше утверждение. В силу C.17) неравенство C.16) эквивалентно условию р (и) = 0 на Г.
76 Гл. 2. Управление эллиптическими системами Следовательно, оптимальное управление и получается из решения задачи Ay = f, 1 о'(р, 1|;) = (у-гд,ф)у УфбЯЧО), [ C.19) Р\т = 0, J а именно и = ^- па Г. C.20) Задаче C.19) можно дать следующую формальную интерпрета- интерпретацию: г on р|г = 0, gp <9vA* Пример 3.4. Возьмем в качестве 41 д подмножество множе- множества C.17): <Ug= {v\(v, -ф) = $ 17±-фdr, У1бЯ~1/2(Г), yt>0 на Г}. C.22) г Тогда неравенство C.16) примет вид р (ы)>0 на Г, mjo (и) = 0 на Г C.23) (если отождествить м с щ). Сопряженное состояние определяется так же, как и в C.19). § 4. Граничное наблюдение1) 4.1. Система, описываемая задачей Дирихле (I) Снова рассмотрим задачу, сформулированную в разд. 2.1. Состояние у (и), таким образом, определяется как решение задачи Лу (и) =f + u в Q, у (и) |г = 0. D.1) Допустим, что коэффициенты в формуле B.4) для оператора А достаточно гладкие, так что (теорема о регулярности) у (и) в IP (Q). D.2) и, согласно § 3 гл. 1, е и1'2 (Г). m ду (и) 1огда можно определить дп J) В оригинале observation frontiere.— Прим. перев.
§ 4. Граничное наблюдение 77 Чтобы по возможности меньше пользоваться пространствами ду Hs с нецелым s, можно, в частности, считать, что а наблюдение определить равенством z(u) = . дп дч, е ь* (Г), D.3) где М — данная функция, принадлежащая пространству L°° (Г) х). Пример. Если М = 1 (соответственно, если М — харак- характеристическая функция множества Го с: Г), то равенство D.3) означает, что мы наблюдаем dyldvA на границе Г (соответственно на части Го границы). функция стоимости имеет вид dT + (Nv, v)^, D.4) dvA где 2Д — данный элемент пространства L2 (Г). Ясно, что в рассматриваемом случае применима теорема 1.2" существует единственное оптимальное управление и ^Ilg, харак- характеризующееся тем, что J'(u)-(v-u) >0 Vw€?/e, или, что то же самое, g. D.5) Полученное неравенство D.5) преобразуем сначала формаль- формально 2). Определим сопряженное состояние как решение задачи 3) А*р(и) = 0, р(и)\г=-м(мду{-У V d V dv л \ г D.6) ') Так как след у (и) |г известен (он равен нулю), то задание dyldvA па Г равносильно заданию ду/дп на Г. Если М ? L°° (Г), то М -^— ч( € I? (Г). 2) Законность этих преобразований будет обоснована пиже. 3) Это как раз и нужно обосновать!
78 Гл. 2. Управление эллиптическими системами Умножая первое из соотношений D.6) на у (v) — у (и) и приме- применяя формулу Грина, получаем Так как у |г = 0, то, учитывая второе из соотношений D.6), приходим к равенству Таким образом, неравенство D.5) эквивалентно неравенству \ [р(u) + Nu](v — u)dx^0 VvеЧ10. D.8) Остается, следовательно, решить задачу D.6). Отметим, что, вообще говоря, если задача D.6) имеет решение, то оно не принад- принадлежит пространству П\ (Q) (так как иначе след р (и) |г принадле- принадлежал бы Я1'2 (Г), что в общем случае певерно). Решение задачи тина D.6) х) требует некоторых дополнитель- дополнительных исследований, которые мы сейчас и проведем 2). 4.2. Неоднородная задача Дирихле Пусть, как и в разд. 4.1, А —эллиптический оператор второго порядка с коэффициентами, достаточно гладкими в области Q. Пусть / (соответственно g) — функция или распределение (предположения будут уточнены ниже) на Q (соответственно па Г). Требуется найти элемент у (из некоторого класса, который еще надо определить), удовлетворяющий условиям Ay = f в Q, у |г = g. D.9) Пусть г|; — некоторая «пробная» функция, определенная на множестве Q (свойства этой функции предстоит еще описать). Умножая первое из соотношений D.9) на тф и применяя формулу ') То есть неоднородной гадачи Дирихле по терминологии Лиопса и Мад- женсса [1]. 2) Речь идот о применении к весьма частным случаям методов, развитых в книге Лиопса и Мадженеса [1].
§ 4. Граничное наблюдение 79 Грина, получаем \ (Ay)ipdx— ^/г|;dx = Q Q ^^\y{A^)dx. D.10) ^\^+]y^+\y{A^) Г OVA Г OVA* Q Принимая во внимание второе из соотношений D.9), приходим к равенству ^^dl\ D.11) q r avA* r Естественно подчинить функцию 1|э условию гИГ = О. D.12) Тогда равенство D.11) примет вид ^dx-lg-p-dl\ D.13) г c/vA* Обратно, если функция у удовлетворяет соотношению D.13) для «любой» функции гр, подчиненной условию D.12), то выполняются равенства D.9). Таким образом, идея состоит в том, чтобы использовать равен- равенство D.13) для определения функции у, которую мы назовем сла- слабым решением задачи D.9). Для реализации этой идеи будем исходить из следующего результата, которым мы уже пользовались: если ср — данная функция пространства L2 (Q), то решение задачи Л*ф - Ф в Й, г|)|г = 0, D.14) принадлежит пространству IP (Q) (см., например, Лионе и Мад- /кенес [1, гл. 2]). Иначе говоря, Л* - изоморфизм из Н* (Q) Л Щ (&) на U (Q). D.15) С помощью транспонирования заключаем: если т|з —>¦ L (яр) — непрерывная линейная форма на i/2 (Q) П Н\ (?*)> то существует единственный элемент y?L2(Q), для которого | у (Л *г|;) dx = L (ф) V^5 в Н2 (Q) П Я1 (Я)- D.16) Пусть теперь feL*(Q), ^€Я-^(Г). D.17)
80 Гл. 2. Управление эллиптическими системами Тогда форма L (г|)), определенная равенством -igp-dT,. D.18) Т OVA * непрерывна на IP (Q) П Я(* 0^)- Таким образом, справедлива Теорема 4.1. Для данных элементов fug, подчиненных условиям D.17), существует единственный элемент у 6 I? (Щ, удовлетворяющий соотношению D.13). Но определению этот элемент у есть слабое решение (в L2 (Q)) задачи D.9). Замечание 4.1. Легко видеть, что Ау = / в смысле про- пространства &>' (Q). Действительно, достаточно в D.16) взять Ч? в 3) (Q); тогда у € L2 (Q) и Л г/ -¦-- / € I? (H). Можно показать (см. Лионе и Мадженес [1, гл. 21, что следы У 1г и и имеют определенный смысл, лричед! у |г 6 Я 1/2 (Г) г и-** (г>. Замечание 4.2. Предположим, что А — симметрический оператор, т. е. А* — Л. Функцию у, удовлетворяющую соотноше- соотношению D.13), будем искать в виде разложения но базису, состоящему из собственных функций оператора А: AiOj = hjWj, lw)dx = i, Wj\v = Q, / = 1,2,..., D.19) а где Xj занумерованы в порядке возрастания. Тогда функцию у можно единственным образом представить в виде Полагая в D.16) г|) -- u>j и учитывая, что А* = А, получаем (см. D.18)) J У (hwj) dx = L(wj) = J fwjdx—\g-p-о1Г. и а г dvA Так как левая часть этого равенства равна Xj-yj, то
§ 4. Граничное наблюдение 81 4.3. Система, описываемая задачей Дирихле (II) Применяя введенные в разд. 4.2 понятия, мы можем теперь обосновать формальные преобразования, проведенные в разд. 4.1. Заметим прежде всего, что сопряженное состояние, введенное формально как решение задачи D.6), определяется строго как решение в L2 (Q) уравнения х=\м( М dvA I dvA I dvA D.22) Заменяя здесь функцию ф па у (v)— у (и), приходим к равен- равенству D.7). Итак, доказана Теорема 4.2. Если состояние системы определяется как решение задачи D.1), а функция стоимости имеет вид D.4), то оптимальное управление и ? 41а определяется как решение зада- задачи D.1), D.6) (причем задача D.6) эквивалентна уравнению D.22)), удовлетворяющее неравенству D.8). 3 а м е ч а н и es 4.3. С помощью введенных понятий мы теперь можем исследовать случай, когда система описывается задачей Дирихле с граничным управлением и граничным наблюдением; ото составляет содержание § 5. 4.4. Система, описываемая задачей Неймана Рассмотрим задачу, сформулироваппую в разд. 2.4, считая, что U - L2 (Г). D.23) Состояние у (и) определяется как решение задачи Ay(u)=f в Q, 1 ьЧГ) \ D'24) !^ = и на Г, dvA Так^ как у (и) ? Я1 (Q), то у (и) |г имеет смысл, и если М в € ?°° (Г), то наблюдение можно определить формулой z(u) — M (и) |г. Тогда функция стоимости имеет вид J(v)=l\ My (v) - 2Д |2 dV + (Nv, v)u. D.25) г Сопряженное состояние определяется как решение задачи А*р(и) = 0 в Q, ) ] ^ ^Ш=М(Му(и)-2я) на Г.] 6 — 1230
82 Гл. 2. Управление эллиптическими системами Для единственного оптимального управления u^°Ug удовлет- удовлетворяются соотношения D.24), D.26) и ] g. D.27) г Пример 4.1. Пусть °Чд — {v \ v с носителем в Го с Г; §0 (х) ^ v (х) ^ |4 (ж) для иочти всех х ? Го в смысле меры йГ; So и |t — данные функции из Ь°° (Г)}; D.28) Л/ — характеристическая функция множества Г\, 1 1\сГ, Г0ПГ1 = 0. J (i' Условие D.27) (если N = vl) принимает вид (р(х; и) + vu(x)) (& - и(х))>0 Щ 6 Ио{х), Ь{х)\ D.30) для почти всех х 6 Го- Пример 4.2. Пусть выполнены условия примера 4.1 и N — 0, т. е. v — 0. Тогда D.30) принимает вид р (х; и) A-й (х))>0 VI 6 Но (z), ii (x)] D.31) для почти всех х 6 Го. Лемма 4.1. Пусть граница Г множества Q вещественно-ана- литична и коэффициенты в выражении для оператора А веществен- но-аналитичны в Q. Тогда либо р(х; и) ФО почти всюду на Го, либо р(и) = 0. D.32) Доказательство. Из соотношений D.26) в силу D.29) вытекает, что А*р(и) = 0 в Q, ^^- = 0 па Г - Гь dvA* dp (и) п „ а значит, г = 0 на 10- Если на некотором .множестве Е cz Го положительной меры р (х; и) — 0, то А*р(и) = 0 в Q; р(и) = 0 и ^^- = 0 на Е а Г, 5v откуда в силу сделанных предположений об аналитичности сле- следует, что р (и) =г 0. Если р(и)=0, то можно найти такое управление и, что My (и) — гд = 0. D.33)
§ 5. Граничные управление и наблюдение 83 Если же inf / (v) > 0, то р (х; и) Ф О почти всюду на Го, и из условия D.31) заключаем: если р{х; и) > 0 в точке х 6 Го, то и(х) ¦¦= %0(х);  ^ ^ если р(х; и)<Ов точке х ? Го, то и(;г) — St(a:). J Замечание 4.4. Условие D.34) означает, что управление является релейным х). Если, например, |0 — — 1, |t = 1,то оптйг- малыюе управление принимает только значения ±1. Замечание 4.Г). Было бы интересно исследовать свойства тех областей, на которых управление и принимает значения ?0 (х) и gi (x) соответственно, и, в частности, получить информа- информацию о свойствах множества, разделяющего эти области. § 5. Граничные управление и наблюдение. Случай задачи Дирихле 5.1. План дальнейшего исследования В разд. 4.4 мы уже изучали системы, описываемые задачей Неймана, в случае граничного управления и граничного наблю- наблюдения. Рассмотрим теперь несколько аналогичных примеров для систем,-описываемых задачей Дирихле. Здесь, как мы увидим, воз- возникают дополнительные трудности. 5.2. Граничное управление из Х2(Г) Пусть 41 = Z2 (Г). E.1) Согласно результатам разд. 4.2 (обозначения сохраняются), существует единственный элемент у (и) ? L2 (Q), являющийся решением задачи Ау {и) = / в Q, у (и) — и па Г. E.2) Именно, решение задачи E.2) сводится к отысканию функции \j (и) ? L2 (Q), удовлетворяющей уравнению (см. D.13)) . E-3) J) В оригинале propri&e «bang-bang».— Прим. перев. 6*
Гл. 2. Управление эллиптическими системами Наблюдение можно определить как z («) = -—у(и) д если, конечно, мы убедимся, что эта производная имеет смысл. Можно показать (см. Лионе и Маджепес [1, гл. 2]), что если и ? то -1 (Г), а и-+-г- у (и) рывное аффинное отображение L2 (Г) -*- Я (Г). Функцию стоимости выберем равной ov& 2 II-ЧТ) — непре- E.4) где N — положительно определенный оператор, отображающий пространство 41 в себя. При сделанных предположениях применима общая теория: существует единственное оптимальное управление и е 41 д, кото- которые характеризуются тем, что u) ovA ov ovA /и- +(Nu, v-u) E.5) Сопряженное состояние определяется как решение задачи А*р(и)--0 в Q, "'j ] па г. ] ) Необходимо отметить, что и, следовательно, р (и) —«регулярное» рошоние 2). В этом прояв- проявляется общая закономерность (вполне естественная, поскольку у и р «двойственны» друг к другу): если «регулярность» состояния «уменьшается», то «регулярность» сопряженного состояния «уве- «увеличивается». 1) Для ф, \|5 g Я (Г) скалярное произведение определяется формулой (ф, (Г) - I ((-Аг)" Ф) где _дг _ оператор Лапласа — Бельтрами на Г. 2) Точнее, р (и) g Я3/2 (Й); см. Лионе и Маджепес [1, гл. 2].
§ 5. Граничные управление и наблюдение 85 Используя задачу E.6), можно привести условие E.5) к экви- эквивалентному виду*): v-и) dT^O Vve<Ud. E.7) г \ dvA* Пример 5.1. Пусть Я1д --- {и | v > 0 па Г, v e L2 (Г)}. E.8) Тогда оптимальное управление получается из решения задачи (типа односторонней граничной задачи) Ay = f, A*p = 0 в Q, ) (—^т)Р = ~ — гЛ на Г, d E.9) y>, + y}z,yA + N д\А* \ovA* а именно u--y\v. E.10) Замечание 5.1. Если управление принадлежит простран- пространству I? (Г), то наблюдение ду (u)/dvA не принадлежит этому пространству (оно принадлежит пространству Н'1 (Г)). Этот результат нельзя улучшить, чем и объясняется наличие нормы в смысле пространства Н~х (Г) в выражении E.4) для функции стоимости / (v) (а также наличие оператора —^Аг во втором соот- соотношении E.6)). 5.3. Одна проблема типа управляемости Пусть Q — открытое множество с границей Г — Г4 [] Г2, где Гг (? — 1, 2) — достаточно гладкое многообразие размерности и — 1. Предположим, что состояние у (и) определяется как решение задачи Ау(и) = 0 в Q, E.11) y{u)\Tl^u, ие^СГц), E.12) У(иIг, = 0. ' E.13) Тогда можно в качестве наблюдения взять функцию -~— д\А г2. принадлежащую пространству Н~г (Г2) (разд. 5.2). Она обладает следующим свойством (типа управляемости; см. § 10 гл. 3). х) Ото делается уже известным способом: умножением первого из соот- соотношений E.6) на у (и) — у (и) и последующим применением формулы Грина.
86 Гл. 2. Управление эллиптическими системами. Теорема 5.1. Если управление и пробегает пространство ду{и) A\),то пробегает подпространство, плотное в Я (Г2) д\А (коэффициенты в выражении для оператора А предполагаются достаточно гладкими). Доказательство. Пусть функция ф 6 Н1 (Г2) удовлет- удовлетворяет условию ^М E.14) 5ф2 г2 dvA Достаточно доказать, что ф = 0. Пусть z — решение задачи E.15) Тогда I (A*z) у (и) dx = 0. Применяя формулу Грина, полу- чаем откуда в силу[E.14) и E.12) имеем г, dvA* Следовательно, dz = 0 на Гь E.16) <9vA* что вместе с E.15) дает z = 0, а значит, и ф = 0. 5.4. Точечные управление и наблюдение1) Если Ъ ? Г, то будем обозначать через б (у — Ь) функцию Дирака в точке Ъ: ° E.17) Пусть ^ = RM, E.18) где RVf — конечномерное пространство (тогда Шд — его замкну- замкнутое выпуклое подмножество). ') U оригинале controle et observation pouctuels.— Нрим. перев.
§ 5. Граничные управление и, наблюдение 87 Пусть состояние у (и) определяется как решение задачи Лу (и) = 0 в Q, E.19) у (и) |г = ^ ufi (у - Ъ,), и = {щ} 6 RM, 6, 6 Г. E.20) г = 1 Задача E.19), E.20) допускает единственное решение. Задача АХР (х, Ъ) = 0, Р (х, 6) |г = б (v - Ь) E.21) имеет решение Р (х, Ъ), называемое ядром Пуассонах). Тогда решение задачи E.19), E.20) можно записать в виде y(u)=^.uiP(x,bl). E.22) Если коэффициенты в выражении для оператора А и граница Г достаточно гладки, то функция у (и) регулярна на множестве Q всюду, кроме точек bt. Поэтому можно в качестве локальных наблюдений выбрать функции и) , с;6Г, 1 = 1, ..., т, E.23) <9vA при условии, что С; Ф bj для любых i и /. Введем функцию стоимости: ду {сс, v) (Nv, v)v, E.24) где N — положительно определенная матрица преобразования пространства IXм в себя. Так как и -> У' " есть непрерывное отображение RM -^- R, то общая теория в рассматриваемом случае применима. *¦) Решение этой задачи можно найти, например, с помощью соотноше- соотношения D.13): для любой «пробной» функции if, для которой
Гл. 2. Управление эллиптическими системами Сопряженное состояние определяется как решение задачи А*р (и) = О, ^ Применяя формулу Грипа, находим, что для оптимального управления и^Шд удовлетворяются соотношения E.19), E.20), E.25) и *M e- E-26) § 6. Ограничения на состояние системы 6.1. План дальнейшего исследования До сих пор множество допустимых управлений Ч1д, характери- характеризующее ограничения на управления, задавалось непосредственно. Однако встречаются и такие задачи, в которых множество °Ug задается опосредованно, через состояние системы. Например, можно рассмотреть случай, когда мпожество 1Lg определяется как совокупность таких управлений ирй, при каждом из которых соответствующее наблюдение Су (и) принадлежит выпуклому замкнутому подмножеству К пространства наблюдений SB- Тогда задача состоит в отыскании характеризующих оптимальное управ- управление условий, непосредственно выраженных в терминах множе- множества К (а не cUd). Мы приведем один пример задачи такого рода. 6.2. Граничное управление, ограничения на границе Пусть состояние системы определяется как решение задачи (обозначения те же, что и раньше) Ау (и) = О, у (и) |г = и, F.1) причем <tl = La(T), u^U. F.2) Мы видели (разд. 5.2), что в этом случае можно определить (Г). F.3) Пусть К — выпуклое замкнутое множество в пространстве Н~г (Г). F.4)
§ 6. Ограничения на состояние системы 89 Зададим множество допустимых управлений )= \v\ v{ dvA F.5) Такое определение возможно, так как и- dy{v) д\А есть линейное непрерывное отображение L2 (Г) -*- Н~г (Г), а потому множество <Ug, заданное с помощью F.5), замкнуто и выпукло. Рассмотрим функцию стоимости 2 , F.6) dy(v) н-*(г) (Nv, где N — положительно определенный оператор, отображающий пространство 41 в себя. Теорема 6.1. Единственное оптимальное управление и, реализующее минимум функции стоимости J (и) на множестве <Ug, получается из решения задачи Лу = 0, A*q = 0 в Q, F.7) dq dv ¦ = Ny на Г, А* ду (и) dv •а F.8) \ F-9) ек, а именно \Г. F.10) (Следует подчеркнуть, что в соотношениях F.9), как нам и хоте- хотелось, фигурирует непосредственно множество К.) Доказательство. 1) Единственное оптимальное управ- управление и 01д определяется условием J'(u)-(v— и) > 0 Vve<Ud, или, что то же самое, A /и-Чт) F.11) :) Скобками обозначено скалярное произведение элементов, принадле- принадлежащих соответственно IIх (Г) и Н~х (Г).
90 Гл. 2. Управление эллиптическими системами Для того чтобы привести неравенство F.11) к виду, позволяю- позволяющему непосредственно использовать множество К, определим функцию q (и) как решение задачи Л*д(и) = 0 в Q, F.12) -2(Г); F.13) дд(и) dv А* при этом q (и) ^ Н1 (Q) *). Умножая соотношения F.12) наг/ (v) — у (и) и применяя фор- формулу Грина, получаем Поэтому неравенство F.11) эквивалентно неравенству \ dvA . dvA dvA Но так как (ф. Ф)н-чп= I (~ г то F.14) можно переписать в виде dvA dv F.14) 2) Отображение F.15) F.16) есть изоморфизм пространства L2 (Г) на // х (Г) (см. Лионе и Мад- женес [1, гл. 2]) 2). Поэтому для любого элемента g ? К сущест- ') Бояоо того, можно показать (Лионе и Маджепес [1, гл. 2]), что q (и) ? 3/2 2) Отображение, обратное к F.16), определяется с помощью решения неоднородной задачи Неймана: ¦TlZ vJ D UG ) ' ^. ' "я " НО. X GV . f7V * откуда ду(и)
§ 6. Ограничения на состояние системы 91 вует такое управление v ?Ч1Э, что ду(и) = g, а следовательно, неравенство F.15) эквивалентно условию F.9). 3) Исключая управление и с помощью равенства F.13), при- приходим к утверждению теоремы. Пример 6.1. Пусть K={g\g>0 на Г} F.17) (т. е. g — неотрицательная мера на Г). В этом случае усло- условие F.9) эквивалентно соотношениям F.18) dvA Задача F.7), F.8), F.18) — это односторонняя граничная задача. Замечание 6.1. Можно убедиться в справедливости сле- следующего результата. Пусть ^) F.19) dvA где X >> 0 — данное число, а функция стоимости / (v) задана формулой F.6). Обозначим через р (и) решение задачи А'р(и) = 0 в Й, 1 др(и) ,, . .^(ду(и) \ „ \ F.20) <9vA* \ <9vA / J Тогда оптимальное управление и ? Ш д удовлетворяет соотно- соотношениям F.1), F.20) и L (Ш )} F.21) vA* / l \ dvA последнее неравенство эквивалентно неравенству F.22) (конечно, при этом еще -~^- + Хи OVA
92 Гл. 2. Управление эллиптическими системами § 7. Теоремы существования оптимального управления 7.1. План дальнейшего исследования Во всех задачах, рассмотренных до сих пор в этой главе, состояние системы было аффинной функцией управления. Мы изучим теперь примеры таких задач, в которых состояние системы является нелинейной функцией управления. Теоремы существования оптимального управления, которые до сих пор были тривиальными, становятся в таких задачах далеко не очевидными: необходимо пользоваться теми же методами, что и при решении нелинейных граничных задач. Это и составляет предмет исследований в настоящем параграфе; в следующем параграфе будут получены необходимые условия оптимальности первого порядка. 7.2. Распределенное управление Пусть Q — то же множество, что и [в'предыдущих парагра- параграфах, а Л — эллиптический дифференциальный оператор второго порядка. Положим Ш+ = {v | v 6 L°° (Q), v > 0 почти всюду в й}, G.1) 41 g ? 41 |., 41 д — выпуклое подмножество в L°°(Q), замкнутое в *-слабой топологии1) G.2) Для каждого элемента v 6 ^+ будем обозначать через y{v) решение задачи Лу (v) + vy(v)=f в Q, G.3) У (v) 1г = 0, G.4) где / — данная функция, например, из пространства L2 (Q). Замечание 7.1. Задача G.3), G.4) имеет единственное решение. Чтобы убедиться в этом, достаточно применить теоре- теорему 1.1 в случае, когда V — //J(Q) и я (ф. Ч>) = 2 I аи —^-г^-dx + I «офФ dx+\ ирт|з dx; G.5)' i,j=l SJ OXj OXi Q Q тогда (если выполнены предположения B.3)) в силу того, что v е<и+ G-6) х) Это означает, что если {»„)? Жа, J vnh dx-+¦ § vhdx yh? L1 (Q), Q a то у € ^а- Заметим, что множество Ж+ обладает этим свойством.
§ 7. Теоремы существования оптимального управления 93 Замечание 7.2. Решение у (v) задачи G.3), G.4) принад- принадлежит пространству Щ (Q), а если коэффициенты в выражении для оператора А и граница Г достаточно гладки, то справедливо даже более сильное утверждение: у (v) e iP (Q) G.7) (так как из G.3) следует, что Ay (v) -- / — vy (v) (j L% (Q)). Ото- Отображение v —>¦ у (v) является нелинейным. Замечание 7.3. Все, что излагается далее в этом разделе, применимо без существенных изменений: — в случае граничных условий, отличных от G.4) и приводя- приводящих к корректно поставленной задаче; — в случае, когда А — эллиптический оператор порядка выше второго. Выберем в качестве функции стоимости либо J(v)=$\y(v)-z!l\2dz + y>\\v\\L~ia), v>0, zaeL2(Q), G.8) Q либо J) Ъ. \ dr Jr v II у ||l-@), v > 0, zn e L2 (Q). G.9) dvA Теорема 7.1. Если выполнены условия B.3) и G.2), а функ- функция стоимости имеет вид G.8) или G.9) 2), то существует по крайней мере одно оптимальное управление, т. е. такой элемент и ? 4la, что Доказательство. Пусть {vn} — минимизирующая последовательность, т. е. J (vn) -> inf J (v); обозначим у (vn) — у . Из неравенства G.6) вытекает (поскольку vn ?<U+), что ii#JlH'02)<const. G.Ю) а из выражения для функции J (v) следует, что il ^IL»(q)< const. G.11) Таким образом, можно извлечь такую подпоследовательность — обозначим ее тоже через {уп, vn},— что уп->у слабо в Я1 (Q) (или в Щ (Q)), G.12) vn -> и *-слабо в Ь™ (Q). G.13) Тогда в силу G.2) имеем и ? <Ug. :) Если выполняется соотношение G.7). 2) Разумеется, возможен и иной выбор функции / (и).
94 Гл. 2. Управление эллиптическими системами Мы покажем, что у — у (и). Но Ауп -\- vnyn = / и, соглас- согласно G.12), Ауп -> А у в пространстве II'1 (Q). Поэтому если мы убедимся, что vnyn^uy в 3)'(Q), . G.14) то будет доказано, что а тогда у = у (и). Для того чтобы проверить соотношение G.14), воспользуемся следующими соображениями. Известно (аналог теоремы Асколи, принадлежащий Реллиху; см., например, Лионе и Мадженес [1, гл. 1]), что вложение III (^) ~~*" ^ №) вполне непрерывно, если множество Q ограничено (а вложение И1 (Q) —у L2 (Q) вполне непрерывно, если множество Q ограничено и имеет достаточно гладкую границу). Из G.12) следует, что Уп-^-У сильно в L2 (Q), G.15) и поэтому если ср g 3j (Q), to vnyn<p dx = I vnyq> dx + \ vn (yn — y)(pdz-+\ uyq> dx q a q (отсюда и вытекает G.14)), так как I vn(yn — у) cpdz|< с || уп — i/||L2(Q)->0. I Q Таким образом, у = у (и), и, следовательно, /(u)<lim/(i;n)= inf /(у). Это и означает, что и — оптимальное управление. Замечание 7.4. Слагаемое v || v ||JOo(Q) в выражении для функции / (v) будет, конечно, лишним, если предположить,- что мпожество 41 д ограничено в пространстве L°° (Q). Замечание 7.5. Системы, описываемые уравнениями вида G.3), иногда называют «системами билинейного тина» (так как отображение (v, у) -> vy билинейно). Можно Доказать теоремы существования, аналогичные теоре- теореме 7.1, для «небилипейных» систем; мы приведем пример такой теоремы в разд. 7.4. Замечание 7.6. (Нерешенная задача.) Пусть ?Oi ?< — данные функции из пространства L°° (Q), причем О < Р < ?о (х) < li (x) почти всюду в Q, G.16)
§ 7. Теоремы существования оптимального управления 95 И пусть %д = {v I lo (х) < v (х) < gi (x) почти всюду в Q}. G.17) Для любой функции v dWg положим <*) y(*)?f) + а«(*И\ G-18) где а0, atj удовлетворяют условиям B.3). Определим состояние у (v) системы как решение задачи A (v)y (v) = f, у (v) |г - 0, G.19) где / — данная функция из пространства Z,2 (Q). Задача G.19) имеет единственное решение. Чтобы убедиться в этом, достаточно применить теорему 1.1 в случае, когда V = Н\ (Q), а форма а (ф, гр) заменена на о„ (ф, Ц) = 2 J au (x) v (х) -*Е-^*- Ас + f я0ф^ <&; G.20) тогда в силу G.17) и B.3) I §rad -ф I2 ^ + а 5^2 dx. G.21) Пусть функция стоимости имеет, нанример, вид -zn]2dx. G.22) Q Нам не известно, существует ли такое управление и ?<Ud, что / (и) ^ / (v) Vy 6 41 д. Трудность решения этого вопроса заключается в следующем. Пусть {vn} — минимизирующая последовательность, а уп —- — у (vn). В силу G.21) || уп || Hi(Q) =С coast, и, следовательно, можно считать (как и при доказательстве теоремы 7.1), что уп—>- у слабо в Н1 (Q), a vn ->¦ и *-слабо в L°° (Q). Но этого недостаточно для перехода к пределу в выражениях \ — ta-v' dxi \ dxj ) Представляются возможными следующие три подхода к реше- решению сформулированпой задачи. (i) Записать уравнение A (v) у (v) = f в виде системы первого порядка и рассматривать затем эту задачу как частный случай некоторой другой, более общей задачи. Такой подход был развит
96 Гл. 2. Управление эллиптическими системами Чезари [1], продолжившим работы Юнга [1], Мак-Шейна [1], Гамкрелидзе [1], Варги [11 1). (ii) Рогуляризировать управление: если, например, предпо- предположить, что °llg — выпуклое множество функций, удовлетворяю- удовлетворяющих условию G.17), замкнутое и ограниченное в пространстве Н1 (Q), то нетрудно установить теорему существования опти- оптимального управления, ибо тогда можно считать, что vn-^-u сильпо в L2 (й). (ш) Возмутить оператор A (v); этот подход излагается в разд. 7.3. 7.3. Сингулярное возмущение системы Пусть 2) Ъ (ф, о|з) — непрерывная билинейная я форма на Щ(&); 1 „ „„ l(Q), J а В ? ?(Hl(Q); B~2(Q)) — соответствующий оператор. Если, например, b (ф, ар) = j Аф Дф их, а то можно показать, что эта форма удовлетворяет условиям G.23) и В = А2. Предположим, что состояние системы определяется как реше- решение ye(v) задачи = 0), • <™> L ' дп где е > 0 —«малый» параметр. Говорят, что оператор гВ -[- A (v) получен из оператора A (v) сингулярным возмущением. Заметим, что задача G.24) имеет единственное решение. Чтобы убедиться в этом, достаточно применить теорему 1.1 в случае, когда V = Щ(&), а форма а (ф, я|;) заменена на гЬ (ф, т|;) -\- av (ф, о|з) ^ ае, v (ф, ij;); G.25) тогда G.26) г) См. также в связи с ;>тим работы Эколаида [11, Иоффе и Тихоми- Тихомирова [1]. 2) Рассматривается задача, сформулированная в замечании 7.6.— Прим. перев.
§ 7. Теоремы существования оптимального управления 97 Изучение задачи G.24) оправдано (в определенном смысле) тем, что справедливы следующие результаты: Теорема 7.2. Для фиксированного v 6 6Ug У* (*).-> У (v) в III (Q) при г -+ 0. G.27) Теорема 7.3. Для фиксированного е > 0 существует опти- оптимальное управление, т. е. такой элемент ие ? Я1д, что \ [Уе (Щ) - zrfdx < J [ye (v) - z:ifdx Vv e Uа. G.28) Замечание 7.7. Пусть z{v) — z^dx; /8= inf Je(v); j= inf J(v). Из теоремы 7.2 следует, что Hm je ^ /, однако ]?еизвестно, E->0 будет ли js-+j. Рассматривая задачу G.24) вместо исходной, мы, таким образом, руководствуемся эвристическими соображениями. Доказательство теоремы 7.2. Утверждение тео- теоремы 7.2 представляет собой частный случай общего результата теории сингулярных возмущений, принадлежащего Юэ [1]. Согласно неравенству G.26) (будем писать уе, у вместо уе (v), У (v)), Уе || уе||Н2(й)< const, || уЕ||Л1(а)<const. G.29) Таким образом, можно считать, рассматривая соответствующую подпоследовательность, что ye—>-z слабо в пространстве НЦО). С учетом оценок G.29) это достаточно для того, чтобы перейти к пределу в равенстве еЬ (#8. Ч') + а» (Уг, -ф) = (/, а|з). Тогда Следовательно, z = у и уЕ~> у слабо в пространстве Hl(Q). Но тогда Eb (Уе, Уг) + а» {Уг ~ У, Уг~ У) = ~ O-v (Уе, У) + «в (У, У) -> 0, откуда и следует утверждение G.27). Доказательство теоремы 7.3. Для простоты записи будем опускать индекс е. Пусть {vn} — минимизирующая последовательность и уп — у (vn). Так как число е фиксировано, то из неравенства G.26) следует, что \\уп \\ щ (Q)-C const. "—1230
98 Гл. 2. Управление эллиптическими системами Таким образом, можно считать, рассматривая соответствующие подпоследовательности, что vn —>¦ и *-слабо в пространстве L°° (Q) и уп -> у слабо в пространстве IP (Q). Тогда dyjdxt ->¦ ->• dyldxi слабо в пространстве II1 (Q), а значит, сильно в про- пространстве L2 (Q). Отсюда, в частности, следует, что Дальше рассуждаем так же, как и при доказательстве тео- теоремы 7.1. Замечание 7.8. Предыдущее доказательство применимо и в случае систем, описываемых эллиптическими операторами порядка 2т, если управление находится под знаком производных порядка не выше 2т — 1. 7.4. Граничное управление Пусть Q — ограниченное открытое множество с регулярной границей Г, и пусть Ug = {v | v e L°° (Г); 0 < р < g0 (.r)< v (х) ^ & (х) почти всюду па Г; |0>|t ? Г°(Г)}. G.30) Предположим, что состояние системы определяется как реше- решение у (v) уравнения J) Ay (v) = /, G.31) где / — данная фупкция пространства L2 (Q), с граничным усло- условием ^^v\y(v)r2y(u) = 0 на Г, G.32) +\y()r dvA где р > 2 — фиксированное число. Задачу G.31), G.32) нужно, конечно, поставить более точно. Введем пространство V = {г|) | г|) е Л1 (Q), яНг € ^Р(Г)} 2) G-33) с нормой 11ф||у = 1И'11н'@) + с||ф||ьр(Г), с>03). G.34) Пространство V банахово. 1) Оператор Л задан формулой B.4) в предположениях B.3). 2) Отметим, что если п !> 3, то ty \г g Я1/2(Г) С I? (Г), где ? опреде- определяется из условия ilq = Уг — ги (п — 1); если же га < 3, то г)з|г ? е Н1/2(Т) cz Lq (Г) при любом конечном q. В случае га < 3 или q >- р можно выбрать F -= Я1(^)• 3) Если q >- р, то можно взять с = 0.
§ 7. Теоремы существования оптимального управления 99 Для элементов ф, г|) ? V определим форму = 2 /1 г,/=1 а от,- OT G.35) Тогда задачу G.31), G.32) можно сформулировать по-другому: найти решение у (v) ? V уравнения av (У {v), ф) = f /ф Ac Vi|> € F. G.36) Q Замечание 7.9. Уравнение G.36), разумеется, нелинейно, так как нелинейно отображение ф -> ав (ф, ty). Теорема 7.4. .Беды выполнены условия B.3) ы множество 41 о задано соотношением G.30), то для любого фиксированного эле- элемента v ^1L g уравнение G.36) имеет единственное решение. Доказательство. Фактически это утверждение пред- представляет собой частный случай общих результатов теории моно- монотонных операторов. Полагая (ф| Ф) 2 \a^^ i,j=i s дх) дх{ получаем «г (фь Ф1 — Фг) — av (фг. Ф1 — фг) = «(ф1 ~ фг. Ф1 — Фг) + + S^ [9 (фО - 9 Ы] (Ф1 - Фг) «Г Уф1, Ф2 е У, G.37) г где в (ф) = | ф |р-2ф- Так как [в (ф,) — в(ф2I (ф! — <р2) > 0, то av (фь Ф1 — ф2) — «р (фг. Ф1 — Фг)>°- G.38) Последнее неравенство означает монотонность оператора V -4- V, порождаемого формой а (ф, ф). На самом деле справедливо даже более сильное утверждение (строгая монотонность): av (Ф1, ф! — фг) — av (ф2, ф! — ф2) > а || ф! — ф2 Нн'(й)- G.39) Неравенство G.38) и свойство коэрцитивности, означающее, что ±^U _^+оо1), G.40) х) Если V = №{Q,), то в соотношении G.30) достаточно считать g0 (х) >- • 0 почти всюду. 7*
100 Гл. 2. Управление эллиптическими системами влекут за собой существование элемента у (v), удовлетворяющего уравнению G.36). (Относительно более общих результатов см. Минти [2], Браудер [2], Лере и Лионе [1], Брезис [1].) Наконец, единственность такого элемента у (v) непосредствен- непосредственно следует из неравенства G.39). Пусть, например, J{v)=\[y{v)-Zjlfdx, G.41) а где zH — данный элемент пространства L2 (Q). Теорема 7.5. Пусть выполнены условия B.3), множество °U g задано соотношением G.30), a y(v) — решение уравнения G.36). Если функция стоимости задана формулой G.41), то существует по крайней мере одно оптимальное управление u?1Lg. Доказательство. Пусть снова {vn} — минимизирую- минимизирующая носледовательность, а уп = у (vn). Так как где с > 0 — константа, не зависящая от v, то || уп \\v ^ const. Поскольку множество ILg ограничено и замкнуто в смысле «-слабой топологии пространства L°°(Q), можно считать, рас- рассматривая соответствующие иодпоследовательности, что уп -у у слабо в пространстве V, a vn -> и *-слабо в пространстве L°°(Q) и и ?11 о- Таким образом, уп->у слабо в ЩО); G.42) Уп\г-+У\г слабо в ЬР(Г), ) flW->6(y) слабо в 1Г(Т), J G'43) где 1/41/' 1 Но в силу G.42) и теоремы о следах (§ 3 гл. 1) Уп\г ->*/!г слабо в //^(Г). G.44) Кроме того, вложение Н1/2(Т) -*- L2(T) вполне непрерывно (см., например, Лионе и Маджепес [1, гл. 1]). Поэтому из G.44) сле- следует, что Уп\т-*-у\г сильно в L2(F), G.45) и можно считать, что Уп\г-+У\г почти всюду на Г. G.46)
§ 7. Теоремы существования оптимального управления 101 Из утверждений G.46) и G.43) вытекает, что 0 (уп) ->¦ 0 (у) сильно в V ~8(Г) (где е > 0), а потому \ vn0 (уп) 1|з dr —> \ uQ (у) ij; dT V\|),^ F. г Итак, откуда у = у (и). Тогда / (u)< lim / (un) = inf J{v), т. е. и — оитимальное управление. 7.5. Управление системами, описываемыми односторонними граничными задачами Мы видели, что отыскание оптимального управления систе- системами, описываемыми линейными уравнениями с частными произ- производными эллиптического типа, приводит к односторонним гранич- граничным задачам. Можно также поставить задачу о нахождении опти- оптимального управления системой, которая сама описывается одно- односторонней граничной задачей. Мы приведем в этом паправлении (еще мало исследованном) только теорему существования для одного частного случая. Пусть А — эллиптический оператор второго порядка. Рас- Рассмотрим множество К = {v | v 6 IP(Q), v > 0 почти всюду на Г}, G.47) и пусть U = L2(T), Шд a<U. G.48) Предположим, что состояние системы определяется как реше- решение у (v) ? К неравенства a{y{y),k-y[y))^]v(k-y(v))dr VkeK. G.49) г Другими словами, Ay(v) = 0 в Q, 1 ^ v почти всюду на Г, | G.50) I v]y(v) = 0 почти всюду на Г. \ dvA J
102 Гл. 2. Управление эллиптическими системами Функцию стоимости возьмем, например, в виде J (») =j [у (v) - 2д]2 dx + (Nv, v)nA N?%(<U,<U), N^vl, v>0. / В рассматриваемом случае справедлива Теорема 7.6. Если состояние системы у (v) и функция стоимости J (v) заданы соответственно с помощью соотноше- соотношений G.49) и G.51), то существует по крайней мере одно опти- оптимальное управление. Доказательство. Пусть {vn} — минимизирующая последовательность и у (vn) = уп. Так как N > v/, то последовательность {vn} принадлежит ограниченному подмножеству пространства L2 (Г), а тогда после- последовательность {уп} принадлежит ограниченному подмножеству пространства H^Cl). Заметим, что отображение гр —>- гр[г про- пространства Н1 (Q) в L2 (Г) вполне непрерывно. Поэтому из последовательности {vn, yn} можно извлечь такую подпоследовательность — обозначим ее тоже через {vn, yn},— что уп-*-у слабо в 7/1 (Q), у?К, Уп\г-+У\г сильно в L2(T), vn-*-u слабо в //'(Q), vn 1г -*¦ и 1г сильно в L2 (Г). Но тогда и так как Hma (yn, уп) > а (у, у), то из неравенства G.49), справедливого при каждом v = vn, получаем откуда у — у (и). Следовательно, lim / (vn) > J (и), т. е. и — оптимальное управление.
§ 8. Необходимые условия первого порядка 103 § 8. Необходимые условия первого порядка 8.1. Формулировка теоремы Пусть ЧС0 — {v | х -> v (х) — такая измеримая функция Q -> Rm, что v (х) ? К почти всюду, К — выпуклое замкнутое множество в пространстве Rm}; (8.1) оператор А задан формулой B.4) в предположениях B.3). Пусть х, К -> Ъ (х, К) — непрерывная ограниченная 1 функция Q X К -*¦ R, J причем 0 < ро < Цх, К) < pi Vx ? Q, VX 6 К. Для v 6 41 о обозначим через Ъ(х, v) функцию х -> Ъ (х, v (x)), а через A(v) — оператор, определенный равенством Л (v) ijj == А^ -J- Ъ (х, v) i|) V^ ? H\Q). (8.3) Пусть х, X —>¦ / (ж, ?о) — непрерывная ограниченная  функция Q X К -> R. J (8l4) Предположим, что для даппого управления v^1id состояние у (v) системы определяется как решение задачи A(v)y(v) = f(x, v) в Q, (8.5) y{v)ZII\(U) (т. е. у(у)|г = 0). (8.6) В силу предположения (8.2) задача (8.5), (8.6) имеет единственное решение. Будем считать, что функция стоимости задана формулой J(v)=lhy(v)dx, (8.7) где h — дапная функция пространства L2(Q). Сопряженный оператор A*(v) вводится равенством A*(v) Ц = Л*г(з + Ъ (х, v) г|> Vxp б Я1 (Q). (8.8) Тогда сопряженное состояние определяется как решение задачи A*(v)p (v) = h, p(v) е П\ (Q)- (8.9) Теорема 8.1. Пусть выполнены условия (8.1), (8.2), (8.4), оператор A (v) задан формулой (8.3) в предположениях B.3), а функция стоимости имеет вид (8.7). Если существует оптималъ-
104 Гл. 2. Управление эллиптическими системами нов управление и^Ч1д, то почти всюду на Q Р {х\ и (х)) [/ (х, и (х)) —Ь(х,и (х)) у (х; и (х))] = = inf р (х; и (х)) [/ (х, к)-Ъ (х, к) у (х; и (х))]. (8.10) ьек Замечание 8.1. Если /г> 0 в Q (т. е. h — неотрицатель- неотрицательная мера на Q), то, согласно принципу максимума для эллиптиче- эллиптических уравнений *), р(х; и(х)) > 0, а тогда равенство (8.10) принимает вид / (х, и (х)) — Ъ(х,и (х)) у (х; и (х)) = = inf [f(x, к) -Ь(х, к)у(х; и{х))]. (8.11) 8.2. Доказательство теоремы 8.2.1. Алгебраическое преобразование. Будем пользоваться обозначением l Q Пусть и g 11-в — оптимальное управление, так что J(u)^J(v) Vv€<Ue. Тогда (см. (8.7)) (h, у (v)- у (и)) > 0 Vye^a- (8.12) Согласно (8.9) (где взято v = и), (h, y(v) — у(и)) ^ (р(и), A(u)y{v) — Л(и)у{и)) = - (р(и), A(v)y(v) - А(и)у{и)) -,- -| (р(и), (А{и) - A{v))y{v)) ^ = (р(и), /(у) - f(u)) + (р(и), (А(и) - A(v)) y(u)) + + (Р(и), (А(и) - A(v)) (y(v) - у{и))). Поэтому неравенство (8.12) эквивалентно неравенству (р(и), /(у) - /(и)) - (р(и), (A(v) - А(и))у(и)) - - (р(и), (A{v) - A{u)){y{v) - у(и)))>0 Vy 6 Ua. (8.13) 8.2.2. Применение неравенства (8.13). Поскольку пе было сделано никаких предположений о дифференцируемое™ функций f(x, К) и Ъ(х, X), мы не можем заменить в неравенстве (8.13) v Не смешивать с принципом максимума Понтрягииа!
§ 8. Необходимые условия первого порядка 105 на и ~\- 0 (v — и), 8 ? @, 1), разделить это неравенство па 8 и устремить 0 к нулю. Классическая идея вариационного исчисления (уже применяв- применявшаяся в разд. 2.5) заключается в том, чтобы в качестве v брать »] = A - 30) и + %jk, k e К, (8.14) гДе li — характеристическая функция некоторого куба с центродх в точке х0 6 ?- *)• Разделив неравенство (8.13) на J %j dx, запишем а его в виде Ъ] — С] — d}>0, где Ъ, = -f-Ц- (р (и), / (Уу) - /(и)), ' ( ^^ () А —— \t> \uh \^ \yj) — л \u/j у wh i C8 15) 1 (и), (A (V]) - Л (и)) (y(vj) - у (и))). Пусть Е — совокупность точек. множества Q, являющихся точками Лебега для функций х-*-р(х, и(х)), x->f(x, u(x)), х ->- b (х, и (х)), х -> у (х, и (х)). Тогда если х0 g Е, то при / -^- оо Ьг -> р (х0, и (х0)) [/ (х0, к) — f (x0, и (жо)I; с, -> р (х0, и (х0)) [Ь (х0, к) — b (х0, и (х0))] У (х0, и (х0)). Следовательно, теорема будет доказапа (поскольку дополне- дополнение множества Е имеет меру нуль), если мы убедимся, что dj —*¦ 0. 8.2.3. Доказательство соотногнеиия dj —*¦ 0. Справедливо неравенство (см. Стампаккья [2, теорема 4.2]) Цу(уI1ь-(а)^с, (8.16). где с ^> 0 — константа, не зависящая от v^6lig; аналогичное неравенство выполняется и для р (v). Полагая jj,;- = J %j dx и обозначая через а;- носитель функции Q получаем \b(v}) -b(u)\-\y(Uj) -y(u)\ dx x) При / ->- oo эти кубы стягиваются в точку х0.— Прим. перев.
106 Гл. 2. Управление эллиптическими системами (различные константы будем обозначать одной и той же буквой с), откуда I dj\ <4i (I I ^M - У<и)\2AхУ/2- (8-17) Положим ^ = У (vj) - У (и). (8.18) Тогда (см. (8.5)) А (и) t|>, = / (уу) -/(»)- F (уу) - 6 (и)) г/ (у,) = gy. Таким образом, а (%, %) + I& (Ж1 ы) 'Ф; ^ = \ gjtyj dx, откуда II ^|lH.(a)<c[||/(i;y)-/(u)||b.@, + ll(b(^)-b(»))if(^)IL«(a)]. (8-19) В силу (8.16) второе слагаемое правой части неравенства (8.19) пе превосходит величины с \\ Ъ (Vj) — Ъ (w)||l2(q), а потому, согласно (8.2) и (8.4), (8.20) По теореме Соболева [1] в этом случае существует такое число г > 2, что 4/2. (8.21) Применяя неравенство Гёльдера, из соотношения (8.17) можно получить \j\^^FiuJ\\L4Q){ И а потому ] dj | ^ c\isJ2. Отсюда и следует доказываемое утверж- утверждение. Замечание 8.2. При выводе оценки (8.16) существенно, что А — оператор второго порядка. Примечапия Метод доказательства теоремы 2.1 часто используется в вариационном исчислении; см., например, книгу Хестенса [1]. Мы старались на возможно более простых примерах продемонстрировать разнообразные ситуации. По поводу общего случая систем, описываемых дифференциальными операторами эллиптического типа произвольного поряд- порядка с общими граничными условиями, см. Лионе [1, статья IIJ.
Примечания 107 Равенство A.31) можно рассматривать как аналог принципа максимума Понтрягина, изложенного (для случая систем, описываемых обыкновенными дифференциальными уравнениями) в книге Понтрягипа, Болтянского, Гам- крелидзе и Мищенко [1]. Свойство релейности оцтимального управления послужило исходным пунктом многочисленных исследований систем, описываемых обыкновенными дифференциальными уравнениями. Однако «эллиптический» случай, по-види- по-видимому, до сих пор не рассматривался. Результат, полученный в тексте, сле- следует из тонкой классической теоремы единственности для задачи Коши (см. .доказательство леммы 4.1). Аналогичная ситуация встретится нам и при изучении оволюциопных уравнений. Относительно проблемы единственности решения задачи Коти для эллиптических уравнений см. Аропшайп [1], Кордес [1], Гейнц [1], Ландис [1], Мюллер [1], Педерсои [1]. Согласно теореме 5.1, для данного элемента g ? //"'(IV) существует такое управление и, что элемент dy(u)/dvA сколь угодно близок (в смысле //-'(Гг)) к элементу g. Численные аппроксимации в такого рода задачах изучаются в книге Латтеса и Лиопса [1]. Доказательство того, что dy(u)/dvA ? //-1(Г), если и ? ?2(Г) (см. разд. 5.2), в тексте пе приводится. Более общие результаты такого характера содержатся в книге Лионса и Мадженеса [1, гл. 2]. Другой метод (менее общий, по более элементарный) получения подобных результатов предложил Нечас [1] (примепив одно тождество, доказанное Реллихом). Одна задача типа рассмотренной в замечании 7.0 была изучена (в связи с ее физическими приложениями) Лурье [1]. Он рассматривал систему, опи- описываемую двумя уравнениями второго порядка эллиптического типа, пред- предполагая, что оптимальное управление существует. Полученные им необхо- необходимые условия оптимальности аналогичны приведенным в § 8. Относительно результатов, более общих, чем описанные в разд. 7.4 (для «параболического» случая; однако все рассуждения справедливы и в «эллип- «эллиптическом» случае), см. Лионе [2]. Теорема 8.1 представляет собой аналог принципа максимума Поитря- гина. Как отмечено в тексте, результаты такого типа, вероятно, довольно трудно получить в более общих случаях; например, если операторы имеют порядок выше 2 или если рассматривается .система уравнений. Предлагаемые для этих случаев доказательства должны восприниматься с осторожностью, поскольку они используют в качестве гипотез некоторые свойства регулярно- регулярности, а обоснование этих свойств неизвестно. Конечно, подобная «аксиомати- «аксиоматизация» доказательства теоремы 8.1 тривиальна. Задачи вариационного типа с управлением, входящим в коэффициенты, рассматривались Пуччи [1], [2].
Г Л А IS Л О Управление системами, описываемыми уравнениями с частными производными параболического типа § 1. Эволюционные уравнения 1.1. Исходные предположения Пусть, как и в § 1 гл. 2, V ж II — два данных гильбертовых пространства. Обозначим через V и Н' пространства, двойствен- двойственные соответственно к пространствам V и Н, причем II' отождест- отождествим с Н. Будем считать, что V cz H с V. Переменная t обозначает время. Предполагается, что t ? (О, Т), где Г< оо; иногда будет рассматриваться и случай Т ->- + °°- Пусть дано семейство билинейных форм, непрерывных на про- пространстве V: Ф, ф-»-а(*; Ф, -ф), t e (О, Г). Относительно этого семейства предполагается, что Уф, а|5 ? V функция t-> a (t; <р, а|э) измерима на (О, Т), \a(t; Ф, г|;) |< с || Ф ||-||ф||; } A.1) существует такое число К, что х) a (f; Ф> д|5)-!-Я, |Ф |2> а || Ф ||3, а > 0, } A.2) Vф е v, v* e (о, г). Для каждого ? можно записать (ср. с A.6) гл. 2) a (t; ф, ф) - (A(t) ф, ![)), Л(«) Ф 6 Г, A.3) где скобки обозначают скалярное произведение элементов, при- принадлежащих соответственно V и V. Введем теперь (как в разд. 2.5 гл. 2, но при S = (О, Т) и Е = = F) пространство I/ (О, Г; F) функций ?-> / (i), отображающих интервал (О, J1) в пространство F, измеримых и таких, что (|) о Аналогично определяется пространство L2 (О, Г; V). Заметим, что A(t) 6^(L2@, Т; V); 1Д0, Т; V')). A.4) ') 1Ф1 = ||фНя' II Ф 11 = II Ф
§ 1. Эволюцуоппые уравнения 109 Действительно, если / ? L2@, T; F), то A(t) / ? V. Функция f _^ A(t)f(t), как легко проверить, измерима и (в силу A.1)) удовлетворяет условию \\A(t)f(t) \\v^c\\f(t) \\v, откуда и следует утверждение A.4). Для функции / ? L2@, T; V) можно определить производпую df/dt следующим образом. Введем сначала пространство распре- распределений на интервале @, Т) со значениями в пространстве V (Шварц [2]): Щ@, Т); V) = Х(Щ@, Т)); V). , (l.o) Тогда, если / ? ?В'(@, Г); V), то / (ср) ? V и ср -> / (ф) — непре- непрерывное отображение i?(@, T)) -> V для любого элемента ср ? б ^(@, У)). Будем обозначать распределения, как обычные фупкции, и будем писать Определим производпую d//di элемепта / ? ^'(@, 71); V) с помо- помощью соотношения Тем самым задано липейное непрерывное отображение 3) ((О, Г))->7. Таким образом, df/dt ? 3'(@, Г); V). Говорят, что /,!->/ в пространстве <2?'(@- Т); V), если /»(ф) -> /(ф) ^Ф 6 ^(@, Л)- В этом случае Если / ? /у2 (О, Г; F), то можно определить / (ф) с помощью равенства A.6), т. е. обычным интегралом Лебега со значениями в V. При этом ф -> / (ф) — непрерывное отображение 3) ((О, Т)) ->~ -> V. Тем самым мы определяем также элемент / ? 3)' ((О, Г); F) и линейное непрерывное взаимно однозначное отображение (вло- (вложение) /-> 7пространства ЩО, Т; V) в ^'(@, ?'); F). Отождеств- Отождествляя элементы / и /, получаем L2 (О, Г; V) с= ^'(@, Л; V). A.7) Следовательно, для фупкции / ? L2 @, Г; F) можно определить производную d//d* 6 3j'(@, T); V). Введем пространство W(O,T) = {f)fE L* @, Т; V), df/dt в L2 @, Т; V')}. A.8)
110 Гл. 3. Управление параболическими системами Это пространство, снабженное нормой T \1/2 ' / J , A.9) <Й у' / становится, как легко видеть, гильбертовым. Справедлива (см. Лионе и Мадженес [1, гл. 1] Теорема 1.1. Всякая функция f ? W @, Т), надлежащим образом измененная (в случае необходимости) на некотором мно- множестве меры нуль, является непрерывной функцией [0, Т] -> //. Короче ото утверждение можно записать так: W @, Т) с С0 ([0, Л; Н), A.10) где С0 ([0, Т]\ Н) — пространство непрерывных отображений [0, Т]-+Н. 1.2. Эволюционные задачи Рассмотрим теперь эволюционную задачу: найти функцию у 6 W @, Т), удовлетворяющую уравнению A(t)y + ^- = f, A.11) t где / — данная функция пространства L2 @, Т; V), и началь- начальному условию У @) = у о, A.12) где г/о — данный элемент пространства Н *). Примеры таких задач мы приведем в разд. 1.5, а сейчас дока- докажем, что справедлива Теорема 1.2. Если выполнены условия A.1) и A.2), то зада- задача A.11), A.12) в пространстве W @, Т) имеет единственное решение. Более того, это решение непрерывно зависит от исходных дан- данных: билинейное отображение /, у0-*-ущос?1)аяства.1?{0, Т; V) X X II в W@, T) непрерывно. Отметим сразу же, что при Т <С оо можно считать, что неравенство A.2)"I ,, ло\ справедливо при К = 0. .М " * Действительно, если положить у — z ехр (Ы), По теореме 1.1 равенство A.12) имеет смысл.
§ 1. Эволюционные уравнения 111 то задача A.11), A.12) будет эквивалентна задаче dz (А (f) + fc/) z + — = /ехр (- fa), 2 @) = г/0, at т. о. оператор A (t) заменяется на A (t) -\-Ы. Взяв к = X, получим утверждение A.13). Таким образом, докажем теорему 1.2, считая, что выполпепо предположение A.13). 1.3. Доказательство единственности Пусть элемент у удовлетворяет условиям A.11), A.12) при / —. 0 и у0 = 0. Умножая равенство A.11) скалярно на y(t) и учитывая A.3), получаем Кроме того, можно показать (это делается в процессе доказатель- доказательства теоремы 1.1), что о \ dt (поскольку у (О) = 0). Следовательно, г \a{t;y{t), о откуда в силу A.13) о * а значит, у — 0. 1.4. Доказательство существования Для того чтобы несколько упростить изложение, предположим, что пространство V сепарабельно, т. е. что существует счетное множество, плотное в пространстве V. Тогда можно найти (беско- (бесконечным числом способов) «базис» Wi, w2, . . ., wm, . . . простран- пространства V в следующем смысле: эле.ченты Wi, . . ., wm липейно независимы; совокупность конечных линейпых комбинаций \ A.14) 2 hwJ (lj 6 R) плотна в V. • ¦
112 Гл. 3. Управление параболическими системами Определил! приближенное решение ym(t) задачи A.11), A.12): т ym{t)=^gim{t)wi, A.15) г = 1 где функции gtm (t) выбираются так, чтобы выполнялись соот- соотношения t} a (t; ут (t), wj) = (у (t), w}), 1 < / < m, A.16) m m = уОт= У timWi, 2 limWl-^Уо В II ИрИ Ш-+ОО. A.17) г 1 г 1 Система A.16), A.17) представляет собой задачу Коши для системы т линейных дифференциальных уравнений относительно gim (t): 5Fm % + лп {t) gm = fm, gm @) = {lim}, at где Wm - II И, Wj)\\, An (t) = || a {t; wt, wj) ||, Так как det Fm ф 0, то задача A.16), A.17) имеет единственное решение. Мы докажем, что если т ->¦ оо, то г/т ->- г/, где г/ — реше- решение задачи A.11), A.12) г). Умножим равенство A.16) па gjm(t) и просуммируем по /. Тогда т. е. ^4\ym(t)f + a(t;ym{(),ym(t)) Z at откуда в силу A.13) | ут (Т) |2 + 2а j || г/т («) ||2^ < | г/От |2 + 2 j[ | (/(«), ym(l) \ dt о о dt + y) а о J) Заметим, что если «базис» ц>|, . . ., wm, . . . выбран, то доказатель- доказательство носит конструктивный характер. 2) Здесь использовано очевидное неравенство 2 | аЪ \ = 2 | а '2а-а~1|'2Ь |^! <С аа~ -|- а~1Ь2.— Прим. перев.
§ 1. Эволюционные уравнения 113 Поскольку (см. A.17)) | г/от 1 < с |г/0|, окончательно получаем ]\\ym(t)\\2dt^c(\y0\2+]\\f(t)\fvldt). A.18) о о Следовательно, элементы ут остаются в некотором ограничен- ограниченном подмножестве пространства L2@, T; V), и поэтому можно из- извлечь такую подпоследовательность {у^}, что уа -+ z слабо в L2 (О, Т; V). A.19) Пусть j — произвольное фиксированное число и \х > /. Равен- Равенство A.16) верно при m — [i. Умножим обе его части на функцию Ф@ 6 (С1 [О, Л), ф(Л -0, A.20) и проинтегрируем результат от 0 до Т: т П A.21) о где cpj (t) = (f(t) Wj. Переходя в равенстве A.21) к пределу при ус ->¦ оо (что возможно в силу A.19)), находим т т I [— B. Ф5) + й (fc z. Ф;)] dt=l (/, фу) Л + (г/о, фу @)). A.22) Это равенство верно при любой функции ф, удовлетворяющей условиям A.20). Поэтому можно взять ф ? 3){{Q, T)), а тогда соотношение A.22) дает —-(z@, ^-) + a(t;z(f), wj) = (/(/), ц;,), A.23) где производная принадлежит пространству 3)'(@, Т)). Но так как в равенстве A.23) число / произвольно, а множество всевозможных конечных линейных комбинаций элементов Wj плотно в пространстве V, то dz —¦ + A(f)z = f. A.24) dt Итак, dzldt = f - A (t)zeL2 @, Г; V), а значит, z 6 W@, T). Но тогда в равенстве A.22) можно интегрировать по частям, так что в силу A.24) (z @), wj) ф @) = (уо, Wj) Ф @) V/, Уф, 8-1230
114 Гл. 3. Управление параболическими системами ИЛИ (z @), wj) = (г/о, ^) V/, откуда z @) - г/о. Следовательно, z — решение задачи A.11), A.12). Так как, согласно разд. 1.3, решение единственно, то z — у. Тогда соотпо- шепие A.19) можно переписать в виде г) ут-+у слабо в L2@, T; V). A.25) В силу A.18) l\\y(t)\fdt^c(\ik\2+l\\f(t)\\2v,dt), A.26) о о а так как dyldt = / ¦— A(t) г/, то 1.5. Примеры Будем пользоваться следующими обозначениями: Q — открытое множество (область) в R", Г — граница области Й; . Q = QT=U X (О, Т) — (открытый) цилиндр, ' ( > Б = Ет = Г X (О, Т) — боковая поверхность цилиндра Q. Пример 1.1. Пусть atj — функции, заданные в цилиндре Q — Q X (О, Т) и удовлетворяющие условиям 2 аи (х, t) Uj >а{1\ + ... + \% а > 0, V Ъ 6 R, \ A.28) почти всюду в Q. J) Справедливо даже более сильное утверждение: ут ->- у сильно в Z,2 (О, У; У). В самом деле, г . о 2 г г . = \ (/. J/m) *- I a (i; j/m, у) Й ^ (^ (Г)' У (Г))~ 0 О Г 1 -$а(«;г/, Vm~y)dt ^A/G-), Ут(Т)-у{Т)) + о +-5-1 г/т @)—г/о12-г-тг(г/т(О), г/о)+^г(Уб, г/т@)—г/о)~-*"°-
§ 1. Эволюционные уравнения 115 Для ф, -ф ? П1 (&) ПОЛОЖИМ Д а (*; ф, 10 = 2 J а„ (х, С)^-^- dx. A.29) i,j=l Q OX; dX-t Возьмем (§ 3 гл. 1) V — /7o(Q). Тогда выполнены условия теоремы 1.2, из которой следует существование единственной функции у ? И7 (О, Г), для которой лО» + -т- = / в ®, A-30) где A(t)y=- 2 у (х, 0) = г/о (х) в Q. A.31) Соотношение у ? W (О, Г) означает, что (см. A.8)) Но если функция у принадлежит пространству L2(Q, T; V) и удовлетворяет уравнению A.30), то ее производная dy/dt принадле- принадлежит пространству L2 @, Т; V). Следовательно, вместо у ? W @,Т) можно требовать только у ? L2 @, Т; V), или, другими словами, у, — 6L2{Q); y = 0 на 21). A.32) Таким образом, если выполнены условия A.28), то существует единственная функция у, удовлетворяющая соотношениям A.30)— A.32), где f и у0 — данные элементы пространств L2 @, Т; V) и I? (Q) соответственно. Г1 р и -м е р 1.2. Будем пользоваться теми же обозначениями, что и в предыдущем примере, но теперь пусть V -- II1 (Q). Во избе- избежание педоразумений при интерпретации пространства V пред- представим уравнение A.11) в эквивалентном виде: ) ф) = (/ (О, Ф) Щ 6 V. A.33) Пусть / = / (х, t) — данная фупкция из L2 (Q); A-34) х) Это условие возпикает в силу того, что V = ВЦп) (разд. 3.3 гл. 1). 8*
116 Гл. 3. Управление параболическими системами определим В результате получим некоторый элемент пространства L2 (О, Т; V'). Равенство A.33) формально интерпретируется сле- следующим образом (как в примере 3.3 гл. 1): %L+A(t)y = f в Q, A.35) dt -^- = 0 па 2, A.36) dvA у{х,О) = уо{х) на Q. A.37) Замечание 1.1. Задачи A.30) - A.32) и A.35) - A.37) являются смешанными задачами (в смысле Лдамара). Оператор dldt -\- A(t) — это параболический оператор второго порядка. Для корректной постановки граничной задачи необходимо знать (i) начальное условие A.31) или A.37); (ii) граничное условие на боковой поверхности 2; A.32) — это условие Дирихле, а A.36) — условие Неймана; разумеется, воз- возможны и многие другие случаи (соответствующие примеры будут приведены пиже). Замечание 1.2. Граничные условия были до сих пор ду однородными: у\х — 0 или — 0. В дальнейшем мы рас- s смотрим также неоднородные граничные условия. Замечание 1.3. Общую теорему 1.2 можно применить и в случае параболических операторов порядка выше второго, в случае систем и т. д.; это будет показано на примерах. Ясно, что все «стационарные» примеры, рассмотренные в гл. 2, имеют ана- аналоги в «эволюциоппом» случае. 1.6. Полугруппы Пусть выполнены условия теоремы 1.2, но A(t) = A, A.38) т. е. оператор A(t) не зависит от t. В уравпении A.11) положим / = 0. Тогда задача A.11), A.12) примет вид + Ay = O, y(O) yo; A.39) at
§ 1. Эволюционные уравнения 117 эта задача допускает единственное решение в пространстве W (О, Т), где Т — произвольное конечное число. Согласно теоремам 1.1 и 1.2, тем самым определено линейное непрерывное отображение Уо-+У® A-40) пространства Н в себя. Следовательно, y(t) = G(t)y0, G(t)e%(H;II) A.41) и оператор G (t) обладает следующими свойствами: (i) Уу0 6 Н, t -*¦ G (t) у о — непрерывное отображение> [0, оо) -*- II; (ii) G @) = /; (iii) G (t) G(s) =- G (s) G (t) = G (t -|- s) V*, s > 0. Семейство операторов G (t) образует полугруппу. 3 а м е ч а п и е 1.4. Разумеется, тот факт, что Н — гильбер- гильбертово пространство, не играет никакой роли при определении полугруппы. Если, например, Н — банахово пространство х), то полугруппой называется всякое семейство операторов G(t) б ? =??(#; II), удовлетворяющее условиям A.42). Замечание 1.5. Формально at t—o- A.43) Говорят, что (—А) — инфинитезималъный производящий оператор полугруппы G (t). Оператор (—А) неограничен в пространстве Н. Его область определения D (А) составляют все такие элементы h ? Н, что 1 — (G(o)h — h) сходится в Н при а->-0. Легко видеть, что в рассматриваемом нами случае D (А) = {h I h б V, Ah б II} (Хилле и Филлипс [1], Като [1], Иосида [1]). Замечание 1.6. Общее решепие задачи A.11), A.12) можно представить в виде y(t)=\G(t-o)f (a) do + G (t) y0. A.44) *) Распространение определения полугруппы операторов на еще более общие случаи см. Иосида [1].
118 Гл. 3. Управление параболическими системами Пример 1.3. Предположим, что оператор А симметричен: а (ф, i|)) = а (хр, ф). Тогда этот оператор, рассмотренный как неограниченный в пространстве // и имеющий в качестве области определения множество D (А) = {h | h ? V, Ah ? Н), является самосопряженным. Если вложение V -> Н вполне непрерывно, то оператор А порождает базис, состоящий из собственных функций: (wj, wh) = b*! где элемепты w}- образуют полную ортопормальную систему в про- пространстве Н. Легко видеть, что тогда оо G{t)yo= 2 е~к}'(у0, wj). A.46) Замечание 1.7. Из теоремы 1.2 следует, что если опера- оператор А определяется с помощью билинейной формы а(ф, \р), удов- удовлетворяющей условию а (ф, г|з) + Я, 11E |2 > а || 1E ||2 Vij) ? V, A.47) то (—А) — инфинитезимальный производящий оператор некото- некоторой полугруппы. Обратное неверно. Существуют такие операторы А, что (—А) — инфинитезимальный производящий оператор полугруппы в гильбер- гильбертовом пространстве //, по условие A.47) не выполняется (Като [1]). Для того чтобы оператор (—А) был ипфинитезимальным про- производящим оператором некоторой полугруппы (теорема Хилле — Иосиды), необходимо и достаточно, чтобы существовало такое число К, что при | > X Замечание 1.8. Можно распространить формулу A.44) на случай, когда оператор А (?) зависит от t. Для этого рассмотрим задачу |A) (,); () l, %?, A.48) at допускающую единственное решение z ? L2 (a, t; V) (и, следова- следовательно, dz/dt ? L2 (a, t; V). Тогда z (t) = Ф (*, or) g, Ф (*, а) в Z(H; H), A.49) и решение у задачи A.11), A.12) можно представить в виде у (t) = \ Ф (t, a) /(or) da + Ф (t, 0) yQ. A.50) о
§ 2. Задачи управления 119 § 2. Задачи управления 2.1. Обозначения. Простейшие свойства ' Пусть заданы гильбертово пространство 41 управлений (ср. с разд. 1.1 гл. 2) и оператор В e%{<U; L2@, T; V')). B.1) Пусть /иг/о — данные элементы пространств L2 (О, Т; V) и 7/ соответственно. Предположим, что выполняются соотноше- соотношения A.1), A.2), и обозначим через у (v) решение задачи dy{v) dt A{t)y{v)=f + Bv- B.2) j/(y)|(=o = j/o; B.3) y(v)eL2@,T;V). B.4) Обозначения. Пусть у (v) — функция t ->- у (v) (t), кото- которую в дальнейшем будем обозначать через y(t; v). Соотноше- Соотношение B.3) можно записать тогда в виде У @; v) - г/о. B.3') В приложениях функция у (р) зависит также и от х; поэтому будем обозначать ее через у (х, р, v). Тогда равепство B.3') можно записать еще и так: у (х, 0; v) = у0 й, а: 6 Q. B.3") Функция у (v) представляет собой состояние системы. Наблю- Наблюдение задается следующим образом (ср. с разд. 1.1 гл. 2): z (V) = Cy(v), Ce Z(W@; T); S3) г). B.5) Определим оператор N (ср. с A.12) гл. 2): М?Х{Ш;Щ; (Nu,u)w>v\\u\\%, v>0. . B.6) Функцию стоимости зададим формулой ./ (v) = || Су (у) - 2д Ц^, + (Nv, v)u. B.7) Замечание 2.1. Отметим, что управление в начальные условия не входит. Случай, когда начальные условия содержат управление, рассматривается в § 11. Наконец, пусть (как в § 1 гл. 2) Ua — выпуклое замкнутое подмножество в <Ц. B.8) ') Отметим, что у (и) е W @, Т); пространство W @, Т) определено равен- равенством A.8).
120 Гл. 3. Управление параболическими системами Задача оптимального управления сострит в том, чтобы отыскать inf J{v). B.9) Естественно, что все результаты разд. 1.2 гл. 2 остаются в силе и для сформулированной сейчас задачи, поскольку для их полу- получения было использовано единственное свойство — непрерывность линейного отображения v ->- у (v) пространства 41 в пространство W@, T) (заменяющее в рассматриваемом случае пространство F). Следовательно, если оператор N удовлетворяет условиям B.6), то существует единственное оптимальное управление  ;) если N = 0, а множество °llg ограничено, то существует непустое замкнутое выпуклое мно- \ B.11) жество оптимальных, управлений г). J Наша цель теперь заключается в более подробпом изучении оптимального управления {при этом результаты будут отличаться от уже получепных в гл. 2). 2.2. Совокупность соотношений, характеризующих оптимальное управление Как и в разд. 1.3 гл. 2, управление и?Ш3 оптимально тогда и только тогда, когда /'(ц).(у— и) > 0 Vv ?%{,, т. е. когда (Су (и) ~н,С{у{р)-у (u)))w + (Nu, v - u)v > 0 Vi; 6 <U0. Введем обозначения (ср. A.25) и A.28) гл. 2): Л — капонический изоморфизм из <Ш на Ш'\ 1 ±\<% — капонический изоморфизм из Ш на 1L'. / Тогда неравенство, характеризующее оптимальное управле~ ние, принимает вид (С*А(Су(и) - гд), y(v) - у(и)) + {Nu, v - и)п> 0 Vv ? Ua, B.13) 1) Относительно примеров, в которых N — 0 и множество 1id не обяза- обязательно ограничено, см. § 7.
§ 2. Задачи управления 121 где первое слагаемое левой части обозначает скалярное произ- произведение элементов, принадлежащих пространствам W'@, T) и W(Q, T) соответственно. Остается теперь интерпретировать неравенство B.13), введя сопряженное состояние. Мы сделаем это только для двух слу- случаев г): (i) С?ЩЬ\0, Т; V); Ш) 2); (ii) Су (v) = Dy (T; v), D ? X {Л; Н) 3). 2.3. Случай (i) Здесь С* ?? {SB'\ L2 (О, Т; V')), и неравенство B.13) можно переписать в виде J (С*Л{Су (и) -2д), y{v)-y(и))dt + (Nu, v-u)u>0 VveWg. B.14) Определим сопряженное состояние р (и) как решение задачи Щ + A*(t)p (v) = С*А (Су (и) - 2д) в (О, Т); B.15) at p(T;v) = 0; B.16) p(v)eL2@, T;V). B.17) Задача B.15) — B.17) имеет единственное решение. Чтобы в этом убедиться, достаточно применить теорему 1.2, обращая время (т. е. заменяя t на Т — t). Умножим равенство B.15) (при v — и) скалярно па y(v) — — у(и) и проинтегрируем от 0 до Т. Учитывая, что y{v)_y{u)\dt=](p{u)j J-{y{v)_y{u)))dt, ) о V dt J о V dt Т Т l(A*(t)p(u), y(v)-y(u))dt=l о о \ (A* (t)p(u), y(v)-y (u)) dt=](p (u), A (t) y(v)-A (t) у (и)) dt, J) В общем случае необходимо использовать пространство W'(Q, T) в сопряженной задаче. Это можпо сделать, но понадобятся сложпые рассуж- допия; поэтому удобнее рассматривать отдельно случаи (i) и (ii). Разумеется, С может быть линейной комбинацией операторов, указанных в (i) и (ii). 2) В этом случае соотношения B.5), очевидно, выполняются. 3) В этом случае говорят, что наблюдается финальное состояние.
122 Гл. 3. Управление параболическими системами получаем I (С* А (Су (и) - 2д), у (v) - у (и)) dt = о = | (р (и), [~ + А (О) (У (v) - У (и))) Л = г = J (р (а), 5у — Бы) di = (Б*р (и), v~u) = о где (Б*р (и), у — и) — скалярное произведение элементов, при- принадлежащих соответственно 41' и 41. Следовательно, неравенст- неравенство B.14) можно переписать в виде ). B.18) Таким образом, доказана Теорема 2.1. Если выполнены условия A.1), A-2), B.6) и С ? X (L2 (О, Т; V); <Ш), то оптимальное управление и? °Ud ха- характеризуется соотношениями , у@;и) = у0; B.19) и)-гя), р(Т;и) = 0; B.20) dt dp (и) dt у (и) 6 А2 @, Т; V), р (и) 6 L2 @, Т; V). B.22) Замечание 2.2. Соотношения у @; и) — г/о и р (Г; и) = = 0 являются граничными условиями для системы дифференциаль- дифференциальных уравнений относительно функций у и р; к этим условиям в конкретных примерах (см. § 3) необходимо присоединить еще граничные условия на боковой поверхности 2. Замечание 2.3. Если 41 о — 41, то соотношение B.21) приводится к виду АуВ*р (и) + Nu = 0. B.23) J) Предыдущие выкладки показывают, что V2/'(") = В*р(и)
§ 2. Задачи управления 123 Исключая с его помощью и, приходим к выводу, что оптимальное управление получается из решения задачи + A at -^- + A at ) у @) = у0, р(Т) = 0 1), B.25) а именно и = - N~1A,u-1B*p. B.26) Задача B.24), B.25) будет подробно изучена в § 4. 2.4. Случай (ii) Здесь фупкция стоилюсти равна / (v) = I Dy (T; v) - 2Д |2 + (Nv, v^, B.27) а неравенство B.13) эквивалентно неравенству {Dy(T; и) - 2Д, Dy(T; v) - Dy(T; и)) + (Nu, v ~ u)# > 0 Vve<Ud, B.28) где первое слагаемое левой части обозначает скалярное произве- произведение в пространстве //. Определим сопряженное состояние р (v) как решение задачи _^ + Л*(«)р(у) = 0 в @, Г); B-29) at р(Т;- v) = D*(Dy(T; v) - zR); B.30) p(v) e Щ0, T; V). B.31) Эта задача, согласпо теореме 1.2, имеет единственное решение (в чем легко убедиться, заменяя t на Т — t). У .множим равенство B.29) (при v = и) скалярно на y(v) — — у (и) и проинтегрируем от 0 до Т. Учитывая, что at / о - (D* (Dy (T; u) - zR), у (Г; v) - у (Т; и)), Здесь y(O) = y(t)\t=o и
124 Гл. 3. Управление параболическими системами получаем (Dy (T; и) - г„, Dy {T; v) - Dy (Т; и)) = $ (р (и), В (Р - и)) dt. о Следовательно, неравенство B.28) можно переписать в виде % Vv?<Md, B.32) и том самым доказапа Тео.рема 2.2. Пусть выполнены условия A.1), A.2), B.6) и функция стоимости J (v) имеет вид B.27), где D ? Х(Н; Н). Тогда оптимальное управление и^б/1э характеризуется соотно- соотношениями dy(u) dt dp {и) A(t)y(u) = f + Bu, y@;u) = y0; B.33) + A*(t)p (и) = 0, р (Г; и) = D* (Dy (T; и) - гд); B.34) dt (A^lB*p(u)+Nu, v — u)^>0 Vy^,?, B.35) где у (и) е L2 (О, Т; V), р (и) 6 L2 (О, Г; V). B.36) Замечание 2.4 (аналогичное замечанию 2.3). Если Шэ = = 41, то соотношение B.35) приводится к виду B.23). Исключая с его помощью и, приходим к выводу, что оптимальное управ- управление получается из решения задачи —— + A (t) у -f- BN~iA^iB*p = /, — -f- A* (t)p = 0, B.37) dt dt /Г\\ / rjr\ 7-4* / j-i / Гр\ \ /П QQ\ У\Щ = Уо1 P\1)==L' \Dy(l)—zfl), (Z.oo) а именно и = — N~lA%lB*p. 2.5. План дальнейшего исследования Примеры применения теорем 2.1 и 2.2 мы дадим в § 3. Затем вернемся к случаю отсутствия ограпичопий на управление. Очевидно — и это важно для приложений,— что в рассматри- рассматриваемых задачах можно использовать теорему 2.1 гл. 2. Замечание 2.5. В сингулярном случае, когда А^В*р (и) 4- Nu = 0, B.39)
§ H. Задачи управления 125 неравенства B.21) и B.35) вьшолняются автоматически. Но соот- соотношение B.39) соответствует случаю отсутствия ограничений на управление. Значит, в сипгулярном случае ограничения на управление не играют никакой роли: множество 41 <? содержит элемент и, реализующий минимум функции / (v) во всем про- пространстве 41. Замечание 2.6. Предположим, что ид = {v\\\v \\ш <Д}. B.40) Тогда если положить l = A^B*p(u)+Nu B.41) и считать !¦ Ф 0 (см. замечание 2.5), то соотношение B.21) (или B.35)) будет эквивалентно равенству u = -R ——. B.42) II ?11» Замечание 2.7. Пусть 41 = L2 @, Т; Е), B.43)- где Е — гильбертово пространство; Wa = {v\\\v(t)\\E^R почти всюду}. B.44) Используя обозпачопие B.41), соотношение B.21) (или B.35)) можно переписать в эквивалентной форме (теорема 2.1 гл. 2): u(t))E = inf (l{t), k). Следовательно, u(t) = -R „;)?„ , если 1Ф0. B.45) Замечание 2.8. Теорию, аналогичную изложенной выпге, можно развить и в случае, когда функция стоимости задана не фор- формулой B.7), а в виде J (v) = (Ciy (v), у (у))да + (Nv, v)%, B.46) где Ci ?? C8; SB) — не обязательно положительно определенный оператор, а оператор N берется «достаточно большим», чтобы определенная формулой B.46) функция стоимости / (v) обладала свойствами коэрцитивности, т. е. /(у)-> + оо, если || v \\ш -> + оо.
126 Гл. 3. Управление параболическими системами § 3. Примеры 3.1. Параболическое уравнение второго порядка: смешанная задача Дирихле Пусть V = //„(Q) и оператор Л (t) задан, как в примере 1.1 (разд. 1.5). Пусть U = L2 (Q), где Q = п X (О, Т) (следователь- (следовательно, 41' — %)¦, & В — тождественный оператор. Пусть состояние у (и) системы определяется как решение- задачи + {)y() f + в Q; 1 dt } C.1) y(u)\z = 0; y(x, 0; и) = уо(х), а; 6 О, J а управление распределено в цилиндре Q. Рассмотрим несколько- возможных случаев наблюдения. 3.1.1. С—вложение Z2 @, Т; V)-+L2(Q). В этом случае сШ — L2{Q) — $6'', Л—тождественный оператор. Сопряженное состояние определяется как решение задачи Цг + ®р() = у(и)-га в Q; ~) dt ^ C.2> p(u)\z = 0; р(х, Т; и) = 0, х?О, где zn — данный элемент пространства L2(Q). Для оптимального управления и ?Шд удовлетворяются coojj пошения C.1), C.2) и g. C.3> Пример 3.1. Пусть 41 о —11. Тогда и = — N~*p. В этом случае можно получить некоторые утверждения о регулярности оптимального управления (см. также замечание 2.3- гл. 2). Имопно, если граница Г области Q и коэффициенты atj (x, t) в выражении для оператора A{t) достаточно гладки, то решение р (и) задачи C.2) удовлетворяет условию р (и) е IP'HQ), C.4) где д'е1?«?>У\ (з.5) dt Я2-1 (Q) — гильбертово пространство с нормой (s
§ 3. Примеры 127 Если, например, N --- vl, v>0, то оптимальное управление удовлетворяет условию х.и е IP'\Q). C.6) Пример 3.2. Пусть %д — {v | v > 0 почти всюду в Q). Тогда неравенство C.3) эквивалентно соотношениям [p(u)+Nu]u = 0 в Q. Исключая управление и из соотношений C.1), C.2), C.7), при- приходим к задаче (типа односторонней граничной задачи)г) dt at = y-zR в Q; C.8) ->)=° ¦ y\z = O, p|2 = 0; y(x, 0) = yQ(x), p(x, T) = 0, x?Q. ) Соотношения C.7) показывают, что в каждой точке цилиндра Q либо и = 0 и р -р TVu -— р > 0, либо р + Nu = 0 и и > О, либо, наконец, и — 0 и р -!¦ iVu — 0. В последнем случае, оче- очевидно, у = zn и дг//д? + Л (?) у = /. Поэтому, если предположить, что dz д ¦ -f- A (t) zrl Ф f почти всюду в Q, dt то возможны только два первых случая (ср. с примером 2.2 гл. 2). Если, кроме того, N = v/, v > 0, то 1 u = inf @, р) почти всюду в Q. C.9) г) Оптимальное управление и получается из решения этой задачи, а именно и = dyldt -\- A (t) у — /.— Прим. перее.
128 Гл.,3. Управление параболическими системами Следовательно, при указанных предположениях оптимальное управление и получается из решения задачи ^ + Ау + -1пЦ0,р) = ^-^- + Л*р = у-гя в Q; \ dt v dt \ C.10) y\z = 0, р|2 = 0; у(х, О) = уо(<с), р(х, Т) = 0, х?п, J а именно равно C.9). Заметим, что если при этом коэффициенты atj и граница Г области Q достаточно гладки, то справедливо соот- соотношение C.4), а тогда из равенства C.9) следует, что у 6 Я1 @. C.11) Пример 3.3. Пусть теперь 6пд ¦= {v | 10(х, t) ^ v{x, t) < li(x, t) почти всюду в Q, ?о и \i — данные функции из L°° (Q)}. C.12) Тогда, согласно теореме 2.1 гл. 2, неравенство C.3) эквива- эквивалентно неравенству [р(х, Г, и) -г Nu(x, t)] [g - и (х, t)] > 0 V| 6 1?о(я> t), li(x, г)]-почти всюду в Q. Последнему неравенству можно дать такую же интерпретацию, как и в примере 2.3 гл. 2. 3.1.2. С — тождественное отображение пространства L2 @, Т; V) в себя. В этом случае SB ^ L2 @, Т; V) и SB' = = L2@, Г; V). Так как V - Bl0(Q), то Л - - А + /, т. е. Л/(х, t) - - Дх/ (ж, 0 -I- / (я, 0 !). Сопряженное состояние определяется как решение задачи C.13) г, Г; u) = 0, J где zH — данный элемент пространства L2 @, Т7; V). Если соответствующим образом выбрать множество бпд, можно построить примеры, аналогичные предыдущим. 3.1.3. Финальпое наблюдение 2). Пусть в предположениях разд. 2.4 D ^Х(Н\ II), II = L2 (Q) и функция стоимости имеет вид J(v)=l [Dy (x, T; v) - 2д (x)fdx + (Nv, v)v. C.14) х) См. примечание па стр. 189.— Прим. перев. 2) В оригинале observation finale.— Прим. перев.
§ 3. Примеры 129 Тогда сопряженное состояние определяется как решение зада- задачи (ср. с B.29) - B.31)) _J_pM + A*(t)p(u) = 0 в Q; \ dt \ C.15) р(и)|2 = 0, р(х, Т; u) = D*[Dy(z, T; и)-2д(х)] в Q, ) а оптимальное управление и?41 о характеризуется соотношения- соотношениями C.1), C.15) и C.3). Пример 3.4. Пусть Ч1д --- 41. Тогда и — — N-1p. Следова- Следовательно, мы приходим к задаче C.1) (где надо заменить и на —TV~1p), C.15); оптимальное управление и получается из реше- решения отой задачи, а именно и — — N~xp. И рассматриваемом случае решение задачи C.15), вообще tobo-v ря, не принадлежит пространству IP^(Q), но р (и) 6 L2 (О, Т; V). Если, например, N~-vI, v>0, то u6L2@, T; Hl Можно привести также примеры, аналогичные примерам 3.2 и 3.3. Замечание 3.1. Случай, когда в условиях этого раздела yV — 0 и множество 41 а ограничено, мы рассмотрим н § 7. 3.2. Параболическое уравнение второго порядка; смешанная задача Неймана Пусть V -- 7/L(Q) и Щ, -- //2(Б), а оператор A(t) задан, как в примере 1.1. Пусть состояние у(и) системы определяется как решепие уравнения ~Г (У ("), -Ф) + «(Ь у (и), лр) = (f(t), уЪла) + («(О, "Ф 1г)л»(г) dt C.16) с начальным условием у@; и) -. у0 в Q, C.17) где /иг/0 — данные элементы пространств L2 (Q) и L2 (Q) соот- соответственно. Уравнению C.16) можно дать следующую интерпретацию (ср. с разд. 2.4 гл. 2): A(t)y(u) = f в Q, C.18) dt ^± = и на 2, C.19) dvA 9-1230
130 Гл. 3. Управление параболическими системами а начальное условие C.17) эквивалентно условию у(х, 0; и) - уо(х), х 6 Q. C.20) Следовательно, состояние системы определяется как решение смешанной задачи (в смысле Адамара) с граничным условием Ней- Неймана, причем управление является граничным. Рассмотрим два возможных случая наблюдения. 3.2.1. Г—вложение L2@, Г; F)-^ L'\QI). В этом случае функция стоимости имеет вид J(v)=[ [у {v) — 2Л]2 dx dt + (Nv, y)L2(v,, C.21) где z4 g L2 (Q). Сопряженное состояние р (и) определяется как решение задачи + Ар{)у{) dt м ^- = 0 па Б; р(х, Т; и) = 0, dvA * Для оптимального управления u^°Ug удовлетворяются соотношения C.18) - C.20), C.22) и $(p + JV«)(v —u)d2>0 4vfUg. C.23) Пример 3.5. Пусть Ш$ — Ш- Тогда соотношение C.23) принимает вид р -|- Nu = 0 на S- C.24) Следовательно, оптимальное управление и получается из реше- решения задачи -za в dt ^ 0 на Б; dvA dvA* I y(x, O) = yo(x), p(x, T) = 0, x?Q, J а именно и = — N~*p |s • C.26) Отметим следующее свойство. регулярности оптимального управления: если коэффициенты в выражении для оператора А Ср. со случаем 3.1.1.
§ 3. Примеры 131 и граница Г области Q достаточно гладки, то решение р(и) зада- задачи C.22) принадлежит пространству H2-X(Q) (см. C.5)), и, сле- следовательно, Р к € #1/2B) *)¦ C-27) Если, например, N = vl, v>0, то оптимальное управление и удовлетворяет условию и е Я1/2B). C.28) Пример 3.6. Пусть <Uq= {v \ v ? L2 B), v ^ 0 почти всюду на Б}. Тогда оптгогалъпоо управление и получается из решения задачи (типа односторонней граничной задачи) = у-2я в Q; dp dvA* =0 на Б; f p + JV-^iL^O, -^ д\А dvA y(x, O) = yo(x), p(x, J) = O, = 0 на 2; C.29) а именно dvA C.30) 3.2.2. Финальное наблюдение 2). В этом случае функция стоимости имеет вид J(v)=l\jf(x, Г; v)-zA , v)L4s), C.31) где гя 6 L2(Q). Сопряжепное состояние р(и) определяется как решение задачи dt = 0 B dv A* C.32) >) Точное, p|s ? /У3/2> 3/4 B) (см. Лионе и Мадженес [1, гл. 4]). 2) Ср. со случаем 3.1.3. Возможен также случай, аналогичный 3.1.2, но мы его изучать не будем. 9*
132 Гл. 3. Управление параболическими системами Для оптимального управления u^4La удовлетворяются соот- соотношения C.18) — C.20), C.32) и \ (р + Nu) (v - u) dZ > 0 Vy6%5. C.33) Пример 3.7. Пусть °Ид = 41. Тогда u = — N-1ph. C.34) Следовательно, оптимальное управление и получается из реше- решения задачи C.35) dt dt = O на 2; dvA dvA* у (х, 0) = y0 (x), p (x, T) = у (x, T) - zA (a:), a: € Q, а именно равно C.34). Пример 3.8. Пусть <Ug = {у | v 6L3(S), у>0 почти всюду на 2}. Тогда неравенство C.33) эквивалентно соотношениям и> 0, р(и) H-iVu> 0, и [р (u) + iVu] = 0 на 2. C.36) Здесь оказывается полезной Лемма 3.1. Пусть коэффициенты в выражении A.30) для оператора A(t) аналитичны в замкнутом цилиндре Q и граница Г (а значит, и боковая поверхность 2) аполитична. Если решение р(и) задачи C.32) равно нулю на подмножестве Soc 2 и мера подмножества 2 о положительна, то р(и) = 0. Доказательство. Известно (см., например, Тапабе [1]), что при сдолапных предположениях решение р(и) анали- тичпо в цилиндре Q и на его боковой поверхности 2. Но тогда функция р(и) аналитичиа на множестве 2 и равна нулю на неко- некотором его подмножестве положительной меры; следовательно, P(u)h --=0. Таким образом, данные Коши па поверхности 2 для решения р(и) нулевые, а потому, согласпо теореме Коши — Ковалевской (так как р(и) — аналитическая функция), р(и) = 0. Возвращаясь к соотношениям C.36), предположим, что и = О и р (и) + Nu — 0 на некотором подмножестве 20 сг 2 положи- положительной меры. Тогда и —0 и р(и) =0, что, согласно лемме 3.1, возможно лишь в случае, когда р(и) = 0.
§ 3. Примеры 133 Положим для простоты N = vl, v > 0. C.37) Тогда равенство р(и) = 0 влечет за собой равенство vu2 = 0 на 2, а значит, и = 0 и р(х, Т; 0) = у(х, Т; 0) — гл(х) = 0. Следовательно, если у(х, Т; 0) — гЛ(х), то и = 0 — оптимальное \ . управление; в противном случае р(и) |s ^= 0 почти всюду. I {^•^°/ Таким образом, если г/(Г; 0) =^= zR, то возможны только два случая: либо и>0и р(и) + Nu = 0, либо u = 0 и р(и) >¦ 0. Тогда u=-i-inf(O, /)|E), C.39) и справедлива Теорема 3.1. Пусть коэффициенты в выражении A.30) для оператора А аналитичны в замкнутом цилиндре Q и удовлетворя- удовлетворяют неравенству A.28). Пусть граница Г аналитична, состояние системы определяется как решение задачи C.18) — C.20), функция стоимости имеет вид C.31) u jj(T; 0) Ф zR *). Если при этом °Ud-=~-{v | f> 0 почти всюду на 2} cz 41 — иго оптимальное управление и получается из решения нелинейной задачи = 0 в + y f,% + at ot —— 4- — ш? @, />) = 0, —i—= 0 на 2; ' 9vA v 3v^ * у(х, 0) = у0(х), р(х, Т) = у(х, Т) — гл(х), а именно равно C.39). Замечание 3.2. Нелинейпые задачи типа C.40), по-види- по-видимому, непосредственно пе изучались. Отпосительпо более общих примеров см. Лионе [5] (см. также разд. 3.4). Замечапие 3.3. Случай, когда в условиях настоящего раздела N = 0 и мпожество Ч1д ограничепо, рассматривается в § 7. ') Это равносильно условию inf J(v) > 0.
134 Гл. 3. Управление параболическими системами Замечание 3.4. В соотношении C.16) предполагалось, что и ? /Д2). Тогда отображение .ty->-(u(t), г|э Irkaa1) опре- определяет некоторый элемент пространства I? (О, Т; V'). Тот же результат вытекает из более общего предположения: и 6 L\<d, T; Я~1/2(Г)) (ср. с разд. 2.4 гл. 2). Можно получить и дальнейшие обобщения; мы приведем далее соответствующие примеры, в которых применяется общая теория неоднородных задач (см. Лионе и Мадженес [1, гл. 4]). Замечание 3.5. Тем же методом исследуется случай, когда состояние системы определяется как решение смешанной задачи для оператора с разрывными коэффициентами (относитель- (относительно стационарного случая см. пример 3.4 гл. 1). Дадим теперь краткий анализ двух примеров, соответствующих в эволюционном случае примерам, рассмотренным в разд. 2.6 и 2.7 гл. 2. 3.3. Система уравнений и уравнения высшего порядка 3.3.1. Система уравнений. Рассмотрим «эволюционную» зада- задачу, аналогичную той, которая уже изучалась в разд. 2.6 гл. 2, по с граничными условиями Неймана и граничным управлением. Пусть состояние у (и) — {г/i (и), г/2 (")} системы определяется как решение задачи — - А у, (и) + у, (и) - уг (и) = /, в Q, f^ L2 (Q), dt dyi (и) dt %2 (и) dt дц дп - л/у2 (и) + ih (и) + yt (и) = /2 в Q, т* Ш дп \ C-41) — и2; (х, 0; и) = у01 (х) е L2 (Й), /у2 (х, 0; и) = у02 (х) ? L2 (Q), х е % J где а -_- {ии иг] ей = L2 (I) X L2 (S). C.42) Задача C.41) имеет единственное решение. Чтобы в этом убе- убедиться, применим теорему 1.2, считая, что V — Hl (Q) X If1 (Q), Ф = {фь Фг} е V; a (t; ф, гр) = а (ф, т|)) = ^ (grad ф! grad ifr + grad ф2 grad i|;2) da; +
§ 3. Примеры 135 (/ @. Ч>) = Ч- (О «2 @ Пусть наблюдение является финальным и зависит только от одной компоненты состояния *): z{v) .- У1 {х, Т; v), C.43) так что функция стоимости имеет вид ¦/(") = $ [Ui (*. Т; v) - z;l (x)f dx + (Nv, v)v, C.44) где 2Д ^ L2 (Q) — данный элемент. Сопряженное состояние системы определяется как решение задачи др\(и) dt (и) dt dpi (и) Pi («) -f Pi (") + P2 (и) = 0 в Q; - kpz (и) + р2 (и) - Pl (и) = 0 в (?; = 0) ^М = 0 на Е } C-45) дп дп Pl (х, Т; и) = У1 (х, Т; и) - гя (а-), р2 (х, Г; и) = О, (см. теорему 2.2; оператор I): Н -> Н, где Н — L2 (О) х L2 (Q), определяется соотношением I) {hi, h2} — {hi, 0}). Для оптимального управления и ^Uo удовлетворяются соот- соотношения C.41), C.45) и [Pi (vi - щ) (v2 - и2)] йЪ v - i7 6 Ud. C.46) При м е р 3.9. Если п случае отсутствия ограничений на управление (°Ud — U) оператор N -^ {Л(, N.,} диагоналей, то Wi = -ArrIPi(u)|J:,  = -Ar2"V2(«)|v. C.47) Тогда оптимальное управление и получается из решения зада- задачи C.41), C.45) (в которой компоненты управления цг, i -- 1, 2, исключены с помощью соотношений C.47)) в виде C.47). 3 а м е ч а п и е 3.G. В случае, когда °Ug -- {v | ut ;> 0, j--l,2, почти всюду на X} ') В оригинале observation finale partielle.— Прим. перев.
136 Гл. 3. Управление параболическими системами и N — v/, v > 0, неравенство C.46) эквивалентно соотношениям "i > 0, Pi (и) + vjut > 0,; u4 [>4 (u) + ViUi] = 0 на 2, 1 7 w2 > 0, р2 (и) + v2u2 > 0, щ [р2 (и) + v2u2] = 0 на 2. J Нам не известно, имеет ли место свойство единственности (ср. с леммой 3.1). Легко убедиться (используя рассуждения, как при доказательстве этой леммы), что если функции pi(u) и р2(и) равны нулю па двух (различных) подмножествах границы 2 положительной меры, то Pi{u) — 0 на 2, i - 1, 2, и рг = 0, i = — 1,2. Однако возможен ли случай, когда, например, pi(w)|x = — 0, но относителыго р2(и)\х нет никаких предположений и рг ф 0, i - 1, 2? 3.3.2. Уравнения высшего порядка. Пусть состояние у (и) системы определяется как решение задачи 1) ду {а) ' ¦ А (а, (х, t) Ay (и)) = / + и в Q, и, f 6 L2 @; C.49) dt ду(и) У (и) Is = О, = 0; C.50) m 2 у (х, 0; и) - y0 (х), х в Q, Уо в L2 (Q); C.51) при этом преднолагается, что а( (= L (Q), aj^a>0 почти всюду в Q. C.52) Пусть управление распределено в цилиндре Q: U = 1? (Q), C.53) а функция стоилюсти имеет вид J{v)=)[y{v) — Zpfdxdt -f- (Nv, v)qi. ' C.54) 6 Тогда сопряженное состояние определяется как решение задачи PW_ _^_ д ^ ^ ^ др ^ __ у ^ _ 2д в д. C.55) dt р(м)|2 = 0, -f—i— =0; ¦ C.56) р(х,Т;и) = 0, х?9.. C.57) -1) Задача C/19) — C.51) имеет единственное решение; чтобы в этом убе- убедиться, достаточно применить теорему 1.2, считая, что V = Щ (Q); a(t; ф, гр) — f Oj (г, г) ДфАг); dx.
§ 3. Примеры • 137 Для оптимального управления u ? <Ug удовлетворяются соот- соотношения C.49) — C.51), C.55) — C.57) и I [р (х, t; и) + Nu (х, t)) [v(x, t) — u (x, t)]dxdt^O V v 6 <Ue. C.58) Q Замечание 3.7. В § 9 мы дадим пример системы, описы- описываемой смешанной задачей Дирихле, в случае граничного управ- управления. 3.4. Дополнение1) Можно поставить вопрос о прямом решении нелинейной систе- системы C.10) 2). Исключим из соотношений C.10) неизвестную величипу у. Для ятого применим оператор dldt -|- А ко второму из урав- уравнений C.10). Учитывая первое из соотношений C.10), получаем уравнение v C.59) Из соотношений C.10) находим граничные условия для функ- функции р: (^ ) -2д|2. C.60) Второе из условий C.60) имеет смысл, только если элемент % принадлежит пекоторому пространству, более узкому, чем пространство L2 (Q). Поэтому интересующее нас прямое решение задачи C.10) требует дополнительных предположений о регуляр- регулярности исходных данных. Для определенности предположим, что y^L2{Q). C.61) Тогда, в частности, в силу C.61) гя | s 6 L2 B), а потому второе из условий C.60) имеет смысл. х) Чтение этого раздела для понимания дальнейшего не обязательно. 2) То есть о ее решении безотносительно к задаче управления, которой она эквивалентна.
138 Гл., 3. Управление параболическими системами Наконец, функция р должна также удовлетворять условиям + А + )р() = уо-гЛ(О), р{Т) = (). C.62) dt I Таким образом, наша цель состоит в том, чтобы получить пря- прямое решение нелинейной задачи C.59), C.G0), C.62). Положим i-inf(O,p) C.63) и за.мети.\1, что /;р (р) > 0. C.64) Пусть (см. C.5)) Т - МЧ Ц> 6 IP'1 (<?); я|; U - 0; г|) (а:, Т) - 0, х ? Q}; C.65) f — гильбертово пространство с нормой, определяемой так же, как и для пространства Нгл (Q). Для ф, г|5 6 5^' ноложил: ц \ dt I \ dt $ C-66) у тогда задачу, которую мы решает, люжно заменить эквивалентной: я (Р. Ч") = 5 [/ - (^ гд] ^ dx dt - — J L?/o — z:i \х-> [>)i т V2' u/ a;r — J 2д \х' Ч ~ aZi v y t ' • \d-"i) Но задача C.67) имеет единственное решение. Это вытекает, например, из результатов Лере и Лионса [1] в силу следующих оценок: ( 1 \ '2 U \ dt / (первое неравенство следует из соотношения C.64), а по поводу второго см., например, Лионе и Мадженес [1, гл. 4]; более общие результаты получены Аграновичем и Бишиком [1]); г2-чад (И) Л (ф!, ф! — ф2) — Я (ф2, ф! — ф2) > (это неравенство следует из монотонности функции р —*~ Р (р) и того факта, что правая часть уравнения C.67) представляет собой линейную непрерывную форму на пространстве f.
§ 4. Расцепление и интегро-дифференциальное уравнение Риккати (]) 139 3 а м е ч а н и е 3.8. Тот факт, что функция р -> р (р) моно- монотонна, не является случайным — он связан с условием опти- оптимальности C.3). 3.5. План дальнейшего исследования Перейдем теперь к более подробному изучению случая отсут- отсутствия ограничений на управление. Мы покажем, как на этот случай распространяются известные результаты, полученные для систем, описываемых обыкновенными дифференциальными урав- уравнениями. Это и составит предмет § 4 и 5. Потом мы вернемся к случаю наличия ограничений на управ- управление, а затем рассмотрим другие задачи. § 4. Расцепление и интегро-дифференциальное уравнение Риккати (I) 4.1. Обозначения и предположения Пусть выполнены предположения разд. 2.3 и рассматривается случай отсутствия ограничений на управление (замечание 2.3). Изучим более подробно задачу B.24), B.25), считая, что U ~ tf (О, Т; Е), D.1) Зв =- L* (О, Т; F), D.2) где Е и F — сепарабельные г) гильбертовы пространства; *-> (В (t) е, г|з) и *-> (С (t) <р, /') W ? Е, г|з ? V, <р ? F, /' ? /*" — измеримые функции; ' Операторы В и С задаются в виде Cf=«t^C(t)f(t)», feL2@, T; V). Легко видеть, что В ? X (Ч1\ L2 (О, Т; V')), С 6 X (L2 (О, Г; V); Будем писать В (t) и вместо Ви и С (t) f вместо С/. Кроме того, предположим, что u(t)», где N{t)?X (Е; Е); ) t—>-(N(t) e, ei)—измеримая функция; [ D.5) E. J l) Это предположение не существенно и додается только для упрощения изложения некоторых моментов.
140 Гл. 3. Управление параболическими системами Пусть АЕ — канонический изоморфизм из Е на Е'; AF — канонический изоморфизм из F на F'; тогда А<л и (t) = AEu (t) почти всюду и Л/ (t) = Apf (t) почти всюду. Для простоты записи положим Di(t) = B(t)N~i(t)AElB*(t), D2(t)=C*(t)AFC(t). D.7) Тогда Di{t)^X(V;V), D2(t)?%(V;V), t?@, T); ) t-+(Di (t) ф, о]?) Уф,г|)б7, i = l, 2, —измеримые функции; }D.8) (заметим, что (iV (t) Аъ1 )* = iV (i) A"i). При этих обозначениях система B.24) принимает вид + A dt где g(t) = - С* (*) AF 2д («), D.10) •а граничные условия B.25) таковы: у @) - 1/0, • р (Г) = 0. D.11) ¦4.2. Оператор /*@> функция r(t) Для «расцепления» задачи D.9), D.11) важна Лемма 4.1. 2? предположениях разд. 4.1 задача ^Р *, Л, 0<*<Г;) I } DЛ2) D.13) ^ + ()^D2(tL> = g в (s, dt
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати (I) 141 где h — данный элемент пространства II, имеет единственное решение. Доказательство. Согласно § 2, соотношения D.12), D.13) можно рассматривать как задачу, решение которой позво- позволяет найти оптимальное управление в случае, когда состояние системы определяется как решение задачи + {)p f + ()v в {s, dt "¦ D.14) Ф (s) = h (т. е. ф = ф (и)), функция стоимости имеет вид \t; v)-za(t)\$dt+](N(t)v(t), v(t))Edl, D.15) а управление v пробегает пространство 41 (s, T) — L2 (s, T; E). Действительно, сопряженное состояние *§(v) определяется как решепие задачи -^-JrA*{t)^ = C*{t)AF[C{t)(f(v)-zn\; $(Т) = 0, D.16) at а и является оптимальным управлением тогда и только тогда, когда AiiB*(t)yp + N(t)u = O. D.17) Исключая отсюда и, получаем соотношения D.12) и D.13). Лемма 4.2. Отображение h ->¦ {tp, ¦ф}, где {ф, \р) — решение задачи D.12), D.13), является непрерывным отображением II —»- -v W(s, T) X W(s, T), где W(s, T) = L\<peL2(s, T; V), ^GL2(S, T; V')) . D.18) I dt ) Это отображение — аффинное. Доказательство. Линейная часть рассматриваемого отображения соответствует случаю, когда /-- 0 и гд -— 0 (и, сле- следовательно, g = 0). Обозначим через ф„ (г;) состояние системы, определяемое как решение задачи D.14) при ф (s) — hn. Для фиксированного управ- управления v при А„ —>¦ h Фп (v) ->- Ф (у) в W (s, T). D.19)
142 Гл. 3. Управление параболическими системами Пусть ип (соответственно и) — оптимальное управление, отве- отвечающее функции стоимости Jl" (v) (соответственно Js (v)). Тогда ) и Jhn (u) -> Jhs (и) в силу соотношения D.19), записанного при v -- и. Следовательно, ?(м)= inf 4 (v). D.20) г Но Jhn («.„) > v | || ы„ \\гЕ dt, а это вместе с соотношением D.20) S означает, что ип при hn -v h принадлежат ограниченному подмножеству пространства Ш (s, T). D.21) Таким образом, можно извлечь такую подпоследовательность {иц}, что u^-^w слабо в 41 (s, T). D.22) Тогда фц (и^) -> ф («') слабо в W (s, Т), и потому Iim > Jhs (w), что вместе с соотношением D.20) дает Jhs (w) ^ Jhs (и). Итак, w - ¦- и, и мы получаем ип-+и слабо в 6ll(s,T); Jhtn {un)-* Jhs (и); D.23) (Pn(un)-^4>(u) слабо в W(s, Т); \ //о/ч "Фи 0*п) ~*~ "Ф (и) слабо в W(s, T). J Отсюда следует непрерывность линейной части отображения h->¦ {ф, я|;} пространства Н с сильной топологией в пространство W (s, T) х W (s, T) со слабой топологией. Следствие 4.1. Пусть h ? II — данный элемент, а {<Pi ^} — решение задачи D.12), D.13). Тогда h-^^(s) D.25) — аффинное непрерывное отображение II ->¦ Н. Доказательство. Отображение D.25) представляет собой композицию отображений h->- {ц>, i|)} и {ф, i|)}->-i|)(s)r а по теореме 1.1 {ф, ij?}—»-г[; (s) — непрерывное отображение W (s, Т) х W (s, Т) -^ Н.
§ 4. Расцепление и интпегро-дифференциалъиое уравнение Риккати (!) 143 Следствие 4.2. Отображение (-1.25) можно единственным образом представить в виде yb(s)--P(s)h-\-r(s), D.26) где P(s) ?%(П; //), r(s) 6 Н. Теперь .мы можем доказать «основное тождество». Л е м м а 4.3. Пусть {у, р} — решение задачи D.9), D.И). Тогда Р (t) --Р (t) у (t) -¦¦ г (t) W6@, T), D.27) где оператор Р (t) получается из решения задачи at I а именно P(s)h--y(s),- D.29) а функция г (i) получается из решения задачи D-30) т] (я) = 0, |G') = О, а именно r(s).~.t(s). D.31) Д о к а ,ч а т е л ь с т в о. Чтобы убедиться, что оператор Р (s) и функция г (,<?), входящие в соотношение D.26), действительно получаются так, как указано в формулировке леммы, достаточно разложить аффинное отображение h —>• т|з (s) на линейную и по- постоянную части. Осталось только доказать тождество D.27). Рассмотрим зада- задачу D.12), D.13) при h --- у (s). Обозначим через ср (соответствен- (соответственно -ф) сужение функции у (соответственно р) на интервал (s, T). Ясно, что функции ер и -ф удовлетворяют соотношениям D.12) и D.13), а потому ср -- ф, \f> -- лр. Отсюда, в частности, следует, что ip ($) — ¦-= ¦ф (s) --= р (s).
144 Гл. 3. Управление параболическими системами Но тогда в силу D.26) p(s) = P(s) y(s) + r(s), а так как s произвольно, то лемма доказана. Приведем теперь несколько свойств оператора P(t). Лемма 4.4. Справедливо равенство P*(t) = P(t); D.32) отображение t -v (P(t) h, h) Vh, Ъ 6 H непрерывно на [О, Я. D.33) Доказательство. 1) Пусть h ? Н. Обозначим через р, у решение задачи D.28) при h = h. В силу D.28), D.29) тогда Умножая второе из уравнений D.28) скалярно на р и интегри- интегрируя, получаем = (V (*), Р (*)) - ] (D* (t) P, P) dt+](y,4L s s \ at (f) p) dt = / = (V (*), P (*)) - ] (D2 (t) P, P) dt - ] \i, D, (t) y) dt, s s откуда (в силу D.8)) ]]]~ D.34) С помощью соотношений D.7) можно показать, что форму- формула D.34) симметрична, а это и доказывает справедливость равен- равенства D.32). 2) Для доказательства утверждения D.33) перейдем сначала к фиксированному промежутку .изменения переменной, сделав замену t = s + х (Т — *), т 6 [0, 1]. Положим Р (s + х (Т - «)) = ps (т) D.35) и аналогично определим ys, fs и т. д. Положим A(s+r(T-s))= As (т) и аналогично определим Dis (т), D2S (т).
§ 4. Расцепление и интегро-дифференциальное уравнение Риккати (I) 145 Задача D.28) принимает тогда вид + (Ts)As(x)f>s + ()is(x)ysO; dx -?h + (T-s)A*s(T)ys-(T- s) П2я (т) ps = 0; dx ра @) = й, y.A) = 0; 0<т<1. Соотношения D.36) .можно рассматривать как задачу, решение которой позволяет найти оптимальное управление для системы, состояние которой определяется как решение задачи — + (Т - s) As (т) Л = (Т - s) Bs (т) w, w 6 1} dx ) D.37) — + (Т - s) As (т) Л = (Т - s) Bs (т) w, w 6 1} @, 1; Е), ) d ) h; J а функция стоимости имеет вид Js (w) = (Т -s)\\\ СЙ (т) X(х) \\%dx + (Т - s) \ (Ns (т) W, w)E dx. D.38) о о В самом деле, в этом случае сопряженное состояние опреде- определяется как решение задачи + ()t()i s()F!!(r)K цA) = 0, D.39) dx и w является оптимальным управлением тогда и только тогда, когда ЛЁ^в*(т) \i + Ns(x)w = 0. D.40) Исключая отсюда w, приходим к соотношениям D.36). Заметим, что inf Js(w)= inf 4 (v), / = 0. zH = 0 D.41) u--?iMo,i;e) dS^(s,d (именно поэтому в формуле D.38) сохранен множитель (Т — s)). Далее, P(s)h = ys @). D.42) Рассмотрим последовательность {sn} —>¦ s/ T *). Обозначил! через А,, (и;) состояние системы, определяющееся как решение зада- задачи D.37), и покажем, что lSn (w) ->- Л8 И слабо в И^ @, 1) 2). D.43) ') Доказательство п случае s = Т будет проведено ниже, после лем- леммы 4.6.— Прим. перев. 2) Напомним, что W@,1)={А, | Ъ? Л2@, 1; F), й/й ? Л2@, 1; F')} (см.A.8)). Ю-1230
146 Гл. 3. Управление параболическимп системами Легко видеть, что элементы XSn остаются в некотором ограни- ограниченном подмножестве пространства L2@, 1; V). С помощью урав- уравнения D.37) нетрудно убедиться, что kSn при sn ->¦ s принадлежат ограниченному ) I (^ 44) подмножеству пространства W@, 1). J Следовательно, можно извлечь такую подпоследовательность {вц}, ЧТО lSii = lSii(w)^l слабо в W@, 1). D.45) Если т)з — фиксированный элемент пространства V, то ({Т - v> AtVL (x) kS}l (т), ф) = (XS[i (т), (Т - «J л:ц (т) ф) и (Г —sJi)^*[l(T)iJ5->-(r —s) Л*(тI|5 сильно в ?2@, 1; F). Таким образом, последовательность отображений сходится (например, в пространстве 3' @, 1)) к отображению и тогда из уравнения D.37) (при s = s^) следует, что ах Так как А,@) = h, то А, = A,s (w), откуда и вытекает D.43). Покажем теперь, что Кп И = Кп->-hM=k сильно в W@, 1). D.46) Для этого рассмотрим последовательность 1 л Х„ =UT~ sn) D,n (К - К), Кп ~K)dx + ^\ kSn A) - Я, A) |2. о ^ Учитывая D.37) (при фиксированном w и s = sn), находим 1 Г 1 хп = J (Т — sn) (BSnw, kSn) dx—\ J (Г — sn) (As ls , Xs) dx + о L о
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати (I) 147 откуда, согласно D.43) и D.37) следует, что Хп -+ J (Т - s) (Bsw, К) dr-l(T-s) (AX, К) dx + о о Так как Xn>a inf (T — sn) \\Kn ~ h ||2 /,2<o, i; v), то KSji -+_%, сильно в L2@, 1; V). Используя затем тот факт, что 23 = - (Т - *„) A Sn (т) Я.8п + B' - sn) BSn (т) w, dx получаем соотношение D.46). Пусть теперь ws — оптимальное управление для системы, опи- описываемой соотношениями D.37), D.38). В силу D.46) а потому ЙтЛ„Кп)</.К). D.47) Далее, как и при доказательстве леммы 4.2, убеждаемся, что эле- мепты wSji принадлежат некоторому ограниченному подмножеству пространства L2 @, 1; Е). Извлечем такую подпоследовательность {«;s }, что ws —>• w слабо в L2 @, 1; Е); заметим, что A,s (ws ) —>- ->¦ Xs (w) слабо в W@, 1). Как и при доказательстве леммы 4.2, заключаем отсюда, что w = ws, XSn ->- Xa слабо в W @, 1) и M-Sn-^M-S слабо в ^@,1). D.48) Так как kSn = P,,n, ц3п = у%, то в силу D.48) Vsn (°) = ysn @) = Р (s") fe"+ Ц. (°) = Та @) = Р (8) h слабо в //. Л е м м а 4.5. Существует такая константа С\, что 1 Р (s) h | < С4 | h | V/i 6 //, V* 6 Ю, T]. D.49) Доказательство. Решение {Р, у} задачи D.28) позво- позволяет найти оптимальное управление для системы, состояние кото- которой описывается соотношениями D.14), а функция стоимости — равенством D.15), причем / — 0 и zn — 0. Эту функцию стоимости обозначим через J'sl (v). Если и — оптимальное управление, то A|2, C2 = const. D.50) 10*
148 Гл. 3. Управление параболическими системами Кроме того, для оптимального управления и В*у + KENu = О в (s, T). D.51) Из соотношений D.28) вытекает, что ] (ср, Ср) dt= ] (?>2р, Р) dt= ] (- ^- + А*у, р) dt= s s s \ at I = (т(«). Р(*))+ at ' а в силу D.51) т т \ (Nu, u)E dt = I (В*у, ЛГ*As' S S Таким образом, о h,h), D.52) откуда с учетом оценки D.50) получаем неравенство D.49). Попутно доказана Лемма 4.6. Справедлива формула D.52), так что (Р (в) A, fc)>0 Vfe б Я. D.53) Продолжение доказательства леи- м ы 4.4 г). Пусть теперь s — 2'; рассмотрим последовательность isn}->-T- Тогда в силу равенства D.38) множество функций Ут — snwsn ограничено в L2 @, 1; Е). Если обозначить через f>Sji и ySn состояние системы и сопряженное состояние, соответствующие управлению wSn, то легко проверить, что множество функций rfT — «пРя, ограничено в L2 @, 1; V); множество функций ]/"?' — snYsra ограничено в L2 @, 1; F). Далее, из первых двух соотношений D.36) следует, что Ф»^0, ^а^О в L2@, 1;F'), а отсюда с помощью двух последних равепств D.36) заключаем, что ps ->- h и Ys ->¦ 0 в пространстве непрерывных функций Добавлено автором при подготовке русского издания.— Прим. перев.
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати (I) 149 Следовательно, Р (sn) h = ySn @) ->¦ 0 в пространстве V при sn ->- Т. В силу леммы 4.5 можпо извлечь такую подпоследова- подпоследовательность — мы ее также обозначим через {$„},— что Р (sn) h ->- 0 слабо в пространстве Н. 4.3. Формальные преобразования Исходя из тождества D.27), проведем ряд формальных преобра- зований, которые будут обосновапы ниже. Продифференцируем формально тождество D.27), используя общее обозначение dX/dt = X', и результат подставим во второе из уравнений D.9): - Р'у - Ру' - г' + А*р - D2y = g. Затем, используя первое уравнение из D.9), найдем Заменим здесь р по формуле D.27); тогда (_/>' + РА) у - Pf + PDi (Ру + г) - r'-f + А* (Ру + г) -Вгу = g, или (—Р' + РА -Ь А*Р + PDiP — D2) у + + (- г' + A*r + PDir — Pf — g) = 0. D.54) Так как у «произвольно» (это тоже должно быть обосновано!), то система D.9) «эквивалентна» соотношениям + ++ ^ = D2 в @, Т); D.55) dt ^ + + iPf + g в @, Г)- D-56) dt Далее, тождество D.27) при t = Т дает р(Т) = Р (Т) у(Т) + г (Т) = 0, что «эквивалентно» равенствам Р (Т) = 0, D.57) г (Т) = 0. D.58) Таким образом, формально получен следующий результат: оператор Р (t) ?_% (Н; П) определяется как решение нелинейного уравнения типа Риккати D.55) с граничным условием D.57),
150 Гл. 3. Управление параболическими системами а функция г (t) определяется как решение абстрактного параболи- параболического уравнения 0.56) с граничным условием D.58). Замечание 4.1. В дальнейшем проведенные преобразова- преобразования „будут обоснованы. Подчеркнем, что существование оператора Р {t) установлено в следствии 4.2; при доказательстве этого факта прямое решение задачи D.55), D.57) не используется. 4.4. Конечномерный случай; аппроксимация Для обоснования преобразований, проведенных в разд. 4.3, мы будем аппроксимировать нашу задачу аналогичными конечно- конечномерными задачами — к таким задачам приводит применение мето- метода Фаедо — Галеркипа. Пусть wi, . . ., wm, . . .— базис пространства V (в смысле разд. 1.4). Пусть ут (v) обозначает т-е приближение состояния, являю- являющееся решением задачи \ dt = (/(О, Щ) + (Б (t) v(t), wj), 1 </ < m; \ D.59) m Ут (О; v) = yOm= J! limWi -+y0 в II при где ут (t; v) нринадлежит подпространству, порожденному эле- элементами Wi, . . ., Wm. Рассмотрим функцию стоимости Jm {v) = 11| С (t) Ут (t; v) - z-A (t) \\l dt + \ (N(t) v, v)Kdt D.60) о о избудем искать \niJm(v) при v? L2@, T; E) = Ш. V Пусть ит обозначает т-е приближение оптимального управ- управления. Определим т-е приближение сопряженного состояния Рт {t\ v) как решение задачи t;v) -*+a*(t;pm(t;v),wj) = = (Cym (t; v) - *„, С (t) Wj)E, pm(T;v) = 0, где рт (t; v) принадлежит подпространству, порожденному эле- элементами W\, . . ., Wm.
$ 4. Расцепление и интегро-дифферепциалъное уравнение Риккати (I) 151 Для оптимального управления ит удовлетворяются соотно- соотношения D.59), D.61) (при v = ит) и В*рт + ЛлЛГит = 0. D.62) Исключая отсюда ит, получаем (в обозначениях разд. 4.1) задачу D'63) №, wj] + a(t; ym, wj) + (Dt (t)pm, w,) = (/(t), w}), S dt ' *Ь±, W/)+ a* (t; Pm, wj) - (Dz (t) ym, w,) = (g (t), dt ' О) = Уот^Уо, Pm(T)=0. Теорема 4.1. Пусть выполнены предположения разд. 4.1, функция стоимости Jm (v) для приближенной задачи порядка т D.59) имеет вид D.60), а оптимальное управление ит получается из решения задачи D.63) согласно соотношению D.62). Тогда inf Jm (v) = Jm (um) ->-inf / (v) = J (u); V V r2 , um->-u сильно в L @, T; E) = 11; Ут-^У, Рт-^-Р СилЬНО в L2@, T\ V). Доказательство. Как известно (см. примечание 1 на стр. 114), ут (t; v) -v у (t; v) сильно в L2 @, Т; V). Очевидно, что Jm (um) < Jm (и) ->¦ / (и), откуда lim Jm (um) ^ ^ / (и). Так как т о то можно извлечь такую подпоследовательность {и^}, что ий->- и слабо в пространстве <U. Тогда у^ (ий) ->¦ у (и) слабо в L2 @; Т; V), так что lim J ^{u^^-J {и). Следовательно, и— и. Итак, Jm(um) ->¦ J (и) И Um ->- Ы Слабо В <2?, и потому Ут ^~- Ут(ит) -*у(и) слабо в L2@, Г; F) и Рт = Рт{ит) -+р(и) слабо в ?2@, Г; F). Но так как Jт (ит) -*- J (и), то (рассуждаем от противного) т т J (Num, um) dt^ l'{Nu, и) dt.
152 Гл. 3. Управление параболическими системами Отсюда, поскольку ит ->• и слабо в Ш, следует, что ит^- и силь- сильно в °И и утверждение теоремы очевидно. Теперь можно «расцепить» конечномерную задачу D.63), как мы это делали в предыдущем раздело. Пусть Vm — подпространство, порожденное элементами w\, . . ., wm. J ' ' Рассмотрим в подпространстве Fm задачу, аналогичную зада- задаче D.12), D.13): _ . ,, . а (t; 4>т, Щ) + (Di (t) т|зт, Wj) = (/ (it), w}), dt 1 D.65) - -p, Wj) + a* (t; г|)т, г^) - (D2 (t) Фт, ^) = (g(t), Wj), \ dt где 1 ^ / ^ m, a h — данный элемент подпространства Vm. Тогда Vm(*) = Pm(s)h + rm(8), 1 i°m (*) 6 5? (Fm; Vm), rm (s) 6 Fm, Pi (s) = Pm (s), J U'bb) и мы имеем тождество Pm (t) = Pm (t) Ут (*) + rm (t). D.67) Формальные преобразования, аналогичные выполненным в разд. 4.3, приводят к соотношениям — —— i»i, W} + a (f, wu Pmwj) + a* (t; Pmwt, ws) + ") \ dt I I (DiPnwt, PmwJ) = (Diw,, Wj) Mi, j, 1<г, /<m; I D.68) ^ , ^ I + a* (t; rm, Wj) + ait / (P*j + g,W]) V/, Обратно, пусть /Jm (t) — локальное решение системы уравнений Риккати D.68), определенное на интервале (s, Т), где Т — s
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати A) 153- достаточно мало. Пусть rm (t) — решение задачи D.69), опреде- определенное на том же интервале. Тогда, если определить Рт (S) ¦"= Рт (*) Ут (*) "И Гт (S), можно получить соотношение, аналогичное D.52) (для размер- размерности т), и аналогичную D.49) оценку \Pm(s)h\^Cl\h\ VA 6 Vm, D.70) где С\ — константа, не зависящая от s и т. Следовательно, решение Рт задачи D.68) и решение гт зада- задачи D.69) существуют глобально, т. о. на всем интервале @, Т). Тем самым обоснованы равенства D.68), D.69), т. е. доказана Теорема 4.2. Если выполнены условия теоремы 4.1, то оператор Рт (t) и функция rm (t) отображают отрезок [0, Т] соответственно в пространства ? (Fm; Fm) и Vm и имеют изме- измеримые и ограниченные производные по t; при этом Рт — решение системы Риккати D.68), а гт — решение задачи D.69). Кроме- того, выполняется неравенство D.70). Теперь устремим т к бесконечности. 4.5. Предельный переход Применяя аналог теоремы 4.1 к царе функций {фт, tym}, где- Фт (*) ¦-= h ? Fmo, m>m0, получаем фт ->• ф и 1рт ->• я(з сильно в L2 (s, T; V), где {ф, ij)} —решение задачи D.14), D.16), D.17). С помощью второго из уравнений D.65) легко проворить оценку I ^m (*) I < const, D.71) а значит, можно считать, что -ф^ (s)->-x слабо в пространстве П. Но. т (% (*), Щ) = 1 [a* (t; %, wj) — (Д2ф^, w}) ~ (g, так что (x, Wj) = (ij) (s), Wj) при всех /, откуда X = ip (*). D.72) Поэтому ^m (*) = Pm (*) k + rm (s) -> г|; (*) = P (s) h -\- r (s) слабо в Н. D.73) Положим в соотношении D.73) сначала h — 0, а затем будем считать h произвольныл!; тогда rm (s) -^ r (*) слабо в Я Vs; D.74) ^m {s)h-+P (s) h слабо в Я Vft 6 Fm<), Vs. D.75)
154 Гл. 3. Управление параболическими системами В силу теоремы Лебега из соотношения D.75) следует, что (Рт (*) h, h) -+ (P (s) h, h) в D (О, Г) V/i 6 Vmo, Ti?H, D.76) и, таким образом, справедлива Теорема 4.3. Если выполнены условия теоремы 4.2 и т -> —>• оо, то Рт —v /* е тож смысле, что (Pmh, h) -+ (/%, Л) e L1 (О, Л V/г 6 Fmo, fe 6 Я (то — произвольное фиксированное число), а гт —>¦ г слабо в про- пространстве L2(Q, Т; Я). 4.6. Интегро-дифференциальное уравнение Риккати Перейдем теперь к пределу в задачах D.68) и D.69) и получим соотношения D.55) — D.58). Возникающие при этом трудности связаны с нелинейностью задачи D.68) (и наличием члена PmD\rm в первом из равенств D.69)). Этот предельный переход мы совершим при дополнительном, довольно жестком, предположении 1); в следующем разделе мы приведем пример, когда это предположение не выполняется, но тем не менее соотношения D.55) — D.58) можно непосредственно обосновать. Это дополнительное предположение таково: В (t) 6 ^ (Е; II) (вместо X (Е; V')) D.77) и вложение пространства V в Н вполне непрерывно D.78) (это условие не налагает никаких ограничений на отображения, ¦если, например, множество Q ограничено). Лемма 4.7. Если кроме условий теоремы 4.1 выполнены еще условия D.77), D.78) и f 6 L* (О, Т; Н), то re W@, T) [m. e. r6L2@, T; V), -^6^@, Г; F')) • D.79) Доказательство. Так как (PmDirm, wj) = (Dtrm, PmWj), (Pmf, W}) = (/, PmW}), то первое из соотношений D.69) позволяет записать (- ~ , rm)+a*(t; rn, rm) = -D1 (rmPmrm) + (/, Pmrm) + (g, rm). \ at ! Вероятно, излишнем.
§ 4. Расцепление и интегро-дифференциальное уравнение Риккати (I) 155 Интегрируя это равенство от s до Т и нринимая во внимание оцен- оценку D.70), получаем i1 rm (s) |2 + a J 11 rm (а) 112 da - X J | rm (о) |г da < откуда rm (*)|2+[l|rm (a) ||2 da^c] \ rm(<j) |2 da + \g(a)\\v,)da. D.80) Используя неравенство Гронуола, заключаем, что D.81) о Далее, из соотношений D.69) следует, что fe, wj) = (pm W, н;у)г, rm (Г) = 0; 1 dt I j D_82) функция pm ограничена в L2@, Г; V). J Продолжим pm нулем вне интервала @, Т). Так как rm(T) = 0, то можно считать, что ^(р™^'"^ на к Сделав преобразование Фурье но t (ф — преобразование Фурье для ф), будем иметь h (rm (t), wj) = (pm (т), Wj)v, D.83) где Умножим равенство D.83) на gjm (т) и просуммируем затем по /; получим iTl.l^Wl^llftnWH.IIr^WII, откуда 1 |т|]7:т(т)]2йт< const. D.84) —оо Оценка D.84) показывает, что производная порядка V2 от функции rm но переменной t ограничена в пространстве
156 Гл. 3. Управление параболическими системами L2 (О, Т; Я) при иг ->- оо. Согласно лемме о компактности (см. Лиопс [3, предложение 4.2]), можно извлечь такую подпосле- подпоследовательность {гу,}, что г^^г слабо в L2 @. /'; V) 1), r^-^г сильно в L2 @, Т; II) 2). Поэтому т т о ' о -> \(Dir,Pwj<p)dt Уф 6 С0 [0, Г], о и тогда, в частности, {РцР(г^, Wj) -v {PDir, wj) в ^'(@, 71)). Таким образом, в соотношениях D.69) можно перейти к пре- пределу при т—>- оо; в результате получим dr \ - — , ^ + a* (t; r, wj) + (PDtr, ws) - (Pf + ft щ) У/ , df / откуда и следует D.56). Из пего вытекает, что dr/dt gL2@, T7; F'), а потому соотношение D.79) справедливо. Теорема 4.4. Пусть кроме условий теоремы 4.1 выполнены еще условия D.77), D.78) и / ? Z/2@, Г; Я). .Ей/ш {г/, р}. — решение задачи D.9), D.11), определяющее оптимальное управление, то р=:Ру + г, D.85) где оператор Р и функция г обладают следующими свойствами: P(?)?Z(H;H), P*(t) = P(t); если л\ 6 W @, Т) и dx\/dt + Л (*)т| 6 ?2 @, Г; Я), }> D.86) иго P(*)ti6JF@, Т)\ Р удовлетворяет уравнению D.55) в том смысле, что dP РАг\ D.87) есеа; г) g И^@, Т), для которых drtfdt + A(f)i]eL2@, Т; Н), Ai\ 6L2@, Т; Я), :) Этот факт вместе с оценкой D.84) доказан для нелинейных задач Лионсом [6]. 2) Мы уже знаем, что rm-+ г слабо в пространстве I? @, Т; Н) (см. тео- теорему 4.3).
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати (I) 157 и граничному условию Р (Т) = 0; г — решение в пространстве W @, Т) задачи D.56), D.58). Оператор Р и функция г опреде- определяются однозначно. Доказательство. Пусть функция г| обладает указан- указанными в D.86) свойствами. Обозначим через р решение задачи *p D2r\ + g, p(T) = 0, at а затем определим / формулой f=^- + A{t)r\ + DlP; feL2(Q,T;II). at Если положить г/о — Ц @), то пара {ц , р} будет решением зада- задачи D.9), D.11). Следовательно, р = Рг\ -\- г, и так как г ? W @, Т) (см. лемму 4.7), то утверждения D.86) справедливы. Пусть в — пространство функций ц, обладающих указанны- указанными в D.87) свойствами (следовательно, г\' ? L2 @, Т; Щ). Тогда dt \dt — линейное непрерывное отображение О ->• L2 (О, Т; V). На пересечении 6 f| ^ ((О, Т); II) оно совпадает с отображением г| ->¦ Р' (t) Tt\ — —j-^- т|, где Р' (t) — обобщенная производная ото- отображения t ->¦ Р (t) отрезка [О, Т] в пространство X (II; Н). Таким образом, можно считать, что (pmpw№)pm(^ dt \ dt I \ dt (на самом деле это соотношение полностью обосновано лишь при условии, что пересечение Qo [\ 3) (@, Т); II) плотно в пространстве ео= {rihee, Л@) -гкл -о». Проведенные в разд. 4.3 преобразования (при у — 1]) можно провести и здесь, так что, пользуясь введенными в начале дока- доказательства обозначениями, получаем соотношение D.87) и равен- равенство D.56). Поскольку, кроме того, должно быть Р (Т) у (Т) -\- + г (Т) ~ 0 при любом у (Т), соотношения D.57) и D.58) доказаны. Остается лишь показать, что соотношения D.86), D.87), D.57) однозначно определяют оператор Р, а D.56), D.58) — функцию г. Предположим, что Р и г удовлетворяют указанным соотношениям.
158 Гл. 3. Управление параболическими системами Пусть у — решение задачи EL + Ay + DlPy = f-Dir, y(O) = yo, at и пусть р = Ру + г. Тогда легко проверить, что р удовлетворяет уравнению dt а значит, пара {у, р} служит решением задачи D.9), D.11). Отсюда и следует единственность Риг. Замечание 4.2. Нелинейное уравнение D.55) (или D.87)) является эволюционным уравнением тина Риккати (конкретные примеры см. в следующем параграфе). Замечание 4.3. Оператор Р (t) и функция г (t) позволяют осуществить синтез оптимального управления (обратную связь): оптимальное управление определяется через состояние системы по формуле и (t) = - N (t) А^В* (t) [P (t) y(t)+r (t)). D.88) Тем самым мы получаем обобщение результатов, известных для конечномерного случая (см. Калман [1], [2]), на ограниченные операторы. Замечание 4.4. Если область определения оператора A (t) в пространстве //не зависит от переменной t, т. е. D (A (t)) = — D при всех t ? [О, Т], то в соотношении D.87) можно взять г| ? D независимо от t. 4.7. Связь с теорией Гамильтона — Якоби Для простоты изложения ограничимся случаем, когда в преды- предыдущих задачах / - 0 и гд = 0. Рассмотрим систему, состояние которой определяется как решение задачи dt \ D.89) у (s; v)=h, J а функция стоимости имеет вид (см. доказательство леммы 4.5) JUv) =] [|| Су (t; v) ||| + (Nv, v)E] dt. D.90)
§ 4. Расцепление и интегро-дифференциалъное уравнение Риккати (I) 159 Положим W'(h, s) = 4inf ^»' v^L2(s, T; E), D.91) и поставим своей целью получить соотношение, которому удовлет- удовлетворяют функции W, dWIds и dWIdh (производная понимается в смысле Фреше). Заметим (см. D.52)), что W'(h,s) = ~(P(s)h,h), D.92) и, значит, Л dw(h,s) =p()h ' / ' dh ds 2 \ ds ' / ' dh Применяя равенство D.87) (предполагается, что оно выполнено!), получаем (если h 6 V) - — (P(s)h, h) + (Л (s)h,P(s)h) + (P(s)h, A (s)h) + ds + (TV (*)Л^1^*(*)P(s)К В*(s)P(s)h) = (D2(s)h,h) = \\C(s)h\&. Таким образом, если ввести функцию Я0(А, р, s) = 1 UC(s)h\\l - (р, A (s) К) - (N-i(s)AE1B*(s)p, B*(s)p) D.93) (здееь h и р —«независимые переменные» в пространстве V), то _о, A€F,s6@,r). D.94, ds Введем гамильтониан Я (А, р, s, e)~\\C(s)h\fF - (р, A (s) h) + i (#(*) е, е) + (р, Д (s) e). D.95) Легко проверить, что Н° (h, p, s) = inf Я (А, р, s, е). D.96) Следовательно, уравнение D.94) можно записать в эквивалентной форме , s, \ о, i6V, 0<s<r.
160 Гл. 3. Управление параболическими системами Уравнение D.94') (или D.94)) представляет собой уравнение Гамильтона — Якоби. Разумеется, к нол1у нужно присоединить еще граничное условие W (Л, T) = 0. D.97) Замечание 4.5. Уравнение D.94) — это дифференциаль- дифференциальное уравнение с частными производными типа Фреше — Вольтер- ра. В рассматриваемом случае, когда ограничения па управление отсутствуют, оператор h ->¦ dlP (h, s)ldh линеен, но это свойство не является общим (см. разд. 4.8). 4.8. Случай наличия ограничений на управление Возникает следующий естественный вопрос: можно ли полу- получить уравнение D.94') в случае наличия ограничений на управле- управление? Пользуясь методом динамического программирования (см. Беллман [1]), покажем, что формально это возможно. Пусть Ч1д - {о | v 6 L* @, Т; Е), v (t) ? Ев), D.98) где Eg — выпуклое замкнутое подмножество пространства Е. Введем функцию (ср. с D.96)) 11° (К р, s) = inf Л (h, p, s, е) D.99) оЧЕ л «проверим» (формально), что ds \ Oh где теперь fr(h, s)=4 inf J's(v). D.101) 1 rfUo Возьмем число б, 0 ¦< 6 ¦< 7 — s (потом 6 устремим к нулю). Тогда 8-\ 6 S-6 2W (h, s) = inf { J ||Cj/(f; у) |[|-df + J (Л'у, у)е rfi -j- s-l 6 Положим v (s) — e (где е 6 Ed). Из соотношений D.89) получаем (подчеркнем еще раз, что наши рассуждения носят формальный характер), что у (s + б; v) = y (s) + b[B(s)e~A (s) h] + О F),
§ 4. Расцепление и интегро-дифференциальное уравнение Риккати (I) 161 где б || О (б) || -*- 0 при б -*- О, а норма берется в смысле соответ- соответствующего пространства (в пашем случае пространства V). Тогда 2ЗЛА, *) =inf {б[\\C(s)h\\2F + (N(s) e, e)E] + V D.102) где переменную v, по которой берётся пижпяя грань, можно рас- рассматривать как пару {е, v |s+a}- В соотношении D.102) функцию у (р, v) можно рассматривать как состояние системы, описываемой на интервале (s + б, Т) уравнением D.89) с начальным условием у (s -}- б; v) = h + б IB (s) е - А (*) h] + О (б). В таком случае inf J [||^(«; !;)!& +(ЛГу, v)E]dt = V S+6 = 27F (h + б [5 (*) е - Л (*) Л], « + б) + О (б). D.103) Но («принцип оптимальности» Беллмапа [1]) 27Г(М)= ^f е?Ед откуда Й, *)= inf ¦f 2W(h + 6[B (*) e - Л (*) Л], s + 6) + 0F)} = = inf l Так как члены 2 F*(fe, s) слева и справа взаимно уничтожаются, то после деления на 26 имеем j IIС(s) h\\% -f у (iV(*) в, е)в} = О, откуда и следует соотношение D.100). 11 — 1230
162 Гл. 3. Управление параболическими системами 4-9. Дополнительные замечания1) 4.9.1. Прямое исследование уравнения Риккати. Мы пока- покажем сейчас, как можно провести «прямое» исследование некоторых систем типа D.9) (т. е. не использующее связи этих систем с тео- теорией управления). Рассмотрим два гильбертовых пространства Vt (i = 1, 2), Vt cz H, V' i плотно в II, и два оператораЛь Ао, удовлетворяющих условиям .. 0 (Atv, у)>а|М&„ сс>0, VveVu 1 = 1,2.1 { ' Речь будет идти о следующей «двухточечной граничной задаче»: } D.105) y@) = 0, p(T) = 0. D.106) Замечание 4.6. С одной стороны, система D.105) более общая, чем система D.9), поскольку здесь допустимы соотношения Vi Ф V2, A2 Ф А*; с другой стороны, система D.105) менее общая, чем система D.9), поскольку здесь Di (t) ~~ — /, D2 (I) -- — /. Добавим, что нриведениые пиже исследования легко распростра- распространяются на случай, когда операторы 4( и 42 зависят от неремен- пой t. Ответ на вопрос о разрешимости системы D.105) при гранич- граничных условиях D.106) можно получить двумя способами. (i) Положим idldt 0, \ /Л4- A=[ 0 -d/dt)'A-[l тогда систему D.105) можно записать в эквивалентной форм© Aw + Aw = F. Заметим, что в силу граничных условий D.106) ] (Лш, w) dt = 4 {| у (Т) |2 + | р @) |2} > 0, о z :) Добавлено автором к английскому переводу книги.— Прим. перев.
§ 4. Расцепление и интегро-дифференциальное уравнение Риккати (!) 1G3 а в силу предположений D.104) т т I (Aw, w)dt=l [(Atf, у) + (А2р, р)] dt > о о Отсюда и следует существование и единственность решении зада- задачи D.105), D.106) (Лионе и Маджонес [1, т. 1, теорема 1.1]). Более точные результаты получены Лионсом [3]. (И) Другой метод, нринадлежащий Куперу [1], примепим при более ограничительных предположениях относительно операторов Ai, An, по зато он дает сильное решение, йдюнпо, будем считать, что выполнены условия D.104) и, кроме того, оба оператора At, ? — 1,2, симметричны, т. е. (Л,ф, г|з) = (Ф, AS Уф,я|) 6 Vt, i = I, 2. 'D.107) Если положить то систему D.105) можно переписать в эквивалентной форме dw , -G. D.109) dt Умножим обе части равенства D.109) скалярпо па dw и заметим,, что тс Idw о \ dt Так как Jh — сюръективное отображение, то из этого неравенства следует существование и единственность решения задачи D.105), D.10G). Более подробно этот вопрос изложен у Лионса [3]. 4.9.2. Другой подход к прямому исследованию уравне- уравнения Риккати. Мы хоти.м упомянуть здесь, опуская технические детали, некоторые результаты Да Прато [1], {21. Эти результаты касаются «прямого» исследования «абстрактного» дифференциаль- дифференциального уравнения с частными производными вида D.87) или более общего вид? dP — 4-РА1 + А2Р4-Ф(Р)=В, D.110) dt где В — данный оператор, 4(иЛ2 — не обязательно сопряженные друг к другу операторы, аФ- некоторая нелинейная аналити- аналитическая функция. 11*
164 Гл. 3. Управление параболическими системами В работе Да Прато [1] изучается случай, когда операторы At (i — 1, 2) не зависят от переменной t. Доказывается локальная теорема существования и единствеппости (решение Р (t) уравне- уравнения D.110) однозначно определяется па малом отрезке [Т — а, Т\); локальное решение является глобальным, если известна некото- некоторая априорная оценка. Случай, когда операторы At зависят от переменной t, и соответствующие примеры рассмотрены в работе Да Прато [2]. При проведении доказательств используется вво- вводимый специально новый класс полугрупп в пространстве линей- линейных непрерывных отображений. 4.9.3. Еще один подход к прямому исследованию уравне- уравнения Риккати. Еще один метод «прямого» исследования уравнений Риккати тина D.87) предложил Темам [1]; этот метод дает также возможность конструктивно построить приближенное решение (соответствующие алгоритмы вместе с численными расчетами см. у Неделока [1]). Изложим вкратце суть этого метода. Рассмотрим уравнение типа D.87). Для того чтобы воспользоваться более привычными обозначениями, обратим время t и обозначим неизвестный опера- оператор через Q: ^ + A*Q + QA + QQ = F, D.111) at Q(O) = QO. D.112) Описываемый метод применим также и в случае, когда в уравне- уравнении D.111) вместо члена QQ стоит произведение Q . . . Q произ- произвольного числа сомножителей. Пусть Ш — пространство операторов II ->¦ Н типа Гильбор - та — Шмидта х). Предположим, что Qoem, Qo>o. I < Приближенное значение Qn оператора Q в момент времени nAt определяется следующим образом. Положим Q" = Qo. Если значение Q4 уже известно (<?" € Ш, (?п>0), то значение Qn+1 находится в три этапа (это вариант хорошо известного «метода дробных шагов», см. Яненко [11, Темам [3]): (i) находим Qn+V3 ц3 равепства + QnQn+l/3 = 0; D.114) /Л Ъ в результате однозначно определяется оператор (9"+1/3 с <?w+1/3 > 0; х) Снабженное естественной структурой! гильбертова, пространства.
4, Расцепление и интегро-дифференциалъное уравнение Риккати (I) 165 (ii) находим ()п+2/3 из равенства \ (n+l)At г ^(a)dT. D.115) лп+2/З /in+i/З \ (n+l)At Ч -V j+mJ г А* в результате однозначно определяется оператор (}п+2/3: У типа Гильберта — Шмидта; (Ш) находим ()n+1 из равенства /on+l лп+2/3 в результате однозначно определяется оператор Qn+1 ?<Ш, (?п+1>0 (причем Qn+1: H -*- V есть оператор типа Гильберта — Шмидта). Можно получить далее «энергетические оценки» (см. Томам [1]). Определяя Qm как кусочно постоянную функцию, равную Qn на [п№, (п ~ 1) At), можно доказать, что (в подходящим обра- образом введенной топологии) Q&t стремится при At -> 0 к решению Q задачи D.111), D.112), обладающему следующими свойствами: . Q б?2@, Т; Т), где Т — пространство операторов "J V -+ II и // -> V типа Гильберта — Шмидта; I D.117) Q6L<»@, Т; ей?); Q(t)>0. J Замечание 4.7. Свойства регулярности решения зада- задачи D.111), D.112) (в предположении регулярности данных эле- элементов) изучал Темам [1]. Замечание 4.8. Метод Темама применим и в случае, ког- когда А — оператор произвольного четного порядка. В том специаль- специальном случае, когда А — эллиптический оператор второго порядка, другой путь «прямого» изучения уравнения Рмккати предложил Кушнёр Ц]. Замечание 4.9. Метод Дробных шагов применяется для решения пекоторых классов нелинейных дифференциальных урав- уравнений с частными производными (см. Демидов и Марчук [1] Темам [2], Лионе ИЗ, гл. 4]). Замечание 4.10. Еще одип подход к исследованию зада- задачи D.111), D.112), использующий нелинейные полугруппы, раз- разработал Брозис [4] 2). Он рассмотрел также вариационные неравен- неравенства, связанные с уравнением D.111). Отметим, что вопрос интер- интерпретации этих порапопств в терминах теории оптимального управ- управления остается открытым. :) См. также Брезис [5],— Прим. перев.
166 Гл. 3. Управление параболическими системами § 5. Расцепление и иптегро-дифференциалыгое уравнение Риккати (II) 5.1. Приложение теоремы Шварца о ядрах Рассмотрим случай 3.1.1 из разд. 3.1. В дополнение к сформу- сформулированным там предположениям будем считать, что Е = II = = L2 (Q), В (t) — тождественный оператор (так что применима теорема 4.4), N (t) —_N, CK(t) — вложение V ->¦ Н, D2 (t) — тож- тождественный оператор, Di (t) = N~l. Согласно теореме Шварца о ядрах (Шварц [2], [3]), P(tL, = lP(x, g, ?)чA)<%, cP6S(Q), E.1) a где Р (x, g, t) — ядро оператора Р (t), т. е. распределение на Qx X Qg, определяемое однозначно по оператору Р (t). Теорема 5.1. Пусть выполнены сделаннле только что пред- предположения. Тогда ядро Р (х, g, t) оператора Р (t), обладающего свойствами, указанными в теореме 4.4, удовлетворяет соотно- соотношениям Or (X, ?, I) у I л* , л *\ г) /~. ? Л | Ь \Ах + At) P № I, t) + dt + \Р(х, I, t)!TlP(?, I, t)dr = 8(x- I), E.2) Q P (x, l,t) = P (I, x, t), E.3) P (x, I, t) = 0, x 6 Г, I 6 Q, t 6 @, T) ^1 (и тогда в силу E.3) P (x, g, it) = 0, x 6 Q, g g Г, [ E-4) * 6 @, Г)); J P (x, I, T) - 0, ^^Qxx Q6. E.5) Замечание 5.1. Ядро Р (x, \, t) обладает, кроме того, свойствами регулярности, соответствующими свойствам, указан- указанным в D,86). В рассматриваемом случае можно получить, однако, более сильный результат. Действительно, как легко видеть — по крайней мере, если в выражении для оператора Л (х, t, д/дх) коэффициенты достаточно регулярны,— P(t)e%(L2(Q); Hl(Q))t E.6) Таким образом, в теореме устаповлопо существование гло- глобального решения нелинейной задачи E.2) — E.5) в некотором специальном классе функций (которые рассматриваются как ядра
§ 5. Расцепление и интегро-дифференциалъное уравнение Раккати (II) 167 линейных отображений). В нелинейных задачах выбор простран- пространства, в котором ищется решение, играет весьма существенную роль (гораздо более важную, чем в случае линейных задач). Доказательство теоремы 5.1. Равенство E.3) следует из того, что Р* (t) = P (t), а равенство E.5) вытекает из соотношения Р (?') — 0. Если (например) ф ? 3) (Q), то должно выполняться соотношение Р (t) ср ? L2 @, Т; V), а значит, Р (t) — = 0 на поверхности 2 — Г X @, Т) (так как V ¦— IJ\ (Q) и, сле- следовательно, выполняется соотношение E.4)). Заметим, что (для ср ? 3 (Q)) г) = I Р (х, I, t)A& (I) dl=]A\P {x, I, /)cp.(D dl, Q Q откуда видно, что ядром оператора Р (t) Л является Af Р (х, ?, t). Тогда (поскольку 8 (х — ?,) есть ядро тождественного оператора) из соотношения D.87) получаем равенство E.2). Замечание 5.2. Соотношения E.2) — E.5) представляют собой нелинейную задачу для уравнения с частными производны- производными параболического типа с нелинейностью «типа Риккати». Замечание 5.3. Результаты разд. 4.4 и 4.5 показывают, что можно аппроксимировать оператор Р, следуя методу Галор- кипа. 5.2. Пример: смешанная задача Неймана с граничным управлением Рассмотрим систему, описываемую уравнением C.16); функция стоимости имеет вид C.21) (пример 3.5). В этом случае пара {у, р} определяется как решение зада- задачи C.25). Можно применить далее результаты § 4, кроме тех (основных!), которые содержатся в разд. 4.6: так как в данном случае оператор В (t) ? % (L2 (Г); V) х) определяется соотно- соотношением (Ьи, Up) = (B(t)u,^,= l utydD, г то условие D.77) не выполняется. Тем но менее окончательные результаты, как мы увидим, остаются в силе; чтобы в этом убе- убедиться, надо рассуждать, как и в общем случае, но принять во вни- внимание специфику рассматриваемой частной задачи. г) На самом дело справедливо более сильное утверждение: у s > 0 В ? jf (L2 (Г); (н1/г+е (Q))'), по и этого недостаточно для возможно- возможности применить результаты разд. 4.6.
168 Гл. 3. Управление параболическими системами Выпишем для нашей задачи соотношения D.28) — D.31), опре- определяющие оператор Р (s) и функцию г (s): ператор Р (s) опреде- определяется через решение задачи ^1 + Лр = 0, -^±- + А*у-р = О в Qx(s,T); dt dt ду dv = 0 на Г х (*, Т); A dvA* l(x,s) = h(x), y(x,T)-. (h — данный элемент пространства L2(Ci)), а именно Р (a) h = y @, *); функция г (s) определяется через решение задачи E-7) E.8). а именно = 0 на Г X (s, T); г (х, s) = I (х, s), х 6 Q. E.9) E.10) Теорема 5.2. Пусть в выражении для оператора А (х, t, д/дх) коэффициенты регулярны *) в цилиндре Q X [0, Т] и граница Г регулярна2). Тогда оператор Р (t) удовлетворяет соотношениям - (Р'ф, ф) + a (t; Ф, Ptf) + а* (*; ^Ф, Р(Т) =0, Р* @ =.-P(i); а функция г (t) удовлетворяет соотношениям - (г', я|,) + а* (*; г, t|j) + (N~lr г (Т) = 0. Я1 1 (Q), E.11) E.12) E.13) E.14) J) Например, дважды пспрсрывпо дифференцируемы. 2) Например, дважды пепрерыппо дифференцируема.
§ 5. Расцепление и интегро-дифференциальное уравнение Риккати (II) 169 Если, кроме того, N = v/, v >¦ 0, то ядро Р (х, ?, t) оператора Р (t) удовлетворяет соотношениям 1 I P (x, С, О P (C g, 0 dl\ = б (a: - l) в Qx X Qs X @, J); r дР(х, г, t) =0 E.15) (х, l,t) = P (l, х, t); E.16) \ E-17) dvA* ' - ' ^Г' te{°'T)'j X QE.; E.18) Доказательство. 1) Заметим прежде всего, что E.19) Действительно, пусть р, у — решение задачи E.7); как известно, Р 6 L2 @, Т; Я1 (Q)). Рассмотрим совокупность соотношении --g- + ^*Y-P в Qx(s,T); ] = 0 на ^А* как граничную задачу для функции у. Тогда в силу сделанных предположений о регулярности (ср. со случаем задачи Дирихле в примере 3.1) у g 7/2.1 (Q x (s, Г)), и потому у (я, s) € Н1 (Q). Отсюда и следует E.19) (непрерывность оператора Р (s) прове- проверяется непосредственно 1)). Легко видеть, что s->- P (s) h есть непрерывное отображение [0, Т] ->¦ IIх (Q). Тогда Р @ г/ (f) 6 /.2 @, Т; V) (где F - Я1 (О)), и в силу равенства D.27) г = р - Ру б L* @, Т; V). Сделав замену t = s + т G" — s) (ср. с доказательством лем- леммы 4.4), нетрудно убедиться, что s ->- Р (s) /г — непрерывно дифференцируемое 1 /E.20) отобра?кепие [0, Т] -> F. х) Пли с помощью теоремы о замкнутом графике.
170 Гл. 3. Управление параболическими системами 2) Формальные преобразования разд. 4.3 можно теперь обосно- обосновать. Мы проведем их сейчас применительно к рассматриваемой задаче 1). Запишем задачу C.25) в вариационной форме: (у', ф) + а (*; у, <р) + (ЛГ'р, ф)гЛг) = (/, Ф) V<p 6Я1 (Й); 1 •- (р, я|>) + а* (ft р, Ч>) - (у, г|?) = - (гд, г» V^ б Я1 (Q); } E.21) 1/0, Р(?') = О. J Используя тождество р — Ру -\- г, из второго уравнения E.21) получаем ~(Р'У + РУ' + r',ip) + a* (t; Ру + г, я|>) - (у, у) = - (г„, ijj). E.22) Но так как — (Рг/', 'ф) = — {у'\ Pty) и,' согласно первому из уравнений E.21), _ (у', ру) = а («; у, Рг^) + (i^V, РУ)ь*ю ~ (Л то равенство E.22) принимает вид - (Р'у, Ч>) + «(*; г/, ^) + в* (<; /Y ^) + (iv-'p, Р^)ьад^ - (У, Ч>) - (г, ф) + а*(^; г, tjj) - (/, Рф) = - Bд, г|)). E.23) Заменяя в нем р на Рг/ + г, находим [- (Р'г/, я|>) + &(t; у] -(У, ^)]+ [- У, я|?) +а* (ft г, ф) - (Р/-2д, i|))]=0 V^ б Я1 (Q) E.24) Фиксируем t — s (что имеет сдшсд почти всюду); так как у (s) можно выбрать заранее произвольным образом, то из равенства E.24) получаем E.11), а затем]и E.13). 3) Ядро Р (х, g, t) оператора Р (t) удовлетворяет соотноше- соотношению E.16), поскольку Р* (t) = Р (t). При N ~ vl можно фор- формально провести следующие преобразования (используя ядра операторов): a (t; Ф, Рф) + a* (ft Рф, г[з) + v (Рф, -2 J) В копкретпих примерах проще проделать этп преобразования запово, чем применять общую теорию и выписывать выражения- для операторов — методы, изложенные в § 4, более важны, чем полученные там результаты.
5. Расцепление и интегро-дифференциалъное уравнение Риккати (II) 171 S1 ЙХЙ ЙХЙ Г (в силу равенства Р (х, %, t) = Р (?, х, х) дР(х, I, t) 2 У OXj хй 5 E ЙХЙ Г , ?, 0^(S, E, x)ij;(I)dxdl = (по формуле 1 рипа) Г.ХЙ. OV ЙХЙ I йхй + г J (J i> (x, ?, 0 P (g, |, 0 drt )ф (х) ф (I) QXB Г Подставляя получепиое выражение в равенство E.11), приходим к соотношениям E.15) и E.17). Замечание 5.4. Было бы интересно построить решение задачи типа E.15) — E.18) прямыми методами и получить утверж- утверждения о регулярности ядра. 5.3. Пример: смешанная задача Неймана с финальным наблюдением Рассмотрим систему, описываемую уравнением C.16); функция стоимости имеет вид_C.31) (пример 3.7). В этом случае пара {у, р} определяется как решение задачи C.35) и можно непосредственно применить рассуждения § 4. Оператор Р (s) определяется через решение задачи at at =-0 на Tx(s, T); E.25)
172 Гл. 3. Управление параболическими системами а именно P(s)h=ly(O, s); E.26) функция г (s) определяется через решение задачи А ^ 1 ] at at E'27) Ti(a?, *) = 0, l{x,T)=r\{x,T), а? ей а именно r (x, s) = I (x, s), sea. E.28) Если выполнены условия теоремы 5.2, то в силу регулярности решении параболических задач г (s) ? /71 (Q) и s -*¦ г (s) — непре- непрерывно дифференцируемая функция [О, Т\ ->- В1 (Q). Поэтому, исходя из тождества р (t) = P (t) y(t) + r (*), E.29) можно провести преобразования, аналогичные приведенным в разд. 4.3. Заметим, что задача C.35) записывается в вариационной фор- форме следующим образом: (у, Ф) + а (*; у, <р) + (JV-Jp, Ф)г..(г) - (/, Ф) Уф 6 Я1 (Й); ^ . -(р',я|з) + а'(*;р,т|)) = О У^бЯ^Й); } E.30) У(О) = уо, p(T)-y(T) = -zn. J Точно так же, как и теорема 5.2, доказывается Теорема 5.3. Если выполнены условия теоремы 5.2, то опе- оператор Р (t) удовлетворяет соотношениям t; ф, ГЦ)-\-a* [t; Py, Ц) + , i E.31) > = 0 Vc"' ' ' TTi'™ ' P (T) = I в Н, ^ E.32) :^* (*) = />(«), ¦ E.33) а функция г (t) удовлетворяет соотношениям — {r\ Ц) + a* (*; г, ф) + (iV~V, P^)b2(r) = (/, Рф) Vi]j ^Я'(Й), E.34) г (Г) = - 2д. E.35)
? 5. Расцепление и интегро-дифференциалъное уравнение Риккати (II) 173 Если, кроме того, N = vl, v > 0, то ядро Р (х, \, t) оператора Р (t) удовлетворяет соотношениям dP{x,l,t) | (Л. ] A^r{Xtlfi) , 1 5' X > E.36) > (ж, С, t) Р {I, I, t) d\\ = О в Qx X Q6 X (О, Г); I Р (г ? Т\ =i & (г ?\ <г % с О v Qte Г^ 37^ /? (ж, 6, *) = Р (g, ж, f); E.38) 5Р(ж, ?, г) ":3! - ¦ 1 ¦ v ' ь' ; =0, а: 6 Г, 16^. *6@, Л» E.39) г Замечание 5.5. Изложенный выше метод доказательства теоремы 5.2 общий; его можно использовать при рассмотрении любого из приведенных в этой главе примеров. 5.4. Пример: смешанная задача Неймана с финальным наблюдением и управлением из векторного подпространства Снова рассмотрим систему, описываемую уравнением C.16); «функция стоимости имеет вид C.31) (разд. 3.2). Предположим, что <Ud = {v | v с носителем в^^сЕ}, • E.40), т. G.ilg — замкпутое векторное подпространство пространства 11. Тогда оптимальное управление получается из решения задачи ¦%- + Ay = f, _^- + Л> = 0 в Q; ) at dt I = 0 на 2, -^- = 0 на 2-2,, P + N^- = 0 „a dvA dvA а именно dv
174 Гл. 3. Управление параболическими системами Расцепление задачи E.41) возможно, но это связано с боль- большими трудностями, за исключением случая, когда Zi = Г, х (О, Т), Г! с: Г. E.42) Если условие E.42) выполнено и N -— vl, v > 0, то для ядра Р (х, ?, t) получаем уравнедио (ср. с E.36)) яр --~ + (Л1 + А1)Р + у~'1р(х, I, t)Р(?, S, t)dl\ = О, E.43) Ot г( а соотношения E.37) — E.39) остаются без изменений. 5.5. Замечания о расцеплении при наличии ограничений на управление Пусть в дополнение к предположениям разд. 4.1 tig ~ {v | v 6 1L, v (t) 6 Ед почти всюду}, E.44) где Ед — выпуклое замкнутое подмножество пространства Е. Тогда оптимальное управление и определяется по теореме 2.1 т а в силу теоремы 2.1 гл. 2 условие B.21) эквивалентно условию (A-'jTp (I; и) + Nu(t), e - и(t))E >0 4e?Ea \ \ E-45) для почти всех t. ) Сделаем еще одно предположение (относительно множества Es)'. для любого | G Е, ? Ф 0, существует единст- "j вепный элемент Ф (Н) ? Ед, для которог > E.46) F, е - Ф A))Е > 0 Уе 6 Eg. J Пример 5.1. Пусть Ед = {е | || е \\Е ^ М}. Тогда В силу предположения E.46) условие E.45) эквивалентно условию либо и (t) = Ф (Л~'Б*р (t; и) + iVu(^), ") если AZlB'p(t;u)+Nu(f)=?O, } E.47) либо A^>(«;u)+iVu@==0. J Теперь можно расцепить задачу B.19), B.20), E.47) следую- следующим образом. В интервале (s, Т), 0 < s <; Т, рассмотрим (ср.
§ 6. Поведение при Т ->- оо 175 с леммой 4.1) нелинейную задачу т i л * I /~i * А / /~i \ / Т1\ _^. | /1 А ч ^_^ / /Л I / fT\ _ ^ 1 TJ | Р / 1 * 1 " "¦ —^— —Г" ^. \L/ ^—^— 1^ -L Л. Т,1 I \y VL/ aj"t / Л I О % JL J • и удовлетворяет E.47) почти всюду в (s, T). Эта задача имеет единственное решение, с помощью которого можно определить отображение h ^ -ф E) E.49) пространства Нъ себя. Но в силу условия E.47) отображение E.49) не является аффинным; именно из-за этого простой результат, аналогичный «интегро-дифференциальному уравпению Риккати»,. не получается. См. также § 14. § 6. Поведение при Т -*- оо 6.1. Предположения До сих пор мы считали, что Т <Z оо. Рассмотрим теперь вопрос, как оптимальное управление, оператор Р (t) и т. д. зависят от Т и как они себя ведут при Т —»- -|-оо. Пусть выполнены предположения разд. 4.1; будем считать, кроме того, что a (t; ф, ф)>-сс || ф ||2, а > О, V?^>0, Уф ? V х). F.1) Предположим, что операторы В (I), С (t), N (t) (разд. 4.1) опреде- определены для всех t^-О, причем Обозначим состояние системы через ут{и) (чтобы подчеркнуть его зависимость от 2'); таким образом, ут{и) — решение зада- задачи B.2) — B.4) па интервале (О, Т). Разумеется, если Т < I", то ут(и) — yr'(v) на интервале (О, Т); следовательно, вместо y-r(v) можно'писать y(v). Функция стоимости имеет вид т т JT(v)=l\\\C(t)y(t; v) — 2Д(t) ||fdt + J (N(t) v, v)Edt, F.2) о о ]) Иными словами, предполагается, что перавепство A.2) справедливо при ),= 0и для всех t !> О (см. также A.13)).
176 Гл. 3. Управление параболическими системами где zn — данная функция, 2д ??2@, оо; F). F.3) Тогда для каждого <Т существует единственное оптимальное управление щ? (рассматривается случай отсутствия ограничений на управление, но, очевидно, этот же результат справедлив и при наличии ограничений). Наконец, пусть {уТ, рт} — решение задачи D.9) — D.11) на интервале (О, Т) х), а Рт (t) и rT (t) — соответствующие опе- оператор Р (t) и функция г (t) (см. § 4). 6.2. Случай Т = оо Рассмотрим (в обозначениях разд. 6.1) задачу минимизации функции стоимости /к, (и) в случае отсутствия ограничений на управление. И в этой задаче оптимальное управление сущест- существует и единственно; обозначим его через Uco. Сопряженное состояние определяется как решение задачи v)~g, F.4) p + Ap(v) at p(v)eL2@,oo;V), F.5) где элемент g задан равенством D.10). Предложение 6.1. Сопряженное состояние р (и) соот- соотношениями F.4), F.5) определяется однозначно. Доказательство. 1) Для упрощения записи положим / = D%y (v) — g ? L2 @, со; V). Нужно показать существование и единственность функции р (и) — р ? L2 @, со; V), удовлетво- удовлетворяющей уравнению $L A'p = J. F.6) + Ap J. dt Из равенства F.6) следует, что dpldt ? L2 @, оо; V'), а это зна- значит, что р (t) — непрерывное отображение [0, со) —>- Н, обращаю- обращающееся в нуль на бесконечности. 2) Единственность. Предположим, что при / = 0 справедли- справедливо равенство F.6). Тогда г) Здесь уТ= у (ит).
§ 6. Поведение при f-> oo 177 и так как (согласно 1)) "аТ то ^ о откуда р — 0. 3) Существование. Пусть дт — решение в пространстве /,2 @, Т; V) задачи _^1 + Л*дг = 7 в @,ЛЛ dt \ F.7) Первое из соотношений F.7) показывает, что 4S ^о о Таким образом а), 1|кт@!|:2Л< С! J||/(Oli2vr'd<< с2> F.8) о о где с2 — константа, не зависящая от Т. Далее, если qT — продолжение функции qT нулем при ? > Т, а /т -- / на интервале (О, Т) и ]т — 0 при t > Г, то ^ *дг = fT на @, оо). F.9) dt Отсюда в силу неравенства F.8) вытекает оценка оо №г('Л|2<**<с2. F.10) о Следовательно, существует такая последовательность {?',,}—>оо, что q.v ->¦ (/ слабо в пространстве L2 @, со; V). Переходя к пре- пределу в равенство F.9), записанном для Т ¦— Тп, получаем т. е. р -- g действительно является решением уравнения F.6). ') Ср. с рассуждениями, проведенными в разд. \.Л.— Прим. перев. 12-1230
178 Гл. S. Управление параболическими системами Для отыскания оптимального управления их необходимо най- найти решение системы -^-f Ay0a + Dipoo = f в @, оо), dt \ F.11) ?_!2 _l А *рж — D2yоо = g в @, оо) I dt ' \ (где g =— С*АРгд) с граничными условиями усо, Рос 6 Ь2 @, оо; V), у*, @) = г/о. F.12) Как и в разд. 4.2, можно показать (рассматривая интервал (s, оо) вместо (s, T)), что справедливо тождество р=о @ - /Jco (Ог/сс (*) + г„о (t) на @, оо), F.13) где оператор Рх (s) определяется через решение задачи (ср. с D.28)) , , . , -.' = 0 в (s, оо), dt P(s)=fe, P,Y 6 /-2 (s, оо;V), а именно /»те (s)h = y (s); F.15) функция rco{s) определяется через решение задачи (ср. с D.30)) ^L + Ai\+D^ = f в (*,оо),) at - + Л l — Dzx\ = g в (s, оо), v ; ti(s) = O, л.5е/-2(*. оо; У), J а именно r{s) = 1 (*). F.17) Теорема 6.1. /?c.w выполнены предположения разд. 6.1 и Л @ = Л, В (t) — В, С (t) = С, N (t) — N, т. е. эти операторы не зависят от t, то Poo (s) ^ Poo (Ра, не зависит от s), F.18) Р^Х{Н;Н), Р* = Р^ F.19)
§ 6. Поведение при Т -> оо 179 Если, кроме того, выполнены условия теоремы 4.4 (соответ- (соответственно теоремы 5.2), то Роо 6^ (V; V) П Ж (V; У) F.20) (соответственно Рос € <? (//; F) П # (У; #)) F.21) и Рос Л + Л*Роо + A^iA» = Dt. F.22) Функция Гос удовлетворяет соотношению = Poof+g, F.23) Доказательство. Здесь новым является только утвер- утверждение F.18), а все остальные — или следствие, или другой ва- вариант ужо известных результатов. Но в случае, когда операторы A (t), В (t), С (t), N (t) не зависят от t, задача F.14) «не зависит от s» в следующем смысле: если сделать замену t -> t — s, то, как легко видеть, Р^ (s) = Рос @). Замечание 6.1. Б случае, когда применима теорема Шварца о ядрах (см. разд. 5.1), ядро Р^ (х, Е) оператора Р<»удовлет- Р<»удовлетворяет соотношениям (А* + А\) Роо (х, I) + I (DtP*) (х, ?) Ре» g, I) dl = а = D2(x,l) в Q*xQ, F.25) (где D2(x, I) — ядро оператора D2 ), Р (х, 1)=Р (I, х) F.26) и граничным условиям, зависящим от рассматриваемой задачи. Например, для задачи разд. 5.1 эти граничные условия имеют вид = о, *ег, gea 1 (и тогда Рос (х, I) = 0, x?Q, а для задачи разд. 5.2 таковы: A* ^-^ = 0, о:ев, ЕегI). J) Разумеется, ость и много других задач. 12*
180 Гл. 3. Управление параболическими системами Прямое исследование нелинейных эллиптических задач толь- только что описанного типа представляется интересным. По-видимо- По-видимому, оно еще но проводилось. Покажем теперь, что в подходящих топологиях иг —>- их, Ут -> Ух и т. д., если Т —> оо. 6.3. Предельный переход при 7-> оо Теорема 6.2. Пусть выполнены предположения разд. 6.1. Обозначим через иТ (соответственно уТ, рт) продолжение на @, -J- оо) функции ит (соответственно уТ, рт) нулем вне интер- интервала @, Г). Тогда при Т ->¦ оо ut-^-Uco слабо в />2@, оо; Е), ' F.28) "уг-^Уос, ])т-*-1><х> слабо в L2@, оо; У), F.29) PT(s)h-^Pco(s)h слабо в II, Vs<oo, 4h?H. F.30) Доказательство. 1) Пусть /т = inf JT (v), /no — inf /со (v). V V При любом управлении v ? L2 @, оо; Е) имеем JT (v) ^ Joo (v), а потому /т ^ /со. Но 0 откуда х) 1|ит117Ло,»:Е,<С, ' F.31) а тогда H#rllL»@.»;v)<C F-32) И II Рт ll/,2(o,c»;v) ^C. . (G.33) ,—' Так как —(рт) = -^~ (ибо рт (Т) = 0), то d< dt -^ + A*~Pt = DSt+1t F.34) (где gT = g на интервале (О, Т) и gT =0 па интервале (Т, оо)), откуда <С. F.35) dt 2() х) Все константы, не зависящие от Т, будем обозначать через С-
§ 6. Поведение при Т -> оо 181 Далее, так как dt l2(o,t;V) ТО. \ут(Т)\^С F.36) Следовательно, существует такая последовательность {?'„}->¦ —у со, что 'uTn-+w слабо в Ьг@, со; Е), . гУтп-*~У,Ртп-+Р слабое L2@, оо; V), ^P_ слаб0 в L2@, oo;F')- dt 37) dt dt Равенство F.34) после перехода к пределу принимает вид ^ g. F.38) dyT dt Кроме того, ¦ ЛуТп + D$Tn =7тп+ Утп (Тп) 8(t— Tn), а в силу оценки F.36) уТп (Тп) б (t — Тп) ->0в смысле простран- пространства 3)'(@, со); //). Таким образом, переходя к пределу, полу- получаем !%- + Aj + Dtf=f. F.39) dt Так как у @) _--г/0, то, сравнивая F.39) и F.38) с F.11) и F.12), заключаем, что у -—-¦ г/о» и р -- рх. Равенство NuT -•- АЪ1В*рт = --- 0, записанное при Г -- Г„, после перехода к пределу дает Nw + Ам1В*рсо --^ 0, откуда w '=- иЛ. Тем самым соотноше- соотношения F.28), F.29) доказаны х). 2) Для доказательства соотношения F.30) напомним, что опе- оператор Pi (s) определяется через решение задачи dt = 0 в = 0 в 1) Так как /т («т) .-»- J^Uoo), можно показать, что в Л2 @, оо; Е).
182 Гл. 3. Управление параболическими системами а именно Рт (s) h - ут (*). Кроме того (см. доказательство леммы 4.1), пара {Рг, 7т} позволяет отыскивать оптимальное управление в случае, когда состояние ф системы определяется как решение задачи at а функция стоимости имеет вид \\%dt + ](Nv, v)Edt. s Так как (см. доказательство леммы 4.5) inf 4,т (о) = (PT(s) h, h) < JhSiT @) < С | h |2, TO " I PT (s) h |< С ! Л |, F.41) где С — константа, не зависящая от sis. Т. Далее, если wT — опти- оптимальное управление для указанной системы, то (как в пункте 1)) \\\wT(t)\\2Edt^C. s Продолжая управление и>т нулем при t > Т и обозначая полу- получающуюся функцию через и>т, заключаем, что эта функция (соот- (соответственно конструируемые так же функции P^i ут) принадлежит ограниченному подмножеству пространства L2 @, оо; Е) (соответ- (соответственно пространства L% @, оо; V)). Следовательно, существует такая последовательность {Тп}-+оо, что w-rn-^-w, Рг„ —*- Р, утп~*~ -*- у слабо в соответствующих пространствах. Значит, пара {Р, у} удовлетворяет соотношениям F.14) (отметим, что | Рг {Т) | ^ С), а тогда Р = р, у = у и уТп (s) -> у (s) слабо в пространстве Н. От- Отсюда и следует соотношение F.30). § 7. Задачи, не обязательно коэрцитивные 7.1. Распределенное наблюдение J) Пусть выполнены предположения разд. 4.1; состояние у (t; v) определяется как решение задачи у' (*; v) + A (t) y{t;v)=t + B (t) v, у @; v) = y0, G.1) а функция стоимости имеет вид (рассматривается случай N = 0) J(v)=]\\C(t)y (t; v) - 2д П2^. ' G.2) В оригинале observation distribute,— Прим. перев.
§ 7'. Задачи, не обязательно коэрцитивные 183 Теорема 7.1. Пусть состояние системы определяется как решение задачи G.1) 1), а функция стоимости задана равен- равенством G.2). Предположим, что множество Шa cz <U — L2 @, T\ Е) ограничено и каждый из операторов В и С описывает взаимно одно- однозначное отображение. Тогда оптимальное управление существует и единственно. Доказательство. Воспользуемся замечанием 5.5 гл.1. Положим У (v) - У @) -= lv, l?Z (L2 @, Т; Е); W @, Т)). G.3) Тогда, если и — некоторое оптимальное управление (оно суще- существует, так как множество 41 д ограничено), то множеством всех оптимальных управлений будет (и + Кег (С1)) [\ ilg. Пусть V cz Ker (CL). Так как С — взаимно однозначный оператор, то lv — 0, а значит, d(lv)ldt + A(lv) — 0. По d {lv)ldt -f- A (lv) — Ви, а тогда и = 0, поскольку В — взаимно однозначный оператор. Пример 7.1. В случае 3.1.1 разд. 3.1 условия теоремы 7.1 выполнены. Они выполнены также в случаях 3.1.2 разд. 3.1 и 3.2.1 разд. 3.2. Замечание 7.1. Если речь идет о финальном наблюдении, то отображение v->¦ у (Т; v) — у (Т; 0) не является взаимно одно- однозначным, и поэтому здесь нет аналога теоремы 7.1. Относительно этого случая см. разд. 7.2. 7.2 Финальное наблюдение Рассмотрим систему, состояние которой определяется как решение задачи G.1), а функция стоимости имеет вид / (v) --= j Dy (Г; v) - гд j2, D 6 X (Н; Н). G.4) Нам потребуется Определение 7.1. Говорят, что (параболический) опера- оператор — dldt -\- A* (t) обладает свойством обратной единственно- единственности 2), если из условий ^бЬ2@, T-V), ~]jeL2@, T-V'), G.5) !?t ' = Q в @, Г), G.6) dt ¦vJ)(s) = O, точка s?@, T) фиксирована, G.7) следует, что г(з г= 0 в интервале (s, T). 1) Вместе с предположениями A.1) и A.2) относительно оператора A(t). 2) В оригинале unicite retrograde.— Прим. перев.
184 Га. 3. Управление параболическими системами Замечание 7.2. «Естественное» граничное условие для G.6), G.5) имеет вид «я|з (Т) дано». Задача G.5) — G.7) с дан- данным значением ty (s), вообще говоря, не корректна, но может обладать свойством единственности решения. Обращая время, можем заключить, что свойство обратной единственности равносильно предположению о том, что задача е е w (о, т), — + A*(T-t)Q = O в (О, Т), dt 6 (Т) = О имеет лишь решение 6 = 0. Этим и объясняется смысл термина «обратная единственность». Замечание 7.3. В работе Лионса и Мальгранжа [1] пока- показано, что параболический оператор обладает свойством обратной единственности при более сильных предположениях, чем G.5) г). Приведем более простой пример, когда оператор обладает свойством обратной единственности. Пусть A (t) = А = А*, а вложение V -v Н вполне непрерывно. Пусть u>i, . . ., wm, . . .— собственные функции оператора А, т. е. Awt = %iWit ? = 1,2, . . .; ki > 0; (u>i, Wj) = б|. Тогда всякая функция я(з, удовлетворяющая соотношениям G.5), G.6), имеет вид G.8) Таким образом, если "ф (s) — 0, то ijjy (s) = 0 при всех /, откуда Cj\= 0 и, следовательно, -ф = 0 в интервале (s, T) 2). Теорема 7.2. Пусть состояние системы определяется как решение задачи G.1), а функция стоимости задана равенством G.4). Предположим, что оператор обладает свойством обратной х) Что вполне согласуется с конкретными приложениями: уравнения параболического типа с достаточно регулярными коэффициентами этим свойством обладают. 2) В случае, когда вложение V -*¦ Н не является вполне непрерывным, доказательство проводится аналогично, если воспользоваться спектральным разложением оператора А.
§ 7. Задачи, не обязательно коэрцитивные 185 единственности и inf J(v)>0; G.9) В* (t) — взаимно однозначный оператор (для Л почти всех t); } G.10) D* — взаимно однозначный оператор. J Пусть, наконец, <ид = {v | v е L2 @, Т; Е), v (t) 6 Еэ почти всюду), G.11) где Еэ — выпуклое замкнутое ограниченное подмножество про- пространства Е. Тогда оптимальное управление и существует и удовлетворяет условию и (t) ? дЕд для почти всех t 1), G.12) где дЕд — граница множества Ед. Доказательство. Так как множество 11 д ограничено, то оптимальное управление и существует (но априори не известно, единственно оно или нет). Сопряженное состояние определяется как решение задачи , T;V), условие оптимальности, управления u^iig имеет вид (здесь p(t) = p(t; и (*))) т ^(B*(t)p(t), v(t)-u(t))Edt^O VveUg. о По теореме 2.1 гл. 2 это неравенство равносильно неравенству [В* (t) p (t),e — и (t))E > 0 Уе 6 Еь для почти всех t. G.13) Далее, В* (t) p (t) ф 0 почти всюду G.14) (и даже всюду, если оператор В (t) определен всюду). В самом де- деле, если В* (s) p (s)=0, то в силу первого из предположений G.10) имеем р (s) = 0, а тогда в силу свойства обратной единствен- единственности р = 0 в интервале (s, Т). Следовательно, р (Т) = 0, т. е. D* [Dy (T; и) - zs] = 0. х) Этот факт, если воспользоваться терминологией, принятой в конечно- конечномерном случае, можно назвать свойством релейности оптимального управ- управления.
186 Га. 3. Управление параболическими системами В силу второго из предположеиий G.10) отсюда вытекает, что Dy (Т; и) — гя — 0, а значит, inf J(v) = J (и) = | Dy (Г; и) - zA |2 = 0. Но это противоречит условию G.9). Таким образом, соотношение G.14) обосновано, а тогда из не- неравенства G.13) следует утверждение G.12). Следствие 7.1. Если выполнены условия теоремы 7.2 и множество Ед строго выпукло, то оптимальное управление и единственно. Доказательство. Если иу и и2 — два оптимальных управления, то V2 (uj -(- и2) — также оптимальное управление 1). Тогда Uy = u2 почтя всюду в силу соотношения G.12) и строгой выпуклости множества Ед. Пример 7.2. Теорема 7.2 применима в случае 3.2.2 разд. 3.2. Предположим, например, что состояние системы определяется как решение задачи 2) ду(о) dt G.15) = v, y(x,O;v) = dvA ¦a D — тождественный оператор, так что J(v) = l[y (х, Т; v) - 2д (x)f dx. G.16) ?3 Пусть U = L2 (О, Т; V (Г)) (= I? B)), т. е. Е = L2 (Г), и 'Uo — \р I Ео (ж) ^ у (^. *) ^ Ei (^) почти всюду на 2; Ео, ?i 6 />» (Г)}- G-17) Тогда почти всюду на Г}, G.18) т. е. можно применить следствие 7.1. Таким образом, если inf / (v) ;> 0, mo оптимальное управление имеет вид | Ео (ж) почти всюду, если р (х, t) > О, \ Ei (ж) почти всюду, если р(х, Л—п ') Множество оптимальных управлений выпукло; см. разд. 5.1 гл. 1. 2) Здесь A (t) — эллиптический дифференциальный оператор второго порядка, коэффициенты которого являются аналитическими функциями переменных х и t
§ 7. Задачи, не обязательно коэрцитивные 187 Было бы интересно получить информацию о свойствах множе- множества, разделяющего на поверхности 2 области, где управление и принимает значения |0 и |j соответственно. Замечание 7.4. Неравенство G.9) означает, что не суще- существует такого элемента u^'Ug, для которого / (и) — 0, если образ множества 11 g при отображении v-+Dy(T; v) замкнут. Следует иметь в виду, что этот образ, вообще говоря, не является замкнутым множеством; так, в примере 7.2 этот образ не замкнут. Замечание 7.5. Предположим, что множество 11д опре- определено соотношениями G.17), G.18) и существует управление и, для которого у (Т; и) = zn (следовательно, inf J (v) = 0), \ ?„(*) <и(х, t) <Ej (x) на 2 о', J где 2 о — непустое открытое подмножество поверхности 2. Тогда существует бесконечно много оптимальных управлений. Действительно, можно показать, что существует бесконечное множество определенных па поверхности 2 таких функций w, что w имеет носитель в Ео, w ? L°° B), G.21) и решение задачи =0 в Qx@, Л; ] dt t G>22) г> 0; ю) = 0, удовлетворяет условию г|з (х, Т; w) = 0. Тогда функция у (и—ги>) = у (и) -\- ety (w) удовлетворяет условию у (Т; и + eu>) = гд и и -\- гю ?ЦЭ при j е | ^ е0. Пример см. у К). Егорова [1]. 7.3. Случай, когда N=0 и lie не ограничено1). Рассмотрим систему, состояние которой определяется как решение задачи dt l G.23) 0@; v) = y0, y(v)eL2@, Т; У), причем v^U = I/ @, Т; V). . G.24) 1) Этот раздел аналогичен разд. 3.1 гл. 2.
188 Гл. 3. Управление параболическими системами Предположим, что наблюдение имеет вид 1^Щ е Lz@, Т; V) X 12@, Т; VI), G.25) dt > а функция стоимости задается равенством J (v) = \\Су (а) — гд\\w(o,t) = dy{v) " 'Г dt 2 1 dt, G.26) v где T e о р е м a 7.3. Если выполнены условия G.23) — G.26) и- "Li q a 41 — произвольное выпуклое замкнутое множество, то суще- существует единственное оптимальное управление. Доказательство. В обозначениях § 1 гл. 2 n(v, v) = \\y{v)-y(Q)\fW(OtT), G.27) а так как отображение v+y{v)-y{0) = lv G.28) является'изоморфизмом L2 (О, Т; V) — 41 ->- Wu (О, Т), где Wo (О, Т) ^ ^ | гр ? W (О, Т), -ф @) =-- 0}, G.29) то n{v,v)^C\\v\\%, C>0, Vv€<U. Отсюда следует утверждение теоремы. Для получения соотношений, характеризующих оптимальное управление, нужно транспонировать изоморфизм2) G.28), или, что то же самое, его обратный: отображение dt является изоморфизмом Wo @, Т) ->- 41. Следовательно, если о — линейная непрерывная форма на пространстве Wo @, Т), то суще- х) Так что паблюдение принадлежит пространству И7 @, 7'). 2) Этот прием — основной при изучении неоднородных граничных задач; см. разд. 4.2 гл. 2, а также Лионе и Мадженес [1].
§ 7. Задачи, пе обязательно коэрцитивные 189 ствует единственный элемент р ? L2 (О, Т; V), для которого ] (р, ^- + аЛ dt = а (г|з) Щ ? Wo (О, Т). G.30) о \ at I Отсюда вытекает, что существует единственный элемент р (и) ? ? L2 @, 7'; F), для которого f (р («), ^- + ^^) d* = S (J/ («) - 4- t @)v d* + о V at I o dt у^Жо(ОЛ'). G.31) о \ dt dt Iv Уравнение G.31) однозначно определяет сопряженное состояние системы. Таким образом, для оптимального управления и ?41 д удовлет- удовлетворяются соотношения G.23) (при v — и), G.31) и т \{р(и), v — u)dt^O Vv4°llo. G.32) о Пример 7.3. Пусть выполняются предположения разд. 3.1 (в частности, V — Н\{Щ) и <Uq = {v | v > 0 почти всюду в Q ¦— О. X (О, Т)}. G.33) Тогда соотношение G.31) можно интерпретировать в виде следую- следующей задачи ]): - -i-LJ + Л р (и) = Лу (у (а) - z.J —Лу1 ~ 2!д , (Л34) р(и)\х = 0, G..15) р(Г;„)=Л^1^-,1) , G.3E) \ dt I т а неравенство G.32) эквивалентно соотношениям р (и)>0, ы>0, up (u) — 0 почти всюду в Q. G.37) 3) Лу — канонический изоморфизм V-> V'. В данном случае Лу — — — Ах -j- I, т. е. Лу есть оператор Il\ (Q) ->- 7/-] (Q), причем I ф-grad ip) dx.
190 Гл. 3. Управление параболическими системами § 8. Другие типы наблюдения и управления 8.1. Точечное наблюдение Пусть оператор А — А (х, t, dldx) определен, как в разд. 3.1. Допустим, что выполнены предположения разд. 3.1; в частности, состояние у (и) системы определяется как решение задачи = f+ v, f6Lz(Q), vtL\Q) = <U, 1 I (8.1) Пусть x1, . . . , xv- — точки области Q ; предположим, что наблюдение задано в виде {у(х3, t\ v}, I .< 7<CR (если, конечно, входящие сюда выражения имеют смысл). Если предположить, что в выражении для оператора А коэффициенты достаточно гладкие, то решение у (v) задачи (8.1) удовлетворяет условию (см. C.4), C.5)) y(v)E IP-4Q). (8.2) Следовательно, у (v) ? L2 @, Т; Н2 (?2)), и у (х\ t) имеет смысл (а отображение t —>- у (х\ t) принадлежит пространству L2 @, 21))Т если только IP (Q) сг С0 (Q). (8.3) Последнее условие выполняется тогда и только тогда, когда .1/2 — 2/п < 0, т. е. п < 3. Поэтому в дальнейшем будем считать п ^3. В этом случае z (v) = Су (v) = {у (х\ t;v)}e № @, Т))*. (8.4) Если наблюдение определено по формуле (8.4), то говорят, что имеет место локальное наблюдение. Функция стоимости задана равенством J (v) = II Су (v) - *„ ||BL2@ir№ + (Nv, и)ш; (8.5) если z;j - {гД(, . . ., z^}, то J (v) = S ] I У {xj, t- v) - zn. (t) |2dt + (Nv, v)%. (8.6) Если 41 a cz <U — выпуклое замкнутое множество и N^-vI, v > 0, то существует единственное оптимальное управление и ? ?<2/<э, характеризующееся тем, что | \ [у (х3, t; и) - гд.] [j, (xJ\ t; v) - у (х3, t; u)\ dt + (Nu, v-u)^0 (8.7)
§ У*. Задачи, не обязательно коэрцитивные 191 Определим сопряженнее состояние как решение задачи г) (8.9) (8.10) Р («) Is = 0, Р (х, Э1; ы) -¦= 0, z 6 Й. Замечание 8.1. «Задача (8.8) — (8.10) имеет единственное решение в пространстве ^J- (Q) (например), определяемое с помо- помощью транспонирования ("как в разд. 7.3): ] 1 о [у (Х\ t; и) - zn} (t)] ф (/, t) dt Тогда неравенство (8.7) принимает вид (8.11) (8.12) Пример 8.1. Пусц-ь 1la --= {v \ y>0 почти всюду в Q}; этот случай уже рассматривался несколько раз. Неравенство (8.12) приводится тогда к соотщошенгаяд1 р (и) + Nu>0, ц>0, [$р (и) -1- Лгн] u = 0 почти всюду в Q. Пример 8.2. Пусть, qig ~il. Тогда оптимальное управле- управление находится из решения! задачи dt ^—1 1л = 0; , 0) Утверждения относительно расцепления (§ 4—6) остаются справедливыми и для это1й задачи. В частности, Р (*) ^ Р @ У (t) + r (t), (8.14) х) Здесь g (i)(gN (,r — а-') — распределение Т 2) Правая часть рапеиства '(8.11) представляет собо4 при га <3 линей- линейную непрерывную форму на пространство Я2.3 (Q).
192 Гл. 3. Управление параболическими системами причем ядро Р (х, ?, t) оператора Р (t) удовлетворяет соотно- соотношениям =2 б (* - «О ® б (I — **) в Q,. x Q6 X @, 2'); (8.15) P (x, I, t) = P (I, x, t); (8.16) P (x, t,t)=-.O,x?r,teQ,te (О, Т); (8.17) а функция ?¦(]?) удовлетворяет соотношениям — г' -|- Л*г -|- PN~lr = Pf — У, гч, ф 5(х — х}), ! о ... ^! ''¦•>' ' } (8.19) Пример 8.3. Рассмотрим случай, когда N = 0, а ^а — ограниченное множество. Тогда оптимальное управление и?<иэ существует и удовлетворяет условию \ d. (8.20) Q Пусть, например, U в "-¦ {v I Ъо (ж, l)^v (х, t) < h (х, t) почти всюду в Q, I,,, ii € L°° (Q)}- (8.21) 13 этом случае неравенство (8.20) эквивалентно соотношению р (х, t; и) и (х, t) :-- inf \р {х, I; и) Ц почти всюду в Q, v Mo./Z) t0 (x, i) < S < Si (ж, О- 11 редположим, что в выражении для оператора А коэффициенты апалитичны в цилиндре Q и граница Г аналитичпа. Тогда р — 0 почти всюду в цилиндре Q. Действительно, функция р аналитична в цилиндре Q вне мпо- -/кества \J {х1} х@, Т), и если р — 0 на некотором множестве 3-1 положительной меры, то носитель функции р принадлежит мно-
§ 8. Другие типы наблюдения и управления 193 жеству I ] {а:'} X (О, Т). Но тогда равенство ВОЗМОЖНО ЛИШЬ При УСЛОВИИ, ЧТО !/ (г*, i; U) = ZRj (t), / — 1, . . ., |Л. Следовательно, если inf / (v) >> 0, то р ф О почти всюду в цилиндре (?> и оптимальное управление имеет вид J?o (я, 0 почти всюду, если р (ж, ?; м) > О, [?j (x,rt) почти всюду, если р (х, I; и) < 0. Отсюда видно, что оптимальное управление единственно. Замечание 8.2. Аналогично можно исследовать случай, когда состояние системы определено, как в разд. 3.2. Замечапие 8.3. Подобное исследование можно провести и для систем, описываемых параболическими операторами вида dldt -- A (x, t, д/дх), где порядок оператора А равен 2тп 1). Замечание 8.4. Если наблюдение имеет вид <rftjy(x\ t), &Mj 6 X (L2 @, T); L2 @, Т)), такое исследование тоже удается провести, при этом сопряженное состояние р определяется как решение уравнения _ ЕЕ. + А*р = У. afl) (eMjy (х\ t) - zv (I) (gi б (ж — x1), (8.23) at j=i а остальные соотношепия (8.13) остаются без излюнения. 8.2. Точечное управление Рассмотрим еще один случай, представляющий собой вариант предыдущего и имеющий важное значение для приложений. Речь идет о задаче с точечным управлением. Пусть оператор А определен, как и в разд. 8.1, состояние у (v) системы определяется как решение уравнения ^- + Ay (v) ^ 2 vj (t) ® б (х - х3), х3 ? Q, (8.24) at j=i где v = {vj}e(Lz(O,T)y, (8.25) а граничные условия, например, таковы: У (v) h = 0, (8.26) у (х, 0; v) = уо(х), хв Й- (8.27) :) В этом случае у (xi, t; v) имеет смысл, если п <J 4m — 1. 13-1230
194 Гл. 3. Управление параболическими системами Разумеется, нужпо еще уточнить, в каком смысле понимается решение задачи (8.24), (8.26), (8.27). Пользуясь снова методом транспонирования (см. замечание 8.1 и разд. 7.3), определим состояние у (v) как тот единственный эле- элемент пространства L2 (Q), для которого ( &Ф \ * J ч ^ г (у) — -—- -\- A ty\ dxdt— У] \а|) (х , t) Vj (t) dt + \ dt I j j=\ о При этом предполагается, что п ^ 3 (тогда правая часть равен- равенства (8.28) представляет собой линейную непрерывную форму на пространстве H2'1(Q)). Если функция стоимости имеет вид J (v) = j [у (v) - zRf dx dt + (Nv, v)v, (8.29) где % = (L2@, T1)I", Ne.^FH;'U), N^vl, v>0, то сущест- существует единственное оптимальное управление. Сопряженное со- состояние /? (у) определяется как решение задачи dt \ (8.30) P(v)\x = 0; p(x, T; v) = 0, х€Й, J и оптимальное управление и ?Шд характеризуется соотношения- соотношениями (8.24), (8.26), (8.27), (8.30) (при v = и) и • 7 = 1 О S р (а:7', <; и) [у/ (<) - "j (t)] dt + (ЛГи, у - и)% > 0 О (8.31) Замечание 8.5. Заметим, что как в предыдущем, так и в этом разделах состояния у и р «двойственны» друг к другу (как, впрочем, и должно быть): если состояние у регулярно (слу- (случай разд. 8.1) (соответственно нерегулярно (случай разд. 8.2)), то состояние р нерегулярно (соответственно регулярно), и форму- формула Грина всегда применима. 8.3. Граничные управление и наблюдение Рассмотрим теперь пример задачи (наиболее важной для при- приложений), когда управление и наблюдение одновременно являются граничнцми.
§ 8. Другие типы наблюдения и управления 195 Очевидно, здесь бесконечно много возможностей. Мы изучим в этой главе два типичных случая. Первый из них рассматривается ниже, а второй (связанный с дополнительными техническими труд- трудностями) излагается в следующем параграфе. Пусть выполняются предположения разд. 3.2; в частности, состояние системы определяется как решение задачи Ш + AyW-f в Q; } ot =1> на у\х, 0; v) = yo(x), Пусть наблюдение имеет вид ъ (v) =-- Су (v) = <М (у (v) |s (L2 B); L2 B)). (8.33) Здесь у (i>) |v означает след функции у (v) на поверхности 21. Так как след у (v) |x принадлежит, в частности *), пространству L2 B), то смысл соотношения (8.33) ясен. Пример 8.4. ЕслиеЖ — тождественный оператор, то наблю- наблюдаются значения функции у (и) на поверхности 2. Если (М — оператор умножения на характеристическую функ- функцию множества So cz 2, то наблюдаются зпачения функции у (v) па подмножестве 20 поверхности S. Если функция стоимости имеет вид f <m + (ЛГу v) (8.34) / (у) = | [Л (у (v) у - z-Af где N^_X^U, 41), N^>vl, v > 0, то существует единственное оптимальное управление и?Щд, характеризующееся тем, что S И (у («) li) - «д] ^ (?/ (w) 12 - у («) Is )^s + + (#«, y-u)L2(a>0 Vy6^c=L2(S). (8.35) Сопряженное состояние определяется как решение задачи dt = 0 в I I (8-36) \ dvA* МУ-гд] на 2, I J :) Сираведлнв более сильный результат: у (у) |s 6 i/1/2!1/4 B); см. Лионе и Маджеисс [1]. 13*
196 Гл. 3. Управление параболическими системами Заметил!, что задача (8.36) имеет в пространстве L2 (О, Т; IIх (Q)) единственное решение, определяемое соотношением = j Ж* Vib?L2@, Т;П'(п)), ?± dt , Т) = 0, Тогда неравенство (8.35) можно переписать в эквивалентной форме: l д. (8.38) Таким образом, доказана Теорема 8.1. Если состояние системы определяется как решение задачи (8.32), а функция стоимости имеет вид (8.34), то оптимальное управление и^Шэ характеризуется соотноше- соотношениями (8.32) (при v ¦¦¦- и), (8.36) и (8.38). Пример 8.5. Пусть <Ug — {v | v 6 L2 B), y>0 почти всюду на 2}, asl — тождественный оператор. Тогда оптимальное управление и получается из решения односторонней задачи dp_ dt A*p=O в Q; dp dy v —- = y — гд, —^->0 на 2, 9 а именно ¦ ^JL[p + N^L. =0 на 2; П = 0, x?Q, = —— на 2. (8.39) (8.40) Мы снова сталкиваемся здесь с нерешенной задачей, которую уже пе раз встречали: получить информацию о свойствах множе- множества, разделяющего на поверхности 2 области, где dy/dvA = О и p-j-Ndy/dvA~O соответственно.
§ 8. Другие типы наблюдения и управления 197 Пример 8.6. Пусть множество %Ld определено, как в при- примере-8.5, а оМ — оператор умножения на характеристическую функцию измеримого подмножества 2 о поверхности 2. Тогда граничное условие на поверхности 2 в задаче (8.36) принимает вид др(и) _{у (и) — 2Д на 20, (8.41) и для получения результата достаточно произвести соответствую- соответствующие изменения в односторонней задаче (8.39). Пример 8.7. Пусть <Ug -- Ш. Тогда оптимальное управле- управление и получается из решения задачи ot = O в Q; (j/|v)-zA) на 2; (8.42) а имепно c,O) = yo(x), p(x,T) = O, агб", и = —— па 2. (8.43) Мы покажем теперь, как «расцепить» задачу (8.42), предполо- предположив для простоты, что вМ — тождественный оператор. Перепишем эту задачу в вариационной форме: , ф) = (/, ф) ' V + a*{t;р' ^~ Л } (8.44) = Уо, Р(Т) = О. Можно, как и в § 4, 5, доказать тождество p(t) = P (t) y(t) + r (t), где P* (t) = P (t), (8.45) и, как в § 5, провести следующие преобразования. Подставляя вы- выражение для р (t) из тождества (8.45) во второе из равенств (8.44),
198 Гл. 3. Управление параболическими системами получаем dP(t) dt •' w T/ \ w dt 7 V d* ' + a* (*; P (*)?/ + r @, яр) - (г/, яр)/Л1.) = - (гд, гр)ь2(г). (8.46) Так как (P(t)-~-, гр] = (-т- , Р (t) гр , то с помощью первого из ра- \ dt J \ Ut I венств (8.44) находим, что I P (t) — , i\>) = — a{t;y,P(f)гр) — (N~*p, P (t)грI.2(Г) + (/, Р(t)гр). \ dt ) Подставив полученное выражение в соотношение (8.46) (и еще раз используя тождество (8.45)), будем иметь dt I \dt + (Ы-'(Ру + г),Р^)ьЧт)-и, + a* (t; Py + г, гр) — (у, гр)ь2(Г) = — (гд, грI/2(Г). Следовательно, оператор Р (t) удовлетворяет соотношениям (dP \ ', — Ф> 'Ф I + а (t\ ф, ^*гр) -{-a (t; Рц>, гр) -f- \ dt / -j- (N~iP(p, Ргр)^2(Г) = (ф, ip)L2(P) Уф, гр^Я'уО), (8.47) Р (Т) --=0, (8.48) а функция г (t) — соотношениям (8:49) г (Т) = 0. (8.50) Выпишем, наконец, соотношения для ядра Р (х, ?, t) опера- оператора Р (t). Из равенства (8.47) (полагая для простоты N = vl) имеем OJr (X, С, Т) . . % ,.. ? v $ Р(ж, ?, ОР(I I, t)dTs = 0 в ЙжxQ5x (О, Г); (8.51)
8. Другие типы наблюдения и управления 199 P (x, g, t) = P (I, x, t), dP(x,i,t)_ • — U, JO t; l , ¦ = 0, x?Q, dP (x, t, t) (8.52) op (g, g, t) te(o, } (8.53) = -S), e@, Л1); (8.54) P (a:, g, Г) = 0, ж,? ЕЙ, X Q6. Замечание 8.6. Представляет интерес прямое исследо- исследование (нелинейных) задач типа (8.51) — (8.54), в частпости выяс- выяснение свойств регулярности оператора Р. Замечание 8.7. Разложение по собственным функциям. Вернемся к задаче (8.32), предполагая, что оператор А не зависит от t, A = А*, а множество Q ограничено и имеет достаточно гладкую границу. Пусть W\, . . ., wm, . . .— собственные функции оператора А для задачи Неймана: A wj = = 0, i = l,2, ...; k) = 6). (8.55) Тогда решение задачи (8.32) можно выразить через функции Wj. Чтобы не ошибиться в знаке, полезно сначала перепиеать задачу (8.32) в вариационной форме 2): ~- (у, а (у, -ф) = (/, г|>) -f (v, (8.5b) x) Здесь б (ж — |) — распределение па Тх X Г^: Равенства (8.53) можно записать апалитически: , дР -- J ф (*) Ф (б) ЙГ. ЙГ гхг 2) При этом вместо i/ (v) будем писать у.
200 Гл. 3. Управление параболическими системами Представим решение у этой задачи в виде 00 оо Т У = 2 У] (*) н>;; J0 € ?2 @, Г), У; J | Vi (t) fdt < с». (8.57) Положим Vj (t) = (v(t), wj)l4t) =lv(x, t) Wj (x) dTx, г подставим (8.57) в (8.56) и возьмем -ф = wj. Тогда Vi (t) + hvi {t) = fj (t) - Vj (t), У] @) - y0]. (8.58) Заметим, что «граничный член» v (t) порождает слагаемое v}(t) в первом из равенств (8.58), ц соотношение -^- = v (см. (8 32)) понимается в среднем; поэтому нет никакого противоречия в том, что производная dy/dvA на поверхности 2 представляется с помо- помощью производных dwj/dvA, равных там нулю. Очевидно, можно выразить оператор Р (t) через функции w3: Р @ == Д.- ^jft, (^) ^j ® wk (8.59) (или Р(х, I, t) = .S^/fe (*) и;у (ж) wft (s)), где коэффициенты PJh обладают свойством рл --= Phi V/,ft. (8.60) Полагая в равенстве (8.47) <р ^ Wj, ц = wh, получаем для коэффи- коэффициентов Pjh (t) бесконечную систему уравнений типа Риккати: ri @ Psk (t)j wrwt dY+ 1 o, Л; j Отметим, что если рассмотреть «урезанную» систему порядка т, т. е взять уравнения (8.61) цри j, к ф, то сходимость решения приближенной системы к решению 'системы (8.61) при т -> оо доказывается рассуждениями, аналогичными проведенным в разд 4D разд. 4.D.
9. Граничные управление и наблюдение 201 § 9. Грапичное управление и граничное или финальное наблюдение для системы, описываемой смешанной задачей Дирихле 9.1. План дальнейшего исследования В разд. 8.3 мы привели первый пример задачи, когда управле- управление и наблюдение одновременно являются граничными. Рассмот- Рассмотрим теперь другой случай *). Пусть оператор А определен, как в разд. 3.1 2), а состояние у (v) определяется как решение задачи v) = f в Q; (9.1) Пусть наблюдение имеет вид z (v) = Су (v) = <М dy(v) dv. (9.2) (9-3) (9.4) где 2» — некоторый «оператор, определенный па поверхности При решении этой задачи возникают следующие трудности: (i) Если управление v выбирается, например, из пространства L2 B), то, во-первых, нужно решить задачу (9.1) — (9.3) (т. е. выяснить, в каком смысле понимается ео решение) и, во-вторых, ду (v) принадлежит пространству, более широкому, ду (V) поскольку dv. dvj чем L2 B) (в силу потери регулярности), нужно определить а следовательно, и функцию стоимости. (ii) Затруднений, о которых говорится в (i), можно избежать, если выбирать управление v более регулярным4), например, v d Hi B), но тогда члеп (Nv, v)% записывается сложнее, а потому и отыскание оптимального управления в свою очередь стано- становится труднее. Мы рассмотрим последовательно оба возможных подхода (i) и (ii) к решению задачи. J) Смысл встречающихся при этом граничных задач будет уточной ниже. 2) То есть A {t) — эллиптический дифференциальный оператор второго порядка, коэффициенты которого являются достаточно гладкими функциями переменных ш(. 3) Необходимые уточнения будут даны ниже. 4) Это, впрочем, не очень реалистично с точки зрения приложений.
202 Гл. 3. Управление параболическими системами 9.2. Неоднородная смешанная задача Дирихле *) Воспользуемся методом транспонирования, как в разд. 7.3 и замечании 8.1. Рассмотрим изоморфизм <р ->- — -^-~-А*(р пространства Ф в L2 (Q), где Ф = {ф | <р 6 Я2'1 (QY, Ф Is = 0; Ф (х, Т) = 0, х 6 Q}. Применяя транспонирование, заключаем, что еслиЛ/(ф)^— линей- линейная непрерывная форма на пространстве Ф (с топологией, индуци- индуцированной топологией пространства Н2*1 (Q), см. C.5)), то суще- существует единственный элемент у ? L2 (Q), для которого + p] (p) фб; (9.5) ш М -у у — липейное непрерывное | отображение Ф' -у L2 (Q). J Рассмотрим формулу М((р)= [f<pdxdt+ [yo(x)q>(x,O)dx— j" v-^-dZ, (9.7) Q a s dvA* тде feL2(Q), y0eL2(Q), veL2B). (9.8) Ясно, что формула (9.7) определяет линейпую пепрерывную фор- форму па пространстве Ф 2). Таким образом, доказана Теорема 9.1. Для элементов /, ?/0, v, удовлетворяющих условиям (9.8), в пространстве L2 (Q) существует такая единствен- единственная функция у (v), что at <9ф + S У о (х) ф {х, 0)dx—^ v —^- dS Уф 6 Ф. (9.9) J) Ср. с § 5 гл. 2. 2) В самом деле, <р {х, 0) G Я1 (Q); следовательно, в частности, ср (г, 0) ? 6 /,2 (fl) и ^—— G Л2 (S) (в действительности справедлив более сильный OVA* результат: ду1д\А* ? Я1/2,1/4(Е); см. Лионе и Мадженес [1]).
§ 9. Граничные управление и наблюдение 203 Формально удостоверимся, что имеет смысл определять реше- решение у (и) задачи (9.1) — (9.3) как функцию, удовлетворяющую соотношениям (9.5) и (9.7). Действительно, запишем сначала ра- равенство (9.5) для ср ? 3) (Q). Тогда форма М(ф) принимает вид | /ф их dt, и потому Q dt Отсюда и следует равенство (9.1). Умножая равенство (9Л) на Ф ? Ф и применяя формулу Грина, получаем U<pdxdt=— ly(x, 0)<р(ж, 0)dx Q Q Принимая по внимание соотношения (9.5) и (9.7), находим, что ov A* откуда вытекают равенства (9.2) и (9.3). Замечание 9.1. Таким образом, состояние системы опре- определяется как решение уравнения (9.9). Замечание 9.2. (Ср. с замечанием 8.7.) Пусть оператор А не зависит от tnA = А*. Пусть «;i, . . ., wm, ... — собственные функции оператора А для задачи Дирихле: Awj = kjWj, w}|г = 0, /=1,2.. .; (w}, wk) = б?. (9.10) Тогда решение у (и) = у ? L2 (Q) задачи (9.1) — (9.3) можно однозначно представить в виде У=^\У1 (О Щ, Vi е 1? @, Т), 2 ] | г/;- @ |2 dt < оо. (9.11) /=i i=i о Для определения коэффициентов ^(?) положим в равенстве (9.9) Ф (х, t) = \J) (*) ^ (ж), ¦ФЕС1 ([О, Г1), \J»(D=O
204 Гл. 3. Управление параболическими системами (а значит, ф ? Ф)- Тогда т S о J У At) (— —- + Xjty eft = ] fj (t) ¦$ (t) 4- где введены обозначения h (t)=U (z, t) Wj (x) dx, yoj = J п а 3 d\ x. г/о Равенство (9.12) эквивалентно соотношениям y'i @ + ^ У; @) = (9.12) (9.13) (9-14) Далее можно повторить сказанное в замечании 8.7. 9.3. Определение dy/dvA\ наблюдение Вычислил! иптеграл \ (dyldt + Ay) ф dx dt, считая, что ср ? Q 6 //2>1(<?)> ф(я, Г) = 0, но ф|2^=0. Применим формально фор- формулу Грина; получим dt и, следовательно, — I Do (x) Ф (ж, 0) dx ~ l /ф dx dt (9.15) Определим теперь производную ду с помощью соотноше- соотношения (9.15). Для этого возьмем «подходящую» функцию г);, заданную на поверхности S, а функцию ф, заданную в цилиндре О, выберем так, чтобы было ф |2 = 1)з (выбор функции ф, очевидпо, неоднозна-
§ 9. Граничные управление и наблюдение 205 чен). Определим производную dy/dvA так, чтобы выполнялось равенство *) lV ly( + \)+l 2 dvA q \ dt ) х dvA* — \ Уо № Ф (я, 0) dx — \ /ф da; d*. (9.16) Можно показать 2), что ^-e-fiT1^K); (9.17) здесь Я (Е) — пространство, двойственное к Hi (S) = <-ф 1 -Ф € Я1 B); 1> (x, 0) = 0, г|) (ж, 21) = 0, x 6 Q}. В качестве наблюдения возьмем z(v) = - — сужение производной dy(v) па (9.18) открытое подмножество SosS;z(y)?/f —1 - 9.4. Функция стоимости; соотношения, характеризующие оптимальное управление Пусть функция стоимости имеет вид dy(v) dv А ГИ, v)qn (9.19) где Ш =--L2 B); N ^Х (U; 11), N>vl, v > 0. Норма в простран- пространстве Н'1 Bо) задается следующим образом. Обозпачим через —As оператор Лапласа — Бельтрами на поверхности Г (так что — As = — Аг — dldt, где — Дг есть оператор Лапласа—Бельтра- Лапласа—Бельтрами на границе Г). Тогда, если /, g ? П~х B0), то но определению (/, g)u-4*o) = $ [(- Д2Г Л g *z = J / [(- Д.)'1 /?] «Е. где (—As)/ — 'Ф — решение в пространстве^Н\ (Ео) задачи (—As)'ф = / в 20; i]) = 0 на границе подмножества So. х) Функция ф при фиксированной функции ty определяется неоднозначно, но правая часть равенства (9.10) не зависит от выбора функции <р, если толь- только выполнено условие ф |2 = if. 2) См. Лионе и Маджепес [1, гл. 4]. 3) Ср. с разд. 5.2 гл. 2.
206 Гл. S. Управление параболическими системами Таким образом, || / ||/j-iB0) -~- (/> /)u-i(z0)- Следовательно, функ- функция стоимости (9.19) полностью определена. Если <Ug — выпуклое замкнутое подмножество пространства L2 B), то существует единственное оптимальное управление- и ^йИд, характеризующееся тем, что Сопряженное состояние определяется как решение задачи _дрМ + л*р{и) = 0 в Q. (9.21> dt на Eq1), р(и) = { Kdv* ' (9.22) ^0 на 2 — 20; /j (ж, Г; и) = О, *6Й. (9.23) Решение р этой задачи «регулярно» 2): р (г/) Ь 6 //J B), так что, в частности, р (и) 6 Lr (О, Г; /Z1 (Q)). Для преобразования неравенства (9.20) применим формулу Грина: умножая соотношение (9.21) на у (и>) — у (и) и интегрируя,, получаем ° = — S (Ц и {у (v) — у (цKd^ + bj(M) гт~^~~г~ rs + ' 2 <9vA* z L c/vA avA J + Jp(M) Ay(v)\- IZL™ + Ay(u)\ \dxdt, . + y() dt I \ dt откуда, учитывая равенство (9.22), находим, что _ , . = г Mi (и _ м) й2 3). (9.24) & dv \ dvA dvA dvA lu-HsLd & dvA* Таким образом, справедлива Теорема 9.2. Если состояние системы определяется как решение уравнения (9.9), а функция стоимости имеет вид (9.19), х) То ость р — решение задачи ( — Az)p — ¦¦ , — z-A в 2о; р —0 на граница подмножества 20. 2) Это все то же свойство двойственности, о котором говорилось в заме- замечании 8.5. 3) Можно показать, что др{и)/д\'А* <с L2(S).
§ 9. Граничные управление и наблюдение 207 то^для оптимального управления u?Wg удовлетворяются соот- соотношения (9.9) (при и =- и), (9.21) — (9.23) и (9.25) Пример 9.1. Пусть <Ug = (U. Тогда оптимальное управление получается из решения задачи dvA* dt — 0 на 2, = 0 в -Л2) 'И~2„ па So, а именно на 2-Е0; и = у Is. (9.26) (9.27) «Расцеплепие» задачи (9.26) формально можно осуществить так же, как и в предыдущих параграфах, но нам не известно, как обосновать необходимые для этого преобразования. Пример 9.2. Пусть <Ud — {v | v >- 0 почти зсюду на S}. Тогда мы приходим к следующей односторонней задаче: dt (9.28> р = (— Aj)" — 2д| на 2 (если S0 = 2); „ („ п\ и (t\ г) (г Т\ — П rP Q У \Х, V) = l/o l*/i Р Vх' -* I — и> * С "'• Оптимальное управление получается^из решения этой задачи,, а именно и = у \%.
208 Гл. 3. Управление параболическими системами 9.5. Регулярное управление Рассмотрим теперь второй возможный подход к решению задачи, о котором говорилось в копце разд. 9.1. Пусть Ш — Щ (S). Если состояпие у (у) определяется как ре- решение задачи (9.1) — (9.3), то легко показать, что dy(v), (9.29) Если наблюдение имеет вид ду (y)/9vA|s, то в качестве функции ¦стоимости можно взять 2 dy(v) (Kv, v)9,, (9.30) где N ?2D1; 41), N>vl, v > 0. Сопряженное состояние в этом случае определяется как реше- решение задачи др (и) dt Р (") = Л*р(и) = 0 в Q; ди{и) dvA р(х,Т;и) = 0, на (9.31) ^более простой, чем задача (9.21) — (9.23). Управление и^611о оптимально тогда и только тогда, когда г (ду(и) \ (ду(и) ди(и)\ 7V1 , /л, . (9.32) Это неравенство, если использовать выражение для р (м), можно -переписать в виде (v-u) , у — •а так как (iVu, i; - и)да = J [(- As) (ЛГи)] (v - и) Й2, то окончательно перавепство (9,32) принимает вид ddPJu)_ + (_ bj(Nu) |(y —u)dS>0 2 L 9v J (9.33)
§ 9. Граничные управление и наблюдение 209 Таким образом, более простой вид задачи, определяющей сопряжепное состояние, влечет за собой усложнение условия оптимальности (9.33), содержащего оператор (—Л^) (условие опти- оптимальности (9.25) этого оператора не содержало). 9.6. Финальное наблюдение Рассмотрим спова систему, состояние которой определяется как решепие задачи (9.1) — (9.3), но будем считать, что наблюде- наблюдение финально, т. е. z(v) = y(; T; и). (9.34) Если i>6L2B), то состояпие у (v) принадлежит пространству L2 (Q) = L2 (О, Т; L2(Q)) (опо определяется как решение уравне- уравнения (9.9)). Так как тогда Ау (и) ? L2 (О, Т; II~2 (Q)), то из равеп- ства (9.1) следует, что б?2@, Т; #~2(Q)). dt* Отсюда (Лионе и Мадженес [1, гл. 1]) вытекает, что t-^-y (t; v) — непрерывное отображение [О, Т] ->- Н~х (Q). (9.35) Следовательно, правая часть равенства (9.34) имеет вполне определенный смысл и паблюдение принадлежит пространству II-1 (Q). Замечание 9.3. Результат (9.35) — не самый сильпый: вместо пространства Ы~х (Й) можно взять Н~1/2 (Q) х), но тогда функция у (х, Т; и) пе будет принадлежать пространству L2 (Q). Пусть, например, Q = @, 1), а состояние системы определяется как решение задачи %L - ^| = 0, у (х, 0) = 0, у @, t) = 0, у A, t) = v (tJ). (9.36) dt дх Тогда оо U (X f) ^S^ II • (f\ ID • (Т\ t Wj(x) =i/2sin(jnx), yj(t) = — w';(\) ^e~n2}4t~a)v(a)da. о (9.37) х) Поскольку норма в пространстве Н~Л1'г (Q) имеет сложный вид, пред- предпочтительнее рассматривать наблюдение кат; момент пространства Я (Q). 2) Следовательно, управление имеет носитель в подмножество {1}Х X @, Т) поверхности S. 14—1230
210 Гл. 3. Управление параболическими системами Если выбрать = 4, (9.38) то veLz(Q,T) и \yj(T)\2>c/j2-ia. Значит, ? \yj(T) \2 = <х>, а потому у (х, Т, v) (? L2 (Q). Замечание 9.4. Аналогичные рассуждения справедливы и в случае параболических операторов произвольного порядка. Пусть, например, Л — эллиптический оператор четвертого поряд- порядка (см. разд. 3.3), а состояние системы определяется как решение задачи (v) = f в <?; ] dt I (9.39) дм = 0i); 2 ¦ у{х, 0; v) = yo(x), Тогда решение у (и) принадлежит L2 @, Т; L2 (Q)) (оно опреде- определяется снова методом транспонирования) и, согласно первому из соотношений (9.39), dy (v)ldt 6 L2 @, Т\ Я (Q)). Следователь- Следовательно, у(;Т; wN#-«(Q). В частном случае параболических операторов второго порядка можно получить дальнейшие результаты, касающиеся функции у {', Т; v), если, например, v ? L°° (S); см. разд. 9.7. В качестве функции стоимости возьмем / (v) = || у (Т; и) - 2д |||_,@) + (Nv, v)L4z), (9.40) где N е % (L2 (S);*L2 B)), N>xl, v > 0. Норма в пространстве II-1 (Q) задается формулой Где (—А)/ =е ф — решение задачи (—А) ф = / в Q; ф = 0 на Г. Оптимальное управление u^'Ug характеризуется тем, что (г/ (Т; и) - *„, г/ (Г; у) - у (Г; и))н-.(а) + + (Nu, v - u)LJ(E) > 0 V i; 6 #в- (9-41) ) g/av — нормальная производная.
§ 9. Граничные управление и наблюдение 211 Сопряженное состояние определяется как решение задачи = 0 в dt (9.42) р (и) |Е = 0; p (x, T\u) = - (- A) [y (T; u) - zj1), x 6 Й. J Неравенство (9.41) можпо преобразовать, если умножить пер- первое из соотношений (9.42) па у (v) — у (и) и применить формулу Грипа. Так доказывается Теорема 9.3. Если состояние системы определяется как решение задачи (9.1) — (9.3) (или уравнения (9.9)), а функция стоимости имеет вид (9.40), то для оптимального управления u^ilg удовлетворяются соотношения (9.1) — (9.3) (при v = и), (9.42) и I я_ л л \ (9.43) dvA* Пример 9.3. Пусть <Ug = 11. Тогда оптимальное управле- управление получается из решения задачи ^U -??- + А*р = 0 в Q; t dv ot = 0 на 2; A* (9'44> у (х, 0) = у0 (х), р (х, Т) = - (- А) [у (х, Т) - 2д] в Q, J а именно и = у \s. Пример 9.4. Пусть 41 a = {v | у>0 почти всюду на S}. Тогда оптимальное управление получается из решения односто- односторонней задачи = 0 в = 0, на 2, (9.45) + iV/>0, y ovA* \dvA* у (х, 0) = Уй (x), p (x, T)=~(- Л) [y (x, T) - zj в Q,- ^ а именпо и = i/ |s. -1) To есть р (х, Т; и) — решение задачи (г, Г; и) = ^(я:, Г; и)—гд в Й; р(я:, Г; и) = 0 на Г. 14*
212 Гл. 3. Управление параболическими системами Пример 9.5. Пусть N = 0 (ср. с разд. 7.2) и Ua = {v \v?<U,\ v (t) 6 Eg почти всюду}, (9.46) где Eg — выпуклое замкпутое ограничеппое подмножество про- пространства L2 (Г). Тогда справедливо утверждение, аналогичное теореме 7.2: если в выражении для оператора А коэффициенты достаточно глад- гладкие и inf / (v) >0, то оптимальное управление u^°lig существует и удовлетворяет условию и (i) ? дЕд для почти всех t, ¦ (9.47) где dEa — граница множества Еэ. Действительно, если управлепие и оптимально, то перавен- ство (9.43) выполняется при N = 0, откуда (теорема 2.1 гл. 2) для почти всех t I dp(t>u) u(t)dr^$dp{t'u) edT VetEg. (9.48) г <5vA* г <5vA* Но в силу свойства обратной единственности (разд. 7.2), которое здесь имеет место, dp (t; и) 0 почти всюду. dvA* Поэтому из неравенства (9.48) следует утверждение (9.47). Заметим, что отсюда же вытекает и единственность оптималь- оптимального управления, если множество Eg, кроме того, еще и строго выпукло. Пример 9.6. Если выбрать множество Ед, как в G.18), то (т 1* Tj\ ?0 (х) почти всюду, если " ' '—— > О, <5vA* ь м dp (x, t; и) I §! (ж) почти всюду, если —— — <; О. Было бы иптереспо получить информацию о свойствах множе- множества, разделяющего па поверхности 2 области, где управлепие и принимает значения ?о и ?i соответственно. Замечание 9.5. Можно было бы избежать использования нормы пространства Н~х (Q), если предположить управлепие v «регулярпым» (как в разд. 9.5), по тогда усложнилось бы выра- выражение (Nv, и)ц. Замечание 9.6. В примере 9.6 можно избежать исполь- использования нормы пространства H~X(Q), когда А — оператор вто- второго порядка; см. разд. 9.7.
§ 9. Граничные управление и наблюдение 213 9.7. Финальное наблюдение; параболические операторы второго порядка Рассмотрим систему, состояние которой определяется как решение задачи + у{)в=0 в Q; ) dt * (9.50) y{v)\s = v, у(х,0; v) = yo{x), x?Q и предположим, что ILg — выпуклое замкнутое подмножество в L°°B) (9.51) (тогда множество °Ug замкнуто в пространстве L2B)). Согласно припципу максимума для параболических уравпений (см. Ладыженская, Солопников и Уральцева [1, теорема 7.2, гл. 3]), у (и) ? L°° (Q), a v-*-y(v) — (аффинное) непрерывное отображе- отображение L" {Ъ)-+U° {Q). Поэтому у(Т; i>)eZ,°°(Q) и, в частности, у (Т; v) 6 L2 (Q). В качестве функции стоимости можпо взять / (и) = \ [у (х, Т; v) - zR (x)f dx + (Nu, v)v, (9.52) где U = Щ2); N ?.? {<й; Ч), N > vl, v > 0. Согласно замечанию 1.1 гл. 1, существует такой единственный элемент и ?<Ug, что / (в)</ (v) Vv 6 Ua, причем этот мипимизирующии элемент характеризуется тем, что \ [у (х, Т; и) - 2д] [у {х, Т; v) - у (х, Т; и)] dx + а g. (9.53) s Определим сопряжепное состояние как решение задачи dt . \ (9.54) т. е. так же, как и в разд. 9.6 (см. (9.42)), но уже без помощи опе- оператора (—А). Тогда можно сказать, что управление и^°И^ оптимально в том и только в том случае, если удовлетворяются соотношения (9.50) (при v = и), (9.54) и др(и) U^m. + Nu]{v-u)dZ^0 Vve<Ud. . (9.55)
214 Гл. 3. Управление параболическими системами Пример 9.7. Возьмем множества <Ug и Е9 такими же, как в (9.46), G.18). Применив полученный только что результат, получим (х) почти всюду, если —г ¦ + Nu (х, t) > О, dvA* / ч др(х, t: и) ._ , . Л (ж) почти всюду, если - -f- iVw {х, t) < О, d и (ж, f; и) -\-Nu{x, () = 0в остальных точках поверхности 2. Если N = 0, то справедливы утверждения, аналогичные утвер- утверждениям примера 9.5. § 10. Управляемость 10.1. Постановка задачи Определение 10.1. Система, состояпие которой опре- определяется как решепие задачи B.2) — B.4), называется управляе- управляемой, если паблюдение Су (v) заметает (аффинное) подпростран- подпространство, плотное в пространстве наблюдений, когда управление v пробегает все пространство управлепий (т. е. ограничения на управление отсутствуют). Замечание 10.1. Определение 10.1 представляет собой аналог известного в конечномерном случае определения для фи- пального наблюдения Су (v) = у (Т; и). Замечание 10.2. В бесконечномерном случае нужно, очевидно, различать плотное подпространство и все пространство. В приложениях (аффинное) подпространство, заметаемое наблюде- наблюдением Су (v), не является замкнутым для параболических уравне- уравнений; оно может быть замкнутым для гиперболических уравнений (см. гл. 4). Замечание 10.3. Естественно, что определение 10.1 легко адаптировать применительно к любой из рассмотренных выше задач (а не только к задаче B.2) — B.4)). Мы покажем на примерах, как проблема управляемости сво- сводится к вопросу единственности.
§ 10. Управляемость 215 10.2. Управляемость и единственность Пример 10.1. Рассмотрим сначала случай 3.1.1 разд. 3.1: состояние системы определяется как решение задачи dt x A0.1) а паблюдение у (v) принадлежит пространству L2 (Q). Если управлепие v пробегает пространство L% (Q), то наблюде- наблюдение у (v) заметает пекоторое (аффинпое) подпространство, плотное в пространстве L2 (Q); иными словами, рассматриваемая система управляема. Действительно, с помощью соответствующей замены всегда можно свести задачу к случаю / = 0 и у0 = 0. Пусть функция ф ? L% (Q) ортогональна к подпространству, заметаемому наблю- наблюдением у (v): Q Рассмотрим функцию 5 — решение задачи Ь-4*5 = "ф в Q; ~\ dt A0.3) Тогда ~~ ~~dt q L dt Следовательно, ^ = 0, а значит, и г|з = 0. В силу теоремы Хана — Банаха отсюда следует утверждение об управляемости. Замечание 10.4. Использованный в предыдущем примере метод является общим. Мы приведем еще два примера его при- применения. Пример 10.2. Рассмотрим случай 3.2.2 разд. 3.2: состоя- состояние системы определяется ,как решение задачи -0 в dt я i \ \ A0-4) dy(v) =v v^qi = L2fy\. yix Q. р)_о X?Q а наблюдение у (x, T; v) принадлежит пространству L2 (Q).
216 Гл. 3. Управление параболическими системами В данном случае система также управляема. Действительно, пусть i]> 6 L2 (Q) и 1^(х)у(х, Т; v)dz = 0 Vv^U. A0.5) Рассмотрим функцию \ — решение задачи dvA* Тогда dt A0.6) = 0; l(x,T)=ip(x) ), x?Q. | \l — z!L + A*t\y(v)dxdt = 0 = q\ dt 1 p о ду (v) 2 dv л откуда, согласно A0.5), ^ Следовательно, g = 0 па поверхности 2. Но если дапные Коши для функции ? на поверхности 2 равны пулю, то (Мизохата [1J) I = 0, а значит, и г|з = 0. Пример 10.3. Рассмотрим теперь систему, описываемую следующей задачей для параболического уравнения четвертого порядка: *?> + Д'И*) = 0 в Q; A0.7) dt y(v)\x=vit ^€^B), A0.8) = v2, v2eL2'B); A0.9) y(x,0;v) = 0, x6Q; A0.10) здесь управление v = {i>i, v2} принадлежит пространству 41 = Решение этой задачи определяется с помощью транспониро- транспонирования: существует единственная функция у (v) ? L2 (Q), для
§ 10. Управляемость 217 которой q где dt dv A0.11) dt dq> (x, t) dv = 0; Ф(:г,Г)-=0, x?Q\. A0.12) Предположим, что наблюдением является у (х, Т; v), x ? Q. Как известно (см. замечание 9.4), у {-, Т; v) ен~2 (Q). A0.13) Рассматриваемая система управляема. Действительно, пусть функция г|) ? Щ (Q) такова, что (у (•, Т; и), г|з) = 0 г) \fv ?<U. A0.14) Определим функцию | как решение задачи f- A s = 0 в (^; ==0; Тогда dt откуда Следовательно, at dv = 0 на 2. A0.16) A0.17) г) Скобки здесь обозначают скалярное произведение элементов, принад- принадлежащих пространствам II'2 (Q) и //§ (Q) соответственно.
218 Гл. 3. Управление параболическими системами Сравнивая эти соотношения с указанными в A0.15) условиями на поверхности 2, заключаем, что данные Коши для функции ? на поверхности 2 равны нулю, а потому (Мизохата [1], Тапабе [1]) ? — 0 и г|з = 0. Отсюда и следует наше утверждение. 10.3. Суперуправляемость и суперединственность г) Снова рассмотрим систему, описанпую в примере 10.3, но предположим, что управление v пробегает подпространство {0, L2 B)} пространства L2 B) X 1? B). Говорят, что имеет место суперуправляемостъ, если подпространство, заметаемое наблюдением у (х, Т; и), плотно в пространстве Н~г (Q). Итак, пусть состояние у (р) системы определяется как решение задачи 2) dt dy(v) A0.18) у (х, 0; v) = 0, x ? Q. ,Для того чтобы выяснить, плотно ли подпространство, заметае- заметаемое наблюдением у (х, Т; и), в пространстве Н~2 (Q), рассмотрим функцию if ? HI (Q), удовлетворяющую условию A0.14). Пусть | — решение задачи A0.15); тогда равенство A0.16) принимает вид •откуда Д? = 0 на поверхности 2. Следовательно, функция .удовлетворяет соотношениям A0.19) Таким образом, необходимо выяснить, имеет ли место супер- единственность: вытекает ли из соотношений A0.19) равенство ? = 0? Приведем один результат, дающий положительный ответ на этот вопрос (Фатторини [5]). J) В оригинале super-controlabilite et super-unicite.— Прим. перев. 2) Мы пишем здесь v вместо v2.
§ 10. Управляемость 219 Теорема 10.1. Если функция g удовлетворяет соотноше- соотношениям A0.19) и принадлежит L2 @, Т; Н2 (&)), причем размер- размерность п равна 1, а область Q есть @, с»), то g = 0. Доказательство. Введем функцию о °° %(ц, t) = — V sin (хц) g (х, t) dx. Так как g @, t) = 0, —у 2' ' = 0, то из уравнепия следует, что а значит, Тогда dt , t) = ехр 1- = о, Г - t)} = * J ехр (- Jit) ?.~1/2| (?.1/4, Т) dh = 0, 0 <т < 71. Таким образом, преобразование Лапласа от функции ^-i/2| ^i/4; ^ равно нулю, а потому g (А,1/*, Г) = 0. Отсюда выте- вытекает, что g (х, Т) = 0 и, зпачит, g = 0. Замечание 10.5 х). Говорят, что система нулъ-управляе- ма 2) (соответственно нулъ-управляема при наличии ограничений v^'Ug), если начало координат О принадлежит замыканию множества, заметаемого наблюдением Су (и), когда управление v пробегает все пространство 11 (соответственно множество 11 д). Можно указать (Фатторини [8]) достаточные условия для того, чтобы эти два понятия были эквивалентны в случае, когда мно- множество 41 g задается глобальными ограничениями (типа B.55) гл. 2). Эти условия удовлетворяются, в частности, для систем, *) Замечания 10.5—10.7 добавлены автором в английском издании.— Прим. перев. 2) В оригинале null-controllability.— Прим. перев.
220 Гл. 3. Управление параболическими системами описываемых волповыми операторами (конечно, приведенные выше определения легко распространяются па гиперболические систе- системы, рассматриваемые нами в гл. 4). Замечание 10.6. Одной из важнейших для приложений является проблема управляемости при наличии аддитивных воз- возмущений. Речь идет об отыскании допустимого управления, кото- которое приводит систему в нужное состояние при наихудших, наибо- наиболее неблагоприятных возмущепиях. Эта проблема, таким образом, тесно связана с теорией игр. Относительно геометрического подхода к этой проблеме (и, в частности, развития метода Антосевича [1]) см. работу Дел- фура и Миттера [1]. Замечапие 10.7. Другое связанпое с управляемостью понятие —модальная управляемость1), которая, говоря пестрого, означает следующее: существует управление, «улучшающее» спектр (например, улучшающее устойчивость системы). Модальная управляемость относительно данного спектра означает возмож- пость выбора управления, которое обеспечивает получение систе- системой нужного спектра. Это понятие, введенное Розенброком [1], детально изучалось Саймоном и Миттерол! [1], Вонхамом [2] и др. в случае конечпо- мерного пространства. Укажем на иптерееную аналогию между проблемой модальной управляемости относительно даппого спектра и следующего рода задачами численных методов линейной алгебры (так называемые «обратные задачи»): дана матрица А (эрмитова или действитель- действительная); найти такую действительную диагопальную матрицу В, чтобы матрица А + В имела данпый действительный спектр (Даунинг и Хаусхолдер [1], Хадлер [1], Лаборд [1]). § 11. Стартовое управление 2) 11.1. Постановка задачи. Общий результат Пусть выполнены предположения § 2, причем U = II. A1.1) Состояние у (и) ? L2 @, Т; V) системы определяется как решение задачи dJ^ + A{t)y{v)=f, A1.2) v) = v, A1.3) J) В оригинале modal controllability.— Прим. перев. 2) В оригинале controle initial.— Прим. перев.
§ 11. Стартовое управление 221 где / — данпый элемент пространства L2 (О, Т; V). Таким обра- образом, управлением здесь служит начальное состояние системы. Для определенности *) будем считать, что наблюдением являет- является у (Т; и), а функция стоимости имеет вид J(v)= \у (Т; и) - 2д р -1- (Nv, v), A1.4) где N 6 X (И; Н), N > vl, v > 0. Оптимальное управление и ? <Ud характеризуется тем, что (у (Т; и) - 2д, у (Т; и) - у (Т; и)) + + (Nu, v — и) > 0 Vy 6 ^а. A1-5) Введем сопрялгенное состояние как решение задачи | A1.6) р (Т; и) = у (Т; и) - zw p (t; и) 6 L2 (О; Г; V). J Тогда неравенство A1.5) эквивалентно неравенству (р @, и) + Nu, v — и) > 0 Уу 6 ^а- (Н.7) Следовательно, справедлива Теорема 11.1. Если состояние системы определяется как решение задачи A1.2), A1.3), а функция стоимости имеет вид A1.4), то для оптимального управления и?Шд удовлетворяются соотношения A1.2), A1.3) (при v = и), A1.6) и A1.7). 11.2. Примеры Пример 11.1. Если ограничения на управление отсутст- отсутствуют (т. е. если °llg = Н), то р @; и) -г Nu = 0. Поэтому опти- оптимальное управление получается из решения задачи at • dt i AL8) у @) + N~lp @) = 0, p (T) = у (T) - 2д; y,PEL2 @, T; V), ) а именно и = — N~lp @). Пример 11.2. Пусть выполпены предположения разд. 3.1, причем dldt -{-А — параболический оператор второго порядка, а 41 g = {v \ v > 0 почти всюду в Q}. A1.9) 5) Мы предоставляем читателю самому провести необходимые рассужде- рассуждения (аналогичные нижеследующим и использующие результаты предыдущих параграфов) для иных типов наблюдения.
222 Гл. 3. Управление параболическими системами Тогда оптимальное управление получается из решения односто- односторонней граничной задачи = 0 в y(x, 0)>0, p( \ y(x, Q)[p(x, O)+Ny(cc, 0)] = 0 в Й; pfo T) = y(x, T)-za(x), x?Q, J а именно u (x) = г/ (a:, 0). Пример 11.3. Пусть выполнены предположения разд. 11.1, причем N = 0 и ^а — ограниченное выпуклое замкнутое 1 подмножество пространства // (= 41). / \ • У Тогда оптимальное управление существует; каждое оптимальное управление и ?tlg характеризуется тем, что (р @; и), и — и) > 0 Уг>6^<5 (И.12) (это неравенство получается из неравенства A1.7) при N = 0). Если дополнительно предположить, что имеет место свойство обратной единственности (разд. 7.2), то inf J(v)>O=$p(Q;u)=Q. A1.13) Тогда оптимальное управление удовлетворяет условию и б Шд, A1.14) где &Ug — грапица множества <Ug. Если множество Ч1д к тому же строго выпукло, то оптимальное управление единственно. 11.3. Управляемость Можно легко адаптировать определение 10.1 применительно к условиям рассматриваемой сейчас задачи: система, состояние которой определяется как решение задачи A1.2), A1.3), управ- управляема (в момент времени Т), если (аффинное) подпространство, заметаемое наблюдением у (Т; v), когда управление v пробегает все пространство 41 = Н, плотно в пространстве Н. Мы убедимся (используя точпо такие же рассуждения, как в § 10), что выяспение этого свойства управляемости сводится к установлению свойства обратной едипствепности. Предположим, что с помощью соответствующей замены пере- переменных мы получили / = 0 в уравнении A1.2). Пусть элемент
§ 11. Стартовое управление 22S h (~H таков, что (y(T;v),h) = O Vv?ll. Введем функцшо | ? L2 (О, Г; F) — решепие задачи Тогда ъ \ at = 0 = - (у (Г; v), Щ + (I @), у @; »)), откуда в силу A1.15) и A1.3) (g @), v) = 0 Vv б Я. Таким образом, g @) = 0. Если имеет место свойство обрат- пой единственности, то g = 0, а потому h = 0, так что доказапа Теорема 11.2. Если имеет место свойство обратной един- единственности, то система, состояние которой определяется как решение задачи A1.2), A1.3), управляема. Замечание 11.1. Если выполнены условия теоремы 11.2, то в случае параболического уравнения подпространство, заметае- заметаемое наблюдением у (Т; v), не замкнуто в пространстве Н. Действительно, если бы оно было замкнутым, то отображение v-*¦ у (Т; v) было бы сюръективным, а тогда для любого элемента h ? If существовало бы решение у 6 L2 @, Т; V) задачи с обращен- обращенным временем at Однако известно, что это не так, ибо параболические уравнения; «необратимы». 11.4. Одна задача об оценке Пусть состояпие у системы описывается параболическим опе- оператором второго порядка х) d]L + Ay = Q в Q. A1.17)- dt 1) Проводимые ниже рассуждения легко распространить на любые пара- параболические операторы, для которых] справедлива теорема Мизохата [1]
224 Гл. 3. Управление параболическими системами Рассмотрим задачу о нахождении (неизвестного) начального состояния у @) по изморенным (или наблюдаемым) характеристи- характеристикам управляемой системы ду_ dv л = ft- (И.19) 2 Точнее, предполагается, что функции g0 и gi (принадлежащие пространству L2 B)) известны и существует функция у, удовле- удовлетворяющая соотношениям A1.17) — A1.19). Тогда эта функция у единственна: если у — вторая такая функция, то разпость у = = у — у удовлетворяет соотношениям ?L + Ay = 0 в Q, y\s==Q, ^ dt ovA ¦0, а значит (Мизохата [1]), у — 0. Следовательно, существует вполне определепное начальное состояние у @), которое нас и интересует. Иными словами, речь идет о (приближенном) вычислении значопия у @) решения некор- некорректной задачи Копга A1.17) — A1.19). Преобразование задачи. Будем рассматривать у @) ¦¦= и как управление, которое пужпо определить оптималь- оптимальным образом. Пусть v 6 L? (О) — °И. Введем две системы, состояпия у1 (v) и у2 (v) которых определяются как решения соответствующих задач "а к ' + Ay1(v) = Q в Q; ) dt \ A1.20) yi(v) = g0 на 2, у1 @; v) = v в Q ) и ^/(^) = 0 в Q; dt ) ^ йна2, y@;v) vb dvA Ясно, что если v = и, то у1 (и) = у2 (и). Введем функцию / (У) = J [у1 (V) - у2 (v)f dx dt. A1.22)
П. Стартовое управление 225 Тогда можно утверждать, что inf J(v) = 0 T- e- существует единственный } A1.23) элемент и, для которого J (и) - - 0. Мы будем искать значение у @) -- у, исходя из соотноше- соотношения A1.23). Замечание 11.2. Поскольку соотношение A1.23) экви- эквивалентно исходной задаче, в пем сохраняется «неустойчивость» этой задачи. Функция / (и), определенная формулой A1.22), некоэрцитивна на пространстве % (§ 5 гл. 1); поэтому мы должны еще «регуляризовать» эту функцию. П р и л о ж е н и е теоремы 5.3 г л. 1. Для е > 0 зада- зададим функцию Je(v) = J(v)+e\v\2 (\v\2=l[v{x)fdx). A1.24) а Тогда, согласно теореме 5.3 гл. 1, если иг?11 --- Н — единственный элемент, миними-  зирующий /8 (у), то и& —> и ъ Ы при е —v 0. / Таким образом, мы спели рассматриваемую задачу к отыска- отысканию (или аппроксимации) элемента иг. Эта новая задача уже устойчива. Действительно, соотношение A1.23) справедливо только для некоторых частных значений g0 и ?i (удовлетворяющих условиям совместности). Поэтому элемент и в соотношении A1.23) «не зави- зависит непрерывно» от функций g0 и gv В то же время элемент ив «зависит непрерывно» от этих функций. Отыскание ив. Рассмотрим более общую задачу: найти inf /? (у), если v ? <Ud c= U = //. A1.26) Пусть иг ? '41д — оптимальное управление, характеризующееся тем, что ^ - У2 fa)] [У' (»)-У2 (у) - У" К) + У2 (и*)] dt dx + Q + e(ue, у-Ие)>0 УивШд. A1.27) Сопряженное состояние р ™ {р1, р2} определяется как реше- решение задач dt \ A1.28) р1=0 на 1, pl(x, 7') = 0 в Й 15-1230
226 Гл. 3. Управление параболическими системами И dp 2 } A1.29) = 0 на Б, р2(х, Т) = 0 в Q. охл* ) Неравенство A1.27) можно преобразовать; для этого умножим первое из соотношений A1.28) (соответственно A1.29)) на у1 (v) — — У1 (иг) (соответственно па у2 (v) — у2 (иг)), проинтегрируем по цилиндру Q и вычтем одно соотношение из другого: q \ dt q 2 = j [p1 (x, 0) -p2(x, 0)](v-us) dx. В результате убеждаемся, что справедлива Теорема 11.3. Для отыскания оптимального управления иг необходимо решить следующую задачу: Q; A1.30) dt ' == SO! — ^6 5 на 2; A1.31) ' = 0, ^ = 0 yl (x, 0) = j/2 (x, 0), У (z, Г) = 0, рг (х, Т) = 0, | в q pl(x,0)-p2(x,0)+Ey1(x,0) = 0 J
§ 12. Двойственность 227 § 12. Двойственность 12.1. Общие замечания Пусть / (и) — квадратичный функционал г) на пространстве 11; его можно записать в виде 3 (v) = я (и, у)— 2L (у) + / @>) A2.1) где л; (w, v) — билинейпая непрерывная форма на пространстве 11, a L (и) — линейная непрерывная форма на этом же простран- пространстве. Предположим, что л (v, v) > с || v ||1, с>0, Уу6%, A2.2) а 11 д — выпуклое замкпутое подмножество пространства 11. Рассмотрим задачу найти inf / (v), если v 6 ^о- A2.3) Введем функцию v-*¦ F (v), определенную на пространстве <U формулой (L(p)f если vVir + °°' если у $ ?/а. Тогда задачу A2.3) можно представить в виде найти ini [n(v,v) + 2F(v)]. A2.5) Функция F обладает следующими свойствами (в дальнейшем только эти свойства нам и потребуются): F выпукла и полупепрерывпа снизу; принимает "» значения в (— оо, + оо]; Fs? -\- oo. J v1^-*3) Определим функцию, двойственную к F относительно били- билинейной формы л 2): F* (и) = sup [я (и, у) - F (у)]. A2.7) Функция /"'* также обладает перечисленными в A2.6) свой- свойствами. Действительно, она представляет собой верхнюю огибаю- огибающую семейства линейных непрерывных функций; поэтому доста- а) Ото предположение вовсе но обязательно (см. примечания к настоя- настоящей главе). 2) Иногда функцию F* называют сопряженной функцией к функции /<', или преобразованном Юпга функции F; см. Иоффе п Тихомиров [2].— Прим. перев. 15*
228 Та. 3. Управление параболическими системами точно убедиться в том, что F* щЬ -|- оо. Но. последнее очевидно: существуют такой элемент и0 ? Ш и такое число у ? R, что я (щ, v) -у </>•); A2.8) отсюда F* (и0) < у < оо. Замечание 12.1. Если предположить, что вместо нера- неравенства A2.2) выполняется только я (v, v) > 0 Vv?6U, A2.9) то тождество F* = -(- оо становится воздюжным (достаточно взять л — 0); однако если функция F ограничена снизу, то очевидно, что F* ф + °°- Замечание 12.2. Функция F**, двойственпая к F* относительно билинейной формы л., совпадает с F. Однако это, вообще говоря, не верно, если выполняется только неравенст- неравенство A2.9) (Брезис [3]). Если билинейная форма я удовлетворяет условию A2.2), но не симметрична, то функция, двойственная к F* относительно формы я*, совпадает с F. Теорема 12.1. Пусть выполнено условие A2.2). Тогда inf [я (у, v) + 2F(v)]+ inf [я (у, и)-f 2F*(v)] = 0. A2.10) Если первая нижняя грань в левой части равенства A2.10) дости- достигается на элементе и, то вторая нижняя грань достигается на элементе —и. Доказательство. 1) Как известно (теорема 1.2 гл. 1), элемент и ?41, минимизирующий функционал л (v, v) -\~ 2F (v), характеризуется тем, что л (и, и) — L (и) ^ л (и, v) — L (и) Уи ? <Ug, т. е. я (и, и) + F(u)= inf [я (и, v) + F(v)). A2.11) Это утверждение верно и для функции F*, поскольку она обла- обладает свойствами, перечисленными в A2.6) (теорема 1.6 гл. 1). Следовательно, существует единственный элемент w ?11,, для которого inf [л (v, v) + 2F* (v)] = я (w, w) + 2F* (w), A2.12) а это соотношение эквивалентно равепству я (w, w) + F* (w) = inf [л (w, v) + F* (v)]. A2.13)
§ 12. Двойственность 229 2) Соотношение A2.11) можно переписать в виде хс (и, и) -\- F (и) -)- sup [я (— и, у) — F (у)] = О, или и (и, и) + F (и) -f F* (—и) =_¦ 0. A2.14) Таким образом (см. замечание 12.2), я (- и, —и) + F* (- u) = -F (и) = - F** (и) = = — sup [я (и, v) ~ F* (v)] = inf [я (— и, v) + F* (v)]. Сравнивая этот результат с равенством A2.13), заключаем, что w — —и. 3) Теперь легко доказать формулу A2.10): inf [я (v, v) + 2F (и)] + inf [я (v, v) + 2F* (v)] = v?<u veil = я (и, и) + 2F (и) + я (— ы, — м) -f 2^* (— w) = = 2 [я (и, и) + F (и) -J- F* (- и)] = 0; здесь использовано равенство A2.14). Замечание 12.3. Допустим, что выполняется только неравенство A2.9). Пусть X — множество (предполагаемое непу- непустым) оптимальных управлений (X — выпуклое замкнутое под- подмножество .множества %1д — см. гл. 1, § 5). Тогда F* щк -j- °° и множество X* элементов w, на которых выполняется равен- равенство A2.13), непусто. Точнее, X* гэ - X, A2.15) и соотношение A2.10) также выполняется (оно доказывается ана- аналогично; следует заметить, что F** ^ F). Замечание 12.4. Равенство A2.10) можно представить еще в виде inf [я (v, v) + 2^(у)] = sup [- я (v, v) - 2F* (v)}, A2.1E) что позволяет оценить значение inf / (v). Замечание 12.5. Правую часть равенства A2.16) можно записать в виде sup [— я (v, и) — 2F* (- у)].
230 Гл. 3. Управление параболическими системами Согласно определению A2.7), F* (— и) = sup [к (— и, v) — F (v)] = sup [л (и, — v) -f L (у)], и так как (гл. 1, § 1) я (и, - v) + ад=у то J*(-ы) =Д sup (—/'(и), у). У(и)^Ч1\ A2.18) Для 5 6^' положим Н, у) A2.19) (т. е. -Ж/у (|) — значение на элементе !• опорной функции множе- множества й11д); тогда /'(ц)). A2.20) Следовательно, равенство A2.16) можно записать еще в виде inf [я (у, у) + 2/>'(у)]= sup [—я (», v)-~ Л ^Л— /'(у))]. сеж сеж A2.21) 12.2- Один пример Пусть ^а= {^ I (у, ft)» < «„ * = 1 т}, A2.22) где эле.мепты gt ?<U и числа а г 6 R даны, причем для определен- определенности положим 1L = Ь% (Б). Состояпие у (v) системы определяется как решение задачи 61 \ A2.23) y(v)\x=v, у (х, 0; v) = у0 (ж), ж6 й, J а функция стоимости имеет вид J(v) = l [у (v) - 2д]2 d2 + (Nv, y)L2B) A2.24)
13. Ограничения на управление и на состояние 231 (см. разд. 8.3). В рассматриваемом случае я (и, v) = \ [у (и) - у @)] [у (v) - у @)] d2 + (Nu, v)mt), L{v)=l{ZiX-y @)] [y(v)-y @)] dS. Пусть | 6 L2 (X); тогда sup (i, y)L2B) = { ?=i г^Т A2.25) ь *9 V-i-°° в противном случае. m Действительно, если | —¦ 21 Sj^i, ?j > 0> то первое равен- ^ ^ ство A2.25) очевидно. Если же g не имеет указанного вида, то по теореме Хана — Банаха существует элемент h ? L2 (X), для которого (g, h) > 0; (h, gt) < 0, i --^ 1, . . ., т. Но тогда для достаточно больших чисел X > 0 элемент Я/г. лежит в множестве %,), а потому sup (t, y)L2B) > Mm (?Д%!B) = + оо. Соотношение A2.25) доказано. Правая часть равенства A2.21) принимает тогда вид [ml т. - я (v, v) - 2 hat I, -J'(v)= 2 Sift, It >0. A2.26) i=l J i=l Это задача квадратичного программирования (требующая, однако, предварительного вычисления величин я ((J')~1gi, (J')'1 gi)). § 13. Ограничения на управление и па состояние 13.1. Один общий результат Пусть °U — (гильбертово) пространство управлений, Ф — век- векторное топологическое локально выпуклое рефлексивное про- пространство над R и р ^%{U\ Ф). A3.1) Пусть 'ё — залшнутый выпуклый конус в Ф A3.2) с вершиной в начале координат. Определим множество допустимых управлений ^в- {у 1фо-ЬрУб«>, A3-3)
232 Гл. 3. Управление параболическими системами где ф0 — данный элемент пространства Ф. Предположим, что 6ttg ф 0. Множество <U0 выпукло и замкнуто. Замечание 13.1. В разд. 13.2 будет показано на приме- примерах, каким образом определение A3.3) охватывает ограничения на управление и на состояние. Пусть задано отображение v -> / (v) множества °llg в R; пред- предполагается, что это выпуклый и дифференцируемый функционал (гл. 1, § 1). Как обычно, ищется inf J{l>). Известно (гл. 1, § 1), что необходимое и достаточное условие оптимальности управления и ? ^/-з задается неравенством /' (и) • (v - и) > 0 Vy 6 Чд. A3.4) Определим множество ?+--{ф'|ф'?Ф', (Ф', Ф)>0 Уф^^}, A3.5) где (ф', ф) — скалярное произведение элементов ф' ? Ф' и ф ^ Ф. Покажем, что («+)+ -.= %. A3.6) В са.мом деле, ясно, что % s (%+yu. Предположим, что это вклю- включение — строгое; тогда найдется такой элемент | 6 (^+)+; что 5 (t ??. В этом случае по теореме Хана — Банаха существует такой элемент ф' 6 Ф'* что ф' > 0 на .множестве % и (ср', |) < 0. По ф' > 0 на множестве с& ¦=> ф' 6 ^+i а так как \ 6 (^+)+, то (ср', Н) > 0. Полученное противоречие и доказывает формулу A3.6). Теорема 13.1. Пусть р* 6 X (Ф'; ^') — оператор, сопря- сопряженный к оператору р. Предположим, что множество р*%+ замкнуто в 11'\ A3-7) — Фо принадлежит замыканию множества $%д в Ф. A3.8) Тогда если и — оптимальное управление {предполагается, что оно существует), то найдется элемент \?<ё+, для которого J'(u) -- р*Х A3.9) и (X, сро -'г ри) - 0. A3.10) Обратно, если элементы u?t?g и X 6 ^+ удовлетворяют усло- условиям A3.9) и A3.10), то и — оптимальное управление.
§ 13. Ограничения на управление и на состояние 233 Доказательство. 1) Для фиксированного управления и ? °U g определим множество . Шв ~ {v | v 6 11, и + ev 6 11 д Для подходящего к > 0}. A3.11) Если v 6 11 д, то v — и 6 lit, ибо u -|- (v — и) 6 11 д. Следова- Следовательно, согласно соотношению A3.4), J'(u) e №)+ A3.12) (заметим, что определение A3.5) имеет смысл независимо от того, является множество % конусом или нет). Убедимся, что (р*?+)+ с ЧП. A3.13) Действительно, (и?, р*с+) > ог) vc+ e«+, т. е. (pw, Cj-) > 0. Но ф0 + ри ? г(г (так как по условию и ?91$); следовательно, согласно свойству A3.6), ср0 -| ри ? (?+)+. Но тогда <фо -г р {и + 0w), c+) > 0 V0 > 0, откуда и + 0»6^(? Для любого 0 > 0, а значит, w^6Uo- Это и доказывает соотношение A3.13). Так как, согласно предположению A3.7), множество р*?Л замкнуто, то к нему применима формула A3.6), т. е. ((р*^+)+)+ = --- р*%+. Поэтому из соотношения A3.13) следует, что (ЧЩ)+ с р*«+. A3.14) Из соотношений A3.12) и A3.14) теперь вытекает, что суще- существует элемент X ? %+, удовлетворяющий условию A3.9). Далее, (J'(u), и) = {X, ри) = inf (J'(u),v) = = ini}(X, pv)= inf {X, ф0 + pv) — {%, %). A3.15) Так как x e *ё+ =ф (X, ф0 + р«) > о, то в силу предположения A3.8) inf (X, фо + ру> = 0. Поэто.му из равенства A3.15) следует соотношение A3.10). г) Скобками обозначено скалярное произведение элементов, принадле- принадлежащих пространствам 11 и 11' соответственно.
23-4 Гл. 3. Управление параболическими системами 2) Обратпо, пусть элементы X ? $+ и и^Шд удовлетворяют условиям A3.9) и A3.10). Тогда для любого управления v?1?g J'(u)-(v — и) — (X, pv — pu} — — (к, фо + pv) — (X, ф0 -|- pu) = (X, ф0 + pv) > 0, поскольку X ?сб+. Следовательно, J'(u)-(v — и) > 0 для любого управления v ?<ид, т. е. и — оптимальное управление. Пример 13.1. Пусть % -^ {0}. Тогда «+ = Ф'. Поскольку по условию <Ug=fc 0, существует такое управление v?°U,d, что Фо + pv --¦ 0. Таким образом, выполняется условие A3.8), и мы получаем: если % = {0}, то теорема 13.1 применима в случае, когда множество р*Ф' замкнуто в пространстве 41'. Замечание 13.2. (Это замечание поглощает и пример 13.1.) Если ф0 =- ри0, где щ ?Шд, то условие A3.8) выполнено. A3.17) Действительно, w = — uQ ?4lg, и потому ф0 -г pw = 0 13.2. Приложения (I) Пусть выполняются предположения разд. 2.1, причем 11 = — L2 @, Т; V). Состояние системы определяется как решение задачи dt \ A3.18) -а функция стоимости имеет вид J{v)=l\y{t;v)- 2Д |2 dt + {Nv, v)y, A3.19) о тде гд 6 /-2 @, Г; Я), N ^ X {11; 41), N > v/, v > 0. Допустим, что «в =-- {У|У(У; v)?yi +Щ, A3.20) тде г/1 — данный элемент пространства II, а % — замкнутый выпуклый конус в пространстве // с вершиной в начале координат. Предполагается, что %оф0. Укажем связь введепных сейчас обозначений с применявши- лайся в разд. 13.1: ф -= Н, pv = у (Т; v)-y (Т; 0), ер0 = у (Т; 0) - уу. Сопряжснпый оператор р* 6 X (Я; L2 @, Т; V)) определяется
§ 13. Ограничения на управление и на состояние 235 следующим образом: если h ? Н, то p*h = w — решение задачи dw . , * dt Действительно, = 0 в (О, Т), w(T) = h. A3.21) », y(t;v)-y(t;O)jdt = dt откуда w = p*h. A3.22) Л е м м а 13.1. Условие A3.7) выполнено. Доказательство. Пусть hn ? %+ и wn — p*hn —>~ w в пространстве L2 (О, Т; V). Тогда ^? A*(t)wn = 0, A*(t)wn-+A*(t)w в L2@, T; V), dt откуда dwjdt —>~ dw/dt в пространстве L2 (О, Т; V). Поэтому wn (Т) — hn-+ w (Т) в пространстве Н. Положим h = w (Т). Тогда hn -> h в пространстве // и (так как множество *ё+ замкнуто) h ? ??+, —-jr ~\- A*w —- 0, w (T) --= h. Отсюда и следует, что w — p*h. Л е м Д1 а 13.2. Условие A3.8) выполнено. Доказательство. Справедливо даже более сильное утверждение: существует такое управлепие v ^°Ug, что ср0 -}- pv — = 0, т. е. у (Т; v) = z/i. В самом деле, всегда найдется такая функ- функция z б L2 (О, Т; V), что dz/dt б L2 (О, Т; V) и г @) = у0, z (Г) = = z/i, где г/о и ,?i — выбранные произвольным образом элементы пространства //. Тогда достаточно взять v = dz/dt -\- A (t) z — / (ср. с замечанием 13.2). Таким образом, можно примепить теорему 13.1. Введем сопря- сопряженное состояние р (и) как решение задачи __dpi^ ш ¦ р(Т;и) = 0. A3.23) dt Легко проверить, что J'(u) = 2 [р(и) -!- Л^Л'и], A3.24) где Лу — канонический изоморфизм пространства V на V.
236 Гл. 3. Управление параболическими системами Согласно теореме 13.1, существует такой элемент X, что *) Х^+, р(и) + Лу^и = р\ A3.25) (X, у (Т; и) - У1) = 0. A3.26) Положим w — р*К и q = р (и) — w. Тогда (в силу соотноше- соотношений A3.21)) at Исключая отсюда и, убеждаемся, что справедлива Теорема 13.2. Пусть состояние системы определяется как решение задачи A3.18), функция стоимости имеет вид A3.19), а множество 11 g задано соотношением A3.20), причем Ш,дФ 0. Если оптимальное управление существует, то найдется такой элемент X ? П, что оптимальное управление и получается из реше- решения задачи -j- + A(t)y + N~lh vq = f, у @) = у о, dt ~^Л а именно Ay^Nu + q = 0. A3.29) 13.3. Приложения (II) Пусть выполняются предпололгения разд. 3.2. Состояние системы у {у) определяется как решение задачи A(t)y(v)=f в Q, ftL2(Q); A3.30) = vt ve<U = L2B); A3.31) dt dy(v) dvA у (х, 0; v) = y0 (x), x 6 Q, y0 6 L2.(Q), A3.32) Всегда можно заменить X на А/2.
§ 13. Ограничения на управление и на состояние 237 а функция стоимости имеет вид J(v) = l [у (х, Г; v) - гя {x)f dx + (TVv, v)L4zb A3.33) Q где N € X (p B); L2 A)), N > v/, v > 0. Допустим, что 4lg = \v | у (Г; w)€yi^«}, A3.34) где г/i — данный элемент пространства Н — L2 (Q), а ? — зам- замкнутый выпуклый конус в пространстве Н с вершиной в начале координат. Таким образом, в обозначениях разд. 13.1 ф ^ н - L2 (Q), pv _, у (Г; v) - у (Г; 0), ф0 - у (Т; 0) - у,. Оператор р принадлежит пространству X (L2 A!); I? (Q)); сопряженный оператор р* ?Х (L2 (Q); 1? (X)) определяется еле дующим образом: если /г 6 ^2 (Q), aw — решение задачи dw ' = U в (J; \ A3.35) = 0, w(x, T) = h{x), то p*A = w |a. A3.36) В рассматриваемом случае условие A3.7), вообще говоря, не выполняется. Действительно, решение задачи A3.35) принад- принадлежит пространству L2 (О, Т; И1 (Q)) и, следовательно, в частно- частности, w h ? L2 (О, Т; Ipl* (Г)). Но ото пространство представляет собой незамкнутое подпространство пространства L2 B). Очевидно, что условие A3.7) выполнено, если конус с(;" л содержится в конечномерном пространстве. J A->.о/) Теорема 13.3. Пусть состояние системы определяется как решение задачи A3.30) — A3.32), функция стоимости имеет вид A3.33), множество <Ug задано соотношением A3.34), где yt — -— у (Т; 0), а конус *<?+ содержится в конечномерном простран- пространстве. Если оптимальное управление существует, то найдется такая функция X ? L2 (О), что оптимальное управление и полу-
238 Гл. 3. Управление параболическими системами чается ив решения задачи JL )y = f, -^L+A*(t)q = O в Q; N3L + q = 0, А = 0 на 2; . dvA dvA* Г y(x,O) = yo(x), q(x,T) = y(x,T)-za{x)-X{x) ей; I x (x) у (x, t) dx=o, xe?;+, а именно и — — N'1 (g Is). Доказательство. Так как yi — у (Т; 0), то ср0 = 0, и можно применить замечание 13.2. Введем сопряженное состоя- состояние р (и) как решепис задачи + Л тогда Согласно теоредю 13.1, существует такой элемент X, что1) X б «+, р(и)\х -\- Nu =~ р*Х = w\s (см. определение A3.36)) и J Я (х)у (х, Т; и) dx = 0. Полагая q = р (и)—v w, легко убеждаемся в справедливости теоремы. Замечание 13.3. Аналогичные примеры можно привести для систем, описываемых параболическими уравнениями произ- произвольного порядка, или системами параболических уравнений. Замечание 13.4. Ясно, что теорема 13.1 применима также и в случае систем, описываемых эллиптическими уравнениями (гл. 2). § 14. Иеквадратичныс фупкции стоимости 14.1. План дальнейшего исследования Функции стоимости в рассмотренных до сих пор задачах были квадратичпыми. Однако все предыдущие результаты (кроме рас- расцепления — см. разд. 14.3) можно распространить и на случай, !) Всегда можно заменить X на Х/2.
§ 14. Неквадратичные функции стоимости 239 когда / (и) — вьшуклая дифференцируемая (неквадратичная) функция. Для этого следует воспользоваться теоремой 1.3 гл. 1. Мы ограничимся лишь одним простым примером (разд. 14.2), а затем укажем на те (значительные) трудности, которые возни- возникают в задаче расцепления (разд. 14.3). 14.2. Один пример Рассмотрим систему, описываемую параболическим оператором второго порядка х): dt \ A4.1) причем -U = Lq{Q),. i<q<oo*), A4.2) /e^@, yoeb".{Q). A4.3) Задача A4.1) имеет единственное решение, удовлетворяющее условиям „до.^е^Ю), * = 1, .... п*). A4.4) axi Тогда можно в качестве функции стоимости взять J{v)=[\y (х, t; v) - za (x, t) |* dx dt + v || v ||%(a), A4.5) где zK — данная функция из Lq(Q), v > 0. 3 а м е ч а н и е 14.1. Можно также рассматривать неквадра- неквадратичную форму на гильбертовом пространстве. Именно, если Ш --= = L2 (Q), то у (v) 6 Lq (Q) при 1 < q < 2 (можно пойти еще даль- дальше, применяя, например, теорему Соболева). Следовательно, мож- можно определить функцию стоимости, в частности, формулой A4.5) при 1 < q < 2. Замечание 14.2. Существенно более трудным этапом является переход от случая линейной системы A4.1) к нелиней- х) Излагаемые шике результаты распространяются и на более общий случай. 2) Следовательно, если q -./- 2, то 41 — рефлексивное банахово (но ло гильбертово) пространство. Как отмечалось в гл. 1, результаты типа тео- теоремы 1.3 гл. 1 остаются справедливыми и в этом случае. 3) Относительно решения параболических задач в пространстве If1, g ф 2, см. Гривар [1|, [2], Со.чонников [1].
240 Гл. 3. Управление параболическими системами ным системам. Некоторые частные результаты в этом направлении приведены в следующих параграфах. Согласно теореме 1.3 гл. 1 (в случае, когда U — рефлексивное банахово пространство), существует единственное оптимальное управление u?<Ug, характеризующееся тем, что J'(u) • {v — и) > 0 Vw 6 ^<? A4.6) {если Ч1д — выпуклое замкнутое подмножество пространства °11). Для функции стоимости A4.5) при w ?<U имеем: J'(u)> w =щ J(u q[\y()b\[y{u)$ q аи + qv\\u\q~2uwdxdt. A4.7) Полагая ^М.^ФН, A4.8) аи легко убеждаемся, что dt \ A4.9) Следовательно, неравенство A4.6) эквивалентно (после деления на число д) неравенству J | у (и) — гд \q~2 [у (и) — z;j ip (v — и) dx dt + -(-v ] j u |?~2u(y — u)dxdt^0 Уи^Шд. A4.10) Q Преобразуем это неравенство, вводя сопряженное состояние р (и) как решение п пространстве I? (Q) (где \lq \- llq — 1) задачи 1) Q; ) ' A4.11) (и) |z = 0; р (х, Г; и) = 0, 1) Заметим, что | у (и) — гД | Я'~ \у (и) — гя] G L4' (<?); задача A4.11) имеет единственное решение /> (и), для которого dp(u)ldxt, dp (u)ldt, d2p(u)/dxtdxj?Lq' (Q).
§ 14. Пеквадратичные функции стоимости 241 Тогда первое слагаемое левой части неравенства A4.10) прини- принимает вид Г ( _ ?ВШ _|_ A*(t)p(u)) y(v — u) dx dt = [p {и) (у - и) dx dt, Q \ dt I Q а потому оптимальное управление и^Ч1д характеризуется тем, что h- A4.12) Q Следовательно, справедлива Теорема 14.1. Пусть состояние системы определяется как решение задачи A4.1), а функция стоимости имеет вид A4.5). Тогда единственное оптимальное управление и?11д характери- характеризуется соотношениями A4.1) (при v --- и), A4.11) и A4.12). Пример 14.1. Пусть 41 a = {v | v 6 'U = Lq(Q), v > О почти всюду в Q). Тогда неравенство A4.12) эквивалентно соотношениям р(и) + v \u\q~2u^b, u^zO, 1 ... .„. [р (и) -{- v ] и \q~2 и] и = 0 почти всюду в Q, J и мы снова получаем одностороннюю задачу. 14.3. Замечания о расцеплении Рассмотрим теперь в условиях теоремы 14.1 случай отсут- отсутствия ограничений на управление, т. е. 11д = 1L. Тогда оптимальное управление получается из решения задачи dt др_ dt а именно 1 , ,/т' 9 A4.15) Действительно, соотношение A4.12) в рассматриваемом случае приводится к виду р (и) -\- v \ и \q~zu = 0. 16—1230
242 Гл. 3. Управление параболическими системами Чтобы расцепить задачу A4.14), будем рассуждать, как в § 4. Определим пару {<р, ф} как решение задачи (ср. с леммой 4.1) дт 1 ,о'—2 ,~> I 1- Ац> -4- —ггт'^ I 'Ф ==/ в У X (s, T)\ j dt v9 х A4Л6> = 0, 1|з = 0 на Гх (s, i|?(а;, Г) = О, Эта (нелинейная) задача имеет единственное решение, поскольку она соответствует задаче оптимального управления, аналогичной задаче, рассмотренной в предыдущем параграфе (только теперь используется Q X (s, Т) вместо Q X (О, Т) и h вместо у0)- Таким образом, можно ввести отображение /г^гр(х, s) пространства Lq(Q) в Lq'(ii); A4.17) это отображение уже не является аффинным. Если положить Ф (h,s) =г|з @, s), где г], г^-Ф(т], t) — отображение Lq (fi) X @, T)->Lq'(Q), A4.18) то придем к тождеству j3 (s) = Ф (у (s), *), 0 < s < Г. A4.19) Теперь можно получить соотпошепия для функции Ф — ока- оказывается, что она удовлетворяет некоторому функциональному уравпепию с частными производными (ср. с разд. 4.8 и 5.5). Имен- Именно, подставим выражение A4.18) для р (s) во второе из уравне- уравнений A4.14) и, проделав формальные выкладки, получим д-ц dt д Используя теперь первое из уравнений A4.14), найдем Ау_ |фГф + /) дц \ vq I dt + А*Ф (у (t), t) = \y(t)- 2д Г2[у (t) - 2д].
15. Теоремы существования оптимального управления 243 Так как речь идет об отыскании равенства, справедливого при любой функции у (t), то из последнего соотношения следует, что __ q^ v A42Q) дг\ сюда нужно еще добавить «граничные условия» Ф (г,, Т) = О Vt| A4.21) и • Ф (т), 0 = 0 па Z. A4.22) Эти (громоздкие) соотношения и являются аналогом интегро- дифференциального уравнения Риккати, рассмотренного в § 4 и 5. § 15. Теоремы существования оптимального управления 15.1. План дальнейшего исследования Настоящий параграф представляет собой аналог § 7 гл. 2 для случая систем, описываемых нелинейными эволюционными урав- уравнениями. Мы рассмотрим только частные примеры; на некоторые общие результаты указано в библиографических замечаниях. В следующем параграфе мы дадим необходимые условия опти- оптимальности первого порядка. 15.2. Нелинейная задача с распределенным управлением Рассмотрим (как в § 3) параболический оператор второго порядка l) dldt + A (t) и предположил!, что состояние у {и) систе- системы определяется как решение задачи +()y() + y()=f в Q, feL2(Q); A5.1) at У (v) h - 0; A5.2) у (х, 0; v) = у0 (х), х е Q, у0 € L2 (О), A5.3) причем v 6 U = L°°(Q). . A5.4) Задача A5.1) — A5.3) имеет едипственное решение, удовлет- удовлетворяющее условию ¦ y(v)e L* (О, Т; HI (Q)). A5.5) ') Тот факт, что порядок оператора равсп двум, в разд. 15.2—15.4. никак не используется. 16*
244 Гл. 3. Управление параболическими системами Замечание 15.1. Разумеется, отображение v-*-у (v) нелинейно. Замечание 15.2. Можно доказать существование и един- единственность решения у (и) задачи A5.1) — A5.3) при более общих, чем A5.4), предположениях об управлении v, папример при v ? (Е Lv (Q) для подходящего значения р (см. Ладыженская, Солон- ников и Уральцева [1]). Для определенности возьмем функцию стоимости в виде J(i>)=l[y(x,T;v)-zu(x)fdx + v\\v\\L-(Q), v>0. A5.6) а Замечание 15.3. Из соотношений A5.1) и A5.5) следует, что ду (v)ldt 6 L'z (О, Т; Я1 (Q)); поэтому функция у (х, Т; v) имеет смысл и принадлежит пространству // (Q). Замечание 15.4. В выражении A5.6) можно брать и v = 0, если определяемое ниже множество 41 g ограничено в про- пространстве IT (Q). В качестве множества допустимых управлений выберем 11 в—выпуклое подмножество пространства L°° (Q), ¦_ замкнутое в смысле *-слабой топологии. Ставится задача найти inf J (v), если v^rUg. A5.8) Теорема 15.1. Предположим, что dl dt -{-A — параболи- параболический оператор второго порядка, удовлетворяющий услови ям A.28), функция стоимости J (и) имеет вид A5.6), а множество ILg определено соотношением A5.7). Тогда существует оптималь- оптимальное управление и Доказательство. Пусть {у„}, vn ? 41 д,— минимизи- минимизирующая последовательность: / \vn) -> inf / (v). Положим уп = — у (vn). Благодаря наличию слагаемого v || у llL<x>(Q) в выра- выражении A5.6) для функции стоимости последовательность {vn} ограничена в пространстве lf° (Q), и потому {уп} ограничена в L2 (О, Т; Hl0 (Q)). A5.9) Действительно, из равенства A5.1) следует, что — — I at откуда (интегрируя от 0 до t и используя ограниченность после- — I Уп (О I2 + а (*', Уп (t), Уп (t)) + J ^nУ\ dx = f fyn dx, I at a a
§ 15. Теоремы существования оптимального управления 2АЪ довательности {vn} в пространстве L°°(())) получаем1) о о В силу леммы Гронуолла последовательность {уп} ограничена в пространстве L°°@, T; L2(?l)), и утверждение A5.9) справедливо. Согласно соотношению A5.1), причем правая часть этого равенства ограничена в пространстве L2 (О, Т; Я (й)); следовательно, [дуЛ ограничена в If (О, Т; H~l (Q)). A5.10) Так как вложепие Н\ (й) -> L2 (Q) вполне непрерывно (см. доказательство теоремы 7.1 гл. 2), то, согласно лемме о компакт- компактности (Лиопс [3, предложение 4.2 гл. 4]), из утверждений A5.9) и A5.10) вытекает, что из последовательности {ип, уп} можно извлечь такую подпоследовательность — мы обозначим ее тоже через {vn, уп}, —что уп->у слабо в L2@,T;Ill(Q)), Л JLl_+E]L слабо в L2@, Г;//"'(Q)), I A5 11) at at I Уп-^У силъпо в L2(Q); J vn-+u *-слабо в L°° (Q), u?<Ud. A5.12) Но тогда (см. доказательство теоремы 7.1 гл. 2) ynvn —>¦ уи, например в пространстве 3' (Q), а следовательно, элемент у удовлетворяет соотношениям A5.1) — A5.3) (заметим, что уп (х, 0) -> у (х, 0) слабо в пространстве L2 (&))¦ Значит, у = у (и) и lim / (vn) >- / (и), т. е. и — оптимальное управление. 15.3. Нелинейная задача с распределенным управлением; сингулярное возмущение Пусть (ср. с замечанием 7.6 гл. 2) ?0, ?i — данные функции из пространства L°°(Q), причем 0 < Р ^ ^о (х> t) ^ \i (x, t) почти всюду в Q, A5.13) и пусть ^д = {v I lo{x,t) f^v(x, t) < li(x, t) почти всюду в Q). A5.14) ') Через | I и || || обозначены нормы в пространствах L2 (Q) и i/J(Q) соответственно.
246 Гл. 3. Управление параболическими системами Для любой функции v^ilg положим u (*. *) » (*. О ^М . A5-15) d I где функции atj удовлетворяют условиям A.28). Определим состояпие у (и) системы как решение задачи ? + ()y() f, feL(Q); A5.16) at y(v)h = O; y(x,O;v) = yo(x), *6G- A5.17) Задача A5.16), A5.17) имеет единственное решение. Чтобы убе- убедиться в этом, достаточно применить результаты § 1 в случае, когда форма a (t; ф, ф) задала равенством ^^ Q). A5.18) оEФ,*) S \ij{,){,)d t,j=i й axj dxt Тогда в силу соотношений A5.13) и A.28) Рассмотрим теперь функцию стоимости A5.6), но при v = О (это возможно, ибо множество <Ug ограничено): / (v) = J [j/ (ж, Г; и) - 2д (x)f (to. A5.19) Нам не известно, существует ли опти.мальное управление для сформулированной задачи (ср. с замечанием 7.6 гл. 2). Трудность решения этого вопроса заключается в следующем: если ип -> и *-слабо в пространстве L°° (Q), а уп -> у слабо в пространстве L2 (О, Т\ Hi (Й)), то, вообще говоря, певерно, что А (ип) уп -> ->¦ А (и) у, а поэтому не ясно, существует ли такое управление w ? ? <Ug, для которого у (w) = у. Обойти — но не преодолеть — эту трудность можно, видимо, тремя путями, аналогичными указанным в разд. 7.2 гл. 2 подхо- подходам (i), (ii), (iii). Мы рассмотрим подробно только один (третий) подход, использующий идею сингулярного возмущения (ср. с разд. 7.3 гл. 2). Пусть (ср. с G.23) гл. 2) Ъ (ф, -ф) — непрерывная билинейная форма па Н\ (Я); 1 . _ „~ Ь(Ф,1|>)>у111>11д8(а), Y>0, V^6^(Q), J ' '
§ IS. Теоремы существования оптимального управления 247 а В — соответствующий оператор, т. е. &(<р, ф) = (В <р, -ф). Если положить «е.о (Ъ Ф, -Ф) = е& (Ф, Ф) + av (t; Ф, г|з), cp,i|? 6 #о (Q), A5.21) где е > 0 —«малый» параметр, то легко видеть, что ве.р^Ф.^^вНфН^ + сНфН^, с>0. A5.22) Введем оператор | + [гВ + А(и)} (параболический оиератор четвертого порядка), называемый син- сингулярным возмущением оператора dldt -\- A{v). Определим состоя- состояние уе (и) системы как решение задачи г) j^ + [ + A(v)]y&(v) = f в Q- 1 dt } A5.23) y?(v)eL2@, T;H2O(Q)); уг{х, 0; v) = yo(x), х?Я. J Докажем теоремы, аналогичные теоремам 7.2 и 7.3 гл. 2. Теорема 15.2. Если г ->• 0, то & (у) -> 2/ Н в ?2 @, Г; Я' (Q)); A5.24) (w)->0 в L2@, r;/S I ,L@ir;// dt dt Теорема 15.3. Для фиксированного е > 0 существует оптимальное управление, т. е. такой элемент ие ? %5, что ][[»в(ж, Т; «в) - Zz(x)fdx ^1 [ув(х, Т; v) - zR(x)fdx\fve'Ue- A5.26) Доказательство теоремы 15.2 (Юэ [1]). С помо- помощью неравенства A5.22) легко показать, что последовательность {Уг {v)} (соответственно {У в Уг{и)}) ограничена в пространстве L% @, Т; П\ (Q)) (соответственно в I? (О, Т; Щ (Q))). Переписы- Переписывая первое из соотношений A5.23) в виде f at получаем утверждепия A5.24), A5.25) для слабой сходимости. Затем убеждаемся в справедливости этих утверждений для силъ- ]) Эта задача в силу неравенства A5.22) имеет единственное решение
248 Гл. 3. Управление параболическими системами ной сходимости; достаточно рассмотреть функцию 1 Т %г = "о I У г {Т; v) — у (Т; и) |2 + 8 j Ь (уе (и), уе (v)) dt + ^ о т + I «„ (*; & (у) - У (v), у, (v) - у (v)) dt, о и доказать, что она стремится к нулю при е -> 0. Доказательство теоремы 15.3. Будем опускать индекс 8. Пусть {vn} — минимизирующая последовательность и Уп =¦ У {vn)- Так как г фиксировано, то из неравенства A5.22) следует, что и„ остаются в ограниченном ) I /|5 27) подмножестве пространства L2@, Т; //^(Q)). j С помощью первого из соотношений A5.23) получаем, что дуп "I -д— остаются в ограниченном I . __. под.множестве пространства L2@, T; II~2(Q)). J Так как вложение //„ (Я) -> /TJ (й) вполне непрерывно (см., например, Лионе и Мадженес [1, гл. 1]), то (как и при доказа- доказательстве теоремы 15.1), согласно лемме о компактности (Лионе [3, предложение 4.2 гл. 4]), из утверждений A5.27) и A5.28) вытекает, что из последовательности {vn, yn} можно извлечь такую подпоследовательность — мы обозпачим ее тоже {vn, yn},— что уп-+у слабо в L2@,T;H20(Q)), dJ±^?}L СЛабо в L2 (О, Т; 1Г2 (Q)), К A5.29) dt dt уп->у сильно в L2{0, T;Hl(Q)); vn —у и *-слабо в L°° (Q), и ^Ш§. Но тогда можно перейти к пределу, поскольку Следовательно, у = у (и). Заканчивается доказательство так же, как и в теореме 15.1. 3 а м е ч а п и"е 15.5. (Ср. с замечанием 7.7 гл. 2.) Нам не из- известно, будет ли при е —> О inf J [ув (х, Т; v) - zAfdx-> inf \ [у (х, Т; v) - zRf dx.
§ 15. Теоремы существования оптимального управления 249 Замечание 15.6. Если коэффициенты при производных порядка не выше 2т зависят от управления, то нужно прибавить сингулярное возмущение гВ, где В — оператор порядка 2т + 2. 15.4. Нелинейная задача с граничным управлением Пусть оператор А = А (х, t, д/дх) определен, как в разд. 15.2, а состояние у (v) — как решение задачи v) = f в Q, f?L2(Q); A5.30) -(»)) = 0 на 2, у6% = Ь00B), A5.31) dt dy(v) dvA Q(y) = \y\p~2y, p>2; A5.32) у(x, 0; v) = 2/0(x), х?&, yoeL2(Q). A5.33) Предположим, что 'Ug = {v I 0 <. P < h(x> f) < v(x> 0 < Ых> *) /15 3/л почти всюду на 2; |0»? Л r00/vu Решение задачи A5.30) — A5.33) понимается в следующем смысле. Рассмотрим прострапство v = & I ^ е я1 (Q), ф |г е ьр (Г)>, A5.35) снабженное нормой G.34) гл. 2; это — рефлексивное банахово пространство. Для элементов ф, -ф ? F определим форму i,j-=j a axj oxi A5.36) Теорема 15.4. Существует единственная функция у (и), для которой A5.37) A5.38) (у), г|>) + а0(<; J/(v), М = (/(О, Ф) Vi|>6 V, A5.39) = уо- A5-40)
250 Гл. 3. Управление параболическими системами Из соотношения A5.39) следуют равенства A5.30) и, формаль- формально, A5.31). Далее, ду (v)ldt 6 L2 @, Т; H~l (Q)), т. е. равенство A5.33) имеет смысл. Поэтому разумно определить решение задачи A5.30) — A5.33) как функцию, существование и единственность которой гарантирует теорема 15.4. Доказательство теоремы 15.4. Эта теорема немедленно следует из общих результатов теории монотонных эволюционных уравнений (Браудер [2], Брезис [1], Лионе [7], [13, гл. 2], Вишик [2]). Достаточно только заметить, что опре- определенная в A5.36) форма av (f; ф,гр) обладает свойствами, апалогич- ными свойствам G.38) — G.40) гл. 2. Пусть функция стоимости / (v) снова имеет вид A5.19). Спра- Справедлива Теорема 15.5. Если множество lig задано соотношением A5.34), а функция стоимости имеет вид A5.19), wo существует оптимальное управление и ? °llg. Доказательство. Пусть {vn}, vn ? °11д,— минимизи- минимизирующая последовательность; положим уп = у (vn). В силу соот- соотношений A5.34) и A.28) a, (t; i|>, i|>) >а f | gT&dq\2dx + p J |-ф|рйГ, а г откуда 1 г где константы е4 и с2 не зависят от и. Таким образом, уп остаются в ограниченном A5 41) подмножестве пространства L2 @, Т; II1 (Q)), | уп \х остаются в ограниченном 1 тР/^, A5.42) подмножестве пространства L \Ъ), ) и так как dyjdt = / — Ауп, то dyn "J -7гг остаются в ограниченном ,. ,„, at r \ A5.43) нодмножестве пространства I? @, Т; II'1 (Q)). J Так как вложение Я1 (Q) -> lp/2+e (Q) (8 6 @, V2) — фикси- фиксированное число) вполне непрерывно, то, согласно лемме о компакт- компактности (Лионе [3, предложение 4.2 гл. 4]), из утверждений A5.41) и A5.43) вытекает, что из последовательности {vn, yn} можно извлечь такую подпоследовательность — мы обозначим ее тоже
§ IS. Теоремы существования оптимального управления 251 через {vn, yn},— что уп-+у слабо в L2(О, Т; Я1 (Q)), dJjL^^l. слабо в //(О, Г; Я (Q)), I A5.44) */„->*/ сильно в L2@, Г, Hm+S(Q)); vn->u *-слабо в L°° Но тогда (поскольку ф-»-1|) | s — непрерывное отображение //1/2+8 (Q) _^ ?2 (Г)) уп-+у сильно в L2 (S). A5.45) Поэтому можно считать (извлекая, если надо, новую подпосле- подпоследовательность), что уп -> у почти всюду на 2 A5.46) и, согласно свойстпу A5.42), что уп -v у слабо в Lp B). A5.47) Отсюда вытекает, что- и, следовательно, у = у (и). Заканчивается доказательство так же, как и в теоремах 15.1 и 15.3. 15.5. Использование выпуклости и принципа максимума для параболических уравнений второго порядка Пусть оператор А = А(х, t, д/дх) определен, как.в разд 15.2 *). Пусть Ьо, h 6 L°°(Q), A5.48) <Ив = {г; | v 6 L~{Q)\ U < v{x, t) < gl5 go,?i 6 R}, A5.49) / (x, t; X) — непрерывная функция при х 6 й, ") «6 tO, Л, 1о<Я<|1; } A5.50) функция Я -> f(x, t; %), %^Цо, lih выпукла. ) Для управления и?Шд обозначим через f (x, t; v) функцию х, t-*~f(x, t; v (x, t)) и определим состояние у (v) системы как *) Тот факт, что порядок оператора А равен двум, играет здесь существоп- "Ую роль.
252 Гл. 3. Управление параболическими системами решение задачи У{v)|s = 0; у(х, O;v) = yo(x),xeQ,yoeL2(Q). „ A5.51) Пусть §• — данная функция пространства L2 (й), причем g > О почти всюду. В качестве функции стоимости возьмем J{v)=$y(x, Т; v)g(x)dx. A5.52) п Теорема 15.6. Если выполнены условия A5.48) — A5.50), а функция стоимости имеет вид A5.52), то' существует опти- оптимальное управление и ^41 При доказательство этой теоремы нам понадобится одна клас- классическая лемма вариационного исчисления (утверждающая полу- полунепрерывность снизу некоторого функционала). Лемма 15.1. Пусть & — открытое множество в {конеч- {конечномерном) пространстве Rm, К — выпуклое замкнутое ограни- ограниченное множество в {конечномерном) пространстве Rp, а ?, к «-»- -> Ф E, к) — такое непрерывное отображение & X К -> R, что- функция к -> Ф {I, к) выпукла на К Vg 6 &¦ A5.53) Пусть {ип} — последовательность функций, удовлетворяющая условиям ип {I) € К почти всюду, i A5.54) ип -> и *-слабо в L°° {&; W). J Тогда lim ^ Ф E, ип (?)) dg > J Ф {I, u{l)) dt A5.55) 0 0 Доказательство. 1) Положим г|)п (?) = Ф (g, un (g)); ясно, что элементы г^ остаются в некотором ограниченном под- подмножестве пространства L°° {0). Из последовательности {ф„} можпо извлечь такую подпоследовательность — мы обозначим ее тоже через {ф„},— что т}эп ->- ^ *-слабов L°° @). Тогда J Ф E, Un (?)) dE = j ^ (S dg. A5.56)
§ 13. Теоремы существования оптимального управления 253 Пусть 0Е — совокупность точек множества 0, являющихся точками Лебега для фупкций и и г^. Как известно *), | & _ &Е | = 0. A5.57) Если взять точку ?о € ®е и обозначить через А куб с центром в точке ?о> содержащийся в множестве (9, то Ф (lo, u-n fa)) = lim —|— J Ф (|, ц (g)) dg. A5.58) Докажем неравенство Ф(Ео, »(Ео)Х*ЛЫ, A5.59) выполняющееся (в силу свойства A5.57)) почти всюду на (9. Из неравенства A5.59) будет следовать, что а это вместе с равенством A5.56) доказывает утверждение A5.55). 2) Для доказательства неравенства A5.59) воспользуемся выпуклостью функции к -> Ф (?, к) на множестве К (см. A5.53)). Это свойство влечет за собой существование аффинной функции к -> 1$и (к), отображающей множество К в R и такой, что Ф (?0, /с) > Zlo (Л;) УкеК,] Тогда Ф (Ео. «(У) = lim ГТ7 S ho («(Ю) ds- A5.61) Но Ф (Ео, ип (?)) < Ф E, «„ (?)) + О (| А |) Vt e A, Vra, я, согласпо первому из соотношений A5.60), igo К U)) < Ф (?. "«(а)+ О(| Д|), откуда -1- J ZSoK (g))dg <_L J фE, «„(?))<? + 0A А |), A5.62) |А|д |А[л Так как функция Ца аффинна, то Цй (ип) -*- Цо (и) *-слабо в L°° (&); следовательно, *) I w | обозначает мору множества со.
254 Гл. 3. Управление параболическими системами Далее, так как Ф (?, ип) = tyn -> яр* *-слабо в Ь°° @), то из нера- неравенства A5.62) вытекает, что I a|a Устремляя | A | к нулю и используя равенство A5.61) и тог факт, что ?о — точка Лебега для функции т}^, убеждаемся, что- неравенство A5.59) справедливо. Доказательство теоремы 15.6. Пусть {vn}, vn 6 E'Ug, —минимизирующая последовательность, т. е. J (vn) -> J = in-E -^ (v). Как и при доказательстве теоремы 15.1, можно проверить, что Уп ~ У (ип) остаются в некотором ограниченном подмножестве пространства L2 (О, Т7; Н\ (Q)) (заметим, что последовательность {/ (х, t; vn)} ограничена, в частности, в пространстве L°° (Q). С помощью первого из соотношений A5.51) получаем, что dyjdt остаются в некотором ограниченном подмножестве пространства L2 (О, Т; Н-1 (Q)). Такидг образодг, как и при доказательстве теоремы 15.1, ик последовательности {уп, уп} можно извлечь такую подпоследова- подпоследовательность— мы обозначим ее тоже через {vn, уп),— что ' Уп-+У слабо в L2@, T;Ill(Q)), слабо в L2@, Т;Н~х(п)), } A5.63) dt dt уп-+у сильно в L2(Q); vn ->¦ и «-слабо в Ц° ((?), и e'Ug. A5.64) Можно также считать, что f(x, t; vn)-+U *-слабо в L°° (Q). A5.65) Но тогда bovnyn ->- bovy, например, в пространстве 3' (Q) и, следовательно, элемент у удовлетворяет соотношениям A5.66) yeL2@,T;Bl(Q); у(х, 0) = уо(х), z?Q. Применим теперь лемму 15.1 в следующих условиях: 0 = Q, I = (х, t) 6 0; ип = vn; Ф (|, к) = h (I) f (x, t; к),] h?3 (Q), h>0, к 6 К = Цо, Ы-
§ IS. Теоремы существования оптимального управления 255 Неравенство A5.55) позволяет записать lim j hf (х, t; vn) dxdt Q откуда в силу соотношения A5.65) lim j hf (х, t; vn) dxdt^ \ hf (x, t; v) dx dt, Q Q Q Q так что /„ (x, t) > / (x, t; v) почти всюду в Q. A5.67) Из соотношений A5.66), A5.67) и того факта, что А — эллипти- эллиптический оператор второго порядка, заключаем (согласно принципу максимума для параболических уравнений второго порядка — см., например, Ладыженская, Солонников и Уральцева [1]), что z/, (х, t) > у (х, t; v) почти всюду в Q A5.68) (здесь Ух (х, t) означает решение задачи A5.66)). Тогда уп (х, Т) > > у (х, Т; и) почти всюду на мпожестве Q, что в свою очередь дает Но, согласно соотношениям A5.63), J(vn)-+ S?y*(^. T)g(x)dx, Q а потому / > / (и). Отсюда следует, что j — J (и), т. е. и —'опти- —'оптимальное управление. 15.6. Управление системами, описываемыми эволюционными неравенствами Как и в разд. 7.5 гл. 2, можно рассматривать системы, состоя- состояние которых определяется как решение односторонней граничной задачи в эволюционном случае, например, °VH =f в Q; 1 dt у (х, 0; v) == 0 в Q; у (о) ^ 0 почти всюду на 2, ¦ -^—^ у почти всюду на 2, p6L2B), 5у (у) \ , ч п v yly(y) = 0 почти всюду па 2. 3vn /
256 Гл. 3. Управление параболическими системами Относительно решения задачи A5.69) см. Лионе и Стампаккья [1], Брезис [1]. Для подобных задач можно получить (как и в разд. 7.5 гл. 2) некоторые теоремы существования оптимального управления. Но в целом эти задачи еще очень мало исследованы 1). § 16. Необходимые условия первого порядка 16.1. Формулировка теоремы Будем пользоваться обозначениями, аналогичными принятым в § 8 гл. 2. Пусть 41 д -— {v | х, t-+¦ v (x, t) — такая измеримая функция <?-^Rm, что v(x, t) 6 К почти всюду}, A6.1) где К — выпуклое замкнутое множество в пространстве Rm. Пусть А = А (х, t, д/дх) — оператор, удовлетворяющий усло- условиям A.28), и Ъ (х, t; К), / (х, t; К) — непрерывные | .„ „. ограниченные функции Q X К ->- Б. J Обозначим через Ъ (х, t; v), v^4ld, функцию х, t -у b (x, t; v (x, t)); аналогично определяется / (х, t; v). Мы часто будем писать просто Ъ (v) и / (v). Введем также следующие обозначения: A (v) tJ; = 4гр + ъ (х> *> v) 'Ф = АУ + ъ (v) 'Ф. 1 Состояние у (v) системы определяется как решение задачи (v) = f(v) в Q; A6.4) dt У (v) Is = 0; A6.5) у (х, 0; v) = Уо (х), х 6 Q, уо 6 L°° (Q). A6.6) Функция стоимости имеет вид J{v)=[y{x,T;v)g{x)dx, A6.7) а где g — данпая функция пространства L°° (Q), причем g > 0. 1) Весьма широкий круг задач механики формулируется в терминах вариационных неравенств (см. Дюво и Лионе [1], [2]), и поэтому теория таких неравенств найдет свои приложения.
§ 16, Необходимые условия первого порядка 257 Онределим сопряженное состояние р (и) как решение задачи = 0 в Q dt A6.8) P(v))s = 0; p(x,T;v) J Теорема 16.1. Пусть оператор А удовлетворяет усло- условиям A.28),- выполняются соотношения A6.1), A6.2), A6.7) и существует оптимальное управление и. Тогда почти всюду в ци- цилиндре Q р (х, t; и (х, t)) [/ (х, t; и (х, t)) — Ъ (х, t; и (х, t)) у (х, t; и (х, t))] = = inf р (х, t; и (х, t)) у (х, t; k) — b (x, t; k) у (х, t; и (х, t))]! A6.9) ft 6 К 16.2. Доказательство теоремы План доказательства тот же, что и в случае теоремы 8.1 гл. 2. 16.2.1. Алгебраическое преобразование. Пусть и — опти- оптимальное управление, так что I [у (х, T\v)—y (х, Т; и)] g(x)dx^0 Vy 6 Щ. A6.10) Умножая первое из соотношений A6.8) (записанное при v = и) на у (v) — у (и) и' применяя формулу Грина, получаем I [у {х, T;v)-y (x, T; и)} g (x) dx = й с = ) р (и) А (и) (y(v) — y (и)) dx dt == Q = lp{u) [A (v) y(v)-A (и) у (и) - (Л (i;) - Л (и)) у (и) - Q - (Л (v) - А (и)) (у (v) - у (и))] dxdt = = U(u)[f{v)-f(u)~{b{V)-~b{u))y(u)~ Q -(b(v)-b (и)) (у (v) - у (и))] dx dt. Таким образом, неравенство A6.10) эквивалентно неравенству lp(u)[f(v)-f(u)-(b(v)~b(u))y(u)-~ Q d. A6.11) 16.2.2. Применение неравенства A6.11). Здесь справедливы замечания, сделанные в пункте 8.2.2 § 8 гл. 2. Введем обозначения: {я0, М € <?; 17-1230
258 Гл. 3. Управление параболическими системами 0j = Gj X Ij — куб, содержащийся в цилиндре Q, с центром в точке {х0, t0}; Gj — куб в пространстве Rn с центром в точке х0; Ij — интервал действительной прямой с центром в точке t0', I ®j I. I Gj | — меры множеств 0}, Gj\ »} = A - Xi) u + Xjk; k?K; Xj — характеристическая фупкция множества Oj. Положим и) [/(vj) - / (и)] dx dt, C} ")dx dt' I <2>j-I Q Если взять у = Vj (б^а), то из неравенства A6.11) получим, что Пусть точка {х0, t0} принадлежит совокупности точек цилиндра Q, являющихся точками Лебега для функций р (и), f (и), Ъ (и), У (и). Допустим, что нам удалось доказать соотношение dj -> 0 при у -^ оо A6.12) (предполагается, что при этом | Oj | -> 0, | Ij | -> 0). Тогда р (х0, t0; и (х0, t0)) [/ (х0, t0; к) — / (ж0, t0; и (х0, t0))] — — р (х0, t0; и (х0, to))[b (x0, t0; к) — — Ъ (х0, t0; и (х0, to))\ у (х0, t0; и (х0, t0)) > 0 A6.13) почти всюду па Q, откуда и следует равенство A6.9). 16.2.3. Доказательство соотношения A6.12). Заметим сна- сначала (Ладыженская, Солонников и Уральцева [1, теорема 7 1 гл. 3]), что р (и) 6 L°° (Q). Поэтому откуда б ~ У («) A6.14)
§ 16. Необходимые условия первого порядка 259 Положим Ь = У (vi) ~ У («)• A6.15) Тогда А (и) Ь = / (v,) -/(«)- [Ъ (Vj) - Ъ (и)] у (v,) s gi в Q; Отсюда следует, что !1№«<о.т;н'(о))< С lifting). A6.17) Но (Ладыженская, Солонников и Уральцева [1]) функции у (vj) принадлежат ограниченному подмножеству пространства L°° (Q), а потому II^IIl«(Q)^C|0,|1/2. A6.18) По теореме Соболева [1] существует такое число г > 2, что Я1 (Q) с Z/ (Q), а тогда из неравенств A6.17) и A6.18) заключаем, что 11%11ь«(о,г;1Ле))<С|0,|1/2. - A6.19) Применяя неравенство Гёльдера ¦ из соотношения A6.14) с учетом оценки A6.19) получаем |^| <С \Gj \У\ и соотношение A6.12) доказано. Замечание 16.1. Можно было бы заменить условия A6.2) менее сильными предположениями о принадлежности функций Ъ (х, t; X) и / {х, р, К) подходящему пространству U (Ладыжен- (Ладыженская, Солонников, Уральцева [1]). Напротив, тот факт, что А — оператор второго порядка, играет в приведенном доказательстве существенную роль. Замечание 16.2. Если из анализа задачи A6.8) можно за- заключить, что р (х, t; v) > 0 почти всюду (ото легко сделать, на- например, в случае Ъ = 0), то равенство A6.9) принимает вид / (х, t; и (х, t)) — Ъ (х, t; и (х, t)) у (х, t; и (х, t)) = = inf [/ (x, t;k) — b (x, t; k) у (х, t; и (x,t))]. A6.20) fcSJSC Тогда для функции у (х, Р, и (х, t)) =; у (х, t) удовлетворяются соотношения jtL + Ay-inl [f(x, t;k)~b(x,t;k)y] = O в Q; at к 17*
260 Гл. 3. Управление параболическими системами § 17. Оптимальное быстродействие 17.1. Постановка задачи Рассмотрим систему, состояние которой определяется как решение задачи ^ ' + A{t)y(t; v) = f-\- Bv1), ^ A7.1) dt [ y@;v) = y0. j A7.2) Пусть 41 о — выпуклое замкнутое подмножество пространства 41, a z/i — данный элемент пространства Н. Предположим, что система управляема*, существует такое v fit a, что] A7.3) у (х; v)=yi для некоторого т 2). J x Оптимальное время определяется равенством т0 = inf т, A7.4) т. е. т0 — нижняя грань всех значений т, для которых выпол- выполняется условие A7.3). Мы остановимся на следующих вопросах: (i) существование управления, оптимального в смысле быстро- быстродействия, т. е. существование такого (таких) и^_Ч1д, что У (т0; и) = ух\ A7.5) (ii) свойства оптимального быстродействия, если оно суще- существует. Эти вопросы рассматриваются в разд. 17.2 и 17.3. Замечание 17.1. Очевидно, можно поставить те же воп- вопросы для систем, описываемых нелинейными уравнениями. 17.2. Теорема существования Теорема 17.1. Пусть выполнены условия A.1), A.2), A7.3), B.1) и Шд — ограниченное подмножество пространства 41. Тогда существует управление, оптимальное в смысле быстродействия. ') Эта запись — символическая. Управление может быть и граничным. а) Одновременно всегда предполагается, что т ? [0, Т], т. е. т < Т. Но, поскольку зпачепие Т можно выбрать произвольно, в этом нет никакого ограничения.
§ 17. Оптимальное быстродействие 261 Доказательство. Пусть значения хп таковы, что У (т„; vn) = г/i, у„ б^а. A7.6) тп -*¦ т0. A7.7) Положим г/„ = у (ип). Так как множество Ч1д ограничено, то уп (соответственно у„) остаются в ограничен- "j ном подмножестве пространства L2 (О, Т; V) / A7-8) (соответственно, L2 (О, Т7; У')). J Тогда из последовательности {у„, уп) можно извлечь такую подпоследовательность—мы обозначим ее тоже через {vn, г/„},—что vn-+u слабо в <U, и^Шд, "\ уп-+у слабо в L2@, T; V), \ A7.9) уп-+у слабо в L2@, T; V').) Из равенств у'п + Ауп = / + 5у„, у @, у„) = г/0 следует, что у' + Ау = / + Ди, г/ @) = г/о, а потому г/ = г/ («). A7.10) Но если рассмотреть очевидное тождество У CV, уп) — г/ (т0; и) = = г/ (т„; уп) — г/ (т0; у„) + г/ (т0; у„) — у (т0; и) A7.11) и заметить, что г/ (т0; vn) -> г/ (т0; w) слабо в пространстве Я (это вытекает из соотношений A7.9)) и V, уп) —J/(V. vn)llv' = ll i J/' (t; i;n to то можно показать, что г/ К; Уп) — 2/ (^о; и) -> О слабо в У. Отсюда, учитывая равенство A7.6), заключаем, что у (т0; и) =у%. Замечание 17.2. По поводу одной гораздо более общей теоремы существования оптимального в смысле быстродействия управления для системы, описываемой нелинейным параболиче- параболическим оператором, см. Лионе [21, а также разд. 10.3 гл. 4.
262 Гл. 3. Управление параболическими системами Пример 17.1. Пусть 1L = L2 B) и состояние у (v) системы определяется как решение задачи (разд. 3.2) ^ '.Ay(v) = f в Q, ) dt A7.12) v; у(х, 0; v) = yo{x), x dy(v) dvA Теорема 17.1 в этом случае применима. Следовательно, эта теорема охватывает и случай грапичного управления. Замечание 17.3. Теорему 17.1 легко переформулировать применительно к системам, описываемым задачей Дирихле, с граничным управлением (см. § 9). 17. 3. Теорема о релейности Пусть выполнены предположения разд. 17.2, причем А не зависит от t, ¦¦ A7.13) <Ug = {v | | v (t) | < 1 почти всюду}. A7.14) Тогда (см., например, разд. 1.6) оператор А есть инфинитози- мальный производящий оператор некоторой полугруппы G(t) в пространстве Н. Замечание 17.4. Приводимые ниже рассуждения отно- относятся к случаю, когда Н — рефлексивное банахово пространство, а оператор —А есть инфинитезималышй производящий оператор полугруппы в этом пространстве. Справедлива (принадлежащая Фатторини [1]) Теорема 17.2. Пусть выполнены условия A.1), A.2), A7.13), A7.14), A7.3), аи — управление, оптимальное в смысле быстродействия, т. е. элемент множества %д, удовлетворяющий условию A7.5) (по теореме 17.1 такие элементы существуют). Тогда | и (t) | = 1 почти всюду на @, т0). A7.15) Эту теорему мы докажем чуть позже, после того как получим несколько нужных для этого лемм. А сейчас отметим вытекающее из теоремы С л е д'с т в и е 17.1. Если выполнены условия теоремы 17.2, то существует единственное управление, оптимальное в смысле быстр одействия. Доказательство. Если щ, иг0_1Сэ и у (т0; иг) = уь i = 1, 2, то и у (т0; A — 9) щ + 9w2)= уи 0 < 9 < 1, а потому
§ 17. Оптимальное быстродействие 26 .' управление и = A—0) щ -\- Gu2 удовлетворяет условию A7.15). Но это возможно, лишь если щ (t)= u2 (t) почти всюду. Введем обозначения: Ks = {h | h 6 G*v (s) !), v 6 L°° @, s; H)}, Ks(e) = {h \h = G*i; (s), i; 6 ^°° @, s; Я), i; имеет носитель в ef][O, s], e — измеримое подмножество отрезка [0, 74}. Лемма 17.1. В обозначениях A7.16) К. = К,-. Ve, s'. A7.17) Если обозначить К = Ks Ve, A7.18) то G (в) Я с: iiT. A7.19) Доказательство. 1) Пусть т > s. Тогда, как легко вицеть, ПРИ 0<г<т — s, | A7.20) -^-e)) при Ot-sJ Таким образом, ЛГ. с А,. A7.21) 2) Пусть т < s. Тогда, как легко видеть, G*v(x)=G*w{s)\ "Iе IS A7<22) Отсюда следует включение, обратное включению A7.21), а потому и равенство A7.17). Тем самым обосновано обозначение A7.18). 3) Легко убедиться, что s), A7.23) "Л я& I откуда вытекает A7.19). В дальнейшем фундаментальную роль сыграет G*y (s) = I G(s — t) v (t) dt. о
264 Гл. 3. Управление параболическими системами Лемма 17.2. Для почти всех t ? е Kt (e) = К. ¦ A7.24) Доказательство. 1) Ясно, что Kt (e) cz К; поэтому достаточно убедиться, что К сг Кt (е) для почти всех t ? е. Пусть h 6 К. Тогда h ? Ks при произвольно малом s, а потому для любого ti < t справедливо представление (см. A7.20)) h= \G{t—o)v(o)da, veL°°@,T;H). A7.25) Допустим, что существует такая последовательность {?„.}, что mos ([*„, tn+i] П е) > р (tn+i — t), p > 0; tn+2 'n+1 Ниже мы проверим (см. вторую часть доказательства), что для почти всех t ? е можпо найти последовательность! {tn}, удовлетворяющую условиям A7.26). jA7-^') Выберем в качестве значения ti, участвующего в еоотношении A7.25), первый член последовательности {tn}; тогда из ра- равенства A7.25) получим G(tn+i — o)v(o)do = t'r, о где mes (e f] [tn+i, tn+2\) tn+i — tn+i)doi I G{tn+i — a2)v(o2)do2 = tn t = [G{t— a)w(o)do, J r^ rG(or-«n+1) 5 iG(tn+1-o2)v(o2)da2 \mes(e (][tn+i, tn+2\) tn на «0[UU. в = 1, 2, ..., впе е П ['n+ь <п+г], «= 1,2, ....
§ 17. Оптимальное быстродействие 265 Из условий A7.26) вытекает оценка 1 |()К Таким образом, h ? G*w (t), где функция w принадлежит L°° (О, Т; Н) и имеет носитель в множестве е, т. е. h 6 Kt (e). Итак, лемма будет доказана, если будет доказано утвержде- утверждение A7.27). 2) Утверждение A7.27) представляет собой известный резуль- результат из теории меры. Введем множество mes / Г 1 1\ e f] I <* — -г, а \ L К J/ и обозначим через dm совокупность точек плотности множества ет (см. Рисе и Сокефальви-Надь [1, гл. 1, § 61). Как известно, mes (е— (]dm) =0, так что достаточно доказать утворжде- ние A7.27) для случая t 6 dm. В этом случае можно построить такую последовательность {?„}, что tn ? dm для всех п; tn+i — ?n -f sn < f, sn > 0, sn/sn+1 < sc; с (таким образом, последнее из соотношений A7.26) выпол- выполняется). Так как tn ? dm cz em при любом п, то существует та- такая константа р > 0, что mes {[tn, tn+1) fle) > p (?n+1 — tn). Лемма 17.3. Пусть и ^ILg — управление, оптимальное в смысле быстродействия относительно пары состояний {у0, J/i}1), т. е. у @; и) = у0, у (т; и) — yt при минимальном т. Тогда для любого s <; т управление и оптимально в смысле быстродействия относительно пары состояний {у0, у (s; и)}. Другими словами, если управление w?_°lla таково, что ~[у (a; w) = у (s; и) для некоторого а, A7.28) то о !>$. Доказательство. Предположим, что равенство A7.28) выполняется при некотором а < s. Определим тогда управление- V^ = { и (t + s — о) в (а, Т - (в- а)). В оригинале u est {г/0, г/,} optimal.— Прим. перед.
266 Гл. 3. Управление параболическими системами Из равенства A7.28) следует, что у (а; и) = у (а; w) — = у (s; и). Так как у (t; v) + Ay (t; v) = u(t + s — о) при t !> о, dt то у (t — (s — a); v) = у (t; и) при t > s, а потому j/ (т — (s — a); v) = j/ (t; u) = yt. Так как т — (s — a) < т, то это противоречит предположению о том, что управление и оптимально в смысле быстродействия относительно пары состояний {у0, у\). Лемма 17.4. Пусть управление v ^1Lg таково, что | v (t) | < 1 — е почти всюду, е > 0' A7.29) у (т; v) = i/i для некоторого т. A7.30) т > т0. Доказательство. Покажем, что существует такой момент $<т и такое управлепио w^ilg, что г/ (в; w) = y (т; у) A7.31) (это означает, что т не может быть оптимальным временем). Заметим сначала, что равенство A7.31) равносильно равенству ]g(t—o) u(o)do + G{%) у0 - G(s) у0 = J G(s— a) w(a) da. A7.32) о о Легко видеть, что левую часть равенства A7.32) можно пред- S -ставить в виде I G (s — a) v (a) do, где и 1 * 7s y(a) = y(a+x — s) + — G(o) \ G(x — s— oi)v(ai)doi + s о + i [G (a + т - s) уо - G (a) y0). s Отсюда ясно, что если т — s достаточно мало, то в силу усло- условия A7.29) | *v (a) |^1, а потому можно взять w = и. Доказательство теоремы 17.2. Предположим, что соотношение A7.15) не выполняется. Тогда существует такое множество е сг [0, т0], mes e > 0, что | и (t) |< 1 - е, 8 > 0, tee. A7.33) Согласно лемме 17.2, можно найти такое s, что Ks (e) = К = == Ks. Иначе говоря, существует такая функция g 6 L°° @, Т; Н)
§ 17. Оптимальное быстродействие 267 с носителем в множестве е, что $ G (s - a) g (о) da = J G (s - а) и (а) da. A7.34) о о .Зададим управление и формулой <!-«)« +в* в @, то), б>0, О для г>т0, ' где б выберем так, чтобы | v (t) 1^1 — ei почти всюду для некоторого ei >¦ 0. A7.36) Это возможно; действительно, на мпожестве е в силу A7.33) | V (t) | < A - б) A - 8) + б \~g (t) | < 1 - 82 для достаточно малого б, а вне множества е | v (t) | = A - б) | и (t) |< 1 - б, поскольку и ? Шд, т. е. \ и (t) | =sC 1. Очевидно, что S S y(s; у)==A — б) $G(s— a)w(a)da + 6 J G(s— a) g (o) da + G (s) y0, о о а потому, учитывая A7.34), получаем y(s; v)=y(s; и). A7.37) Но тогда, применяя лемму 17.4 (поскольку условие A7.36) выполнено), заключаем, что управление и не оптимально отно- сительпо пары состояний {у0, у (s; и)}. Согласно лемме 17.3, отсюда следует, что управление и не может быть оптимальным в смысле быстродействия относительно пары состояний {у0, г/4}, а это противоречит условиям теоремы. Замечание 17.5. Можно получить дальнейшие резуль- результаты (причем гораздо более простыми рассуждепиями) в случае, если полугруппа G является на самом доле группой, иначе говоря, если можно обратить время (см. гл. 4, § 1). В частности, спра- справедлива Теорема 17.3. Пусть —А есть инфинитезималъный производящий оператор группы G(t) и °tt в = {v I ^ (t) 6 Нд с Н, IIд— окрестность нуля в Н}. A7.38) Если выполнено условие A7.3) и существует управление и ^'Uq, оптимальное в смысле быстродействия, то и (t) ? дНд почти всюду, A7.39) где дНд — граница множества Нд.
268 Гл. 3. Управление параболическими системами Доказательство. Если соотношение A7.39) не выпол- выполняется, то существует такое .множество ее [0, т0], mes e > О,, что d (и (t), дНд) > Ci > 0 для почти всех t 6 е, A7.40) где d (со, Q) — расстояние между множествами со и Q. Пусть %е — -характеристическая функция множества е. Тогда равенство у(х0; u) = y1=G(%0)y0+ )G(x0 — o)u(o)do о можно переписать (используя тот факт, что G — группа) в виде- у (т0; u) = G (т,) у0 + { G Ы - а) и (a) do, A7.41) о где и (а) = и (о) + ^^ G(a — xt) [у (т0; и) - у (т(; м)], Tl <т0. A7.42> mese Если выбрать xi столь близким к т0, что \и (о) — и (о) | <; — при age, то с помощью соотношения A7.40) легко проверить, что и ? 41 д,. а в силу равопства A7.41) у (ть и) = у (т0; и) = у\. Это противо- противоречит предположению о том, что т0 — оптимальное время. Теорема 17.4.1 Пусть выполнены условия теоремы 17.3- и множество Нд выпукло. Тогда существует такой элемент h0 ? /Д что (h0, у (т0; и)- у (т0; м)) > 0 Уи^^о- A7.43) Доказательство. 1) Определим множество К = {h\h^H,h = y (т0; у) - у (т0; 0), у 6 ^о}; A7.44) очевидно, что опо выпукло. Покажем, что 0 — впутренняя точка множества К; A7.45) точка у\ — у (т0; 0) принадлежит К, но 1 A7.46) не является внутренней для К. ) Пусть h — произвольный элемент пространства Н. Чтобы доказать утверждение A7.45), достаточно убедиться, что е/г ? К
§ 17. Оптимальное быстродействие 269 .для достаточно малых | е |. Так как h = J G (т0 — a) G (а — т0) h do, о то eh = у (т0; e,G (а — т0) h) — у (т0; 0) ? К для достаточно малого | е |. Чтобы доказать утверждение A7.46), будем рассуждать от противного. Если бы точка у\ — у (т0; 0) была внутренней для К, то для некоторого е > 0 точка^ у\ — у (т0; 0) + е (j/i — G (т0) у о) принадлежала бы К, т. е. существовало бы такое управление v (ЦШд, что г/i — г/ (to! 0) + е (i/! — G (т0) г/0) = у (т0; у) — у (т0; 0). Отсюда следовало бы, что г/i = г/(т0; 0) + 5^(т0 — а)—— у(а)^а = г/(т0; »), 0 1+6 т. е. что управление w (а) принадлежит внутренности множества %д вопреки утверждению A7.39). 2) Теорема вытекает теперь из утверждений A7.45), A7.46) л следствия 6 § 9 гл. 5 книги Данфорда и Шварца [1]. Замечание 17.6. Если определить сопряженное состоя- состояние р (t) как решение задачи -^Е- + А*р = 0 в @,т0), A7.47) at . РЫ = К A7-48) 1го неравенство A7.43) будет эквивалентно неравенству o. A7.49) о Учитывая наличие локальных ограничений на управление, полу- получаем неравенство (см. теорему 2.1 гл. 2) (р (t), h — и (t)) > 0 почти всюду в @, то)& Vu ? Hg. A7.50) Пример 17.2. Если Нэ — единичный шар пространства Я. то u{t) = — P^ . A7.51) \РШ
270 Гл. S. Управление параболическими системами § 18. Некоторые обобщения 18.1. Уравнения с запаздыванием 18.1.1. Определение состояния. Рассмотрим сначала эволю- эволюционные уравнения с запаздыванием без управления. Решим ти- пичпую х) задачу: пусть дано число со > 0; найти фупкцию у (t),. удовлетворяющую условиям у^ЬЦО, Т; V), у'^ЬЦО, Т; V), т. е. y?W{0, Г); A8.1) у' (t) + A (t) у (t) + у (t - w) = ft(t) при ?>со, y(t)^g{t) в @, со), где /f ? L? (со, Т; V) и g ? W @, со) — данные функции 2). Представим сформулированную задачу в более удобной форме. Зададим оператор М 6 X (L1 @, Т; V); L2 @, Т; V)) формулой My(t) = {yn(t-^ 6СЛИ *>С°' A8.3) (^ U > если * ^ '-- и определим фупкцию (t), < если ' -J- A g, если t << со (так что / 6 U- @, 2'; V')) и число yo = g @) A8.5) (так что г/0 6 Я). Тогда (при условии, что выполняются соотно- соотношения A.1) и A.2)) можно представить равенства A8.2) в виде- у' + Ау + My = 1 в @, Т); у @) = у0. A8.6) Действительно, на интервале (со, Т) первое из равенств A8.6) сводится, очевидно, к первому из соотношений A8.2), а на интер- интервале @, со) равенства A8.6) превращаются в у' + Ay - g' + Ag, y(O) = g @), откуда в силу доказанной в теореме 1.2 единственности следует, что у = g на @, со). Эволюционную задачу с запаздыванием A8.6) легко обобщить. Пусть ?-> со (?) — измеримая положительная \ ни 7V ограниченная функция на [0, Т]. ) ' 1) Мы ограничиваемся здесь лишь простыми примерами. Более общие результаты (в случае отсутствия управления) можпо найти в работах Артоля fll и Байокки [1]. Относительно конечномерных систем см. книгу Халаная [1] (и библиографию к ней). 2) Это можно обобщить.
§ 18. Некоторые обобщения 271 Определим на функциях у ? W (О, Т) оператор М формулой (АО ОХ A8'8) \0, если *-со()< тогда можно искать решение у ? W (О, Г) задачи A8.6), где опе- оператор М задан формулой A8.8). Если выполнены условия A.1), A.2) м A8.7), а оператор М опре- определен формулой A8.8), то задача A8.6) имеет единственное реше- решение (см. Артоля [1], Байокки [1]). 18.1.2. Задача управления. Пусть теперь В ?Х A1; ЯР). Рас- Рассмотрим систему, состояние у (v) которой определяется как реше- решение задачи ,п ч f A8.9) у @; и) = у0. J Будем считать, что функция стоимости имеет вид J(v)=\\y (t; v) - 2д|3 dt + (Nv, v)u. A8.10) о Наконец, пусть <Ud — выпуклое замкнутое подмножество про- пространства 41, a u^4Lg — оптимальное управление. Введем сопряженное состояние следующим образом: заметив, что М 6 X (С0 ([0, Т\; Н); L2 @, Т; #)), а значит, Me%(W@, T); L2@, T; Н)), A8.11) построим сопря?кенный оператор М*, удовлетворяющий условию М* 6 # (?2 @; Т; Н); W @, Т)'), A8.12) и определим сопряженное состояние р (и) как решение задачи, A8.13) p(T;u) = O. Замечание 18.1. Если предположить, например, что функция со (t) монотонна и регулярна, так что оператор М* определяется формулой, аналогичной формуле A8.8), то задача A8.13) имеет единствонпоо решение (см. Байокки [1]). В иных случаях нужно применить метод транспонировапия. Оптимальное управлепие и ?Шд характеризуется тем, что т $ (У (t; и) — гд, у (t; v) — y (t; и)) dt + (Nu, и — u)u > О
272 Гл. 3. Управление параболическими системами С помощью соотношения A8.13) получаем отсюда 1 a. A8.14) Следовательно, для оптимального управления и ? tLa удовле- удовлетворяются соотношения A8.9) (при v = и), A8.13) и A8.14). Пример 18.1. В случае со (t) = © y'(u)+A(t)y(u)=f в (О,©), у @; и) = г/о, -р'(и)+ Л*@/Ф)+Р (* + <»;") = } A8.15) = (/(*; и)-гя, 0<г<Г-со, сюда следует присоединить еще неравенство A8.14). 18.2. Ненормируемые пространства В общей теории систем (Балакришнан [3]) естественно рассма- рассматривать управление как элемент ненормируемого пространства. Мы приведем здесь простейший пример такой ситуации Введем пространство 3)'+ (V) = X B>_; У)." .A8-16) где >2L — пространство функций класса С-х на R с носителями, ограниченными справа х). Иными словами, i$+(F') есть простран- пространство распределений со значениями в V и с носителями, ограни- ограниченными слева (т. е. если / ? <S5l (Г), то/=0 при t <. tf). Пусть и=>3>'+(У), A8.17) °11д — замкнутое подмножество в 3)'+(V). A8.18) Если предположить, что функция t -*¦ a (t; ф, if)) определена и бесконечно дифференцируема на числовой прямой R, то (Лионе [1]) существует такая единственная функция у (v) ? 3)'+ (V), что = f+v. A8.19) Будем считать, что функция стоимости имеет вид J(v)=(g,y(v))= I (g(t), у(t; v)) dt, A8.20) *) С топологией ГОпарца [11; запись го ? 3}_ означает, что ш— функция класса С°° и <р (<) = 0 при t > гф.
§ 79. Пейифференцируемая функция стоимости 273 где g 6 3J- (V) (т. е. g — бесконечно дифференцируемая функция со значениями в V и с носителем, ограниченным справа) ). Пусть и — оптимальное управление (предполагается, что оно существует), т. е. / (и) ^ / (у) для всех у 6 41 д. Определим сопря- сопряженное состояние р (и) как решение задачи A*p(u) = g, P(u)t3)-(V). A8.21) ^ + Ap() g, at Тогда оптимальное управление и^Шд характеризуется тем, что ' +00 I p(t;u)(v — u)dt^O VveWd. A8.22) § 19. Педифферснцируемая функция стоимости 2) 19.1. Основной результат Рассмотрим изучавшуюся в § 2 задачу управления, но в мак- максимально простой ситуации. Отмстим, что все наши рассмотре- рассмотрения можно перенести и на общий случай. Пусть U -- 1? (О, Г; Н), В ? X (//; Я); состояние системы опре- определяется как решение задачи (см. B.2) — B/i)) ^ + )y( I dt \ A9.1) y{v)\t=o = y0, y(v)eL2(Q;T;V). ) Будем считать, что z -- у и N --- vl, v > 0. В качестве функции стоимости возьмем + 2g\\v(t)\dt, g = const >0. A9.2) о ([функционал у ->- / (у) не является дифференцируемым из-за т наличия слагаемого 2g \ \ v (t) \ dt. о Ставится задача отыскания inf / (и), где У 3 — выпуклое замкнутое подмножество пространства 41. Ясно, что существует 1) См. Шварц [2]. 2) Этот параграф добавлен автором к русскому изданию.— Прим, перее. 18-1230
274 Гл. 3. Управление параболическими системами единственное оптимальное управление, т. е. такой элемент и ? ^Ud, что /(u)= inf J(v). A9.3) eil Согласно теореме 1.6 гл. 1, оптимальное управление и характеризуется тем, что г J (у (t; и) - *д, у (t; v) - у (t; и)) dt + о + v ) (и, v — и) dt -f- g ^ | v\ dt — о о г — g^luldt^O Vv^Uq. A9.4) 0 Определим сопряженное состояние р как решение задачи — ^Е. ^ A* (t)р = у (и) — 2Д, р(Г)=:0. A9.5) Тогда (см. предыдущие параграфы) неравенство A9.4) экви- эквивалентно неравенству т т т ,. A9.6) Таким образом, для оптимального управления и ^41 д удовлет- удовлетворяются соотношения A9.1) (при v — и), A9.5) и A9.6). 19.2. Частный случай Рассмотрим случай отсутствия ограничений на управление, т. е. 41 д = 41. Для упрощения записи положил! В*р + vu = if. A9.7) Тогда неравенство A9.6) примет вид т т ,. A9.8) Возьмем сначала v = Xw, затем v = — Xw, где X > 0, a w — произвольный элемент пространства 11. Из неравенства A9.8) получим \>, w) + g\w\]dt-][(¦$, и о о
§ 19. Недифференцируемая функция стоимости 275 и 0 откуда т 0 (if), W) -f- g 11 г 0 3 0 т 0 Mdt v, '\u\]dt>0 VA>0, 6^ = L2@, Г; Я); A9.9) ^0. A9.10) о Двойное неравенство A9.9) эквивалентно неравенству I СФ. и>)К*|и;| VwtH, что дает ItWKg. A9.11) Таким образом, (ф, u) + g I "• 1 ^ 0 иочти всюду, а это вместе с неравенством A9.10) показывает, что (^ (*), и (t)) + g \u{t) | = 0 почти всюду. A9.12) Итак, если ограничения на управление отсутствуют, а функция стоимости имеет вид A9.2), то оптимальное управление и характеризуется соотношениями at dt '\В*р (t) + vu («) К ? почти всюду на [0, Т], 1 . ,. (Б*р (Q + vu (t), и (t)) + ?| u (QI = 0 почттги <?сю% ка [О, Г]. J ^ ' Замечание 19.1. Соотношения A9.14) можно интерпре- интерпретировать следующим образом: (i) если | В*р (t) + vu (t) | < g, то и (t) = 0; (ii) если | B*p (t) + vu (i) | == g, то (Б*р @ + vu (t), и (t)) = -\B*p (t) + vu (t) | .| и (t) |, и потому 2?*р (г) -{- vu (t) = — %u (t), A,>0. Иначе говоря, 18*
276 Гл. 3. Управление параболическими системами Пример. Рассмотрим самую простую задачу из разд. 3.1, например случай А = —А. Соотношения A9.13) и A9.15) при- принимают тогда вид ду др Ay = f + и, ¦ Ар — у — zH в Q; dt dt _ ' A9.16) р (х, Т) = 0, х ? Q; и (х, t)\2dx<ig2 =ф и(х, «) = i \\р(х, (,) ), A9J7) u(x,t)\dx = g=> =#¦ p (x, t) -f- \xu (x, t) = 0, ji ^ v. j Замечание 19.2. Очевидпо, аналогичные примеры можно построить для всех задач настоящей главы, а такте гл. 2 и 4. Замечание 19.3. Пусть ug — оптимальное управление, т. е. решение задачи A9.3), если функция стоимости / (v) имеет вид A9.2). Можно проверить, что и„ ->¦ и в пространстве 41 при g ->¦ 0, где и — оптимальное управление в задаче с «дифференци- «дифференцируемой» функцией стоимости (когда в формулу A9.2) подставле- подставлено g = 0). Замечание 19.4. Многочисленные задачи минимизации, содержащие недифференцируемые функционалы, встречаются в ме- механике (см. разд. 3.10 гл. 1, а также работы Дюво и Лионса [1], [21). Примечания Результаты, илложонныо в § 1, мы привели лишь для удобства читателя. Наше доказательство существования следует методу Фаедо — Галёркипа. Другие доказательства см. в книгах Лионса [3], Лионса и Мадженеса [1, гл. 3]. См. также Фридман 11], Ладыженская, Солошшков и Уральцсва [1]. Эволюционные неравенства 1) мы не рассматрипаем (см. примечания к гл. 1). В разд. 1.6 дается минимум сведений из теории полугрупп, необходимый для понимания дальнейшего. Более подробно эта теория изложена в моно- монографиях Хилле и Филлипса [1], Като [1], Иосиды [1]. Метод полугрупп тесно сня.чан с методом преобразования Лапласа по t, по поводу которого см. Гарнир [1], Лионе [4]. Весь § 1 посвящен исключительно линейным задачам. О нелинейных задачах речь идет в § 15, 16. х) Задачи управления системами, описываемыми эволюционными нера- неравенствами, еще очень мало изучены. См., например, разд. 15.6.
Примечания 277 Б § 2 результаты, хорошо известные для систем, описываемых обыкно- обыкновенными дифференциальными уравнениями (Калмаи [1J, |2]), переносятся на системы, описываемые эволюционными дифференциальными уравнениями с частными производными. В этом случае совокупность равенств, фигурирую- фигурирующих в теореме 2.1, можно назвать двухточечной граничной задачей; новым здесь является только наличие граничных условий (или неравенств) па боковой поверхности. 13 § 4, 5 на случай неограниченных операторов в бесконечномерном пространстве обобщается теория синтеза (обратной связи), являющаяся классической в конечномерном случае (см. Атанс н Фалб [1], Калмаи и Бюси [1], Бюсн и Джозеф [1], Ли и Маркус [1]; случай ограниченных операторов is бесконечномерном пространстве рассматривали Фалб и Клешшаи [1], Форр [1]).Бри таком обобщении обоснование формальных вычислений разд. 4.3 выбывает серьезные трудности. Эти трудности обусловлены нелинейностью (квадратичные нелинейности «типа Риккати») рассматриваемых уравнений. Примененный для определения оператора Р (t) и функции г (t) метод здесь описан впервые; см. также Балакришиап н Лионе [1], Бенсуссаи |3]. Прямое исследование1) нелинейных иптегро-дифференциальных уравне- уравнений параболического типа, характеризующих ядро Р (х, g, t) (см. § 5), про- проводили Да Прато [1], Темам [1], [4]. Численный анализ уравнений этого тина дал Б еде лек И]. Можно привести и другие примеры, когда вариационное исчисление помо- помогает решать нелинейные дифференциальные уравнения с частными производ- производными. В этой связи упомянем работу Флеминга [5], который, следуя идее Хопфа (см. Хопф [1], Конвой и Хопф I1J), рассматривает некоторое нелиней- нелинейное уравнение гиперболического тина как уравнение Гамильтона — Якоби одной стохастической задачи вариационного исчисления. Случай некоорцнтмвнон функции стоимости J (и) в конечномерном про- пространстве исследовал Форр [2]. Естественно, можно записать функции у и р с помощью фундаментального решения эволюционного параболического оператора dldt -\- Л (t), а и част- частном случае, когда Л A) =г= Л,— с помощью полугруппы, для которой —А является ннфшштозимальным производящим оператором (см. Балакршпнап [1], f2J, Аксельбанд [1J). Можно также использовать все классические методы представления решений: разложение по собственным функциям, преобразо- преобразования Лапласа, Меллипа п т. д. (см., например, Сакава [11, [21). В § 0 результаты Калмаиа [1], [2] (касающиеся понедешвд при Т ->¦ оо) переносятся на бесконечномерный случай. При этом, как и в § 4, о, метод определения оператора Роо и функции /•«, отличается от используемых в ко- конечномерном случае. Скалярный случай (линейный и нелинейный) более"- подробно, изучен Калмапом и Бюси [1]. Интегро-дифферепциальные уравнения Риккати, о которых шла речь в § 4, 5, 6, были уже введены раньте (но не в такой общности) многими авто- авторами (см., например, Эрцбергер а Ким [1], Цафестас и Найтингейл [1], [2], Вонг [11 и библиографию к последней работе). По при этом возникала следую- следующая трудность (остававшаяся непреодоленной): отыскивались априори (по аналогии с классическим случаем) такой оператор Р и такая функция г, чтобы выполнялось тождество р —- Ру ~ г; это в свою очередь приводило к необходимости прямого исследования питегро-диффереициалыюго уравне- уравнения Риккати. Мы же, напротив, сначала определяем Р и г, проверяем справед- справедливость тождества р ¦--¦ Ру -'¦ г, а потом показываем (в разд. 4.6 и в приме- примерах § 5), что Р и г удовлетворяют «естественным» уравнениям. Таким способом, Удается обеспечить глобальное существование оператора Р (t) и его ядра Р (-Ti Si t) (с помощью теоремы Шварца о ядрах). To есть исследование, не использующее связей с теорией управления.
278 Гл. 3. Управление параболическими системами Уравнение Риккати связано с теорией поля в вариационном исчислении (см. Хостенс 111; метод инвариантного погружения Беялмапа см. Беллмап, Калаба и Винг [1]; метод выметания Гельфапда см. Гельфанд и Фомин [1, § 31]). Аналогичные методы часто применяются в астрофизике (метод инва- инвариантов см. Лмбарцумян [1], Чандрасекар [1]; преобразование Ряккати см., например, Хаммер и Рыбицкий [1]). Из результатов разд. 4.5 следует сходимость приближений, построен- построенных по методу Фаедо — Галёркипа (классическому для эволюционных уравнений без управления: см. Фаедо [1], Грин [1], Лиопс [3]). Результаты разд. 4.7 хорошо известны для систем, описываемых обыкно- обыкновенными дифференциальными уравнениями; см. Калмап [1], [2]. Рассуждения разд. 4.8 формальны (что подчеркнуто и в тексте); при этом применен метод динамического нрограммиронания (см. Беллмап [1]; Моисеев 1]); аналогичные рассуждения содержатся в книге Бутковского [1] и в рабо- работе Волга [1]. Результаты разд. 4.8, конечно, можно обосновать, но примене- применение уравнения Гамильтона — Якоби D.100), являющегося функционально- дифференциальным уравнением, наталкивается па существенные трудности. Уравнения такого тина рассматривали в иной связи Донскор и Лионе [1], а в задачах, близких к нашим, Флеминг [1], [2] и Мортенсен [1], [2] 1). Эти уравнения решаются с помощью интегрирования в функциональных простран- пространствах (см. Допскер [1]) г). Свойство обратной единственности (разд. 7.2) изучали Лионе и Мальграиж [1] методом Карлемапа (Треп [1, гл. 2, разд. 2.2]). Другой метод, использую- использующий выпуклость, был применен Лгмоном и Ннренбергом [1], [2]. См. также Крейн [1], [2], Зейдмаи [1]. Результаты § 8, 9 в более общем виде изложены в книге Лнонеа и Мад- жепеса [1, гл. 6] (там рассматривается параболический оператор порядка 2т с общими граничными условиями, но односторонние задачи п вопросы рас- расцепления не затрагиваются совсем), а также в работе Лионса [1, статья III]. Утверждение (9.17) в тексте не доказано; мы отсылаем читателя к книге Лионса и Маджеиеса [1, гл. 4]. Другое доказательство, менее общее, но более элементарное, можно получить с помощью формулы Реллиха для эллиптиче- эллиптического случая (Печас [1]) и преобразования Лапласа по t. Различные конкретные примеры содержатся в книге Бутковского [1] и в работах Брогана [1] и Виберга [1]. Эти авторы не пользуются транспони- транспонированием при постановке граничных задач с ненулевыми граничными усло- условиями, а сразу вводят распределения, сосредоточенные па поверхности цилиндра Q. Отметим, что такой способ трудно применять, если размерность пространства больше 1. Результаты разд. 10.3 принадлежат Фатторипи [5] (который доказал управляемость также и непосредственно, без привлечения теории двойствен- двойственности). В этой же работе содержатся еще и другие результаты — для абстракт- пых параболических операторов и параболических операторов произвольно- произвольного порядка в случае, когда размерность пространства равна 1 (а также для гиперболических операторов). Примеры решения вычислительных задач, примыкающих к разд. 10.2, см. в книге Латтеса и Лионса [1], где вводится и изучается метод квазиобращеиия (который, кстати, было бы интересно рас- распространить на сунерединствепность, см. разд. 10.3). Более обстоятельное, чем в разд. 11.3, исследование управляемости систем с начальным состоянием в качестве управления провел Фатторини [2], [3], [4]. См. также Миранкер [1]. *) В частпости, используя результаты Нельсона [1], можно прийти к за- задачам такого типа для систем, описываемых уравнением Шредингера. 2) В рассматриваемом нами случае естественно исходить из представле- представления состояния системы через функциональные интегралы.
Примечания 279 Результаты разд. 11.А принадлежат Беисуссану [1], предложившему также численный метод решения задач такого типа (другой метод можно найти в книге Латтееа и Лнонса [1]). Состояние системы можно записать «явно», используя фундаментальное решение оператора a/dt -- Л (t). Тогда задачу об управляемости (например, рассмотренную is разд. 11.3) удается переформулнропать па языке операторов. Именно этот путь избрали Копти [1], [2] п Миттср [11, обобщшшше па беско- бесконечномерный случай один результат Антосевнча [1], доказанный им для слу- случая конечного числа измерении. Пусть состояние системы определяется, например, как решение задачи dt (*) а наблюдение имеет вид Су (и). Эта система называется наблюдаемой, если i; = 0, Су (О) = 0 => г/0=0 (Калмаи [1], [2], Маркус [1]). Если, например, Су (v) = ——- , то система (*) наблюдаема в силу теоремы единственности для задачи Коиш. Если неко- некоторая система ленаблюдаема, то — по крайней мере теоретически — ее мож- можно сделать наблюдаемой, переходя к факторпространству (вообще говоря, но бесконечномерному подпространству, явное нахождение которого весьма сложно); см. Балакришнап [3]. Теорема 12.1 представляет собой вариант одного классического резуль- результата (Мапдельбройт [1]; Фепчел [1]). Функции, удовлетворяющие усло- условиям A2.0), систематически использовались в работе Моро |1], где можно найти и теорему 12.1 (сформулированную иначе). Приведенное нами изложе- изложение, далеко не самое общее; см. Мипти [1], [2], Моро [1] (и библиографию к этой работе), Рокафеллер [1], [2], [3], Сеа [1]. К разд. 12.2 примыкает работа Рассела [2]. Результат, более общий, чем теорема 12.1, получил Брезис [3]; относительно других результатом и их приложений см. Бенсуссан [3]. Естественно, теорему 12.1 можно применить также в «эллиптических ситуациях» (гл. 2) и в «гиперболических ситуациях» (гл. 4). Относительно приложений теории двойственности см. работу Пирсона [1]. В разд. 13.1 предлагается один из возможных способен перенесения классической теории множителей Лагранжа на бесконечномерный случай. Мы следовали здесь изложению Обипа [1], [2]. Необходимо упомянуть также фундаментальные работы Джона [1], Куна и Таккера [1]. Некоторые дополнения (частично эвристические) к разд. 14.3 имеются is работе Лнопса [12], где нелинейная обратная снязь разлагается в ряд Тей- Тейлора, коэффициенты которого удовлетворяют последовательности интегро- днфферепциальпых уравнений с частными производными. Более общие, чем в разд. 15.2—15.4, результаты можно найти в рабо- работе Лионса [2] (см. также Лионе [8]). Теоре.ма 15.6 принадлежит Флемин- Флемингу 15]. Другие варианты теоремы 16.1 дал Флеминг [5]. Исследование регуляр- регулярности решений параболических уравнений (играющей фундаментальную роль) проводили Ильин, Калашников и Олейннк [1]. Как и is эллиптическом случае (см. примечания к гл. 2), следует остерегаться «аксиоматических» доказательств утверждений типа теоремы 16.1 (или типа принципа максимума Понтрягина), при которых все трудности проблемы переносятся в условия теоремы. Теорема 17.1 в менее общем виде была доказана 10. Егоровым [1]; см. также Балле [1].
280 Гл. 3. Управление параболическими системами Теорема 17.2 принадлежит Фатторшш |1]. В работе Фридмана [1] ость ошибка (в лемме 2, по недоразумению приписываемой Фатторшш, нельзя фиксировать Т). Подробное исследование этой же проблемы проводил 10. Его- Егоров [2]. См. также Балакршниан [1], Фалб [1]. Теорема 17.2 представляет собой обобщение результата о релейпости оптимального управления в конеч- конечномерном случае (Беллман, Глнкеберг и Гросс [1], Халкнн [1], Ла-Салль [1], Маркус [2]). Теорема 17.3 принадлежит Фридману [1] и Фатторшш [6]; мы следовали изложению Фатторшш (в работе Фатторшш |6] рассмотрен и более общий случай, когда оператор A (t) зависит от /). Можно рассматривать управление как элемент более общих, чем в этой книге, пространств, погружая пх в гильбертовы пространства Соболева «отри- «отрицательного показателя». Например, в работе Лионса и Мадженеса |2] изучает- изучается случаи, когда управление выбирается в пространстве Жеврея. Т5 разд. 18.2 приводится (тривиальный) пример, когда управление является распреде- распределением. Мы не рассматриваем здесь случай, когда на управление и наблюдение накладывается шум. Систематическое исследование, таких задач, а также систем, описываемых стохастическими дифференциальными ураннепиямн с частными производными, содержится в работах Бепсуссаиа [2J, [3] и Куш- нера [1]; конечномерный случай рассматривали Калман и Б юс и [11. Мы не рассматривали также системы, описываемые дифференциальными уравнениями с частными производными с днуия управлениями'—антагони- управлениями'—антагонистическими (теория иг])) или нет. Вероятно, можно распространить на этот случай некоторый результаты Варейя [1]. Отметим также работы Бонтрягн- на [1], [2], Мищенко и Поптрягина [1], [2] и Пшеничного [1], [2] но дифферен- дифференциальным играм, которые было бы интересно но мере возможности обобщить и па случаи систем, описываемых дифференциальными уравнениями с част- частными производными. Наличие двух иеантагонистических управлений приводит к случаю, когда состояние системы определяется как решение некоторой односторон- односторонней граничной задачи, Уто в свою очередь приводит к важной проблеме (упо- (упомянутой в разд. 7.5 гл. 2) оптимального управления системами, описывае- описываемыми односторонними граничными задачами. Систематическое исследование этой (трудной) проблемы не проводилось. Наконец, мы не рассмотрели систем, описываемых многозначными диф- дифференциальными уравнениями, коэффициентами в которых служат неогра- неограниченные операторы (относительно случая ограниченных операторов см. Кастой [1]). Отметим, что односторонние граничные задачи, изучавшиеся в этой гла- главе, обладают некоторой аналогией с задачами, встречающимися в теории пластичности (см. Кристеску [1], а также примечания к гл. 1).
Г Л А И Л tt Управление системами, описываемыми уравнениями с частными производными гиперболического типа или корректными по Петровскому § 1. Эволюционные уравнения второго порядка 1.1. Обозначения и предположения Будем пользоваться обозначениями § 1 гл. 3. Рассмотрим такие гильбертовы пространства V и Н, что Fez//, V плотно r //, V сепарабелыю. A.1) Отождествляя // с его двойственным и обозначая через V пространство, двойственное к пространству V, можем записать V cz /Г с: V. A.2) Далее, пусть дано семейство операторов Л (t) ? % (V; V). Определим семейство билинейных форм на пространстве V: a (t; Ф, г|з) =-= (A (t) Ф, о|з> Уф, я|; 6 V, A.3) и предположил!, что Уф,т|з ? V функция t—у a (t; ф, тр) непрерывно дифференцируема на [0, 71; j a (t; ф, г[>) = а (*; ф, ф) Уф, г|; g F; A.Л) существует такое число Я, 6 R, что х) | a (t; ф, Ф) + Я, | Ф |я > а ]| Ф ||2, а > 0, | A.6) Уф б V, V* € [О, Т]. J Замечание 1.1. Сделанные предположения далеко не са- самые общие из тех, при которых справедливы приводимые ниже результаты. Но методы, применяемые в дальнейшем, являются общими (см. также Лионе 13]). 1.2. Постановка задачи. Теорема существования и единственности Рассмотрим следующую эволюционную задачу: найти функ- функцию у, удовлетворяющую условиям at A.7) I ф I = ;1ф Ня" Нф !l "^ II Ф I!
282 Гл. 4. Управление гиперболическими системами уравнению d2y A(t)y = f в (О, J), A-8) d2 где / — данная функция пространства L2 (Q, Т; II), A.9) и начальным условиям У(О) = УО, A.10) ш, ¦ A.11) где уо и yi — данные элементы пространств V и Н соответственно. Замечание 1.2. Из равенства A.8) следует, что Отсюда, в частности, вытекает (см. теорему 1.1 гл. 3), что произ- производная dyldt — почти всюду непрерывная функция [0, Т\ ->¦ V'. А тогда в силу соотношения A.7) у — непрерывная функция [0, Т\ ->¦ II. Следовательно, равенства A.10) и A.11) имеют смысл. Докажем, что справедлива Теорема 1.1. Если выполнены предположения A.4) —¦ A.6), то задача A.7) — A.11) имеет единственное решение, причем {/, Уо, У>}-+{у, jj) A.12) — линейное непрерывное отображение II @, Т; I1)XV-AII-+ L2 @, Т; V) X L2 @, Т; II). Замечание 1.3. В действительности справедливо более сильное утверждение (см. Лионе и Маджопос [1, гл. 3]): у — непрерывная функция 10, Т] ->¦ V; Л -~ — непрорывная функция 10, Т] ->¦ //. Замечание 1.4. Существенное, отличие сформулированной сейчас задачи от эволюционной задачи, поставленной в § 1 гл. 3, состоит в том, что теперь можно обратить время, чего нельзя сде- сделать в параболических задачах. Иначе говоря, если рассмотреть задачу A.7) — A.9) с начальными условиями (вместо A.10), A.11)) УСП = Уо, A.14) at
§ 1. Эволюционные уравнения второго порядка 283 где у 0 и г/i — данные элементы пространств V и // соответственно то она также имеет единственное решение, непрерывно зависящее от исходных данных (как в теореме 1.1). 1.3. Доказательство единственности Пусть элемент у удовлетворяет соотношениям A.7) — A.11) при / = 0, уо = 0, yt = 0. Зафиксируем s ? @, Г) и положим [ 0, t>8. Согласно A.8) (при / = 0), Интегрируя по частям х), получаем l[a(t;^,^)-(y',y)]dl=^O. A.16) о Введем обозначение -^-аA;<р,Ч>) = а'(*;«Р,1>) Vip.iKV. A-17) Тогда равенство A.16) можно переписать в виде I $ 2]d* — \a(t; t, t) d* = 0, о I -$-[a(t; ф, t) - | if @12] о а^ или a @; ф @), ф @)) + | у (s) |2 = { a' (fi ф, ф) Л. о Следовательно (в силу A.6)), ^^ 2. A.18) ^ ) о t Если положить u? (t) — I y (a) da, то неравенство A.18) о примет вид II «>(«)II2 +1»(«) I2<^i (? II »@ - »(«)II2Л + !«>(«)!2). Как и обычно, z =
284 Гл. 4. Управление гиперболическими системами откуда A - 2c,s) || w(s) \\2 + \y(s) |2< c2 } (\\w(t) ||2 + | у (t) |2) dt. A.19) 0 Таким образом, если выбрать число s0, например, так, чтобы было 1—2cfs0 = 1/2, то из оценки A.19) получим (] + t для 0 о Это в свою очередь означает, что у = 0 на отрезке [0, s0]. Посколь- Поскольку, однако, длина s0 этого отрезка пе зависит от выбора начала координат, то у == 0 па отрезке [s0, 2s0] и т. д., т. е. единственность доказана. 1.4. Доказательство существования х) Пусть w\, . . ., wm, . . .—«базис» пространства V (в смыс- смысле A.14) гл. 3). Пусть Уот= ^)l°imWi, Уот-^Уо в V щш т-^-оо; A.20) Vim = 2) г=1 Определим приближенное решение ym (t) нашей задачи соотно- шениялш г/т @) = г/от, г/т @) = г/1т. Очевидно, что эта задача Коши для системы m липейных диф- дифференциальных уравнений относительно gtm (t) имеет единствен- единственное решение. Для получения априорной оценки функции ут (t) умножим второе из соотношений A.21) на g\m (t) и просуммируем по /; тогда (Ут (t), Ут @) + п (t; Ут @, Ут (t)) = (f(t), Ут (*)), Ср. с разд. 1.4 гл. 3.
§ 1. Эволюционные уравнения второго порядка 285 Т. е. -Г"[1 Ут (О I' + « ft J/m (О, 0т @)] ~ «' (*! Ут (О, Ут @) = си = 2 (f(t),y'm(t)). . Следовательно, I г/m (О I2 + а («; г/т @, г/т @) = I г/<т I2 + а @; г/от, уОт) + + J а' (ст; г/т (ст), ут (а)) da + 2 J (/ (ст), г/;, (ст)) da, о о откуда I г/^ @12 + II г/m (О II2 < (II г/от II2 +1 г/im I2) + с I i/m (О I2 + m(o)\\2 + \f(o)\.\y'm(o)\]do. A.22) О Но поэтому если положить 22 = ^т@, A-23) то из неравенства A.22) получил! t t Y-m (t)<c [|| 1/от||2 + 1г/1т|2+ J I / (a) |2 da] + с $ Ym(o)da. A.24) о о В силу леммы Гронуолла отсюда следует, что Нг/mWIKC, teio, Л, A.25) где С — константа, не зависящая от т. Соотношение A.25) означает, что ут остаются в ограниченном подмножестве "| пространства Ь°° (О, Т; V); | dum \ A.2С)) -^— остаются в ограниченном подмножестве пространства L°° (О, Т; Н). J Следовательно, можно извлечь такую подпоследовательность
286 Гл. 4. Управление гиперболическими системами {//ц}> чт0 y^-^-z *-слабо в Ь°°(О, Т; V); л dt~*dt*' J Тогда, в частпости, у^ @) ->¦ z @) слабо в пространстве Н и так как, согласно A.20), г/ц @) = г/оц -> г/о в v, то z @) = у0. A.28) Пусть ф 6 С1 ([0, Г]), ф (У) = 0; обозначим q>j(t) = ц> (t) Wj. Умножив второе из соотношений A.21) (при m = ц > j, где j — произвольное фиксированное число) на функцию ф (t) и про- проинтегрировав от 0 до Т, получим г т о ' о Переходя здесь к пределу при }л-> оо (что возможно в силу A.27)), находим т ) [— (z'i wj) ф' 4~ а (t'i zi Wj) ф] dt = о = $(/, ^)фЛ + (г/1, ^-)Ф(О). A.29) о Если взять ф ? S (@, Г)), то соотношение A.29), как легко проворить, даст —у (z, u;;) 4- a (i; z, Wj) = (/, «v) V7, а потому Отсюда следует, что (г' @), ^-) Ф @) = (уи wj) Ф @) V/, V<p, а значит, z' @) = yt. Таким образом, элемент z действительно является решением задачи A.7) — A.11).
§ 7. Эволюционные уравнения второго порядка 287 Замечание 1.5. На самом доле мы доказали даже больше: у 6 If" (О, Т; V), dyldt 6 L°° (О, Т; Н). Как было отмочено в заме- замечании 1.3, справедлив и еще более сильный результат. Замечание 1.6. Легко показать, что ут-*у сильно в L2@, Г; F); "| dJb_^*L СЛабо в Ь*{0,Т;П). dt dt Действительно, слабая сходимость уже доказана, а рассматривая т Xm=l[a (t; ут-У,Ут-У)+\ Ут (*) - У' (t) I2] Л, о легко проверить, что Хт ->¦ 0. Отсюда следуют соотношения A.30). 1.5. Примеры (I) Будем пользоваться обозпачешгами § 1 гл. 3. Пусть функции atj (ж, Z), i, ) — 1, . . ., re, удовлетворяют условиям: atj(x, t)?L°°(Q) при фиксированном ^6[0, Т\, *) flij^i ^бС^О, ?']) при фиксированном а:^Й; | ац = а>п Vt, 7"; [ .A.31) 2 а„{х, №&><*№ + •'•¦+&), «>0- Sj€R- I Пусть V — подпространство пространства IP(Q), причем Hi (Q) = V = Я1 (Q), A.32) а Я = ?2(Q). Для ф, 1)з g 7 положим а (*; Ф> ф) = i,j=l Й OX] OXi Тогда выполнены условия теоремы 1.1. Конкретные результа- результаты зависят от выбора V. Приведем три примера. Пример 1.1. Пусть V — Н\(О). Тогда по теореме 1.1 суще- существует единственная функция у, удовлетворяющая соотношениям у, JL, ^L\Q)% Q = QX(O, T); A.34) t di2 ' \ ' ' дх A [x,t, f)y = f в Q, A.35) \ dl
Гл. 4. Управление гиперболическими системами ГДО А [х, t, f) г|) = Л (t) ф = - |] А (а„ (х, 0 -^-) 5 A-36) = Q на 2 = Гх(О, Г); A.37) *,О) = И>(*). ^^=^(х), a:6Q, УоеП1о№, Ш € ^2(Q). A.38) П р и м о р 1.2. Пусть V ¦— FP-(?l). Тогда по теоре.че 1.1 суще- существует единственная функция у, удовлетворяющая соотношени- соотношениям "A.34), A.35), A.38) (при уо'е TIl(Q)) и ^- = 0 па 21). A.39) dvA Пример 1.3. Пусть выбрано Го с: Г (подмножество поло- положительной меры границы Г) и V --= {т|> | г|) 6 #х(&); г|) = 0 на Г„}. A.40) Тогда но теореме 1.1 существует единственная функция у, удовлет- удовлетворяющая соотношениям A.34), A.35), A.38) (при yQ e V) и у = 0 на Г0х@, Т); -QL = 0 на Г, X @, Г), где 1\ = Г - Го. <5vA Естественно, при Го = Г (соответственно Го ф 0) мы при- придем к примеру 1.1 (соответственно к примеру 1.2). Замечание 1.7. Оператор 02/dt2 --- А — гиперболический оператор второго порядка. Задачи, рассмотренные в примерах 1.1 —1.3, являются сме- смешанными задачами в смысле Лдамара; см. Лдамар [1], Ладыжен- Ладыженская И]. 1.6. Примеры (II) Рассмотрим «эволюционную задачу второго порядка», анало- аналогичную рассмотренной в разд. 2.7 гл. 2. Пусть функция а (ж, t) такова, что . а (ж, t) 6 ?°° (Q) при фиксированном t ? [0, Т\; а (х, t) ^С1 ([0, Т}) при фиксированном х ? Q. V • / х) Формальная проверка этого равенства осуществляется так же, как в примере 1.2 гл. 3; обоснование см. в книге Лнонса н Мадженеса [1, гл. 5].
§ 2. Задачи управления 289 Введем V = {y\$, A^L2^)}, Я = L2(Q), A.42) а (г; ф, ф) = J а (х, г) Дф Л-ф da; Уф, г|з ? F. A.43) Тогда можно применить теорему 1.1, согласно которой суще- существует единственная функция у, удовлетворяющая соотношениям у, ^-, Лг/€^2(<?); A-44) at =j в <?; A.45) at Дг/ = О, ^ = 0 на 2; A.46) дп у (х, 0) = уа (х), ОЩЛ = у, (х), х € Q, yQ 6 F, ,?l 6 Z^2 (Q). A.47) at Замечание 1.8. Оператор г|з -х^ф'с^2 |- А (аД-ф) является корректным по Петровскому; см. Геяьфанд и Шилов [1, т. 3]. 1.7. План дальнейшего исследования Отметим, что в рассмотренных примерах граничные условия на поверхности Е были однородными, т. е. записывались в виде Bjij |2 — 0, где / — 1 или / — 1, 2 и т. д., a Bj — дифференциаль- дифференциальный оператор порядка 0 или 1 и т. д. Если же мы хотим изучать задачи с граничным управлением, то очевидно, что от одпородпо- сти граничных условий необходимо отказаться. Сначала мы займемся задачами с распределенным управлени- управлением — как в цилиндре Q, так и в области Q. Затем уже исследуем задачи с граничным управлением. § 2. Задачи управления 2.1. Обозначения. Простейшие свойства Будем пользоваться обозначениями, аналогичными принятым в § 2 гл. 3. Пусть B.1) а /, у о, #i — данные элементы пространств L2 @, Т; Н), V и Н соответственно. Предположим, что состояние у (и) системы опре- 19—1230
290 Гл. 4. Управление гиперболическими системами доляется как решение задачи d2y(v) -1\± + A{t)y(v)=f + Bv; B.2) dt y{0;v) = y0, -— — Уи B.3) dt у 6 L2(Q, Г; V), ^- 6 L2 @, T; II)x). B.4) dt Наблюдение z (v) можно задать так же, как в разд. 2.1 гл. 3. Если определить W @, Т) как пространство, заметаемое состоя- состоянием у, когда v -- 0, а тройка {/, yQ, i/t} пробегает произведение L2 @, Т; II) X V X II, то можно воспользоваться формулой B.5) гл. 3. Если оператор N обладает свойствами B.6) гл. 3, то функцию стоимости / (у) можно выбрать в виде B.7) гл. 3. Пусть множество допустимых управлений 41 g — выпуклое замкпутоо подмножество пространства hi. Тогда существует един- единственное оптимальное управление u^allg, характеризующееся соотношением B.13) гл. 3. Мы уточним этот результат, рассматривая более конкретные наблюдения z (v). Именно, будут изучены следующие случаи: @, ; & Si 1, У), am) Т; И); SS) V), , z(v) = Cy(v); , z(v) = Cy'(v); z(v) = Doy(T; z(v) = Dy'(T; v); V). B B- B. B. .5) ¦6) 7) 8) Конечно, можно рассматривать все четыре случая вместе (вводя четыре гильбертовых пространства Ши ¦ ¦ ., SSi), но лучше иссле- исследовать их по отдельности, чтобы разделить трудности, специфи- специфические для каждого случая. 2.2. Случай B.5) Функция стоимости имеет вид / (v) = || Су (v) - zK \\%c + (Nv, v)v, B.9) 1) Отличие рассматриваемой задачи от сформулированной в гл. 3 состоит в следующем: здесь мы берем функцию / в пространстве L2 @, Т; II), тогда как в гл. 3 можно с самого начала считать, что / ? I? @, Т; V').
§ 2. Задачи управления 291 а оптимальное управление u^ilg характеризуется тем, что (Су (и) — zK, Су (v) — Су (и))^ + (Nu, v — и)%>0 Vi? 6 B.10) Так как С* 6«2? (Ш'\ L2 @, Т; V')) то, обозначая через Лда = Л канонический изоморфизм Ш -> S6', перепишем неравенство B.10) в эквивалентной форме: т \ (С* А [Су (и) — 2Д], y(v) — y (и)) dt + (Nu, v-u)%^0 4v?<Ug. B.11) Здесь мы сталкиваемся со следующей трудностью. Формально можно определить сопряженное состояние р (и) как решение задачи d2p(u) , • dt Однако поскольку С*А [Су (и) — zK ] gL2 @, Т; V), нельзя при- применить результаты § 1 г). Поэтому паложим более сильное усло- условие на оператор С: С ^Х(Ьг @, Т; II); $в). B.13) Тогда С*А [Су (и) — гд] ? L2 @, Т; Н), и по теореме 1.1 зада- задача B.12) имеет единственное решение, причем р (и) 6 L* @; Т;П ^ € L2 @, Т; Я). B.14) dt Преобразуем неравенство B.11). Умножим первое из равенств B.12) скалярно (в пространстве //) на у (v) — у (и) и проинтегри- проинтегрируем от 0 до Т: u), y(v)-y(u)\dt = = I (С*А [Су (и) - Яд], y(v)-y (и)) dtl B.15) г) Эта трудность преодолевается, если обобщить результаты § \, что и будет сделано ниже; см. также Лионе и Мадженсс [1, гл. 3]; Байокки [1]. 19*
292 Гл. 4. Управление гиперболическими системами а затем применим формулу Грина к левой части равенства B.15). Заметим, что если <р, 1р 6 W (О, Т; V); ф', о|/ ? L2 (О, Г; II); Ф", ф" 6 6.L2 (О, Т; V), то f (ф', г])) df = (ф' (J), o|) (Z1)) — (ф' @), о|) @)) — о - (Ф (Г), ф' (Г)) + (Ф @), о];' @)) + f (Ф, ф-) Л. о Поэтому равенство B.15) принимает вид -ТГ + А1 = J (С'Л [С» (») - гд], y{v)-u (и)) it, О левая часть этого соотношения, если учесть уравнение B.2), за- записывается так: \ (р (и), B(v- и)) dt = (В*р (и), v-u)l) = (А^В*р (и), v - U)v. о Таким образом, условие B.11) оптимальности управления и ^Ilg эквивалентно неравенству (Ап1В*р {u)+Nu,v — u)u^Q V у 6 Uo. B.16) З'а м е ч а н и е 2.1. Условие B.16) аналогичпо условию B.18) гл. 3. Замечание 2.2. Предыдущие выкладки показывают, что -| /' (и) = В*р (и) + AyNu. B.17) Полученный результат (ср. с теоремой 2.1 гл. 3) формулируется как Теорема 2.1. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.9), где оператор С удов- удовлетворяет условию B.13). Тогда оптимальное управление и 6 ^<? характеризуется соотношениями + A(t)y(u) = f + Ви, у @; и) = у0, у' @; и) = У1; B.18) х) Скобки здесь обозначено скалярное произведете элементов, принад- принадлежащих пространствам 11' Т&11 соответственно.
§ 2. Задачи управления 293 A(t)p(u) = C*A(Cy(u)-zn), B.19) p(T;u) = O, p'(T;u) = O; (А^В*р (и) + Nu,v — u)%^0 Vv 6 <Ud; B.20) где у (и), р (и) 6 L2 (О, Т; У), у'(и), р (и) 6 L2 (О, Т; Н). B2\) Замечание 2.3. Если <Ud = Ш, то соотношение B.20) приводится к виду А^В*р (и) -j-Nu = 0. B.22) Исключив с его помощью и, заключаем, что оптимальное управ- управление получается из решения задачи df У @) = у0, У' @) = уи р (Т) = 0, р (Т) = 0, а именно и = — N~lA^B*p. Задача B.23) будет более подробно изучена в § 4. 2.3. Случай B.6) Функция стоимости имеет вид -(Nv,-v)v, B.24) а оптимальное управление и ? 41 Эт характеризуется тем, что (Су' (и) - *„, Ci/' (v) - Сг/' (и))да + (Nu, v - u)v>0 Vv e<Ug. B.25) Так как C*^X(SB'\ I? @, Г; Я)), то неравенство B.25) эквива- эквивалентно неравенству \ (С* А [Су' (и) - гд], у' (у) - г/' (и)) dt + (Nu,v-u)v^0 V у 6 %а- о B.26)
294 Гл. 4. Управление гиперболическими системами Паша цель — как и в разд. 2.2 — состоит в том, чтобы преобра- преобразовать условие B.26) к более удобному виду. Определим сопря- сопряженное состояние р (и) как решение задачи р" (и) + Ар (и) + I А (а)р(а; и) do = С*Л (Су' (и) - zn); B.27) р(Т;и) = 0, р(Т;и) = 0, B.28) где оператор А' (о) вводится по формуле а' (о; ср, г|э) = (А' (о) ц>, -ф) V<p,a]) 6-V. Задача B.27), B.28) имеет единственное решение — по край- крайней мере при наличии дополнительного предположениях) A'(a) 6^(F; Я). B.29) Действительно, обращая время и изменяя обозначения, пере- перепишем задачу B.27), B.28) в виде у@) = 0, у'@) = 0. Определим (как и в разд. 1.4) приближешюе решение ут (t): t {Ут, Щ) + (A (t) Ут, Wj) + I {А' (О) ут (о), Wj) do = Нетрудно убедиться, что -p[l Ут (t) \2 + a (t; ym (t), ym (*))] - a (t; ym (t), ym (t)) + dt + 2 \ [A' (a) ym (a), y'm (t)) da = 2 (/ (f), y'n {t% 0 %откуда I Ут (t) I2 + II ym (t) ||2 <C ] (| y'm (a) |2 + || ym (a) ||2) da + + j (f»(i)!|i)|^()| о о Дальпейшие рассуждения проводятся так же, как в разд. 1.4. Единственность доказывается аналогично тому, как это делалось в разд. 1.3. Нам не известно, как обстоит дело без предположения такого типа.
§ 2. Задачи управления 295 Теперь яреобразуем неравенство B.26). Сначала выкладки проведем формально, а потом их обоснуем. Умножим равенство B.27) скалярно на у' (v) — у' (и) и проинтегрируем от 0 до Т; при этом надо иметь в виду, что скалярное произведение не имеет смысла. Полагая далее получаем I (р' (и) + Ар (и), у' (v)-y' (и)) dt + J (q, у' (v) - у' (и)) dt = о т = J (С*Л [Су' (и) - 2д], у '(V) - у' (и)) dt. B.32) о Интегрируя по частям и учитывая уравпение B.2), переписываем левую часть равенства B.32): - 5 (Р'(")• У"(у) - У'(")) dt+\a{t;p(u), у'(у) - г/'(и)) о о + \{A'{t)p{u),y(v)-y{u))dt = о = - S (р' («).5 (у - и))Й* + S [«(*; р' ("). у (у) - ^ (")) + о о + a (t; р (и), у' (у) - у' (и)) + a (t; р (и), у (v) - у {и))] dt = = -\(p'(u),B{v-u))dt+ ]J-a(t;p(u),y(v)-y(u))dt = о о dt = - J Go' (и), B(v- и)) dt = (- BY (и), v-u) = о = (— А^В*р' (и), v — u)v. Таким образом, неравенство B.26) эквивалентно неравенству (- АуВ*р' (и) +Nu,v-u)n^0 Vy 6 "Но. B.33) Теперь остается обосновать формальные выкладки^ проведен- проведенные выше.
296 Гл. 4. Управление гиперболическими системами Введем сначала функцию ч|) как решение задачи (при этом мы продолжаем оператор A (t) на всю прямую R так, чтобы он обла- обладал свойствами, аналогичными свойствам оператора A (t) на интер- интервале (О, Т)) B(v-u) на (О, Т),Л О при 1>Г; I B.34) -ф @) = 0, -ф' @) = 0, J и продолжим ее на полуось t <; 0, полагая равной нулю. Затем введем функцию я как решение задачи т { C*A(Cy'(u)-zR) на @, Т), n"-i-A(t)n+l A'(a)n(a)da={ ,, „ ' { ' ' [ 0 при ?< 0; я(Г) = 0, я'(Г) = 0; . B.35) и продолжим ее на интервал ? > Т', полагая равной нулю. На интервале @, Т), очевидно, справедливы равенства ¦ф -^ У (v) — У (ы)> л =- р (и) и (Су' (и) — гд, Су' (у) — Сг/' (li))^ = + °о Т = I (я" + An + J Л' (ст) я (ст) йст, я|/) dt. B.36) —оо i Пусть {pn (t)} — регуляризирующая последовательность на дей- действительной прямой R. Тогда правая часть равепства B.36) равна х) lim J ((я" + Ля)*р„+ d A' (o)n(o)de)*pnf г!з'*р„) dt = = lim Xn. B.37) Выражение Хп, введенное в равенстве B.37), упрощаем, приме- применяя интегрирование по частям: Хп = \ [(— п * р„, -ф" * р„) + ((Ал) * р„, -ф' * р„) + —оо + ((Л'я) * р„, т|з * | + СО — оо
§ 2. Задачи управления 297 = ] (— я *р„, B(v — u)*pn)dt + — оо + J [(я' * (>„, (Л яр) * р„) + ((Ля) * р„, яр' *'р„) + — ос + ((Л'я) * р„, яр * р„)] dt. Мы получим нужный результат, если покажем, что второй интеграл (обозначим его через Yn) в этом выражении стремится к нулю при п -> оо. Этот интеграл можно переписать в виде + 00 уп = I [(л' * р,„ Л (о]) * р„)) + (А (л * р„), о])' * р„) + + (А' (я * р„), о]) * р„)] Й + Y^ + У2„ + Y3n, где + ОО F't == J (я' * р„, (А\\>) * р;1 — Л (г|5 * р„)) dt, — с» -f-oc J ((Ля) * рл — Л (л * р„), яр' *.р„) dt, — оо -{-оо Y3n = J ((Л'я) * рп — Л' (л * р„), яр * р„) dt. — оо Так как первое слагаемое в выражении У„ равно + ОО , J -— a (if; я * ра, яр * р„) dt = О, то Уп = Уг\ -\- Yn -\- Yn. Далее, согласно одной лемме Фридрихса (см., например, Лионе [3, лемма 7.2 гл. 4]), -^- [(Л-ф) * Рп — Л (-ф * р„)]-*- 0 в L2(R;F'),' а а потому +„°° Yn = — ) 1Я*рп, Аналогично доказывается, что У? ->0и У^ ->-wO; эт0 и завершает- обоснование неравенства B.33). Таким образом, доказана Теорема 2.2. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.24), где оператор С удовлет- удовлетворяет условию B.6). Допустим, кроме того, что выполнена
298 Гл. 4. Управление гиперболическими системами предположение B.29). Тогда оптимальное управление u?°Ug характеризуется соотношениями + A (t) у (и) = f + Ви, у @; и) = у„ у' @; и) = yt; B.38) ^- + A (f)p(u) + ] А' (а)р(а; и) do = r t ] t = С*А(Су'(и)-гя), p(T;u) = Q, р'(Т;и) = (У, B.39) х— Л%В*р'(и) + Nu, v~u)v^0 VvCth- B-40) Замечание 2.4. Если 41 д ¦= 1С, то соотношепие B.40) приводится к виду - А^В V (и) + Nu = 0. B.41) Исключив с его помощью и, заключаем; что оптимальное управ- управление получается из решения задачи + A (t)p + \а' (а)р(о) da = С*А (Су' - z,;); а именно и -= N Замечание 2.5. Подчеркнем, что однозначная разреши- разрешимость задачи B.38) — B.40) нам известна (из самого способа, которым эта задача иолучепа). Прямое доказательство теоремы существования и единственности для этой задачи пе представляется очевидным. 2.4. Случай B.7) Функция стоимости имеет вид / (v) = || DQy (T; v) - 2д ||2да + (Nv, v,n, B.43) а оптимальное управлепие и?<Ча характеризуется тем, что (Doy (Т; и) - *д, DQy (Г; v) - Doy (T; и))^ + + (Nu, v — и)п>0 Vy 6 Uа, B.44)
§ 2. Задачи управления 299 ИЛИ * (D*0A [О0у (Т; и) - *д], у (Т; v) - у (Т; и)) + g, B.45) где первое слагаемое левой части неравенства B.45) обозначает скалярное произведение элементов, принадлежащих простран- пространствам V и V соответственно. Определим (формально) сопряженное состояние р (и) как реше- решение задачи &?> + A{t)p(u) = 0; . B.46) р(Т;и) = 0; B.47) ¦ р (Т; и) = DtA [Поу (Т; и) - 2д]. B.48) Теорему 1.1 можно применить, лишь если р' (Т; и) принадле- принадлежит пространству Н 1). ]1оэтому наложим более сильное условие на оператор Do: Dot% (H; SB). . B.49) Тогда задача B.46) — B.48) имеет единственное решение. Умножая уравнение B.46) скалярно на у (t; v) — у (t; и) и при- применяя формулу Грина (что в данном случае законно), получаем + (D*0A [Doy (Т; и) - zj, у (Т; v) - у (Т; и)) = 0. Таким образом, неравенство B.45) эквивалентно неравенству (—В*р (и), v — и) + (Nu, v — i%>0 Vy 6 "Не, B-50) или (- А%1В*р (и) + Nu, v -и)и >0 Vve<Ug. B.51) Тем самым докапана Теорема 2.3. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.43), где оператор Do удовлетворяет условию B.49). Тогда оптимальное управление 1) Если это пе так, то нужно использовать слабые решения; см. ниже § 3.
300 Гл. 4. Управление гиперболическими системами и?Ч1д характеризуется соотношениями + Л (t) y{u) = f + Ви, у @; и) = г/0, у' @; и) = у,; B.52) at B.53) р (Т; и) = 0, р' (Т; и) = D*0A [Doy (Т; и) - zj; J ( — Aj}B*p(u)-\-Nu, v — u)%>0 Vy6^e. Замечание 2.6. Если ILg — IL, то соотношение B.51) приводится к виду - А^В*р (и) + TVw = 0. B.54) С его помощью можно исключить и из соотношений B.52), B.53). 2.5. Случай B.8) Функция стоимости имеет вид / (v) = || Dy' (T; v) - 2д Hlg, + (Nv, %, B.55) а оптимальное управление и ?<Ug характеризуется тем, что {Dy (T; и) - 2д; Dy' (Г; v) - Dy' (T; и))^ + + (Nu, y-i%>0 V^e^a» B.56) или (?>*Л Шг/' (Г; и) - za], у' (Т; v) - у' (Т; и)) + + (Nu, v—u)n>Q 4vt<Ud. B.57) Сопряженное состояние р (и) определяется (формально) как решение задачи dt > B.58) р (Г; и) = ?*Л [/)/ (Г; и) - 2д], / (Г; и) = 0. J Тогда /? (Г; м) принадлежит пространству Н, и поэтому необходи- необходимо обобщить результаты § 1. Это будет сделано в следующем пара- параграфе, где (как следствие) решена настоящая задача.
§ 3. Применение метода транспонирования 301 § 3. Применение метода транспонирования в задачах управления 3.1. Транспонирование Пусть выполнены условия теоремы 1.1. Тогда для данной функ- функции / 6 L2 @, Т; II) существует такая единственная функция ср, что Ф" + A (t) ср - /; Ф (Т) = 0, Ф' (Т) = 0, C.1) причем ф 6 L2 @, Т; V), <р' 6 L* @, Т; II). Обозначим через X пространство, заметаемое функцией ф, когда элемент / пробегает пространство L2 @, Т; II). Снабженное нормой || Ф ||х = II/ 1к«(о,т;Я)» пространство X становится гиль- гильбертовым, а оператор ф ~-> ср" + Лц> является изоморфизмом X^L2 @, Т; Н). С помощью транспонирования заключаем: если ф ->- Лф — непрерывная линейная форма на X, то существует такой единственный элемент y^U@, T; II), что i /g 2) I ) Кроме того, L ->• у — непрерывное отображение X' -»- L2 @, Г; II). Если положить т L (Ф) = I (/, Ф) dt + (г/,, Ф @))- (j/o, ф '@)), C.3) о где / 6 V- @, Г; V), C.4) Уо 6 Я, C.5) Я6Г, C.6) то мы определим тем самым непрерывную линейную форму на про- пространстве X. Следовательно, применяя утверждение C.2) к форме L (ф), определенной соотношениями C.3) — C.6), убеждаемся, что справедлива Т е о р с м а Н 3.1. Пусть выполнены условия теоремы 1.1, а /> J/oi У\ — данные элементы, удовлетворяющие условиям C-4) — C.6). Тогда существует такая единственная функция УЕЬ2 @, Т; Н), что о (у, ф' + A<p)dt=l (/, ф) dt + (уь Ф @)) - (i/0) Ф' @)) Уф 6 X; о C.7)
302 Гл. 4. Управление гиперболическими системами при этом {/, г/0, уi}-+у — непрерывное отображение L1 @, Т; V) х Н х V ~+ L2 @, Т; Н). Мы дадим формальную интерпретацию соотношению C.7) (обо- (обоснование см. в книге Лионсаи Мадженеса [1, гл. 3]). Выбрав в соот- соотношении C.7) в качество ф {t) гладкую функцию с компактны» носителем в интервале @, Т), получим pL + A{t)y = f B (Oin C.8) at Умножая скалярно это равенство на функцию ф и интегрируя по частям, приходим к соотношению I (/, Ф) dt= - (у @), Ф @)) + (у @), Ф' @)) + J (у, Ф ' + АФ) dt, о о откуда, сравнивая с соотношением C.7), находим начальные условия У @) = г/о, У' @) = уи C.9) 3.2. Приложение (I) Теперь мы можом уточнить, в каком смысле понимается реше- решение задачи B.58). Применим теорему 3.1, обращая время; тогда сопряженное состояние р (и) определяется как единственный элемент простран- пространства U @, Т; И), удовлетворяющий соотношению г I (р (и), ф' + A (t) Ф) dt = (Dy' (T; и) - zw Оц>' (Т))^ C.10) о для любой, функции ф, для которой Ф" + A (t) ф е L2 @, Т; Л), ф @) = 0, Ф' @) = 0. Следовательно, в соотношении C.10) можно взять ф = у (v) — — у (и), а тогда фу (Т; и) - 2д, D [у' (Т; v) - у' (Т; и)]) = \ (р (и), B(v- и)) dt. о Неравенство B.57) эквивалентно неравенству (В*р (и), v — u) + (Nu, v — и)п >0| Vy б <U0, C.11) или g. C.12) Таким образом, доказана
§ 3. Применение метода транспонирования 303 Теорема 3.2. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.55). Тогда оптимальное управление и^_°11а характеризуется, соотношениями (ЗЛО)» C.12) и dt ) C.13) у@; и) = у0, у'@; и) = 3.3. Приложение (II) Несколько обобщим рассмотрения разд. 2.4. Именно, пусть функция стоимости по-прежнему имеет вид B.43), но Do 6 G X (V, Ш) (вместо предположения" B.49)). Тогда D*A [Doy (Т; и) — zn] ? V', и мы дюжем применить теорему 3.1 для исследования задачи B.46) — B.48): сопряжен- сопряженное состояние р (и) определяется как единственный элемент про- пространства L2 @, Т; II), удовлетворяющий соотношению т . _ \ (р (и), ф" + A (t) ф) dt = — (Doy (Т; и) — г,л, -О0ф (Т))$$ C.14) о для любой функции ф, для которой Ф" + A (t) ф б L2 @, Т; Щ, Ф @) = 0, <р' @) = 0. Выбирая ф = у (v) — у (и) в соотношении C.14), легко убедиться^ что неравенство B.44) эквивалентно неравенству (— A%B*v(и) + Nu, v — и)п >0 Vг;?Чд. C.15) Таким образом, доказана Теорема 3.3. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.43), причем Do ?% (V; $8)- Тогда оптимальное управление и ^%s характеризуется соотно- соотношениями C.13) — C.15). 3.4. Приложение (III) Можно также дополнить рассмотрения разд. 2.2. Будем счи- считать, что С 6 X (?? @, Т; V); SB) (вместо предположения B.13)). Для решения задачи B.12) применим теорему 3.1: сопряженно© состояние р (и) определяется как единственный элемент простран-
304 Гл. 4. Управление гиперболическими системами ства L2 @, Т; Н), удовлетворяющий соотношению \ (р (и), ср" + Л (t) ср) dt = (Су (и) ~ 2д, СФ)^ C.16) о для любой фупкции ф, для которой Ф" + Л (t) ц>еЬ* @, Т; //), Ф @) - 0, ср' @) - 0.. Полагая ф = у (v) — у (и) в соотношении C.16), убеждаемся, что ¦справедлива Теорема 3.4. Пусть выполнены предположения A.4) — A.6) и функция стоимости имеет вид B.9), причем С ? ? X (L2 @, Т\ V); $6)- Тогда оптимальное управление и ? °llg характеризуется соотношениями C.13), C.16) и (A%iB*p (и) +Nu,v — и)у > 0 V г; 6 %V C.17) Замечание 3.1. Пусть U = L2 @, Т- Е); C.18) Ita — {v | v G Ш, v (t) 6 Eg почти всюду}, C.19) где Eg — выпуклое замкнутое подмножество пространства Е. С помощью теоремы 2.1 гл. 2 легко проверить, что неравенство C.17) J) в данном случае эквивалентно неравенству (и) + Nu) (*), е - и @)в > 0 ) } C.20) почти всюду на @, Т) Ve ? fc\j. J •§ 4. Примеры 4.1. Гиперболические задачи с распределенным управлением и распределенным наблюдением Пусть оператор А определен, как в разд. 1.5, а С — тождест- венпый оператор, рассматриваемый как элемент пространства X (L2 @; Т; Я); Z,2 @, Г;. Щ). Пусть, далее, 41 = L2 @; 5 — тождественный оператор. D.1) Наконец, пусть V = Н\ (Q), состояние системы определяется как х) Это замечание, очевидно, применимо и в других рассмотренных выше случаях.
§ 4. Примеры 305 решение задачи г dzy{v) dt2 Ay{v) = . у(х, 0; v) — yo(x), dy (x, 0; v) dt а функция стоимости имеет вид J{v)=l[y(v)-2Д]2dxdt + {Nv, v)u. Q Согласно теореме 2.1, для оптимального управления и удовлетворяются соотношения D.2) (при v — и), (u)\s = 0; р(х,Т;и) = 0, др {Х' Т' и) = 0, 5/ D.3) (АЛ) h- D.5) Q II p и м е р 4.1. Пусть °lla — {v I y>0 почти всюду и Q}. D.6) Тогда оптимальное управление получается из решения односто- односторонней задачи • = у- ч в <?; 01 = 0, р —0 на 2; у (х, 0) = у0 (.г), -2-L i = У1 (х), dt р(х,Т) = 0, dt J) Если V = 7/1 (Q), то второе равенство D.2) должно иметь вид dy(v)/dvA |s = 0 (см. разд. 1.5). 20—1230
306 Гл. 4, Управление гиперболическими системами а именно Замечание 4.1. Если (д21д1г + А) гл Ф / почти всюду в цилиндре Q и N — v/, v > 0, то, как и в примере 3.1 гл. 3, можно получить дополнительную информацию об оптимальном управлении: и = inf(O, p) иочти всюду в Q. D.8) Таким образом, в этом случае оптимальное управление нахо- находится из решения нелинейной задачи df - v =fu Q; -\- Ap = y — z-A в Q; df2 у = 0, р = 0 на 2; p(x, T) = 0, -PB' 7) = 0 на Q. dt D.9) Замети.м, что (в частности) р следует, что (()), а тогда из равенства D.8) 1(<?) ¦ D.10) (свойство регулярности оптимального управления). Замечание 4.2. Будем теперь считать, что С — тож- тождественный оператор, рассматриваемый как элемент пространства Х(Ь*ф, Г; V); 1/@, Т; V)). Пусть, далее, V - Щ (Q), а фупкция стоимости имеет вид J U = I \[у (и) - 2д]2 + 2. Г— (У (v) - 2д) Y] dx + (Nv, v)%. D.11) Тогда (ср. с C-13) гл. 3) сопряженное состояние определяется как решение задачи ^^ + Ap (u) = (-Ax + J) [y (u) - z;x] в Q; ) r)(u)\ =0. „/а, т-и) = 0 9P fa' Г; Ц) - 0 xPQ 1 ' dt -с — D.12)
§ 4. Примеры 307 Так как (—Ах -\- I) \у (и) — гд] ? L2 @, Г; У), то нужно приме- применить результаты § 3 (теорему ЗУ}). 4.2. Гиперболические задачи с распределенным управлением и финальным наблюдением Предположил!, что состояние у (v) системы определяется как решение задачи D.2), а наблюдением является у (х, Т; v) 6 L2 (Q). D.13) Тогда Су (v) -- Doy (T; v), где Do — тождественный оператор L2 (Q) -> L2 (Q). Пусть функция стоимости имеет вид J (v) = I [У (*, Т; v) - 2д (x)f их + (Л-у, ^^(q,. D.14) В рассматриваемом случае можно применить теорему 2.3: для оптимального управления u^<Ug удовлетворяются соотноше- соотношения D.2) (при v --- и), р (и) = 0 на 2; р (х, Т; и) = 0, др {Х' Г; U) = г/ (а-, Т; и) - 2д (л) на Q 5^ D.15) и (-p(u) + Nu, u-tt)L.(Q,>0 Vi;6^- D.16) Пример 4.2. Пусть множество ^ определено, как в D.6). Тогда неравенство D.16) эквивалентно соотношениям и>-0 почти всюду в (),Л —р (и) + NW^>Q почти всюду в Q, I D-17) и {—р (и) -\- Nu\ = 0 почти всюду в Q. \ Замечание 4.3. Если наблюдением является у (х, Т; v) ? ? V (следовательно, Do — тождественный оператор V —>¦ V), а функция стоимости имеет вид J(v)=l\[y{x,T\v)~z:if + Tl ), D.18) 20*
308 г^Гл. 4. Управление гиперболическими системами то в правой части последнего из соотношений D.15) нужно заменить у (х, Т; и) — яд (х) па (—Аж -f- /) [у (х, Т; и) — гд (х)]. Решение получающейся задачи нужно понимать в смысле теоремы 3.1. 3 а*м е ч а н и е 4.4. Предположил!, что наблюдением является у'(х, Т; v) eL*(Q); D.19) следовательно, Су (v) = Dy' (T; v), где D — тождественный опе- оператор L2 (Q) ->- L2 (Q). Пусть функция стоимости имеет вид J(v) = l [У' (Ч Т; v) - 2Д (x)f dx + (Nv, v)%. D.20) a Сопряженное состояпие определяется как решение задачи д2р(и) + A(t)p(u)=0 в Q; dt р (и) = 0 на S; р(г, Т;и) = у'(х, T;u)~zn(x\ др{х' Т;и) = 0 в 5^ D.21) Решение этой задачи нужно попимать в смысле теоремы 3.1 *). Согласно теореме 3.2, для оптимального управления и^°11д удовлетворяются соотношения D.2) (при v = u), D.21) и $[Р (и) + Nu) (v — и) dx dt > О V v 6 %d. D.22) Q 4.3. Уравнение типа Петровского с распределенным управлением и распределенным наблюдением Рассмотрим теперь систему, состояние которой определяется как решение задачи (см. разд. \ .6) f- A{aAy(v))=f + v, veL2(Q); D.23) Я Л т/ ЛЛ ¦ = 0 на S; дп D.24) на П. dt То есть I Р (в) ( тиГ-г- I ( ) 1 Q fi для любой функции ф, для которой *. O)=o, <p'(*, о>=о, *-
§ 4. Примеры 309 Если функция стоимости имеет вид J(v) = l [у (х, t; v) - 2д]2 dx dt + (Nv, v)v, ), D.25) т. е. наблюдением является у (v) ? L2 (Q), то, согласно теореме 2.1, для оптимального управления u^'Ug удовлетворяются соотно- соотношения D.23), D.24) (при v — и),\ и) + А (а Ар (и)) = у (и) '•— zn Bt(?; дп р(х,Т;и) = 0, dt D.26) и Q D.27) Пример 4.3. Если множество %5 определено соотношени- соотношением D.6), то задача сводится к односторонней задаче типа D.7) и справедливо замечание, аналогичное замечанию 4.1. 4.4. Уравнение типа Петровского с распределенным управлением и финальным наблюдением Рассмотрим ту же систему, что и в разд. 4.3, но будем считать, что наблюдением является у' {х, Т; v) 6 L* (Q), D.28) а функция стоимости имеет вид D.20). Сопряженное состояние р (и) определяется как решение задачи Ар(и) = 0, дп и))==0в Q; - = 0 на 2; х;Т;и) = у'(х,Т;и)-гя(х), dt = 0 в q. D.29)
310 Гл. 4. Управление гиперболическими системами Решение этой задачи понимается в смысле теоремы 3.1, т. е. dt I = \ \y (x, T; u) - z-A (x)] ф' (x, T) dx D.30) Q для любой функции ф, для которой dt df = 0; ф (х, 0) = 0, ф' (.г, 0) = 0, дп я Для оптимального управления u?<Ug удовлетворяются соот- соотношения D.23), D.24) (при v ¦-= м), D.27) и D.29). 4.5. План дальнейшего исследования Выясним теперь, в какой степени и каким образом результаты, относящиеся к расцеплению (§ 4, 5 гл. 3), можно перенести на задачи этой главы. Кроме того, рассмотрим случаи, когда управление и наблюдение определяются иначе, чем в приведенных выше задачах,— в частности, когда управление и наблюдение граничны. § 5. Расцепление 5.1. Постановка задачи. Сзедение к системе уравнений первого порядка Снова обратимся к задаче, рассматривавшейся в разд. 2.2 (и в разд. 3.4). Оказывается, что при этом очень удобно записы- записывать уравнение, определяющее состояние системы, в виде системы уравнений первого порядка, что мы сейчас и сделаем. Замечание 5.1. Фор.чально мы возвратимся к случаю, рассмотренному в гл. 3, но методы доказательств будут уже дру- другие — ясно, что одним лишь изменением записи невозможно перей- перейти от гиперболического случая к параболическому. Чтобы не увеличивать чисто технические трудности, предполо- предположим, что a(t; ф, т|;) = а(ф, г|>) но зависит от t; 1 ._ .. а(Ф, ф)>а||Ф||2г, а>0, Уф 6 V. J {'}
§ 5. Расцепление 311 Введем пространство ¦Ц = V X II. E.2) Если <р, ty ?f), где <р -- {ф0, ф1>, Ч> ~= {^о, %}, то определим ска- скалярное произведение в Ц: [ф, г|э] =- а (ф0, -фо) г (фь tyi) E.3) {такое определение законно, так как а (ф0, г|H) = a (i|j0, ф0) и имеет место соотношение E.1)). Затем введем пространство Т - F х V. E.4) Отождествим пространство t) с двойственным к нему про- пространством; пусть УЛ' — пространство, двойственное к ТГ. Тогда очевидно, что f" cz § с: f" и Г-KxF'. E.5) Пусть состояние у (у) системы определяется как решение задачи /^2@, Г; Я); I I ;и) = |„; у'@; у) = |i4). E.7) Предположим, что (обозначения аналогичны принятым в § 4 гл. 3) 41 = I? @, Т; Е), SB = L2 @, Т; F); E.8) Bv = «t -> В (t) v (t)», B{t)?? (E; IT). E.9) Введем У -= {г/о, .!/,}€/"^@, Т; Ц). E.10) Наконец, для tp g У определил! (^ q) E.11) Очевидно, что Jt tZ (Г; Г'). E.12) Залетим также, что А^Х Aу, // X F'). J) Мы изменили здесь обозначения (|,- вместо г/г-,г = О, 1), чтобы не сме- пшнать потом начальное значение су- \uo,yi}.
312 Гл. 4. Управление гиперболическими системами Легко теперь убедиться, что задача E.6), E.7) эквивалентна задаче1) d-^ + Jy(v)=i + .%v, y(v)eL2@, Г; I)); ) dt ( E.13) y@; y) = l = {io. fei} 61), где f - {0, /}, E.14) 36 v ¦= {0, Bv}. E.15) Именно эту задачу E.13) мы и будем изучать. Отметим, что Л -f А* = 0. E.16) Действительно, если ф б f", ty € V» то [t^*<p, 1|з] — [ф, ,^г|з1 = а (фо, — vJ5i) -f- (фь Афо) = — а (ф1, "фо) "т (—^t(Poi 'ФО; поэтому <4*q> = {фь —^4фо}, откуда и следует равенство E.16). 5.2. Совокупность соотношений, характеризующих оптимальное управление Рассмотрим систему, изучавшуюся в разд. 2.2 (и разд. 3.4). Функция стоимости / (и) задается формулой B.9), которая в пред- предположениях разд. 5.1 принимает вид J(v)=]\\C(t)y(t; v)-z-;l\\Fdt+](N(t)v(t), v(t))Edt; E.17) о о при этом мы считаем, что Nv = «t ->- N (t) v (?)», N (t) 6 X {E; E). Введем оператор % (t): % (t) ф = С (t) фо, % {t)?% ft; F); E.18) тогда функцию / (v) можно записать в виде т т о о Оптимальное управление u?<Ud характеризуется тем, что ) (<ё (t) у («; и) - гд> Ъ @ [у (t; v)-y(t; u)])F dt + о + (Nu, v — и)# > 0 V v e lia, E-20)
§ 5. Расцепление 313 или ] [<&* (t) ли« @ у («) - *J- у (*>) - у («)] л + о -f- (iVa, у — и)# >0 Vv?<Ud. E.21) Оператор 'ё* (i) ? ,2? (/"; I)) задается следующим ¦ образом: [Г @ /', <р] = (/', 4S (t) <p) = (/', С @ ф0) = (С* @ /', ф0), 1 , /'er, c(t)ez(V; f), c*(t)e%(F', vy, i ^ ' поэтому [«• (*)/', <p] = a^^C* (i) /', фо), откуда V* @ /' = {Л ~'С* {I) /', 0}, /' 6 F'. E.23) Сопряженное состояние р (и) определяется естественным обра- образом (по аналогии с гл. 3) как решение задачи + -^*Р (и) = ^* @ Af [«(t) у (м) - 2Д]; 1 dt \ E.24) Замечание 5.2. Так как = {А ~'С* (t) AF [С (t) у0 (и) - *д], 0} € L2 (О, Г; t}), E.25) то задача E.24) имеет едипственпое решение р (и) ? L2 @, Т; t)). Преобразуем теперь неравенство E.21). Используя первое из равенств E.24) и первое из равенств E.13), получаем ] [<&' (t) AF \% (t) у (и) - 2д], y(v)~y (и)] dt = dt = f [p (u), 3S (v - и)] dt = ) (^*р (и), v - и) dt = о \ (АЁ*$*р (и), v — и)Е dt. о
314 Гл. 4. Управление гиперболическими системами Следовательно, неравенство E.21) можно переписать в виде {ЛЁ*Я*р {и) + Nu, v — и)% > 0 Уи?Шд. E.26) Однако, как легко проверить, i?*p (и) =- ,$*р1 (и), а потому неравенство E.21) окончательно эквивалентно такому: ,. E.27) ! (u) + Nu, v — и)щ ^0 V' v^41q. Запишем задачу E.24) более подробно: Й" ЛЛ- + Pi («) = ^ ~'С* («) AF [С @ 1/0 (м) - za], dt и) dt Ро(Т;и) = О, E.28) Второе из уравнений E.28) показывает, что р0 {и) — —А'1 ' ; поэтому из соотношений E.28) можно исключить />0 (и): + Ар1{и) = С*{ t) AF [С (t) у0 (и) — z.J; ^„ /г. ,л ^ E-29) Pt(T;u) = 0, dt Таким образом, функция р, (и) равняется сопряженному со- состоянию р (и), определенному как ролюпие задачи B.19) или C.16) {в зависимости от того, С (t) 6 X {II; F) или С (t) ?? {V; F)). Замечание 5.3. В примененном сейчас методе нет надоб- надобности различать случаи С (t) g X (//; F) и С {t) g X {V; F) вплоть до соотионгоний E.24) и E.26). Однако такое различие необходи- необходимо, если пытаться интерпретировать задачу E.29). В первом из указанных случаев решение этой задачи «обычное», а во вто- втором следует использовать метод транспонирования (см. § 3). Замечание 5.4. формально задача E.13) записывается аналогично задачам, рассмотренным в гл. 3. Но оператор J- некоэрцитивен на пространстве f — из равенства E.16) следует, что [.dff, ф] — 0 и, следовательно, результаты гл. 3 неприменимы. Однако .можно «аппроксимировать» оператор Л; возмущенными операторами, коэрцитивными на пространство f", а значит, «аппроксимировать» рассматриваемые гиперболические задачи
§ 5. Расцепление 315 управления параболическими задачами управления. Этот прием, называемый параболической регуляризацией, описывается в сле- следующей главе. 5.3. Расцепление В случае отсутствия ограничений на управление Щд — 41) неравенство E.26) эквивалентно соотношению Ав*%*р (и) + Nu = 0. E.30) Это соотношение дает возможность исключить управление и из задач E.13) (при v — и) и E.24): at 4* 4*" + ^*Р ~ ^ = - Ъ* (t) AFz,A s g; dt где 31 = ^N~iAEi.»\ 3J2 = C(*A1M. E.32) Далее будем рассуждать так же, как в § 4 гл. 3. Пусть s g 6@, Т), a h б I). Рассмотрим задачу (ср. с D.12), D.13) гл. 3) at Лемма 5.1. Задача E.33) имеет единственное решение, причем «р, г|зе/>2E, Г: I)). Д о к а з а т е л ь с т в о. Действительно, соотношения E.33) можно рассматривать как задачу, решение которой позволяет найти оптимальное управление в случае, когда состояние системы определяется как решение задачи - л <p(*) = h, E.34) at
316 Гл. 4. Управление гиперболическими системами функция стоимости имеет вид J*(и) = \ ||%(t)<p(и) -2Л\\1 dt+\(N(t) v(t), v(t))Edt, E.35) s s а управление v пробегает пространство 41 (s, Г) = L2 (*, Г; Е). Рассуждая, как и при доказательстве леммы 4.2 гл. 3, можно показать, что h ->- {<р, г|з} — непрерывное аффинное отображение i) -> L2 (в,1 Г; t|) X L2 (в, Т; ff). Так как, согласно E.33), dty/dt 6 L2 (s, Т; Н X V), то выраже- выражение г|з (s) имеет смысл. Если перейти к «скалярной» записи для «компонент» ip0, ipi, то получим для функции гр! задачу, аналогич- аналогичную задаче E.29). Предположим, что *) С (t) e 5? (Я; i^); E.37) тогда tpj — непрерывная функция [s, T]->V; opj — непрерывная функция [s, Т]-*-Н; яро= — ^4~4i — непрерывная функция Л eju м а 5.2. Если выполнено предположение E.37), то h->i|}(s) E.38) — аффинное непрерывное отображение t) —>¦ D (А) х V 2). Следствие 5.1. .Если выполнено предположение E.37), то ib (s^ = oJ^ (s\ h ~!~ г (s) (Ъ 39) где & (s) 6 Ж (?); i? (i4) X F), r (s) ? I). Как и в лемме 4.3 гл. 3, отсюда следует «основное тождество» Р (*) = ^ (*)У («) + г (О V* 6 (О, Г), E.40) где оператор сР (t) определяется через решение задачи (- ^Р + 3)iy = 0 в (s, Г); \ dt _^6 = 0 в s) Если С (t) ? 35 (F; F), то нижеследующие выкладки формальны. 2) Если С (t) g i? (F; F), то можно показать, что E.38) — непрерывное отображение J) ->- Ц.
§ 5. Расцепление 317 а именпо ^(s)h-v(s), E.42) а функция г (t) определяется через решение задачи di\ dt _ = о KSjlh E-43) dt а именно г (*) = !(*). E.44) Лемма 5.3. Справедливо равенство &* («) = & (в), E.45) где cF* (s) — оператор, сопряженный с оператором сР (s) в про- пространстве X (t); I)). Доказательство. Пусть h 6 ^. а Р» Y ~ соответствую- соответствующее решение задачи E.41). Тогда = [v (*). Э (*)] -} 1Ш W л +1 [v, -f- откуда [^ (в) h, h] = I ([^lY, у] + [^гР, Р] *• E-46) Правая часть равенства E.46) сид!метричпа относительно h и h, а это и доказывает формулу E.45). Лемма 5.4. Существует такая константа а, что [^ (*)Ы < cj [h] Vh €I), Vse (О, Л, E.47) где [h] = [h, h]Vi. Доказательство. Рассмотрим систему, состояние кото- которой определяется как решение задачи E-34) при / == 0, а функция стоимости имеет вид E.35) при zK = 0, т. е. /? (и) = \ || % (t) ф (v) III Л -j- | (ЛГ @ ^ @. ^ (*))* d/. E.48)
318 Гл. 4. Управление гиперболическими системами Если и — соответствующее оптимальное управление, то Кроме того, для оптимального управления и удовлетворяются соотношения E.41) и AE1@*y + Nu = 0. E.49) Но тогда легко убедиться, "что У* (М) = ] [2&, р] dt + \ (AENu, и) dt = S S -37 + Л*Ъ Pi ^ + f (АЛ и) Л = [у (*), Э (*)]. Таким образом, J*(u) = [&(s)b,b], E.50) откуда, применяя оценку [аГ* (s) h, h] ^ c4 [h]2, получаем неравен- неравенство E.47). Кроме того, аналогично лемме 4.4 гл. 3 можно показать, что функция t -> [qP (t) h, hi непрерывна на отрезке [0, Т\, каковы бы ни были элементы h, h ? I). 5.4. Интегро-дифференциальное уравнение Риккати Исходя из тождества E.40) *), мы проведем теперь некоторые формальные преобразования. 11одставим во второе из уравне- уравнений E.31) выражение для р (t) из тождества E.40): -Ф' (t) у (t) - & (t) у' (*) - г' (t) -f - A* W (t) у (t) + r (t)] - S2y @ - g. E.51) Используя затем первое из уравнений E.31), получим __«fFy ._ & [-Лу _ 3I (с^у -]- г) |. f] _ г' + ¦\-ЛЧ&у -!-г)- ^2у = g. E.52) Так как E.52) является тождеством относительно у (t) (t — произвольное фиксированное число), то заключаем, что должны выполняться два соотношения —з>' @ + & (о ^ -h ^*^ @ - a1 (t) &i& @ = ^2; E.53) -г' (i) + .^*r (i) + ^ (i)^ir @ -¦= fr(t)f + g, E.54) J) Как и в гл. 3, мы специально подчеркнем то обстоятельство, что суще- существование оператора ?Р (s) н функции г (s) уже установлено.
§ 5. Расцепление 319 к которым следует присоединить условия (соответствующие усло- условию р (Т) — 0) & (Т) - 0, E.55) г (Т) - 0. E.56) 3 а м о ч а н ие 5.5. Учитывая равенство E.16), уравне- уравнение E.53) можно записать еще в виде - if' (t) Ar®{t)A-A® (t) + ® (t) 2^ (t) = 3J. E.57) формально задача E.53), E.55) идентична задаче для интегро- дифферонциального уравнения Риккати D.55), D.57) гл. 3; одна- однако в уравнении D.55) гл. 3 операторы А я А* коэрцитивны, тог- тогда как в уравнении E.53) Л- -|- Л* -= 0. Теперь наша цель заключается в следующем: (i) обосновать проведенные выше формальные преобразования; (ii) изучить более подробно уравнение E.53) и привести при- примеры. (i) Обоснование этих преобразований возможно провести дву- двумя способами. Во-иорвых, .можно следовать методу § 4 гл. 3, т. е. рассмотреть сначала конечномерную задачу, а затем перейти к пределу (как в разд. 4.5 гл. 3). Технические детали такого доказательства гро- громоздки, по существенно не отличаются от изложенного в § 4 гл. 3. Во-вторых, можно использовать параболическую регуляриза- регуляризацию; по этому поводу см. § 2 гл. 5. (ii) Представим оператор SP (s) в виде где в силу леммы 5.2 и следствия 5.1 Ро (s) eX(V;D (A)); l\ (s) ? X (//; П (А)); E.59) Лемма 5.5. Операторы Рг (s), i -- О, 1, 2, 3, удовлетворяют соотношениям *); E.60) P2(s) = P;(s)A; E.61) Р* (s) = P (s) E 62^ где сопряженные операторы берутся в смысле двойственности про- пространства Н (соответственно V) к себе (соответственно к V'). !) Если С (t) G X (V\ F), то Ро (s) G X (V; V); Pi (s)G X (II; V); Рг (s) 6 ex (V; II); P3 (s) eX (II; H).
320 Гл. 4. Управление гиперболическими системами Доказательство. Действительно, используя равен- равенство E.45), получаем а (Ро (*) К + Л (s) hu h0) + {1\ (*) К + ^з (*) К \) = = a (ho, Po (s) h0 + Л (s) lh) + [K P2 (s) Ti0 + Pz (s) 1ц), Vh = {A0,A1}, h = {Ao, Л,} б t|, откуда и следует утверждение леммы. Заметим, что 0 W0 0 0 BN-'A^B*)-^ D C*AFC 0\ _ [А~уВг О О 0/ ~ \ О О легко убедиться, что уравнение E.53) эквивалентно уравнениям - Р'о + 1\А + Р2 + ВДРа = Л^Д,, E.63) fP3D]/>2 = 0, E.65) P3DiP3 = 0 E.66) с условиями Pt (Т) -- 0, i = 0, 1, 2, 3. Но уравнение E.65) — следствие уравнений E.60) — E.62) и E.64). В самом деле, пере- переходя в уравнении E.64) к сопряженным операторам, получаем - (Р*У - Р*о + Pt + PlOiP? = 0, а умножая затем справа на А, находим - (PUT - PU + Р3Л + PtD^PU =0; отсюда, принимая во внимание равенства E.60) — E.62), полу- получаем соотношение E.65). Таким образом, справедливо Предложение 5.1. Пусть операторы Ро, Ри Р3 удовлет- удовлетворяют соотношениям E.60), E.62), E.63) (где Р2 заменяется на PfA) и условиям Pt (Г).— 0, i — 0, 1, 3. Тогда оператор & (t) определяется формулой &(t)=(Po(t) Л( \Pt(t)A P3(t)) Замечание 5.6. Операторы^; (t) удовлетворяют системе ишпегро-дифференциалъных уравнений Риккати. Уравнение E.53) (или E.57)) более «симметрично», чем совокупность упомянутых
§ 5. Расцепление 321 в предложении 5.1 уравнений; поэтому для расцепления удоб- удобнее записывать уравнения в виде системы первого порядка по t. Замечание 5.7. В примерах каждый из операторов Pt (I) представляется своим ядром — распределением Pt (x, |, t); см. § о гл. 3. Таким образом получаются классы иптегро-дифферон- циальных уравнений с частными производными Риккати, прямое исследование которых, насколько нам известно, но проводилось. 5.5. Расцепление в другой задаче управления Рассмотрим теперь задачу, изучавшуюся в разд. 2.3; функция стоимости имеет вид / (v) = $ || С (*) у' (t; v) - 2д ||| dt + J (N(t) v (t), v (t))s dt. E.67) о о Введем оператор 'ё (t): «¦ (t) ер = С (t) cPl, ? (t) 6 X (f,; F); Тогда формулу E.67) можно записать в виде т г J(v)=lW6 it) у [о) - гя \\i-di + $ (Лг @ v(t), v (t))E dt. E.69) о о Оператор %* (/) задается соотношением <e*(t)J' --- {0, C*(t)f}, f EF'. E.70) Сопряженное состояние р (и) определяется как решение задачи г) 4*р (и) = V (t) AF[V (t) у (и) - zj; E.71) р(Г;и) = 0. Оптимальное управление и ?йМд характеризуется тем, что (см. E.26)) (Лд'if *р {и) -\- Nu, v — и)% > 0 V г; 6 ?^. E.72) В случае отсутствия ограничений на управление это неравенство эквивалентно соотношению Лд1.^?*р(м) -|- Nu = 0. E.73) 1) Запись такая же, как в задаче E.24), но оператор % (I) — другой. 2 1—1 230
322 Гл. 4. Управление гиперболическими системами Если перейти к «скалярной» записи задачи E.71) для «компо- «компонент» ро, Pi, то получим dpi (и) dt -APo(u) = C*(t)AF[C(t)yl(u)-zR\; откуда at ¦;и) = Ь, Pi(T;u) = 0, + АРо (и) = -С* (t) AF[C (t) Vi{u)- 2д]; E.74) Сравнивая эту задачу с задачей B.27), B.28) (там рассматривался случай, когда оператор А зависит от t), мы видим, что Ро = — р. Замечая, что неравенство E.72) можно записать в виде (АЁгВ*Р1 + Nu, v - и)п > 0 w б 41 д, E.76) легко убедиться, что оно эквивалентно неравенству B.33). Замечание 5.8. Чтобы получить соотношение E.72), нужно воспользоваться интегрированием по частям и формулой Грина, а это приводит к таким же техническим трудностям, как и в разд. 2.3. Расцепление осуществляется точпо так же, как в разд. 5.3 и 5.4. Снова имеет место тождество р (*) = ® @ у (*) -|- г (t), E.77) которое приводит к уравнениям E.53), E.54) (с новыми операто- операторами Э)\ и <2?2). Таким образом, опять получается система интег- ро-дифференциалъпых уравнений Риккати. Замечание 5.9. Естественно, если оператор сР (t) и функция г (t) известны, то можно осуществить синтез оптималь- оптимального управления (см. замечание 4.3 гл. 3) u{t) = -N-'{t)kE\%*[®{t)y{t) + r(t)]. E.78) Справедливы также замечания, аналогичные сделанным в разд. 4.7 и 4.8 гл. 3.
§ 6. Стартовое управление 323 § 6. Стартовое управление 6.1. Постановка задачи Рассмотрим систему, состояние которой определяется как реше- решение задачи y"(v) + A(t)y(v) = f в (О, Т); F.1) y@;v) = 0, y'@;v) = v, F.2) где / 6 L2 (О, Т; Н), a v — данный элемент пространства И. Сле- Следовательно, U = II. F.3) Пусть, далее, функция стоимости имеет вид х) J(v) = \\y (T; v) - z» ||2 + | /(Г; v) - ^ |2, F.4) где %Ъ 6 V, zj 6 Я- Наконец, пусть множество допустимых управлений <U д — ограниченное замкнутое подмножество в <U. F.5) Изучается задача об отыскапии inf / (v). v?Vd Замечание 6.1. Функция стоимости F.4) не содержит слагаемого (Nv, v)%. Если N^-vI, v>0, то дальнейшее спра- справедливо и при наличии этого члена, однако случай F.4) наиболее интересен. 6.2. Коэрцитивная задача Теорема 6.1. Пусть справедливы предположения A.4)— A.6), а функция стоимости имеет вид F.4). Тогда существует единственное оптимальное управление. Доказательство. Рассмотрим однородную квадратич- квадратичную часть (обозначим ее через я (v, v)) функции J (v): п, (v, v) = || у (Г; v) - у (Т; 0) |р + -r\y' (T; v)-y'(T; 0) \\ Положим я|5 = у (t; v) — у (t; 0); тогда г|)" -г A (t) t|; = 0; г|) @) = 0, г|/ @) = v F.6) n(v, v)= ||г|)(Г) ||2 + \$'(Т) |2. . F.7) х) Напомним, что через || ]| (соотиетственно через | [) обозначена норма в пространстве V (соответственно в Ю- 21*
324 Гл. 4. Управление гиперболическими системами Легко убедиться, что л (v, у)>с | v |2, с>0, Vv6#. F.8) В самом деле, рассмотрим задачу с обращенным временем Ц(Т) дано в V, т]/(Л дано в II. Эта задача корректна и, в частности, (i|) (t), i|/(Г)}-> г|/@) — непрерывное отображение V X II-*¦ Н; следовательно, |г|/@) |2<С1(||г1,(Г) ||* + |г|/(Г) |*), что равносильно неравенству (G.8). Замечание 6.2. Если функция стоимости равна J(v) = \y (T; v)-z^\2 + \ y'(T; v) - 4]2, то аналог теоремы 6.1 не имеет, места. Существование оптимального управления (вообще говоря, но единственного) обеспечено, если множество Шд ограничено в пространстве Н. Это означает следующее: (i) если ограничения па управление v отсутствуют (Шд — 41) или если множество °Цд не ограничено, то нужно наблюдать у (Т; v) в пространстве V и у' (Т; v) в пространстве Я; (и) если множество 4ls ограничено, то может- оказаться доста- достаточным наблюдать у (Т; и) и у' (Т; v) в пространстве // — или даже только у (Т; v) в пространстве Н. 3 а м е ч а п и е 6.3. Результат теоремы 6.1 справедлив для обратимых по времени систем, т. е. систем, для которых в урав- уравнениях, описывающих состояпие системы, можно обратить время. В случаях, рассмотренных в гл. 3, аналога этого утверждения нет. 6.3. Совокупность соотношений, характеризующих оптимальное управление Пусть функция стоимости имеет вид F.4). Онтимальпое управ- управление и ^Шд характеризуется тем, что (y(T;u)~zl, y(T;v)-y(T;u))v + + (y'(T;u)-zl y'{T; v)-y'(T, u))>0 4v?<Ua. F.9) Определим сопряженное состояпие р (и), используя аналог теоремы 3.1 (для обращенного времени): существует такая един-
§ 6. Стартовое управление 325 ственная функция р (и) ? L2 (О, Г; //), что т \(р{и), ср" -\-Aq>)dtz= о \ 4 F.Ю) для любой функции у, для которой ф?/,2@, Г; V), ф'?/-2@, 71; //), Ф" -|- ЛФ ? L2 (О, Т; Н); Ф @) - О, Ф' @) _-. 0. Можпо показать, кроме того, что р (и) — непрерывная функ- функция [О, Т]-)-Н и имеет место формула Грина (см. Байокки Ц], [2]) J (p (и), яр' + A$) dt = (у' (Г; и) - 4, V (Г)) + о + (у(Т; и) - z% $ (T))v - (р @; и), ф' @)), F.11) где функция гр обладает теми же свойствами, что и функция ср, но при этом ip' @) =^= 0. Положим в равенстве F.11) гр- = у (v) — у (и); тогда (y(T;u)~z% y(T;v)-y(T;u))v + + (г/' (Т; и) - 4, г/' (Г; у) - г/' (Г; и)) = (р @; и), у - и), и, следовательно, неравенство F.9) эквивалентно неравенству (р@; м), у- u)>0 Vi;€^e. F.12) Таким образом, справедлива Т е о р е -м а 6.2. Пусть выполнены условия теоремы 6.1. Тогда оптимальное управление u^.'Uq характеризуется соотношениями у" (и)-\-А (I) у (и) = 1; 1 | F.13) F.10) и F.12). Замечание 6.4. Пусть Л — канонический изоморфизм V—>~ V'. Тогда соотношению F.10) можно дать следующую интер- интерпретацию: р (Т; и) = у' (Т; и) - z\, р' (Т; и) = - Л [у (Т; и) - г°я]. 3 а м е ч а п и о 6.5. Из соотношений F.12) — F.14) можно исключить и; в результате .мы нридем к нелинейной задаче типа
326 Гл. 4. Управление гиперболическими системами односторонних граничных задач: у" + A (t) у = /, р" + A (t)p = 0 в (О, Г); ") у @) = 0, р (Т) = j/' (Г) - 4, Р' B1) = - Л [у (Т) - 4], } F.15) Пример 6.1. Пусть Л — оператор второго порядка, опре- определенный, как и в разд. 1.5. Пусть, далее, V = Ill(Q), 1lg = {v\v^0 почти всюду на Q}. Тогда задача F.15) принимает вид у (х, 0) = 0, р (х, Т) = ду {Х' Т) - 4 (х) вй; at др(х,Т)_ dt у = 0, /7 = 0 на S; (z,0) в Q; F.16) 0, р (ж, 0) > 0, р (ж, 0) :*,о) = О почти всюду в Q. Пример 6.2. Если в предыдущем примере V = граничные условия «г/ == 0, /7 = 0 на 2» в задаче F.16) должны быть заменены следующими: • = 0 па 2. то dv dv F.17) Замечание 6.6. Все сказанное выше верно и в случае,, когда оператор Л пе обязательно симметричен, а симметрична только его главная часть второго порядка. Тогда достаточно в уравнениях, определяющих сопряженное состояние р, заменить А на А*. Предполагается, что З поэтому Л = — Ах л- I.
§ 7. Граничное управление (I) 327 Замечание 6.7. Если состояние у (v) системы определяет- определяется как решение задачи ») = v, y'@;v) = 0, то получаются аналогичные результаты. Если 'U — V, то решение задачи F.18) понимается в смысле § 1. Если 41 ~ II, то решение задачи F.18) понимается в смысле § 3, т. е. как такая функция у (v) ? L2 (О, Т; II), что ] (у (v), Ф" + A (t) <p)dt=] (/, Ф) dt + (v, Ф' (У)) F.19) О 0J для любой функции ф, для которой ф g L2 (О, Т; V), ф' 6 L2 (О, Т; Н), <р" + Л (г)сре?2@, Т;Л); ф(О) = О, ф'(О) = О. В этом случае у {T;v) 6 /Л у' (Т; v) ? V' и можно получить результаты, анало- аналогичные предыдущим, если J(v) = \y (T; v) - z° |2 + |; у' (Г; v) - 4 \\Ь'- F-20) § 7. Граничное управление (I) 7.1. Постановка задачи Будем рассматривать теперь случаи, когда управление является граничным. Сначала изучим систему, состояние которой определяется как решение задачи х) *"''A-+Ay(v) = f в Q; G.1) ¦ = v на X; G.2) dt2 dy{v) CV/ y(x, 0) = y0(x), ?M^l3. = yi{x)t X?Q. G.3) dt В следующем параграфе мы исследуем случай, когда условие G.2) (условие Неймана) заменено условием Дирихле: y(v) = v на 2. G.2') *) А — оператор второго порядка, определенный, как и в разд. 1.5.
328 Гл. 4. Управление гипс; бошческими системами Нужно, копечно, сначала определить, как понимать решение задачи G.1) — G.3), что мы сейчас и сделаем, предполагая, что г;6^=?2B). G.4) Замечание 7.1. Можно избежать трудности формулиров- формулировки разд. 7.2, если выбирать управление v более регулярным, но тогда мы столкпемся с другими трудностями — при выписывании условия оптимальности (см. разд. 9.1 гл. 3). !\Гы ограничимся лишь рассмотрепиом случая, когда выполняется соотношение G.4). 7.2. Определение состояния Лемма 7.1. Существует такой единственный элемент у (v) 6 //(<?), что q - I Уо И dj~^ dx+^y, (х) Ф (х, 0)dx+l щ> dl G.5) a at q x для всех функций ф 6 Z, где X = |Ф | Ф ? Lz (О, Т; Я1 (Q)), ср' 6 L2 (Q), Ф" + Л Ф 6 />2 (<?); = 0; Ф (х, Г) = 0, Ф' (х, Т) = 0, а: 6 й} ? G-6) Доказательство. Действительно, если v ? L2 B), то линейная форма ф ->- f wp dZ непрерывна на пространстве X 2). 2 Поэтому правая часть равенства G.5) непрерывна на простран- пространстве X, а отсюда в силу утверждения C.2) следует справедливость леммы. Заметим, кроме того, что v —>- у (v) — аффинное непрерывное 1 отображение I? (I) -> 1? (Q). J G-7) Замечание 7.2. Формально применяя формулу Грина, можпо убедиться, что решение у (v) уравнения G.5) удовлетво- удовлетворяет соотношениям G.1) — G.3). Таким образом, теперь мы будем рассматривать систему, со- состояние которой определяется как решение уравнения G.5). Это верно, даже если v ? II 1у2 B).
§ 7. Граничное управление (I) 329 Замечание 7.3. Разложение по собственным функциям 2). Пусть оператор A (t) — А не зависит от t; пусть, кроме того, u?i, . . ., wm, ... — собственные функции оператора А для задачи Неймана: Awj = KjWj, —-— =0, j = l, 2, ...; (wj, wh) = 8'j. G.9) dvA г Тогда решение у (v) = у уравнения G.5) можно однозначно представить в виде оо y=^yj(t)wj; G.10) . yjeL2@,T), Z]\yj(i)\2dt<oo. G.11) ;=i о Для определения коэффициентов г/^ (?) положим в равен- равенстве G.5) Ф (х, t) == tp @ ц>; (ж), t|) б С2([0, Г]), г|; (Г) = 0, г|з' (Г) = 0. G.12) Тогда Т Т Т \ (l/j'vp" + hjy$) dt = \ /yi|; dt — Уор\>' @) -f- //i/ф @) + j и;-г|; dt ViJ;, 0 0 0 G.13) где использованы обозначения Sf f [ G-1^> q a J Следо в ательпо, b + V}, yj(O) = yoj, у){Щ = Уи- G.15) 7.3. Распределенное наблюдение Предположим сначала, что мы наблюдаем функцию у (v) в цилиндре Q, а функция стоимости имеет вид - / (v) = | [г/ (у) - 2д]2 ^d/ + (Nv, i7)L2B) #6^(/!2(S); L2(E)), #>v/, v>0. Если <^а — выпуклое замкнутое подмножество пространства 11 — />2 (S), то существует единственное оптимальное управление и (z°Uq, которое характеризуется тедг, что I [у (и) - z.J [г/ (у) - у (и)] dx dt + (Nu, v - и)^® > 0 V v € ^e. Q . G.17) ') Ср. с замечаниями 8.7 и 9.3 гл. 3.
330 Гл. 4. Управление гиперболическими системами Определим сопряженное состояние р (и) как решение задачи (и) df др(и) + Ар (и) = у(и)— гд в Q; dvt = 0; р(х,Т;и) = 0, др{х> Т' и) = 0, dt '-\ G.18) которая имеет единственное решение. Для того чтобы преобразовать неравенство G.17), заметим, что если из равенства G.5) вычесть это же равенство, записанное для v — и, то получим G.19) положив здесь ф = р (и), будем иметь I [у (v) - у (и)] [у (и) - зд] dxdt=[{v-u)p (и) d2. G.20) Q 2 Таким образом, справедлива Теорема 7.1. Пусть состояние системы определяется как реше- решение уравнения G.5), а функция стоимости имеет вид G.16). Тогда для оптимального управления и ^°Цд удовлетворяются соотноше- соотношения G.5) (при v = и), G.18) и I g. G.21) Пример 7.1. Пусть 6ilg = cU. Тогда соотношение G.21) приводится к виду р {и) + Nu = 0. G.22) Это равенство позволяет исключить и из соотношений G.5) (при v = и) и G.18), т. е. прийти к задаче fl Ay = 1, -^r + Ap^y-Zx в Q; dt2 dy dvA у (х, 0) = % (x), p(x,T) = 0, 1 г, дР г. v хр = 0, —^— = 0 на 2; dvA at dt = yt (x) на Q; O на Q. G.23)
§ 7. Граничное управление (I) 331 Пример 7.2. Пусть <Ug = {v | v^O почти всюду на 2}. Оптимальное управление получается из решения односторонней граничной задачи dvA dvA У fa dv на 2; Tf~ 1 = 0,^ = 0 на 2; dvA/ dvA G.24) dyfaO) dt = yi{x) на Q; ^^ = 0 на Q, а именно dt u = dy_ dv л G.25) 7.4. Граничное наблюдение Пусть теперь мы наблюдаем функцию у (и) на поверхности 2. Допусти.м, что справедлива Лемма 7.2. Решение уравнения G.5) таково, что у (v) |2 6 € L2 B) и v->- у (v) |s — аффинное непрерывное отображение про- пространства L2 B) е себя. Замечание 7.4. Идея доказательства леммы 7.2 заклю- заключается в следующем. Мы отметили (см. сноску на стр. 328), что если v?H~1/z B), то у (v) 6 L2 (Q) = L2 (О, Т; L2 (Q)); можно непосредственно прове- проверить, что если v е#аМ2), то у (v) 6 Ьг (О, Г; Я2 (Q)). Тогда, используя теорию интерполяции1) (см. Лионе и Маджепес [1, гл. 1]), заключаем, что если v 6 ?2B), то у (v) 6^2 (О, Т; IIх (Q)) и, в частности, у (v) |2 6 L2 B), откуда и следует утверждение леммы. Пусть функция стоимости имеет вид =l [У (») ~ >0. J G.2b) Сводя аффинный случай к линейному..
332 Гл. 4. Управление гиперболическими системами Пусть по-прежнему "Uq — выпуклое замкнутое подмножество пространства 41. Оптимальное управление и?Щд характери- характеризуется тем, что I [У (и) - гд] [У (v)-U («)] d2 + (Nu, v - u)L2{T) > О Vv 6 Ud. G.27) Определим сопряженное состояние р (и) как решение задачи г) dt2 dp (и) dvA = y(u)-z-A на S; [ G.28) dt Преобразуем (формально) неравенство G.27) следующим обра- образом: умножив первое из соотношений G.28) на у (v) — у (и) и применив формулу Грина, будем иметь р (ы) (у - и) йЪ. Эти формальные преобразования можно обосновать, например, аппроксимируя функцию у регулярными функциями и переходя к пределу. В результате получаем, что неравенство A.21) эквивалентно неравенству d. G.29) Тем самым доказана Теорема 7.2. Пусть состояние системы определяется как решение уравнения G.5), а функция стоимости имеет вид G.26). Тогда для единственного оптимального управления и ?_4La удовле- удовлетворяются соотношения G.5) {при v = и), G.28) и G.29). г) Для определения решения р (и) используется аналог леммы 7.1 для обращенного времени.
§ 7. Граничное управление (I) 333 Пример 7.3. Пусть Шд — 1С. Тогда соотношение G.29) приводится к виду р (и) -I- Nu ----- О на 2. G.30) Исключая (с помощью этого равенства) и из соотношений G.5) (при v — и) и G.28), приходим к задаче ду дР — у — Z-, нэ. z*\ .... . . ду (х, 0) . . ,_ у (х, 0) = у0 (х), у\' ' = у{ (х) на Q; dt на Q. dt G.31) Пример 7.4. Пусть Шд -- {v | у>0 почти всюду на 2}. Тогда оптимальное управление получается из решения односто- односторонней граничной задачи dv dv G'32) OT A/dvA г/ (ж, 0) == г/0 (ж), -^ = yi (x) на Q; 9/ il) = o на Q, ду а именно и --- -— dvA Замечание 7.5. Предыдущие расслютрения распростра- распространяются и на случай систем, описываемых, например, такими опе- операторами, как в разд. 4.3.
334 Гл. 4. Управление гиперболическими системами § 8. Грапичное управлепие (II) 8.1. Постановка задачи Будем использовать обозначения, аналогичные ^ принятым в предыдущем параграфе. Предположим, что состояние у (v) системы определяется как решение задачи ± = f*Q; (8.1) y{y) = v на 2; ' (8.2) у (х, 0; v) = Уо (х), д1±*ЛА = yi {х). (8.3) at В этом случае управление граничное, а смешапная задача (8.1) — (8.3) является задачей типа Дирихле. Если считать, что v ? L2 B), то решение задачи (8.1) — (8.3) можно определить с помощью транспонирования (как в предыду- предыдущем параграфе), но при этом не известно, будет ли решение у (v) принадлежать пространству I? (Q). Можно, конечно, рассматривать задачи управления, в которых у (v) ? L2 (Q); например, если у (v) 6 И (Q) (что соответствует рассматриваемому случаю — см. Лиопс и Мадженес [1]), то возь- возьмем в качестве функции стоимости / (у) = || у (v) - 2д \&-i(Q) + (Nv, v)Ltm. (8.4) Но мы будем считать в дальнейшем, что управление v «регу- «регулярно». 8.2. Регулярное управление Пусть имеет место очень сильное предположение: <U=til&), (8.5) т. е. v ? 1L тогда и только тогда, когда все вторые производные управления v на поверхности 2 принадлежат пространству L2 B) и v (х, 0) = v (х, Т) = v' (х, 0) = v' (х, Т) = 0, а: 6 Г. Тогда задача (8.1) — (8.3) имеет единственное решение у (v) ? 6 Я1 (Q). Действительно, возьмем такую функцию $, что ф е Я2 (Q); -ф Ь - v; ф (а:, 0) = 0, -ф' (а:, 0) = 0, х 6 Q;
§ 8. Граничное управление (II) 335 тогда функция z — у (v) — г|з должна удовлетворять соотношениям z + Az = / - fl>' + Аф) == 7е L2 (<?); z |2 = 0; z (х, 0) = #0 (х), z (х, 0) = yt (x), x 6 Q. Пусть I/ (а:, Г; у) — финальное наблюдение, и пусть J(v) = \y (x, T; v) - 2д \2L4Q) + v 11 v ||2н2(?), v > 0; (8.6) здесь II v\\2A = J (Дг^Jdr d* + J (О2dT dt, (8.7) О "О а Аг — оператор Лапласа — Бельтрами па границе Г. Если 41 д — выпуклое замкнутое подмножество пространства й11 --- III B), то оптимальное управление и ?Шд, которое в данном случае существует и единственно, характеризуется тем, что (у (х, Т; и) - z-A, у (х, Т; v) — y (x, T; и)) + + v(«, v-u) 2 >0 Vveiio- (8.8) Сопряженное состояние р (и) определяется как решение задачи р'(и) + Ар(и) = 0 в Q; р(и) = 0 на 2; | (8.9> р (х, Т; и) = 0, р (х, Т; и) = у (х, Т; и) - гд (х), х 6 Й. Можно показать (см. Лионе и Мадженес [1]), что dp (и) (этот результат не самый сильный). Тогда из соотношений (8.9) с помощью формулы Грина полу- получаем (у (х, Т; и) - 2д, у (х, T;v)-y (х, Т; и)) = $ ^М (у - и) dZ. z dvA Поэтому неравенство (8.8) принимает вид $ OEM (V _ u) dS + v («, у - «) 2 > 0 .Чие^в, (8.11) ИЛИ at
336 Гл. 4. Управление гиперболическими системами Таким образом, справедлива Теоре м а 8.1. Пусть выполнено предположение (8.5), а функция стоимости имеет вид (8.6). Тогда для оптимального управления и ?Шд удовлетворяются соотношения (8.1) — (8.3) (при v -^ и), (8.9) и (8.12). 8.3. Примеры Пример 8.1. Пусть % д -- %. Тогда оптимальное управле- управление получается из решения задачи у" -f А у = /, р" + Ар = 0 в Q; Л = 0, dt y = 0 па 2; (8.13) у (х, 0) = г/0 (ж), г/' (ж, 0) = г/, (а-) на Q; р (х, Г) = 0, // (х, Т) = у (х, Т) — 2Д (х) на Q; .г/ (ж, 0) = у (х, Т) = у' (х, 0) = у' (ж, Т) = 0, а; 6 Г, а именно и г/ |2. П р ir м о р 8.2. Пусть U — {v | v 6 Щ B), у>0 почти всюду на 2}. Тогда оптимальное управление получается из решения односторонней граничной задачи Ау = /, р" + Ар = 0 в Q; у" JJ д" \ atI dv. dt = 0 па 2; /у>0 на (8.14) у {х. 0) = ,г/о (*), .у' (а-, 0) = У1 (х) на Q; р (а:, 7') = 0, р'(х, Т) = у (х, Т) - za (x) на Q; у (х, 0) = у (х, Т) = у' (х, 0) = у' (х, Т) = 0, х е Г, J а именно и -- у |^. § 9. Параболическо-гиперболические системы 9.1. Один общий результат Пусть f и t) — такие гильбертовы пространства г) над полем действительных чисел R, что Т cz I), f" плотно в f). ') Они будут играть здесь иную роль, чом пространства f0 и I), введен- введенные в § о.
§ 9. Параболическо-гиперболические системы 337 Отождествляя пространство I) с его двойственным и обозначая через У пространство, двойственное к пространсту У, получаем У с ^ с= У. Пусть Ji- — данный оператор: Л^Х {У; У), (9.1) («?#Ф, ф) ^э=а [| ф ||2 , а>0, V9 6^1M (9.2) а Л — оператор, неограниченный в пространстве I) и такой, что — Л есть инфинитезимальный производящий "J оператор полугруппы G (s) в I), в f и в f, при- I (9.3) чем G (s) является сжимающей полугруппой в I) 2). I Обозначим через Z> (Л; f)), Z) (Л; У) ж D (Л; !F') области опре- определения оператора Л соответственно в пространствах I), У и f". Доказана (см. Лионе и Мадженес [1, гл. 3]) Теорема 9.1. Пусть f ?У. Тогда существует такой един- единственный элемент у, что Л; У), (9.4) = /; (9.5) при этом f -> у — непрерывное отображение У —у У |~] D^(A; У). -Рассмотрим пару действительных неременных {х0, t}, где {х0, t} € © = @, а0) X (О, Г), а0 < оо, Г < оо. (9.6) Далее, пусть, как и в § 1, пространства V я Н таковы, что V с с Н cz V'. Положим (9.7) тогда У = L2 (О; V'). г) Ломаные скобки обозначают скалярное произведение оломоптов, при надлежащих соответствеппо пространствам f3' и f3. 2) То есть || G {s) \\х^ щ < 1. 3) Так что, например, 9® = {г|5 | г|) (х0, t) ? У; х0, t ->г|) (хо, г) — измери- измеримая функция] 0 -> F; f || i|> (ж0,0 ||ydxodi < оо}. О 22—1230
338 Гл. 4. Управление гиперболическими системами Пусть а (х0, t; ф,т|з) — семейство билинейных непрерывных форм на пространстве V, обладающих следующими свойствами: х0, t -у а (х0, t; ф, rj;) — измеримая ограниченная функция на (Э; ¦ ( а (х0, t; ф, ф) > а || ф|| \ почти всюду в О, ' сс>0, Уф 6 V1). Определим оператор Jb в пространстве f: если г|з ? f, то Aty — «х0, t-±A (xo, t) ¦§ (х0, t)», (9.9) где оператор А (х0, t) e^(F; V) (9.10) задан форлхулой (Л (х0, t) фь ф2) = a {xo, t; ф,, ф2) УфЬ ф2 6 F. Ясно, что предположение (9.2) выполнено. Оператор Л зададим формулой ЛФ = ^ + ^-; (9,11) dt д его область определения в пространстве I) имеет вид D(A; t,) = (ф 1 Ф6^, -^+— б?), ф(жо,О) = О, 9@ (9.12) Оператор Л удовлетворяет условию (9.3); в этом легко убедиться, если заметить, что (s) Ф (х0, 0 = h (Жо S'' - 5) ПРИ г° > *' ' > S; (9.13) |_ 0 в противном случае. Таким образо.м, выполнены все условия теоремы 9.1, а потому справедлива Т о о р о м а 9.2. Пусть выполнены предположения (9.8) я). Тогда существует такая единственная функция у — у (х0, t), что уеЬ2(О;П ¦^- + -^-бЛ8@; П; (9.14) dt д х) Достаточно, чтобы для подходящего X иыполнялось неравенство a(xo,t; ф, 2) Входящие сюда услония, очевидно, имеют смысл. Области определе- определения этого оператора в пространствах ~У'° и У'", т. е. D (Л; V) и D (Л; ?/Э')> опре;и\:гяк)Т('я аналогично. 3) Подчеркнем, что форма a (xq, t; ф, г|)) но обязательно симметрична отно- относительно переменных ф и г|з.
§ 9. Параболипеско-гиперболические системы 339 -^ + -^- + А (х0, t)y = f, f?L2(в; V'); (9.15) at dx0 y(x0, 0) = 0, ; y@, 0 = 0, te@, T). (9.17) Пример 9.1. Пусть V = Щ (Q), Я = L2 (fi) и A (x0, t) ф — 4 hr, x0, t, — I ф = — 2j Z~ \aij (ж' ^o; t) —— где а„ (а:, х0, t) 6 /,тс (Q X 0) и 2 af/ (а:, х0, 0 g*gy > a (|? + . . . + Ц), а > 0, Vgt- € R. Теорема 9.2 дает возможность утверждать существование реше- решения задачи IL + ^]L + A LXo,t,—)y=:fB QX0; at ax0 \ ox I у (x, .r0, t) = 0, x 6 Г; ^ (ж, о,о = о, жб«, «е(о, Л; у (х, х0, 0) = 0, а; 6 й, а.'о 6 @, а0); Ниже будут приведены и другие примеры использования тео- теоремы 9.2. Замечание 9.1. Оператор d/dt -|- <9/(?г0 + А (х, ж0, г, 5/5ж) представляет собой «комбинацию» гиперболического оператора d/dt -|- (9/5ж0 и параболического оператора 3/<?? -|- 4 (ж, х0, t, d/dx); этим и объясняется заглавие настоящего параграфа. Замечание 9.2. Разумеется, ложно рассмотреть гораздо более общие примеры отого же типа, если взять в качестве Л гиперболический оператор или гиперболическую систему пер- первого порядка в множестве О — G х @, Т), где G — открытое подмножество пространства Rm и х0 ? Rm. Замечание 9.3. И качестве оператора А (х, х0, t, d/dx) в теореме 9.2 можно также взять оператор — или систему —„ норядка 2m, m > 1. 22*
340 Гл. 4. Управление гиперболическими системами 9.2. Дополнение Обобщим теорему 9.1 на случай, когда начальное условие (9.16) ненулевое. Для этого нам понадобится следующее предложение о следах. Лемма 9.1. Пусть ъ ? L2 (О; V), ~ + р~ 6 L2 (О; V'); тогда можно определить функцию z (х0, 0) ? L2 @, а0; #)• Обрат- Обратно, если ф (ж0) — данная функция из пространства L2 @, а0; //), то можно найти функцию z (не единственную), обладающую ука- указанными выше свойствами, непрерывно зависящую от функции ф ц такую, что z (х0, 0) = ф (х0). Доказательство. 1) Используя продолжения с помо- помощью отражений от границы, можно свести задачу к случаю, когда О = R2; для этого случая мы и проведем доказательство. Воспользуемся методом «диагонализации» (см. Диксмье [1]): существует такое представление х) что канонический изоморфизм Л: У-> V превращается в опера- оператор умножения па Я2; точнее, существует такой унитарный опе- оператор /: Н -*-1), что /ЛФ = КЧц> Уф € V. Далее, примепим преобразование Фурье JF по переменным х0 ж t (обозначая через ?0 и т двойственные переменные). Если z = z, to Kz ? L2 (R2; b); -«- (?0 ~bT) z 6 ^ (R ; ?))• (9.18) Положим ?^В(?о,тД) = |?,2 + -^Aо + тJ| • (9.19) LA J Мы хотим доказать, что z (ar0, 0) 6 ?2 (R*; Я); так как операто- операторы/и ,^ унитарны, то это равносильно доказательству соотно- соотношения f z (^oi т> А) йт = ф (^oi ^) 6 L2 (R|o; ?))• (9.20) Предполагается, что пространство V сепарабельно,
§ 9. Параболическо-гиперболические системы 341 Hot Hi 1 ! II1 jo, X) =+f 1 — oo 2 Soi ^)llt)tt): Izjt d% + OO — CO ¦; отсюда a - + CO ' —со 1 и, следовательно, l!2 J —oo Поэтому в силу соотношений (9.18) имеем со -|-оо п откуда и следует соотношение (9.20). 2) Обратно, пусть ф — данная функция из пространства L2 @, Т; II); мы хотим построить функцию z, обладающую ука- запными в формулировке леммы свойствами. Снова сведем задачу к случаю действительной прямой Rj и плоскости. Используя те же приемы, что и в 1), можем сказать, что по данной функции г|з ? L2 (Rx; t)) нужно построить функцию z, удовлетворяющую условиям (9.18) и J z (|0, т, X) dr ^ г|з (go> ^)- (9.21) —оо Возьмем z (go, т, Я) = F (|0, т, Я) ф (т, К), где „2" Легко проверить, что в этом случае условия (9.18) и (9.21) действи- действительно удовлетворяются. Теорема 9.3. Пусть выполнены предположения (9.8). Тог- Тогда для данных функций / € # (О; V), (9.22) у0 (х0) € V @, а0; Я) (9.23) существует единственная функция у = у (х0, t), для которой удовлетворяются соотношения (9.14), (9.15), (9.17) и V (*о, 0) = 1/о (х0). (9.24)
342 Гл. 4. Управление гиперболическими системами Доказательство. Согласно лемме 9.1, существует та- такая функция z 6 L2 (О; V), что at ах0 Тогда функция у = у — z удовлетворяет соотношению ' dz dz и равенствам, аналогичным условиям (9.16), (9.17). Так как ш + ^-о € Ь2 (О; Г) и Az е /.2 (О; Г), то / € ?2 (®; V), и до- казываемое утверждение следует из теоремы 9.2. 9.3. Задача управления Пусть 41 — пространство управлений и В ?? (<и; L2(&; V')). (9.25) Для управления v 6 °И состояние у (и) = у (х0, t;- v) системы определяется как решение задачи = f + Bv в fix О; (9.26) ^r + A{x at от0 у (х0, 0; v) = у0 (х0), х0 6 @, а0); (9.27) у@, t; v) = 0, te(O, Г); (9.28) здесь /иг/,- данные функции, удовлетворяющие условиям (9.22) и (9.23). Предположим, что наблюдение распределено г) по множеству Q X О, а функция стоимости имеет вид (*о, Ь v) - zlx\2пdx0dt + (Nv, v)Vt (9.29) где z-A ? Ll (Q X О; Я) — данная функция, N^X{U\ 41), N^vT, v>0. Пусть <Ud — выпуклое замкнутое подмножество простран- пространства 11. Ставится задача об отыскании inf / (v). 1) Очевидно, возможны и другие случаи: можно наблюдать у (т0; 7"; v) ? € L2 @, а0; Л) или у (а0, t; v) ? L2 @, Т; Н) и т. д. Мы не рассматриваем под- подробно все эти случаи, ибо они исследуются аналогично.
§ 9. Параболическо-гиперболические системы 343 Оптимальное управление и^Шд существует и единственно; опо характеризуется том, что I (у(и) -zn, y(v)-y (и)) dx0dt + (Nu," у -1% > О 0 (9.30) Сопряженное состояние р (и) определяется как решение за- задачи ==у{и)_гя в dt дх0 р (х0, Г; и) = 0, х0 € @, а0), р (а0, Г,и) = 0, t? @, Т),. причем р (и) € L2 (О; V), D- + ~) Р («) б ^ (©; F'). (9.32) \ dt дх0! Допустим, что имеет место Лемма 9.2. Выполняется равенство я я + + )р(), y() — y(u))dxodt = dt ox0/ I в = -l(p («). D" + ^-) [2/ (у) - 2/ («)]) ^о Л. (9.33) 0 \\ dt дх0! I Тогда из соотношений (9.31), (9.33) и (9.26) вытекает, что (У {») — 2Д, y(v) — y (и)) dx0 dt = = J [р (и), (^ + ~ + Л (z0, о) [J/ (у) - 2/ (u)]) dx0 dt = = J (р (и), 5 (у - u)) rfz0 Л = (i?V (и), у - и)') = = (А%В*р(и), v — u)u. Таким образом, если верна лемма 9.2, то справедлива J) Скобками обозначено скалярное произведение элементов, принадле- принадлежащих соответственно пространствам %' и %.
344 Гл. 4. Управление гиперболическими системами Теорема 9.4. Пусть состояние у (v) системы определяется как решение задачи (9.26) — (9.28), а функция стоимости имеет вид (9.29). Тогда существует единственное оптимальное управле- управление u^°llg, для которого удовлетворяются соотношения (9.26) — (9.28) (при v = и), (9.31) и (А%В*р (и) + Nu, v — и)% > О V v 6 41 д. (9.34) Доказательство леммы 9.2. Очевидно, что y(v)-y(u)?TuD (Л; Г'), где Л = d/dt + d/dx0, так как у (х0, 0; v) — у (х0, 0; и) = 0. Кроме того, р (и) ^Т |~) (]D (A*; f"). Поэтому равенство (9.33) эквивалентно равенству (Лф, ij)) = (ф, 6 T[\D (Л; Г'), Щ^Т[\Б (Л*, У). Но это последнее равенство верно для всех ф ?D (Л; V). Посколь- Поскольку множество D (Л; f") плотпо в множестве V(]D(A; T'), то утверждение леммы получается предельным переходом. 9.4. Пример (I) Пусть в условиях разд. 9.3 V = Н10 (Q); U = L2 (О; V) = L2 @; Я (Q)); В — тождественный оператор. Тогда для оптимального управ- управления и ? "Ид удовлетворяются соотношения: dx0 \ dx 0 ox у (x, x0, t; u) = 0, p (x, x0, t;u) = O, x? Г, {x0, t, 6 0; у (x, x0, 0; u) = y0 (x, x0), x0 6 @, a0), x 6 Q; y(x,o,t;u) = o, te(o,r>, x p (xLx0, T; u) = 0, x0g@, a0), x p(x,ao,t;u) = O, te(O,T), x (9.35) J [p(u) + (—&x-\-I)Nu\(v — u)dxdxodt^O Vv^Ug. (9.36) QX0
§ 9. Параболическо-еиперболичеекие системы 345 Если U = L2 (Q х О), (9.37) то задача (9.35) остается без изменения, а вместо неравенства (9.36) имеем \ [p(u) + Nu](v — u)dxdxodt^O Vve<Ua. (9.38) QX0 d 9.5. Пример (II) Пусть в условиях разд. 9.3 V = Н1 (Q); В 6 «2 (<&; ?2 @ х Г)). (9.39) Умножая равенство (9.26) скалярно на -ф g F, перепишем его в виде t дх0/ + \Bv{x, xa, t) -ф ЙГЖ V-ф 6 Я1 (Q). (9.40) г Для упрощения записи допустим, что 41 = L2 (О X Г); Б—тождественный оператор. (9.41) Тогда соотношение (9.40) интерпретируется так: T)vM + A['*i fW)/Qx0; (9.42) дх0/ \ дх! '**** ^ = У, «б Г, {^0, 0 6 О; (9.43) dvA к этим равенствам следует добавить еще условия (9.27), (9.28). Следовательно, состояние системы определяется как решение параболическо-гиперболической задачи с управлением в граничных условиях. Предположим, например, что <Ug = {v | у>0 почти всюду на Г X О}. (9.44) Тогда оптимальное управление получается из решения одно- односторонней граничной задачи
346 Гл. 4. Управление гиперболическими системами dp(x,xo,tj=sOt dy(x,xo,t)>o наГх©; 9v,, dvA dvA dvA (9.46) у (x, x0, 0) = y0 (x0), p (x, x0, T) = 0, x0 € @, a0), x € ^;\ Q; J (9/l7) у (ж, 0, 0 = 0, p(x,a0, t) = 0, te(O; T), а именно 9.6. Расцепление Пусть выполнены условия теоремы 9.4 и °11о — °Ч- Тогда нера- неравенство (9.34) приводится к соотношению A^B*p(u) + Nu = 0. (9.48) Поэтому оптимальное управление получается из решения системы (9.49) i ¦У=- — h\ at дх0 с граничными условиями (9.47). Мы в общих чертах исследуем расцепление этой системы с помо- помощью того же метода, что и в § 4, 5 гл. 3 и § 5 настоящей главы. Предположим, что U = Z2 (О; Е); В = В (х0, t)?Z (E; V). (9.50) Рассмотрим задачу (ср. с леммой 4.1 гл. 3) ^ + ^- + A4> + BN-iA^B^ = f, xoe(O,ao),te(s,T);} dt дх0 I } (9.51) ' -ТГ-~ + л^-Ф = -2д' *о€(О, ao),*6(*,'Z'); I Ф (аг0, s) = h (x0), q (,r0, 21) = 0; 1 Ф@, 0 = 0, г|;(о0, 0 = 0, / где /i — данный элемент пространства L2 @, а0; Н).
§ 9. Параболическо-гиперболические системы 347 Эта задача имеет единственное решение. Действительно, она соответствует задаче отыскания оптимального управления (при отсутствии ограничений на управление) системой, состояние ср (v) которой определяется как решение задачи y } (9.53) = t + B (x0, t) v, х0 е (о, «о), t e (*, Л; ф(ж0, s) = h(x0), ф@, 0 = 0, а функция стоимости имеет вид J (v)= $ \y{v)- 2Д |2 dx0 dt + I (Nu, v)E dx0 dt4). @, ao)K(s, T) @, ao)X(.s, T) Согласно лемме 9.1, функция ty (x0, s) определяется однозначно и принадлежит пространству L2 @, а0; II); следовательно, h -v aj) (x0, s)—аффинное непрерывное \ ,q r./\ отображение пространства U @, а0; Н) в себя. J ' ' Обозначим через "ф (s) функцию Xq-^- "ф (х0, s), принадлежа- принадлежащую пространству I? @, а0; Н). Тогда ^ (s) -=-. Р (.9) h + r (S), (9.55) Р (s) € ^ (^2 @, а0; Я); Z2 @, а0; Я)), (9.56) г (.9) 6 ?2 @, а0; Я). (9.57) •Отсюда следует «основное тождество» p\t) = P (t) y{t) + r (t), (9.58) где через р (t) обозначена функция х0 -v p (x0, t) и аналогично объясняются обозначения у (t) и г (i). Оператор iJ (f) определяется через решение задачи (ср. с лем- леммой 4.3 гл. 3) г)р + Р + %у = 0, хе (о, а0), day + ^*Т-Р = О, ^6@, а0), t?(s, T); \ | (9.59) = h, ? (^, J) = 0; р @, f) = 0, у (а0, «) = 0, (9.60) а именно P(s)h = y (x0, s); (У.01) !) Предполагается, что N = N (х0, t) ? X (Е; Е).
348 Гл. 4. Управление гиперболическими системами функция г (t) определяется через решение задачи (~ + -^)ц + Ац + BN-lA^B*l = /, х6@, а0), 16(*, Т); \ ot дхй1 7 + Г) t ох0/ ц (х0, s) = О, I (х0, Т) = О;г\ (О, 0 = 0, I (a0, t) = О, (9.62) а именно r(*) = 5fo,a). (9.63) Можно показать (аналогично доказательству леммы 4.4 гл. 3), что P*(t) = Р (<). (9.64) Проведем теперь формальные преобразования, использующие ядра операторов (обоснование этих преобразований в данном случае технически весьма сложно). Согласно теореме Шварца о ядрах (см. Шварц [2], [3]), имеет место представление Р (s) h = ]°Р (х0, g0> s) h (У ^о, (9.65) где Р (х0, ?0 s) — ядро оператора Р (s), т. е. распределение на @, а0) X @, а0) со значениями в пространстве X (Н; Н). Тогда р (х0, t)=) Р (х0, Ъо, t) у (g0, t) dl0 + г (х0, t) о и, следовательно, о дх0 ох0 о ot ¦ ot Отсюда, принимая во внимание первое из соотношений (9.49), получим V дР м ^ Т дР At дг о дх0 дх0 о at
§ 9. Параболическо-гиперболические системы 349 Окончательно приходим к уравнениям dt дх0 T о )Р ( fao, So, = / ® б (S - х0) (9.66) _iL_*L + 4v а0 О а0 J P to, So, «) / (So, t) dlo - Ч о (9-67) с граничными и начальными условиями Р (а0, So, 0 = 0, Р (^0, оо, 0 = 0, J° fo, So, Л = 0; (9.68) г (а0, *) = 0, г (*„, Г) = 0. (9.69) Пример. В условиях разд. 9.4 пусть Р (х, |, х0, So, 0 — лЗро оператора А Для простоты предположим, что 41 = = Ьг (Q X О) и 7V = v/, v > 0. Тогда ядро Р (х, S, г0, So, 0 удовлетворяет соотношениям  QX@, a0) ar0, т]о, So = 8(x-l)8(xo-lQ); (9.70) Р (*?> 5, #о> So, Ч == " ' S, 3J, 5о, ^о, v> J^ ^, 5, «^О, эО, V ^, ^ С -^ ИЛИ ь С ¦*¦ , К So, t} € @, во) X @, а„) X (О, Т); (9.71) с \л,, ь, "о. So, Ч — ", -* v, ь, ^о, "о, *•/ — ", Р (х, S, г0, So, Т) = 0. Таким образом, получается нелинейное интегро-диффореп- диальное параболичоско-гипорболическое уравнение типа Рик- кати. Существование слабого решения задачи (9.70), (9.71) известно априори. Как мы уже отмечали в аналогичных случаях для параболи- параболических или гиперболических уравнений, было бы очень интересно провести прямое исследование задач типа (9.70), (9.71).
350 Гл. 4. Управление гиперболическими системами § 10. Теоремы существования оптимального управления 10.1. План дальнейшего исследования В этом параграфе мы докажем некоторые теоремы существо- существования оптимального управления для нелинейных систем. Речь идет о результатах, аналогичных полученным в § 15 гл. 3 для параболического случая. 10.2. Пример. Введение «вязкости» Пусть U = L00 (<?), Q = Q X (О, Т), A0.1) а состояние у (v) системы определяется как решение задачи *Q; A0.2) С Ъ 0 и y(v).= O на 2; A0.3) у (х, 0; v) = у0 (х), дУ^0'^ = У1 (?), х € Q, (ю.4) dt где А — оператор второго порядка, заданный, как в разд. 1.5 2). Предположим, что функция стоимости имеет вид y(v)-zR\zdxdt + v\\v\\L~{Q), v>0. A0.5) Ставится задача об отыскании inf / (v), где 11 д — выпуклое- подмножество пространства L°°{Q), замкнутое в смысле слабой ¦-топологии. Даже в рассматриваемом весьма простом случае мы сталкиваем- сталкиваемся со следующей существенной трудностью (аналогичной той,, которая уже встречалась в разд. 15.3 гл. 3). Пусть {vn} — минимизирующая последовательность. Тогда с помощью формулы A0.5) 2) заключаем, что vn остаются в ограниченном подмножестве простран- пространства l°°(Q). Поэтому из последовательности {vn} можно извлечь такую подпоследовательность — мы обозначим ее тоже через {vn},— что yn-v и «-слабо в L°°(Q); и ?Ш3. A0.6) Задача A0.2) — A0.4) имеет единственное решение у (у) ? IP (Q). Слагаемое v || v \\ L множество 41q ограничено. 2) Слагаемое v || v \\ТОС1Г. в формуле A0.5) является излишний, если
§ 10. Теоремы существования оптимального управления 351 Далее, умножив равенство A0.2) (записанное^при v — vn) на ду (vn)ldt и обозначив у (vn) через уп, получим ~г г- U Уп I + а (t'i Ум Уп)] ~г Г 2 1 Г + J vn (yn) dx — ^a (t; yn, yn) = \ fy'n dx, A0.7) а & п где | уп\2 = I (y'nJ dx. Отсюда следует, что уп (соответственно у^) остаются в ограничеднод! "j подмножество пространства L°° @, Т; 7/J(Q)) ( A0.8) (соответственно 7^°°@, Т; L2 (Q))). ) Тогда из последовательности {уп} можно извлечь такую подпо- подпоследовательность — мы обозначим ее тоже через {уп},— что уп->у слабо в IT@, Т; Н1 (Щ, 1 у'п-+у: слабо в L°°@,T;L2(Q)). J Однако этого недостаточно, чтобы можно было заключить, что vny'n-+ uy', например, в пространстве 3)' (Q). A0.10) Замечание 10.1. Утверждение A0.10), очевидно, спра- справедливо, если можно показать более сильную сходимость последо- последовательности {vn}. Ото удается сделать в случае, когда управление более регулярно. Положим, например, U - /Л0 П 771 «?), A0.11) а в качестве функции стоидюсти возьдгем (вместо A0.5)) Ы»)=1\У A>) - 2д I"dx dt + v II v IL-(Q) + e I! v\\hhq), e > 0. Q A0.12) Тогда, как легко проверить, vn-± и сильно г) в пространстве L2 (Q), а значит, имеет место утверждение A0.10). Следовательно, в предположениях A0.11), A0.12) оптималь- оптимальное управление существует. Мы придем к такому же выводу, изменяя уравнение, описываю- описывающее состояние системы 2). Фиксируем s>0 и предположим, что х) Так как вложение IP (Q) -*- L" (Q) «полис нопрерышю. 2) Это пример параболической регуляризации', гл. 5.
352 Гл. 4. Управление гиперболическими системами состояние у (v) системы определяется как решение уравнения v) + vy'(v) = f в Q A0.13) ot с граничными условиями A0.3), A0.4). Легко видоть, что задача A0.13), A0.3), A0.4) имеет такое единственное решение у (v), что у (v) 6 Я1 (Q), y'{v) 6 L2 @, Т; Щ (Q)). Теорема 10.1. Пусть состояние системы определяется как решение задачи A0.13), A0.3), A0.4), а функция стоимости имеет вид A0.5). Тогда существует хотя бы одно оптимальное управ- управление. Доказательство. Пусть {vn} — минимизирующая последовательность; обозначим у (vn) через уп. Тогда последова- последовательность {vn} ограничена в пространстве L°°(Q), а из соотношений A0.13), A0.4), A0.3) следует, что г + е 11 gradK у; (ж, 0 |2dx + J уп (УпJ** = $ jfy'n dx. a an Отсюда заключаем, что у„ и i/^ остаются в ограниченном подмножестве пространства L2 (О, Г; Н\ (Q)); i/n остаются в ограниченном подмножестве пространства LCX3@, Г; Щп)). Согласно равенству A0.13), yn = f~Ayn-\-eAy'n — vny'n; A0.15) поэтому последовательность {у'п} ограничена в пространстве L2 @, Т; Н~х (Q)). На основании «леммы о компактности» (Лионе 13, предложение 4.2 гл. 4]) из последовательности {уп} можно извлечь такую подпоследовательность — мы обозначим ее тоже через {уп},— что наряду с соотношениями A0.6) и A0.9) имеем у'п-*у' сильно в L2(Q). A0.16) Тогда утверждение A0.10) справедливо и, следовательно, у = ~ у (и), т. е. и — оптимальное управление. Замечание 10.2. Пусть уе (v) — решение задачи A0.13), A0.3), A0.4), а функция стоимости равна Q
§ 10. Теоремы существования оптимального управления 353 Нам не известно, верно ли, что inf JB(v)^- hit J (v) при е-»-0. Замечание 10.3. Аналогичный теореме 10.1 результат справедлив, если Л — эллиптический по х оператор порядка 2т. 10.3. Оптимальное быстродействие Пусть 41 д — выпуклое замкнутое ограниченное подмножество пространства Я1 (Q). A0.17) Положим Рассмотрим систему, состояние которой определяется как решение уравнения у" (v) + Лу (v) + p (у' (v)) =f + vnQ A0.19) с граничными условиями A0.3) и A0.4); здесь f ? L2 (Q), v 6 lid, а оператор Л задан так же, как и в разд. 10.2. Как известно (см. Лионе и Штраус [11 г)), существует един- единственное решение у (v) задачи A0.9), A0.3), A0.4), причем у (v) 6 L™ @, Г- Hi (Q)), у (v) 6 /."(О, Т; L2 (Q)), у [и) 6 Lp+1 (Q). • A0.20) Пусть К — слабо замкнутое подмножество в V X Н. A0.21) Предположим, что существует такой элемент v ? <Ud, что "i ,«^ пг>ч {у (т; v), у' (т; v)} 6 К для некоторого т е @, Т). ) (Ш^> Оптимальное время определяется равенством т0 - inf т, A0.23) т. е. То — нижняя грань всех значений т, удовлетворяющих условию A0.22). Теорема 10.2. Пусть выполнены предположения A0.17), A0.21) и A0.22). Тогда существует такое управление и ?.41 а, что {у(х0; и), у' (т0; и)} еЛГ, A0.24) где т0 — оптимальное время. 1) И этой работе и моются более общие теоремы существования и един- единственности. "; 23 — 1230
354 Гл. 4. Управление гиперболическими системами Доказате л ь с т в о. 1) Пусть значения тп таковы, что {У (т„; vn), у' (т„; v,,)} ? К, тп -> т0, vn е <&в. Положим уп --- у (у„). Из соотношений A0.19), A0.3), A0.4) (записанных при v --- vn) получим J) 44- [I У» W I" + a (У- Ю> У» (*))] + 5 I Уп IP+1 Ac == J (/ + О г/; da;, I at a a A0.25) откуда следует, что yn (соответственно у'п) остаются в ограниченном % подмножестве пространства Lw @, Т; П\ (Q)) I A0.26) (соответственно L°° @, Т; L2 (Q)) fl ^ p+1 (<?)) J И ЧТО II Уп (т„) ||у + | у'„ (т„) | < const. A0.27) Следовательно, можно извлечь такую подпоследовательность — мы обозначим ее тоже через {рп, уп},— что ип -» и слабо в II1 (Q) и сильпо в L2 (Q); и ?Шд; A0.28) уп-уу *-слабо в L°°@, T; iftfQ)), 1 2 (й)) П Z,p+1(^); J A09) у'^г/' .-слабо в LTO@, Т- L2 (й)) P(y'n)-»/? слабо в L(p+i)/p(Q). ¦ (Ю.ЗО) Так как у"п -= f г ^ — Ауп — Р (j/n), то у"п^у" = 1 + и~Ау -g .-слабо в L~@, Г; Я (Q)) Л L(p+1)/p@. A0.31) Согласно оценке A0.27), можно считать, что (г/Л^п), y'n(Tn)}->-{Xo, Xi} слаб0 в ^ХЯ; {Хо, Xi}6^. A0.32) Легко убедиться, что Уп (т„) ^ г/ (т0) слабо в Я,  (д), J ->г/(т0)слабо в/г(й)п^(д), J l • ' Действительно, Уп (т„) — У (то) = г/* (т„) — уп (т0) + уп (т0) — у (т0); но, согласно первому из соотношений A0.29), имеем, в частности, г) Для простоты предполагается, что оператор Л но зависит от f, в про- противном случае см. Лионе и Штраус [1], Штраус [1].
§ 10. Теоремы существования оптимального управления 355 Уп (т0) -> У (т0) слабо в Я и Аналогично (применяя соотнопшпие A0.31)) проверяем и второе утверждение A0.33). Сравнивая соотиоп1ения A0.33) и A0.32), заключаем: {Z/Ы, у'Ы) = (Хо, XiKtf. (Ю.34) Следовательно, мы докажем теорему, если убедимся, что у — у (и), для чего достаточно показать, что g =¦• Р (У')- A0.35) 2) Для доказательства равенства A0.35) воспользуемся моно- монотонностью оператора у' —>- Р (у'). Пусть ф — некоторая функция, обладающая свойствами, аналогичными указанпым в A0.20) и A0.3) свойствам функции у = у (и). Из монотонности оператора у' -*¦ р (у') следует, что О V9. A0.36) Q С другой стороны, 7 — vn) (y'n ~ ф') dxdt = а (уп (Т), уп (Т))\ + 1 [| у, \2 + а {у0, у0)] U vn) (Уа - ф') Q откуда Q ±f l[\yi\2 + a(y0, yo)]-\- > U i (у" + л^) Ф' A» dt- (Ю.37) Q Q Так как у" -\- Ay -\- g = f -{• v, то правая часть неравенства A0.37) равняется I g (у' — ф') dx dt, а потому неравенство A0.36) Q а) Здесь (и только здесь) используется сильная сходимость vn к и. Нам пе иявестпо, останется ли теорема в силе, если не предполагать мпожество 41 q относительпо компактным в пространство L2 (<?). 23*
356 Гл. 4. Управление гиперболическими системами переписывается в виде И УФ. A0.38) Применим теперь прием, предложенный в работе Минти [2]. В неравенстве A0.38) возьмем ер = у —¦ Л/ф, где Я, > 0, а функция т|з обладает такими же свойствами, что и функция ср. Тогда получим Q т. е. I [g~f> (У' - >Д>)] $dxdt> 0. Q Устремляя величипу X к нулю, приходим к неравенству Q откуда и следует соотношение A0.35). Замечание 10.4. В частном случае, когда функция Р имеет вид A0.18), примененный выше общий метод доказатель- доказательства может быть заменен специальным рассуждепием (принадле- (принадлежащим де Джоржи), использующим равномерную выпуклость (см. Лионе и Штраус [1]). Примечания Доказательство единственности (разд. 1.3) принадлежит Ладыженской jl]; оно совпадает с тем, которое приведено в книге Лионса и Мадженеса [1, гл. 31. При доказательстве существования (разд. 1.4) используется метод Фае- до — Галеркина — аналогично тому, как это сделано в § 1 гл. 3. Теоремы 2.1—3.4 (за исключением теоремы 3.1) представляют собой обоб- обобщение на неограниченные операторы в бесконечномерном случае результатов классической теории двухточечных граничных задач в конечномерном про- пространстве (обобщение на ограниченные операторы в бесконечномерном слу- случае тривиально). Рассматриваемая ситуация аналогична той, которую мы встречали уже в гл. 3 для параболических операторов. Хотя здесь возникают серьезные дополнительные трудности технического характера, основным методом по-нрежпему остается использование транспонирования. Примеры, рассмотренные в § 4, приводят нас к многочисленным одно- односторонним граничным задачам (причем отличным от тех, которые формулиро- формулировались в гл. 3). Глубокий анализ этих-задач (регулярность решения; изуче- изучение множества, разделяющего области, где решение обладает разными свой- свойствами, и т. д.) представляет собой неисследованную п очень интересную проблему. Расцепление (§ 5) приводит к интегро-дифференциалытым'уравнениям тппа Риккати (которые формально аналогичны изучавшимися в гл. 3). Стро- Строгое обоснование получения этих уравнений связано со значительными труд- трудностями. Мы подробно исследовали только один частный случай; расцепле-
Примечания 357 ние задач, приведенных в примерах 7.2 и 7.3, но рассматривается. Системати- Систематическое изучение этого вопроса, и в особенности прямое исследование уравне- уравнений типа Риккати (т. е. исследование, не использующее их связи с теорией управления), представляется весьма интересным. Для изучения ситуации, рассмотренной в § 6, можно привлечь теорию двойственности Калмапа; относительно конечномерного случая см. Калман [31, Калман и Бюси [1]. Приведенные в § 7 утверждения распространяются — теми н;е метода- методами — на случай систем, описываемых операторами порядка 2т- Примеры можно найти в работе Сиразетдинова [1]. Результаты, содержащиеся в § 8, являются технически сложными и, ве- ' роятно, далеко пе самыми сильными. Здесь мы наталкиваемся на трудность в исследовании регулярности решений гиперболических уравнений (отмо- (отмоченную и детально изученную в книге Лионса и Маджепоса [1, гл. 5]. Отме- Отметим, в частности, что оценки в 1Я, q ¦-/= 2, в гиперболическом случае но яв- являются точными (см. Литтман [1]). Именно поэтому результаты, полученные в § 14 гл. 3, не распространяются на гиперболический случай. Доказательство теоремы 9.1 содержится в книге Лиопса и Маджепеса [1, гл. 3]. Глубокое изучение односторонних граничных задач, сформулиро- сформулированных в этом параграфе (и особенно регулярности решения) представ- представляется нам интересным. То же самое можно сказать и об уравнении типа Риккати, полученном в разд. 9.6. Вместо оператора dldt -'¦ д1дх§ можно рассматривать гиперболическую систему первого порядка это порождает, в частности, и новые уравнения типа Риккати. Например, уравнение (9.70) в этом случае принимает вид I р 0е. "П. *о, "По, <) Р 01, I, "По, |0, t) ахв где Р — теперь матрица || P (x, §, xq, ^,o,t) ||, A — матрица эллиптической системы, aGv- область, которую пробегает переменная т0. При этом гранич- граничные условия будут довольно сложными; придется использовать теорию гра- граничных задач для гиперболических систем первого порядка. В таком же плане можно изучать уравнения переноса, а также эллиптичес- ко-параболические уравнения — см. Олейник [1]. Уравнения с частными произ- производными тица рассмотренных в разд. 9.2 (но без управления) исследовали Ильин [1] и Лионе [9]. Полученные в § 10 результаты порождают много проблем. Например, в доказательстве теоремы 10.2 используется как монотонность, так и компакт- компактность, причем не известно, действительно ли это необходимо. Другие теоремы существования см. в работе Шмаодеко [1]. Мы совсем не затронули целый ряд задач, которые в гиперболическом случае можно сформулировать вполне аналогично задачам, рассматривав- рассматривавшимся в гл. 3. Так, например, вне рамок этой главы остались: — случай наличия ограничений на управление и на состояние системы (см. § 13, гл. 3);
358 Гл. 4. Управление гиперболическими системами — приложения теории двойственности (см. § 12 гл. 3) *); — случай точечного управления (см. § 8 гл. 3) 2); — случай гиперболических операторов или операторов, корректных по Петровскому, с запаздываниями. Выяснению управляемости гиперболических систем посвящены работы Фатторини [5], Рассела [3], Цуйока [1]. В работе Л. Егорова [1] получен вариант принципа максимума Ионтря- гипа для систем, описываемых гиперболическими уравнениями \\ задачей Гурса. Применяя формулы, дающие явное выражение состояния системы (через собственные функции), можно свести некоторые задачи управления к про- проблеме моментов; см. Бутковский и Полтавский [1], Бутковский [1]. Наконец, рассмотренными методами можпо изучать управление систе- системами, описываемыми уравнениями Шредингора. В случае отсутствия огра- ограничений на управление расцепление приводит к новым нелинейным уравне- уравнениям с частными производными тина Риккати. х) В связи с этим вопросом см. работу Бепсуссана [3] 2) Относительно этого случая мы отсылаем к книге Лионса и Мадже- песа [1].
ГЛАВА Q Регуляризация, аппроксимация и метод штрафов § 1. Регуляризация 1.1. Параболическая регуляризация Пусть выполнены предположения § 1 гл. 4; тогда F с Яс V. Для простоты предположим, что форма a (t; ф, ty) не зависит от перемепной t, т. о. а (ф, i))) — a (\f, ф) — непрерывная "i ,л .% билинейная силшетричная форма на F. J Для того чтобы упростить изложение, допустил!, что а (Ф, ф) > а || ф ||2, а>0, Уф 6 V. A.2) Рассмотрим спачала эволюционное уравнение без управления у" + Ay=f, A.3) где / — даиная функция в пространстве I? (О, Т; Н), с начальпыми условиями " У @) - г/о, у' @) = i/i, i/o 6 V, г/i 6 Я. A.4) Как мы видели (§ 1 гл. 4), задача A.3), A.4) имеет такое единствен- единственное решение у, что y?L*(O, Т; V), у' € ^2 @, Т; Л). A.5) Будем аппроксимировать задачу A.3) — A.5) некоторой зада- задачей параболического типа. Пусть е — данное положительное число. Докажем следующие предложения. Теорема 1.1. Существует единственная функция уе, для которой Уг+Ауг + еАу'е = /; A.6) Уе@) = й>, У'е(О) = У1, A.7) уееЬ2@, T;V), Уг€Ь2(О, Т;Й). A.8) Теорема 1.2. Если е ->¦ 0, /по г/s-vy в //@, Г; F), A.9) jfe-»y' в Lz@,T;H), A.10) scte i/ — решение задачи A.3) — A.5).
3f>0 Гл. 5. Регуляризация, аппроксимация и метод штрафов Замечание 1.1. Задача A.6) — A.8) называется парабо- параболической регуляризацией задачи A.3) — A.5). Такое название объясняется ниже (после того, как уравнение A.3) будет запи- записано в виде системы первого порядка). Доказательство теоремы 1.1. Будем рассуждать как в разд. 5.1 гл. 4. Введем пространства Г = V х V, f)---V X II, Т'= V х V; в пространстве f) скалярпое произведение определим по формуле [ф, г|з] = а (ф0, i|>0) + (Фь ¦ФО» где ф -- {ф0, ф1} е Е) , г|з = {ф0, Ь) 6 f)- Введем обозначения: Перепишем задачу A.6) — A-8), используя эти обозначения: at A.13) ys6?2@, f; Г), У;б^2@, Г; Г'). A.15) Теорема 1.1 будет доказана, если мы убедимся, что выполняют- выполняются условия теоремы 1.2 гл. 3 (этим и оправдывается терминология, введенная в замечапии 1.1). Но, как мы видели (см. формулу E.16) гл. 4), [Ац>, ф1 = 0, поэтому Ьт#еФ, ф] = га (фь ф1) и, следовательно, при X > О иЕф, ф] + А, [ф!2 = %а (ф0, Фо) + IX | Ф1 |2 +еа (фЬ ср4I > > a inf (X, е) || ф |||/э. Отсюда и вытекает справедливость неравенства A.2) гл. 3, т. е. теорема 1.2 гл. 3 действительно применима. Доказательство теоремы 1.2. Умножая скаляр- но обе части уравнения A.6) на производную функции уе, получаем at
§ 1. Регуляризация 301 откуда \y'e(t)\Z+a(ye(t), ye(t)) + 2г\а{у'г{о), y'e(a))da-. о = 12/112 + а (г/о, г/о) + 2 I (/ (a), ye (a)) da. о Отсюда, в частности, следует, что при е -»- О уе остаются в ограниченном ^ .. .„¦. подмножестве пространства L2 (О, Т; f)) х); J ^ }' остаются к ограниченном ¦} ,. .„. подмпожестве пространства L2 @, Г; F). / ^ " ' Следовательно, из последовательности {уг} можно извлечь такую подпоследовательность — мы обозпачим ее тоже через {г/е},— что yb-+z слабо в 7/@, Т; V); 1 y;-»-z' слабо в Л2@, Г; Н). j Так как, согласно соотношению A.17), еЛу'е ->- 0 в простран- пространстве I? (О, Т; V) при е -> 0, то из соотношений A.6) и A.18) заключаем, что yl-+z" = f — Az слабо в L2@, T\ V). A.19) Тогда, в частности, уе @) -> z @) слабо в Я; г/е @) ->¦ z' @) слабо в F'; поэтод!у z @) -- jy0, z' @) -- у^ и в силу единственности решения задачи A.3) — A.5) z — у. Таким образом, мы показали, что ys^-y слабо в пространстве L2 @, Т; I)); остается доказать теперь сильную сходимость. Для этого рассмотрим выражение Хе = I Уг (*) - У (t) I2 + а (уе (t) - у (t), уЕ (t) - у (t)) + t + 2е J а (^ (a), ^ (a)) da. A.20) о Применяя равенства A.6) и A.3), легко проверить, что о - * [{Уг (t), У' (*)) + а (Уг (*), У Ш + 2 (| у, |2 + a (&, ft,))- A-21) -1) На самом дело — даже в некотором ограниченном подмножестве про- пространства Ь°° @, Т; {)).
362 Гл. 5. Регуляризация, аппроксимация и метод штрафов С другой стороны, из тех же равенств A.6) и A.3) следует, что {у" (*), у г (9) + а(у (')> у г @) = (/ О. г/е @), и иоэтому (у; @, ?/' @) + а (Уе @. г/ (*)) = 5 (/ (о), У'г (а) + у (а)) do - , о t — &\а (у'е (а), у' (а)) da -j- | г/, |2 + а (у0, у0). о Подставляя эти выражения в соотношение A.21), получаем Xs~+0 Vt. A.22) Отсюда, в частности, следует, что Уе~>-У сильно в L2 (О, Г; ?)). Замечание 1.2. Па самом деле из соотношения A.22) следует более сильное утверждение: У г @ -> У 00 сильно в V Vt б [О, ТУ, A.23) г/е (if) -> г/' @ сильно в Н. A.24) 1.2. Приложение к задачам оптимального управления Рассмотрим теперь систему, состояние у (v) которой опреде- определяется как решение задачи (см. § 2 гл. 4) у" {и) + Ay (v) - / -|- Bw, A.25) у@; v) -г/о, г/'@; у) ---. у{; A.26) г/ (у) б L* (О, Г; F), у' (v) б /^2 (О, Т; Н), A.27) где 5 6,2? (U; L2@, Г; Д)). A.28) Пусть функция стоимости имеет вид (см. разд. 2.2 гл. 4) (Nv,v)v, . A.29) где С 6%(L*@, Т; II); ЖI), . A-30) N^X{U;U), N > v/, v>0. A.31) 5) Можно также рассмотреть случай, когда С ? jff (?2 (О, Г; V); Ш) (см. разд. 3.4 гл. 4), показав предварительно, что процесс параболической регу- регуляризации сходится также » случаях, когда применяется транспонирование (см. разд. 3.1 гл. 4). Мы не будем подробно останавливаться на этом.
§ 1. Регуляризация 363 Рассмотрим далее состояние уг (v), определенное как решение задачи, являющейся параболической регуляризацией зада- задачи A.25), A.26): i v, s>0; A.32) Уг @; v) = у0, у'г @; v) = уи A.33) в качестве функции стоимости возьмем /е (v) = || Cys (v) - 2д |||у + (Nv, v)v. A.34) Пусть % q — выпуклое замкнутое подмножество пространства 1С; положим / = inf / (v), /е — inf /8 (v), v ZHq, A.35) и доцустим, что и (соответственно иг) — оптимальное упра- управление для системы A.25) — A.31) (соответственно A.32) — A.34)), т. е. и, и& б <Ug, J (и) - /, /Е (ив) = /Е. A.36) Теорема 1.3. Пусть выполнены предположения A.1), A.2), аи, ие — оптимальные управления (см. A.36) и A.35)). Тогда при е -> О иг-+и в И; A.37) Уг{и<>)-+у{и) в L2@, Т; V), ХТ;Н);) {1-^> /8->/- A-39) ДЪ казательство. 1) Согласно теореме 1.2, для любого фиксированного v ?11 Je(v)-+J(v). A.40) Тогда, в частности, /е ^ /Е (и) ->¦ / (и) = j, т. е. lim /Е 5^ /• A.41) 2) С другой стороны, что вместе с соотношением A.41) доказывает ограниченность вели- величины || ue ||^j. л Таким образом, из последовательности {и?} можно извлечь такую подпоследовательность — мы обозначим ее тоже через {ие},~ что uz^w слабое 1l\w?<Ug- A.43)
364 Гл. 5. Регуляризация, аппроксимация и метод штрафов Тогда, согласно теореме 1.2, можно утверждать, что У г Ы -> У И слабо в L2 (О, Т; V), Уг ("е) -> У' И слабо в L2 @; Т; Я). Поэтому lim/e(ue) > J (w), A.44) откуда, сравнивая с оценкой A.41), находим, что w = и и выпол- выполняется соотношение A.39). Таким образом, соотношения A-37), A.38) справедливы в смысле слабой сходимости. 3) Так как Jг («г) -- {СУг ("е), Суе (ue)W + (Л^е. ие)ж — -2(Су,Ы 2д)- И 2д |р -> / (и) и /е @) -> / @), то, полагая (С [у. К) - Уе @)], С [уе (и) - уЕ @)]) + (NuE, иг)ш = -lll».Hlfe. получаем |||ие|||# -> |||и|||^- Поскольку норма |]| • |||^ эквивалент- эквивалентна норме || • ||^, приходим к соотношению A.37); соотноше- соотношение A.38) отсюда следует по теореме 1.2. Замечание 1.3. В силу замечания 1.2 справедливы результаты, аналогичные теореме 1.3, для следующих функций стоимости: / (v) = || Су' (v) - zR Dig + (Nv, v)v, ' A.45) С e% (L2@, T; H); SB) A.46) (см. разд. 2.3 гл. 4); / (v) = \\Doy (T; v) - zn nig, + (Nv, %, A.47) П0?%(Н;<ЖУ) A.48) (см. разд. 2.4 гл. 4); /(v) = \\Dy' (T; v) -zK ||2^ + (Nv, v)v, A.49) D ?X(H\ SB) A-50) (см. разд. 2.5 гл. 4). Замечание 1.4. Ясно, что, применяя результаты гл. 3, можно записать соотношения, характеризующие оптимальное управление иг. Мы сделаем это, считая выполненными условия теоремы 1.3. !) Если Do 6 X (V; ей?), то можно получить аналогичные результаты, применяя метод транспонирования к параболической регуляризации.
§ 1. Регуляризация 365 Запишем уравнение A.32) в виде системы первого порядка; ^^- + <*Jt{v)=l + ?v, A.51) at где (см. разд. 5.1 гл. 4) 3Sv = {0, Bv). A.52) Вводя (как в разд. 5.1 гл. 4) оператор «6#(Ь2@, Т; Щ 38); Щ = Су0, у = {у0, yt), можем записать функцию стоимости A.34) в виде /е (У) = || Ще (v) - 2д ||2да + (Nv, v)n. A.53) Определим сопряженное состояние р8 (uE) = p8 как решение задачи dt \ A.54) Тогда для оптимального управления ие удовлетворяются соот- соотношения A.51) (при v = иЁ), уе @; ие) = {у0, yi), A.54) и A.55) Вернемся к «скалярной» записи. Положим Ре = {РгО, Pel}, Ре = Pel- A-56) Тогда (ср. с разд. 5.1 гл. 4) - Pso + Pel = А ~!С*Л^ [С#8К) - 2„], j — Pel— Apa0 + eApsl = 0; " A.57) Рео(Л = 0, ре1(Г) = О, откуда Ре" + Аре — &Ар'г = С*А<% [СуЕ (иг) - zj; 1 . Неравенство A.55) принимает вид E + Nue, v — г/е)ж>0 Vve<Ug. A.59) Таким образом, оптимальное управление ие ^ ^э ^ля задачи A.32) —A.34) характеризуется соотношениями ^ A 60) A.32), A.33) (мри у = ие), A.58), A.59).
366 Гл. 5. Регуляризация, аппроксимация и метод штрафов Теорема 1.4. Пусть выполнены условия теоремы 1.3, а Ре — сопряж.нное состояние, определенное как решение зада- задачи A.58). Тогда при е —>- О р&-+р в 7/@, Г; V); ) где р — решение задачи р" + Лр = С*АШ [Су (и) - 2д]; Таким образом, р (и) — сопряженное состояние для системы A.25) — A.31) (см. соотношения B.40) гл. 4). Доказательство. Действительно, согласно теореме 1.3, У г (ме) "-*¦ У (и) 1! пространстве L2 @, Т; Н), а потому можно при- применить теорему 1.2 к функциям, удовлетворяющим соотношениям A.58) и A.62). (При этом нужно обратить время, что в данном слу- случае возможно.) Замечание 1.5. В случае Ч1д ¦-- 41 оптимальное управле- управление системой A.25) — A-31) получается из решения задачи A.63) У @) = уо,у'(О) = уп р (Т) = 0, р (Т) = О,. а оптимальное управление для параболической регуляризации A.32) — A-34) получается из решения задачи Уг + Л У г + 8j4 г/е+ В Ы~1А%~В*рг = /, ^ Ре + Л/>е — &Арг — С*Аж.Су& = — С*А^гл; > A.64). уе(О) = уо, y'e(O) = yu реB0 = 0, рвB-) = 0, J а именно 1.3. Приложение к задаче расцепления Пусть <U = L2@, Т;Е), Ш = L2 @, T; F) (см. § 5 гл. 4), а операторы В, С, N определяются так: Bv = «? -> В (t) v», Су = «t-^C (t) у», Nv =z «t—>N (t) v».
§ 1. Регуляризация 367 Введем операторы ?Si и ??2 по формулам E.32) гл. 4. Тогда задача A.64) записывается в виде Для этой задачи выполнены все условия, при которых приме- применима теория § 4 гл. 3. Поэтому справедливо тождество pf. (t) = &е (t) ye (if) + rE (t), A.68) ^(Об-^й;^). <^*(^) = ^e@. A.69) где оператор &>е (^) определяется через решение задачи A.70) JYe _ ^»2ре = о в (.9, Г); at а именно ^e(*)h = ye(s). A.71) Оператор &> e (f) удовлетворяет интегро-дифференциалыюму уравнению типа Риккати - 3>; + ^е.^е + ^*^е + ^e^i^e = %г в (О, Г); \ ^е(Л = 0 • J ( ' или, после исключения оператора <ДЪ, -&'г + {ФгЛ - А&г) + 2е (U ^) 3\ + ^е^^8 = ^2 в (О, Т); A.73) Кроме того, справедливо тождество (см. разд. 5.3 гл. 4) Р (<) = <3> (*) У (<) + *(*), A-74) и тогда по теореме 1.4 получаем г, что при е ->- О ^е@Ь-»-^> (t) Ь в I) Vh6l). A.75) ') Используя результат, аналогичный только что сформулированному для задачи A.70).
368 Гл. 5. Регуляризация, аппроксимация и метод штрафов Это позволяет доказать, что оператор сР (t) удовлетворяет соотношениям в (О, Т); 1 J 1.4. Несколько замечаний Замечание 1.6. Можно также аппроксимировать парабо- параболические задачи эллиптическими. Если, например, состояние у (v) системы определяется как решение задачи (см. § 2 гл. 3) v; y(O;v) = O, A.77) at то функцию у (v) можно аппроксимировать решением уе (и) задачи at и получить результаты, аналогичные теореме 1.3. Замена задачи A.77) задачей A.78) называется эллиптической регуляризацией (см. Лионе [10], Олейник [1]). Замечание 1.7. Можно не менять типа задачи и получить теоремы устойчивости следующего, например, характера. Пусть состояние системы определяется как решение задачи A.25) — A.27). Пусть, далее, {Ат} — последовательность таких операторов, что (Ат(р, 1|з) = ап (ф,4) = а-т И>, ф) ->- а (ф, г|;) Уф, г|з 6 V; 1 A ?дч ат (ф> ф) ^а II ф[|2> «>0 и не зависит от m. J Обозначим через г/т (о) состояние системы, описываемой с помо- помощью оператора Ат, т. е. y"n{v) + Amym{v)=f + Bv; I 80 г/m (О! V) = Уот, Ут @; V) = ylm, J причем Уот-^Уо в ^; Ут-+У1 в Я. A.81) Наконец, пусть функция стоимости для системы A.25) — A.27) имеет вид A.29), а для системы A.80) Jm(v) = \\Cyn(v) - z-A\?m + (Nv, y)a. A.82)
§ 1. Регуляризация 369 Тогда имеют место результаты, аналогичные теореме 1.3 (при этом /е и г/е надо заменить на Jm и ут соответственно). Это позволяет получить теоремы об аппроксимации, если ис- использовать (i) метод Фаедо — Галеркина — для аппроксимации состояния; (и) .метод конечных разностей — также для аппроксимации со- состояния (в этом случае возникают дополнительные технические трудности1)); см. Боссави [1], Неделек [1]. Замечание 1.8. Аналогичные результаты о сходимости справедливы и для некоторых нелинейных систем. Замечание 1.9. Методы, описанные выше, не следует путать с методом регуляризации управления (см. разд. 1.5). Замечание 1.10. Необходимо иметь в виду, что управ- управляемость не является устойчивой относительно регуляризации и аппроксимации. 1.5. Регуляризация управления Пусть выполнены предположения разд. 8.3 гл. 3. Состояние системы определяется как решение задачи Л . . .| = / в <?, f?L2(Q); } dt I A.83) = v; у @; v) = y0 на Q, dvA где v б % = L2 (S) = L2 @, T; L2 (Г)). A.84) Функция стоимости имеет вид J (v) = I [y (v) I* - 2Д]2 dX + (Nv, v)L4s). A.85) Предположим, что <Ua =-- {v | v e eU, v (t) 6 К почти всюду}, A.86) где К — выпуклое замкнутое подмножество пространства L2 (Г). Введем более регулярное пространство управлений ^6L2(S)}, A.87) dt J) Весьма серьезные, например, при аппроксимации ядра If (x, оператора ^° (t). 24-1230
370 Гл. 5. Регуляризация, аппроксимация и метод штрафов представляющее собой гильбертово пространство с нормой Затем введем множество <и1а = <и1 [\<Ua A.88) Щ\ — выпуклое замкнутое подмножество пространства Ш1) и определим регуляризованпую функцию стоимости J* (v) = \ [У И Is - znf с® + (Nv, v)L2& + е || v' |||,w> e > 0. A.89) s s Регуляризованная задача управления состоит в отыскании inf Je(v). Очевидно, что существует единственный элемент ие ?%а, для которого /e(wE)= inf /e(y). A.90) Теорема 1.5. Пусть состояние системы определяется как решение задачи A.83), а функция стоимости и регуляризованная функция стоимости имеют вид A.85) и A.89) соответственно. Пусть множества <Ug и 11\ определены, соотношениями A.86) и A.88) соответственно. Тогда при г ->- 0 иЕ-+и в L2 (!>), A.91) inf /е(у)-». inf /(у).. A.92) ве^ re '/а Дока з~а тельство. 1) Так как °ИЬ cz 41 g, то /e(«e)> inf ^"(у)> i^ /(у) = /(м). A.93) Докажем следующее утверждение: для любого г] > 0 существует такое 8 (т]), что ) ,. Q/. /в(иеХ/(и) + т| при е<е(л). 1 <llJi) Для этого выберем элемент w ?ШЬ так, чтобы J(w)^J(u)+~i\. A.95) Это возможно, поскольку множество °11\ плотно в множестве <Ug. Действительно, пусть и есть продолжепие функции и на действи- действительную прямую R(, причем и ? L2 (R(; Z,2 (Г)) и и (t) ? К почти
§ 1. Регуляризация 37' всюду (такое продолжение, очевидно, существует). Регуляриауя затем функцию и: u*pn = wn, рпеЗ>(Щ, рп>0, J pndt = l, A.96) — оо убеждаемся, что (в силу теоремы о выпуклости) wn (t) ? К почти всюду. Обозначая далее через wn сужение функции wn на интер- интервал (О, Г), находим, что wn ? °li\ и при п -> оо wn-+u в L2 (О, Т\ L2-(Y)). Следовательно, имеет место неравенство A.95). По тогда 1 Je (ue) ^ J& iw) ^ J iu) + -К- 'Ц — е II " Z откуда и следует A.94), если взять е (r\) || w' \fm^)- Из утверждения A.94) в свою очередь вытекает неравенство Шп /е (ие) < / (и), . A.97) которое вместе с неравенствами A.93) доказывает соотношение A.92). 2) В силу сказанного С ^ /е (ме) ^ v || гге ||L2(i.) -f- e || Ug ||l2B). Значит, из последовательности {ие} можно извлечь такую подпо- подпоследовательность — мы обозначим ее тожо через {ие}, — что us -> и0 слабо в %; и0 ?Ша. С другой стороны, lim /E (u)>lim / (ue)>J (u°), что вместе с неравенством A.97) доказывает справедливость соот- соотношения A.91) в смысле слабой сходимости. Далее поступаем так же, как в части 3 доказательства теоре- теоремы 1.3. Полагая ИИ12= I [У (У)-у @)]2dX + (Nv, y)L,B), легко проверить, что ||| иг\\\2 + е\\\ Ие|||ЬB) -> ||| "|||2; поэтому При 8 -V О т. е. выполняется соотношение A.91). Замечание 1.11. Запишем совокупность соотношений, характеризующих оптимальное управление ие. Сопряженное 24*
372 Гл. 5. Регуляризация, аппроксимация и метод штрафов состояние р (ие) определяется как решение задачи at dp (ue) = У Ы - «д «а 2, A.98) (х, Т; и&) = 0 на й. Для оптимального управления иг g ?/a удовлетворяются соот- соотношения A.83) (при v = ие), A.98) и 1/,. A.99) Из теоремы 1.5 следует, что при е —>- О ие) —>- р [и) в L (и, 1; 11 Пример. Пусть К --- {/ |/>0 почти всюду на Г, / g L2 (Г)}. Тогда оптимальное управление а& получается из решения одно- односторонней граничпой задачи А*рг = 0 в Q; dt dt дх ¦ = Уг — 2д, А* dv , !¦ на S; <)t' \ dvA IJ ¦ —— = О ПРИ t = 0 и t — Т, dt \dvAl Уг {х, 0) = уо (х), р (х, т) = о, х е а, а имеппо
§ 2. Аппроксимация системами типа Коши — Ковалевской 373 § 2. Аппроксимация системами типа Коши — Ковалевской 2.1. Эволюционные уравнения на многообразии Пусть QcR" — ограниченное множество с регулярной гра- границей Г, а оператор А определен формулой ^ - | A L, {х) ^L) + аЛ B.1) г, /=1 OXi \ OXj I где ац 6 C2(Q), a0 6 L°°(Q). Введем также форму а(ф, tjj)= 2 Sa^T^"^T" Х 1 i,/=ia OXj охг Q I B 2) J 1(й). J а(ф, Ф)>а||ф|||мй), а>0, Замечание 2.1. Исследуемые ниже задачи можпо рас- рассматривать и в случае, когда коэффициенты a-j, a0 зависят от t (являясь измеримыми ограниченными функциями t), а также в слу- случае эллиптических операторов произвольного порядка.С незна- незначительными техническими изменениями излагаемый далее метод применим и в случае, когда а0 ¦< 0. Состояние у (v) системы определяется как решение задачи Ay(v) = Q в Q (и при любом 6@, Т)); B.3) Ш+Ш = иыЪ==Тх{0,ту, B.4) dt dvA y(x,O;v) = yo(x), xeT. B.5) Нужно, очевидно, начать с определения решения задачи B.3)— B.5). Покажем, что эта задача того же типа, что и рассмот- рассмотренные в § 1,2 гл. 3, так что мы "имеем дело с параболическим эволюционным уравнением па границе Г. Оператор А. Пусть h — данный элемент пространства z (Г). Существует такая единственная функция ф 6 Н1 (Q), что Aty = 0 в Q; ф = h на Г. B.6) Тогда (см. Лионе и Мадженес [1, гл. 2]) можно определить производную дУр/д\А как элемент пространства Н~г/г (Г). Зада- Зададим оператор А формулой {|^} B.7)
374 Гл. S. Регуляризация, аппроксимация и метод штрафов яспо, что А??{Ит{Т); 1Гт{Т)). B.8) Л е м м а 2.1. Для любого h 6 Я1/2 (Г) справедливо неравенство (Ah, ЩТ = I (Ah) ft df > a41| А Ц2нуЧг), a* > 0. B.9) г Доказательство. Так как = - J^Itj) ЙГ + а (я|>, ф) = 0,. то (Ah, h)r = а (г|), г|?) ^ а \ Таким образом, задачу B.3) — B.5) можно переформулиро- переформулировать следующим образо.м: пусть пайти решепие у задачи х) dy . dt = v в @,Т); B.11) у(О) = и,наГ. B.12) Ур-авнепие B.11) с начальным условием B.12) подпадает под рассмотренный в § 1 гл. 3 тип задач, если считать, что V = H (Г), Н = Ь2(Г), 7' = Я"/2(Г), а оператор А заменеп оператором А. Предположение A.2) гл. 3 выполняется (при Я = 0) в силу неравенства B.9). Следовательно, если г; б L2 (О, Т; L% (Г)) = I/ (Е) 2) и г/0 € L2 (Г), то задача B.11), B.12) имеет такое единственное решение, что у?Ь2 (О, Т; Я*/* (Г)), у' е ^2 (О, Г; Я"!/2 (Г)). B.13) Для^отыскапия функции у остается еще решить задачу Ay (x, t) = 0 в Q, t фиксировано (почти всюду); 1 • у (х, t) = у (х, t) на Г. J Таким образом, справедлива х) Для краткости записи зависимость функции у от управления о но указана. 2) В более общем случае v ? V- (О, Т; //-1'2 (Г)).
§ 2. Аппроксимация системами типа Коши — Ковалевской 375 Теорема 2.1. Пусть выполнено предположение B.2), a v — данный элемент пространства L% (H). Тогда существует един- единственная функция у (v) — у, являющаяся решением задачи B.3) — B.5) и удовлетворяющая условию у е L* (О, Т\ IP (О)). B.15) Замечание 2.2. Уравнение B.11) представляет собой параболическое уравнение на многообразии Г, а оператор А — псевдодифференциальный эллиптический оператор первого поряд- порядка на многообразии Г. Задача управления. Пусть фупкция стоимости имеет вид 1) J М = | [у (v) - гл]2 dZ + (Nv, v)L4»; . v?qi = L2 (E); Л" e X (Lz (I), L2 B)), N > v/, v > 0. J BЛ6) Ищется 'U где I/^ — выпуклое замкнутое подмножество пространства 41. Условие оптимальности управления и^°Цэ таково: \ [у (и) - 2д] [у (v)-y (и)] dl + (Nu, v - u)L4z) > 0 Vi; 6 «e. B.17) Можно применить результаты разд. 2.3 гл. 3. Определим со- сопряженное состояние р (и) как решение задачи + Ар()у()*Дыъ} ) = 0 на Г. J Тогда неравенство B.17) эквивалентно неравенству J [р (и) + Mt] (w - и) dS > 0 Vy6^s- B.19) 2 Л е м м а 2.2. Оператор А* определяется следующим образом: решим задачу = 0 в О, х]г = *. B.20) B.21) /с — данный элемент пространства Н1/* (Г); тогда A*k = - dvA* -1) Можно также рассмотреть функцию стоимости, соответствующую финальному наблюдению.
376 Гл. 5. Регуляризация, аппроксимация и метод штрафов Доказательство. По формуле Грипа имеем г г dvЛ* а потому (Л/г, к)Г= 1^>5 ) 5 отсюда и следует равепство B.21). Используя лемму 2.2, можно утверждать, что задача B.18) эквивалентна задаче А*р(и) = 0 в Q (и при любом *е@, Т)); л p {xz T; u) == 0, ж 6 Г (и р(и)=р(и) на поверхности S). Таким образом, доказапа Теорема 2.2. Пусть выполнены условия теоремы 2.1, а функция стоимости имеет вид B.16). Тогда для оптимального управления и?11д удовлетворяются соотношения B.3) — B.5) (при v = и), B.22) и J [p (u) + JVu] (у — u)dS>0 Vveilg. B.23) Пример 2.1. Если 1lg = 11, то для отыскания оптималь- оптимального управления необходимо найти решение задачи Ау = 0, А*р = 0 в п (и при любом *6@, Л); B.24) г/ (ж, 0) = г/0 (ж), р (х, Т) = 0, ж 6 Г. Пользуясь введенными выше обозначениями i/, p, эту задачу можно переписать в следующем виде: 3' ' 3* ' } B.25) 'у{О) = уо, р(Т) = 0. J Тогда и = — iV/? k = — N^p. B.26) Задача B.25) допускает расцепление (см. § 4, 5 гл. 3). Именно, справедливо тождество р (t) = P (t) у (t) + 7{t), B.27)
§ 2. Аппроксимация системами типа Коши — Ковалевской 377 где dt — dt B.28) B.29) Уравнепие B.28) представляет собой пелинейное параболи- параболическое интегро-дифференциальное уравпение типа Риккати на мно- многообразии Г X Г. Теорема Шварца о ядрах в рассматриваемом сейчас случае позволяет представить оператор Р с помощью его ядра Р (х, ?, t), являющегося распределением па произведении Гж X Г|. Заметим, что ядро А (х, |) оператора А не сосредоточено па диагопали Гж X Г|, так как А не является дифференциальным оператором. Соотношение B.27), естественно, можно «распространить» с границы Г на все множество Q. Следовательно, существует опе- оператор Р (t) 6 X (?2 (&);L2 (^)), удовлетворяющий, в частности, условию p(t) = P (t) y(t) (t). B.30) Пример 2.2. Рассмотрим теперь случай, когда <Ug = {v I v > 0 почти всюду на 2, и € Ьг B)}.* B.31) Оптимальное управление получается из решения односторон- односторонней граничной задачи Ау = 0, А*р = 0 в Q (и при любом др , Г)); dvA* dt ' — У - dt d\ y(x,O) = : а именно at dt dvA p (x, T) = 0 на Г, „ _^j_ J?LHa v U, — , -t- -z tld Zj ^L)>O на S, B.32) на S,
378 Гл. 5. Регуляризация, аппроксимация и метод штрафов Замечание 2.3. Можно рассмотреть аналогичные задачи, содержащие производные второго порядка по t, например: Ay(v) = 0 в Q (и при любом t?@, T)); Л Щ> Ш | B.33) у(х,0; v) = yo(x), dy{x:°'v) = yi(x) на Г, dt где г/0 и г/i — данные элементы, принадлежащие пространствам Н1^ (Г) и L2 (Г) соответственно; при этом предполагается, что А = А*. B.34) В этом случае мы приходим к задачам гл. 4 — но па многообра- многообразии Г, а не на множестве Q. Здесь также можно применить пара- параболическую регуляризацию (см. § 1). 2.2 Аппроксимация системами типа Коши — Ковалевской Рассматриваемая в открытом множестве Q (а не на многооб- многообразии Г), задача B.3) — B.5) не является задачей типа Коти — Ковалевской. Мы увидим, что ее, однако, можно очень иросто аппроксимировать параболической задачей тина Коши — Ковалев- Ковалевской в области ii. Для е >> 0 определим состояние уг (v) как решепие задачи ?ММАуй(и) = 0 в ИХ (О, Т); B.35) dt dt dvA ys (x, 0; v) — г/о {х) на Q, B.37) где функция г/о удовлетворяет условиям Ау0 = 0 в Q; у0 - г/0 па Г г). B.38) Задача B.35) — B.37) — типа Коши — Ковалевской в обла- области Q — имеет единственное решение. Действительно, она эквива- эквивалентна задаче (г/? (t; v) = г/е (i)) . е -— (г/е @, t) + -7Г (Уг (t), ip)r + «(j/e @. Ф) = csj at = (v(t),ty)r Утр?Н1(п); B.39) Уг @) = »о, B.40) *) Эта задача (см. Лионе и Мадженес [1, гл. 2]) имеет единственное реше- решение в пространстве //I/2 (Q); потому, в частности, у ? L2 (Q).
§ 2. Аппроксимация системами типа Еоши — Ковалевской 379 обладающей единственным решением (см. § 1 гл. 3), причем у г (v) e L* (О, Т; Я1 (Q)); t -> уе (t; v) - \ ,, непрерывное отображение [0, Я-> JJ (Q). X ' ' Теорема 2.3. Пусть в условиях теоремы 2.1 функция yz{v)— решение задачи B.35) — B.37), B.41). Тогда при е -> О У г (Р) ~+y{v) в L* (О, Т; Ю (Q)). B.42) Доказательство. Будем писать уе (соответственно у) вместо уе (v) (соответственно у (v)). Полагая в равенстве B.39) г|з = уг и интегрируя, получаем + ^ || уе (Т) |!2Jj2(r) + } а (уе, уе) dt = ] ( ) dt + || |1 + II = ] (v, уг)г dt + || О л • ^ Отсюда заключаем, что г/е остаются в ограниченном ) . ^ ,о\ иодмпожестве пространства L2@, Т; Н1 (&)); ] ' \\уЛТ)\кчт)<С, -}/~?\\Уг(Г)\\ьЧп)<С- B-44) Следовательно, из последовательности {уп} можно извлечь такую подпоследовательность — мы о.бозпачим ее тоже через, {У г},— ЧТО уг-^г слабо в L2 (О, Т; Н1 (Q)), B.45) Уе (Т) -> X слабо в 1} (Г). B.46) Пусть ф 6 ^([0, Я; ЯЧй)); из равенства B.39) (при -ф = ф) следует, что г = J (и (<), Ф)г d* + е (у0> ф @)) + (г/о, ф @))Г - о - е (у. (Л, Ф (Л) - (г/? (Т), ф (Л)Г. B.47) В силу соотношений B.45) (из которого вытекает, что г/е |s -»- z |s в пространстве L2 B)), B.46) и B.44) в равенстве B.47) можно перейти к пределу при е ->- 0. Тогда получим - } (z, ф')г dY + \a (z, 4>)dt=\ (v, Ф)г di + (г/0, Ф @))Г - (Х, Ф (Л)г- ооо B.48)
380 Гл. 5. Регуляризация, аппроксимация и метод штрафов Если взять функцию ф такой, что ф (Т) = 0, то из равенства B.48) получаем z = у и далее (х, ф (Г))г = (У (Т), Ф (Т))т, . т. е. % = у (Т). А тогда из соотношений B.45), B.46) следует, что уг-+у слабо в L2@, Т\И*Щ, Уг{Т)-*у{Т) слабо в ?2(Г). B-49) Рассмотрим выражение т с 6 Привлекая уравнения, которым удовлетворяют функции уг и у, получаем: г т %г = J [(у« Уе)г + fa, J/)r] ^ — Па (Уе» ») + й ( о о Следовательно, при е -> О т Х?-> 2 ) [(у, у)г - а (у, у)] dt — \\y (Г) ЦЬ(г) + 11 Уо llW) = О, о откуда и вытекает соотношение B.42). Наряду с задачей оптимального управления разд. 2.1 поста- поставим следующую: найти inf Je(v), B.50) где Л {v)=l\ Уг (v) - *д |2 dS + (Nv, v)LH&, B.51) 2 а г/е (v) — решение задачи B.35) — B.37); элемент, на котором реализуется B.50), обозпачим через иг. Из теоремы 2.3 теми же рассуждениями, что и при доказатель- доказательстве теоремы 1.3, получается
§ 2. Аппроксимация системами типа Коши — Ковалевской 381 Теорема 2.4. Пусть выполнены условия теоремы 2.1. Пусть для любого е > 0 состояние у? (у) определяется как решение зада- задачи B.35) — B.37), а функция стоимости /е (i>) имеет вид B.51). Тогда при е -> О Ые_> и в U = U- (I), B.52) 2/е («г) -> г/ И в TJ (О, Г; Я1 (Q)), B.53) /е (ие) -> / (а). B.54) Для отыскания оптимальпого управления иЁ ?11$ можно использовать результаты гл. 3. Определим сопряженное состоя- состояние рг (иг) как решение задачи Lhl -j- А*ре {ие) = 0 в ?2 X (О, Т); 1 — g- B.55) (иг) = О ПРИ ж 6 ?2> ^ — ?"• J Теорема 2.5. Для оптимального управления ие ? %а аппроксимирующей системы типа Коши — Ковалевской удовлет- удовлетворяются соотношения B.35) — B.37) (при v = »е), B.55) и $ГРе(Ие)+-^"в](у —«e)d2>0 ^V^4la. B.56) V Заметим также, что, применяя теорему 2.3 (при обращенном времени) к задаче B.55), получаем Ре К) -> Р (и) в V (О, Г; Я1 (fi)). B.57) Пример 2.3. Пусть ILg — 'U. Тогда оптимальное управ- лепие получается из решения задачи dt dt dt дуг dvA N р? = dt dvA* уе (х, 0) = ^о (ж), Рг (ж, Т) = 0, ж 6 fi, М>Ё = 0 в (?; на 2; на 2; [ B.58) а именно B.59^ Если {г/, р} — реашние задачи B.24), то при е -»- О {Уе. Р*}-+{У, Р}
382 Гл. 5. Регуляризация, аппроксимация и метод штрафов Можно расцепить задачу B.58) — по аналогии с § 4, 5 гл. 3. В результате получим Ре (t) --= (t) (t), B.60> где оператор РЕ удовлетворяет интегро-дифференциальпому урав- уравнению типа Риккати (ср. с разд. 5.2 гл. 3): - е а* (РеФ, я|)) B.61) B.62) а функция гг является решением задачи - е (г; г|з) - (г; г|;)г + a* (re, if) + (A' ге (Г) - 0. При ё -> 0 имеем, в частности, в L2 (Й) V-ф € Я1 (Q). B.63) B.64) B.65) Замечание 2.4. Было бы интересно провести прямое дока- доказательство существования и единственности решения задачи B.61), B.62) во всем интервале (О, Т), а также соотношения B.65) (которое, впрочем, может быть улучшено). Пример 2.4. Пусть множество ^ определено, как и в дри- мере 2.2. Тогда оптимальное управление получается из решения односторонней граничной задачи ^ at dt at dt dt dvA \ dt dvA I L \ dt dvA ys (x, 0) = y0 (x), Рг (x, T) = 0 на Q, ^0 на 2; = 0 на 2; 2) Устанавливая равенство B.61), отметим, что оператор Ре удовлетво- удовлетворяет также условию в(Реф, ч|з) + (.Рьф, гE)г=е(ф, РЕ11')
§ 2. Аппроксимация системами типа Коши — Ковалевской 383 а именно i* ду^ на z> B6?) dt dvA Если {у, р} — решение задачи B.32), то при е—у О {Уе,рг}-+{У,Р} в (?2@, Т; II1 (Q))J. Замечание 2.5. В случае, когда состояние системы опре- определяется как решение задачи B.33), можно рассматривать следую- следующую аппроксимацию задачей типа Коти — Ковалевской в обла- области Q: dt л Я// |т Г}1 7? 1 л ^ г/Е (х, 0; у) = г/0 (х), ' " ' ' == г/4 (х) на Q, где функция г/о удовлетворяет условиям Лг/о = 0 в Q; г/о = г/о па Г (фупкция г/i удовлетворяет аналогичным условиям). 2.3. Линеаризованная система Навье—Стокса Пусть состояние у (v) = {у0 (v), yn+i (v)} системы определяет- определяется как решение задачи r)=f-f-v в Q dt 1 divyo(v) = O в<? [ B.69) 5'o(v) = fi/oi(v), ••-, Уоп(у)}=О на S, | у0 (ж, 0; v) = у0 (х). J Это линеаризованная система Навье — Стокса. Можно точнее сформулировать задачу B.69). Рассмотрим про- пространства У = {ф | Ф 6 G/J (Q))n, div ф = 0}, ) Я = {ф | Ф € (L2 (Q))n, div Ф = 0}, J ^-/U; представляющие собой замкнутые подпространства пространств
384 Гл. 5. Регуляризация, аппроксимация и метод штрафов {Н\ (Q))n и (I? (Q))n соответственно. Положим j—1 и i, j=i q dXj dXj Ставится задача отыскания такой функции у0 (v), что у @; v) = уо в Я, v-dx. B.71) B.72) где f, v — элементы пространства (L2 ((?))". Таким образом, при переходе к вариационной «формулировке» этой задачи «исключается» функция г/п+] (v). Задача B.71), B.72), согласно теореме 1.2 гл. 3, имеет един- единственное решение, для которого у0 (*; v) € V @, Т; V). Если функция стоимости имеет вид J (v) = 11 Уо (х, t; v) - гд |2 cfa: at + (iVv, B.73) B.74) где ^ = (L2 (Q))n, то применимы результаты § 2 гл. 3. Для опти- оптимального управления и ? <?/,? удовлетворяются соотношения B.71), B.72) (при v = и), - -f- (Po (u), а (ро (и), ф) = (у( и) - гД, ф) Ро(Г;и) = О; po(uN^2(O, T; V); (р0 (u) f Лги, v — и) > 0 Vv 6 Uд.. B.76) Задачу B.69) можно аппроксимировать следующей задачей типа Коши — Ковалевской: для е > 0 определим {yj, Уп-\л) как решение задачи d/o(v) dt ¦ - Ауое (v) + grad угп+1 = t + v в «?; dt yl (x, 0; v) = y0 (a:), ysn+i (x, 0; v) = g (x), x 6 Q; У? (v) 6 L2 @, T; (Hi (Q))n), yUi (v) 6 Ь°° (О, Г; L2 (?2)), J B.77)
§ 3. Метод штрафов 385 где g — произвольный элемент пространства L2 (Q). Можно показать (тем же методом, что и при доказательстве теоремы 1.2 гл. 3), что задача "B.77) имеет единственное решение, причем при е -> О yS(v)-*yo(v) в L2@, T; A1Ъ(Щп). B.78) Если определить функцию стоимости как /е (v) = $ I Уо (х, f, v) - ъ.л |2 dx dt + (Nv, x)y, B.79) Q то легко убедиться, что при е -> О inf /e(v) = /e(ue)-»-/(u)= inf /(v), B.80) B.81) Уо(ие)^Уо(и) в Ьг@,Т;(И1(.ЩП B-82) Таким образом, справедливы результаты, аналогичные ука- указанным в разд. 2.3. Замечание 2.6. Такие же результаты могут быть полу- получены и для нелинейной системы Навье — Стокса (случай, когда управление отсутствует, рассмотрен Лионсом [11]). § 3. Метод штрафов Рассмотрим случай 3.2.2 § 3 гл. 3. Состояние у {и) системы определяется как решение задачи dt ду(и) = v па 1, иеЬ2B); C.2) dvA у (x, 0; v) = i/o (х), х 6 О, г/о € L2 (Q), C.3) где Л -— Л (х, t, д/дх) — эллиптический оператор второго порядка. Пусть 11 -— L2 B), "Uв—выпуклое замкнутое подмножество в 41. C.4) Предположим, что наблюдение финально, так что функция стоимости имеет вид J(v)=[ [у (х, Т; v) - 2д {x)fdx -f (Nv, v)L2is); \ a i C-й) N ?? D1; 41), N^vl, v>0. 25-1230
386 Гл. 5. Регуляризация, аппроксимация и метод штрафов Ставится следующая задача: найти inf / (v) = /; C.6) оптимальное управление для этой задачи обозначим через и. Аппроксимируем эту задачу семейством вспомогательных за- задач, где у и v будут независимыми переменными. Определим пространство dt dv Л 2 C.7) Заметим, что это определение имеет смысл. В самом деле, если y?L2@, Т; Н1 (Q)) mdy/dt~\- Ay E.L2(Q), то можно определить произ- производную dy/dvA на >] (с помощью формулы Грина — см. Лионе и Мад- жепес [1, гл. 41), причем dy/dvA ? L2(Z). Легко видеть, что про- пространство У, снабженное нормой ду_ dt Лу L4Q) ду_ dvA 1/2 C.8) является гильбертовым пространством. Далее, положим е = _{ei, е2, 83}, е? > 0, i = 1, 2, 3, и определим на произведении Y X 11 функционал Je ('/, v)=$[y (x, T) - 2д (x)f dx + (No, v)u + dt + Ay-f + L4Q) E2 — [[y(x,0)-yu(x)fdx. C.9) C.10) f-з "
§ 3. Метод штрафов 387 Теперь рассмотрим новую задачу (говорят, что она получается из задачи C.6) введением штрафов1)): найти inf Cfz(y, v)r=js. Y C.11) Теорема 3.1. Задача C.11) имеет единственное решение {Уг, Ue}. C.12) Доказательство. Рассмотрим однородную часть вто- второй степени квадратичной формы J е (у, v): Р (У, »)=\У2 (х, Т) dx -f (Nv, v) f JL e3 h ду dt Достаточно показать, что 2 C.13) Так как (Л'у, P ОмО> следовательно, vlh 1 е3 i > 'Ifc * 2 V + II у 1 ll^i ТО ^-_ а 41 (x, T)dx; dt 2 I-2(Q) 1 \ 2 , 1 е2 / Ь т ч ду -± А dt ' 2 dvA 2 2 II II Q 3.!/ д\'л \ ч откуда и получаем перапенство C.13) (причем константа С зави- зависит от е). J) Множители 1/ег- характеризуют величину «штрафа», если соотноше- соотношения C.1) — C.3) не удовлетворены точно. 25*
388 Гл. 5. Регуляризация, аппроксимация и метод штрафов Теорема 3.2. Если е -- {вь е2, s3} -»- 0, то /е- Л C-14) иг-+ и в 41, C.15) Уг-».у(и)вУ. C.16) Доказательство. 1) Так как при у — у (и), v -~ и характеризующие «штраф» слагаемые в выражении C.10) равны нулю, то ^ е (У г, Uг) {У (U), U) - C.17) 2) В силу оценки C.17), функция JЕ (уг, ие) ограничена, а по- потому, используя выражение C.10), заключаем: dt dv» — и. Отсюда следует, что dt i<4Q) — uc dvA ° V \\ye(x, O) — yo\\L4ii) Поэтому, в частности, при 8 —v 0 множество функций dye/dt-\-AyE ограничено в L2(Q); множество функций уе (х, 0) ограничено в LZ(Q); ^множество функций dye/dvA ограничено в L2(Z), C.18) C 19) C.20) C.21) C.22)
§ 3. Метод штрафов 389 i тогдаx) иножество функций уе при е-> 0 ограничено в Ьг@,Т;Н*(п)). C.23) Соотношения C.19) — C.21), C.23) показывают, что множе- етво функций уе ограничено в пространстве Y при е -> 0. Следо- Следовательно, можно извлечь такую подпоследовательность {уе, ие}, «то уе-*-у слабо в У, 1 ,„„.. itt-*-u слабо и 11; и^Ч1д. ) Используя еще раз неравенства C.19) — C.21), заключаем: dy ,~ ^ дг ¦ \- А у = f в (J; —^ отсюда видно, что ~У = У(Ц)- C.25) Так как Зг {Ус, Us) > \ [Уе (*, Т) — Zj2 dx + (Nu&, иг)ш C.26) а я уе(х, T)-+y(z, T) слабо в L2(Q), то неравенство C.26) влечет неравенство lim Je (уе, щ) > I [у (х, Т) - 2д]2 dx + (NZ, u)%, и или в силу C.25) lim Js (уЁ, щ) ^zJ(u). C.27) Неравенства C.17) и C.27) показывают справедливость соот- соотношения C.14), а также равенства и — и. Следовательно, утверж- утверждения C.15), C.16) справедливы в смысле слабой сходимости. 3) Остается показать, что эти утверждения справедливы и ') В силу теоремы 1.2 гл. 3 (ср. с разд. 3.2 гл. 3).
390 Гл. 5. Регуляризация, аппроксимация и метод штрафов в смысле сильной сходимости. В самом деле, рассмотрим представ- представление / г/т\ _ / \ j I i _2 / \ j__ е, Ив) = «е + Ре - 2 й где ае = i г/е (ж, Т) dx + (ЛГме, Так J где как г(Уг, 1 1 «е) + i = j (и а = 0) .) = а Ь2(* «в 2^ г/0 ж — '^) у ( • Т- '1 -» ! а) Л 1 ег дУе ¦ ue !2 X, 1 , ibj ^д ^Х^ tiX -f~ J Лд Q ; + (ЛГ? (х) dx, то а6 J- Р5->а. Однако limae>a (в силу слабой сходимости), а потому a?+a, C.28) РЁ->0. C.29) Из соотношения C.28) вытекает, что ие~> и сильно в 41, т. е. утверждение C.15) справедливо. Тогда dyJdvA —у и сильно в 41 — = L2 (?) и, поскольку, как мы уже знаем, я,, AyE-*-f сильно в L2(Q), dt уг (х, 0) —>- г/о (ж) сильно в L2(Q), утверждение C.16) справедливо. Замечание 3.1. Тем самым мы еще раз доказали оценки C.19) — C.21), причем в силу соотношения C.29) с произвольно малой кэнстангой С для достаточно малого | е |. Замечание 3.2. Мы изложили метод штрафов на примере задачи C.1) — C.3), однако это общий метод. Он применим с небольшими естественными видоизменениями также в случае линейных эллиптических, параболических и других задач, рас- рассмотренных в предыдущих главах.
§ 3. Метод штрафов 391 Замечание 3.3. Можно, очевидно, охарактеризовать пару {Уе> ие}> привлекая развитые в предыдущих главах методы. Тогда мы придем к новым односторонним граничным задачам. Замечание 3.4. Можно применить аналогичные цриемы для исследования систем, описываемых нелинейными уравнениями € частными производными. Например, если состояние системы определяется, как в разд. 15.2 гл. 3, а функция стоимости имеет вид A5.6) гл. 3, то можно ввести функционал (у, v) = J [у (х, Т) - гя(x)f a J J%-+Ay + vy - f dt — \\y(x,O)-yo(x)\fL4Qh определенный на векторном пространстве ') У Хв управлений v 6 % — L°°(Q) и таких функций у ? У, что at Можно показать, что если {уе, ие} реализует минимум функ- функционала 3 г (у, v), то можно извлечь подпоследовательность, слабо сходящуюся к оптимальной паре (у(и), и} в произведении YU Примечания Метод параболической регуляризации разд. 1.1 используется также в кни- книге Лпонса и Мадженеса [1, гл. 3]. Применяя этот метод, совокупность соотно- соотношений, характеризующих оптимальное управление в задачах гл. 4, можно получить предельным переходом, исходя из результатов гл. 3. Именно так мы и поступили в разд. 1.2 и 1.3. Идея, близкая к использованной при доказательстве теоремы 1.5, содер- содержится в работе Тихонова [1]. Задачи, подобные рассмотренным в разд. 2.1, но при отсутствии управ- управления, изучаются (другим методом) в книге Лионса [3, гл. 6, § 6]. См. также Фридман и Шипброт [1], Лионе и Маджеиес [1]. Такие задачи встречаются в приложениях — см. Гарппов [1]. Аппроксимация задачами типа Коши — Ковалевской была предложена (для удобства использования метода конеч- конечных разностей) Лионсом [11]. В разд. 2.3 мы ограничились линейными уравнениями Навье — Стокса. Используя работы Лере [1], 12], [31 и Ладыженской 12], можно (как указано в замечании 2.6) перенести результаты разд. 2.3 о существовании и аппрок- д) Хотя дифференциальный оператор не является линейным, фупкция у принадлежит векторному пространству благодаря специальпой структуре этого оператора. 2) Следовательно, У = Л2,1 (Q) П L2 (О, Т\ НЦп)), если коэффициенты оператора достаточно регулярны.
392 Гл. 5. Регуляризация, аппроксимация и метод штрафов симации на нелинейный случай (вопрос о единственности оптимального управления не решен). Управление системами, описываемыми уравнениями Навье — Стокса, в стационарном случае изучал Госсе [1]. Метод штрафов в том виде, в котором он предложен в § 3, является, насколько нам известно, новым. Обычно рассматривают (см. работу Куранта [1] п весьма шюгочисленпыеисследовагишнонелииейиому программированию) «штраф» за невыполнение ограничения, тогда как здесь мы вводим «штраф», относящийся к уравнению состояния. Этот вариант метода штрафов был раз- разработал (в августе 1967 г. в Лос-Анджелесе) в сняли с потребностями вычисли- вычислительных задач, относительно которых см. работу Ивоиа |1]. См, также Бала- кршипан [4], [5], Бенсуссал и Кенпет [1]. Этот же метод для изучения неко- некоторых дифференциальных игр применял Тартар [1]. Вариант этого метода оказался весьма полезным при исследовании стохастических задач опти- оптимального управления — см. Бепсуссаи [1], Беисуссап и Лемарешаль [1].
Библиография1) А г м о и. Н и р е if б е р г (A g m о n S., N i г е n b е г g L.) [1] Properties of solutions of ordinary differential equations in Banacli space, Comm. Pure and Appl. Math., 16 A963), 129—239. [2] Lower bounds and uniqueness theorems for solutions of differential equations in a Hilborl space, Comm. Pure and Appl. Math., 20 A967), 207—229. Агранович М. С. В и ш и к М. И. [1] Эллиптические задачи с параметром и параболические задачи обще- общего вида, У МП, 19. Л'» 3 A964), 53—161. А д а м а р (Н a d a m а г d J.) [1] Le probleme de Cauchy et les equations aux derivees partielleslineai- res hyperboliques, Paris, 1932. Аксельбанд (A x e 1 b a n d E. I.) [1] A solution to the optimal pursuit problem for distributed parameter' systems, /. Comput. and System Sci., 1 A967), 261 — 286. А м б а р ц у м я ii 13: A. [1J К вопросу о диффузном отражении света мутной средой, ДАН СССРГ 38 A943), 257—261. Аннин (Ann in В. D.) [1] Existence and uniqueness of the solution of the elastic plastic torsion problem for a cylindrical bar of oval cross-section, /. Appl. Math, and Mech., 29 A965), 1038—1047. Антосевич (AntosiewiczH. A.) [1] Linear control systems, Arch. Ration. Mech. and Anal., 12 A963)r 313—324. Ароншайн (Aronszajn N.) [1] A unique continuation theorem for solution of elliptic partial diffe- differential equations or inequalities of second order, /. Math. Pures et Appl., 36 A957), 235—24.9. Артоля (Artola M.) [1] Equations paraboliques a retardement, СП. Acad. Sci. Paris., 264 A967), 668—671. [2]* Sur les perturbations des equations d'evolution. Applications a des problemes de retard, Ann. Ecole Norm. Super., 2 A969), 137—253. А т а и с М., Ф а я б П. [1] Оптимальное управление, изд-во «Машиностроение», М., 1968. Ауслеидер (Auslender L.) [1]* Methodes numeriques pour la resolution des problemes d'optimisation avec constraintes, These, Universite de Grenoble, 1969. Б а й о к к и (В a i о с с h i С.) [1] Sulle equazioni differenziale astratte lineari del primo e del secondo x) Работы, отмоченные звездочкой, добавлены или уточнены при подго- подготовке русского издания.— Прим. перев.
394 Библиография ordine negli spazi di Ililbert, Ann. Mat. Рига ed Appl., 76 A967), 233-304. [2] Soluzioni ordinarie о goneralizzate del problema di Cauchy per equa- zioni differenziali astratte linear! del socondo ordine negli spazi di Hilbert, Ric. Mat., 16 A967), 27—95. Балакришнан (Balakrishnan A. V.) [1] Optimal control problems in Banach spaces, SI AM J. Control, 3 A965), 152-180. [2] Semi-group theory and control theory, Washington, 1965. [3] Foundation of the state space theory, /. Comput. and System Sci., 1 A967). [4]* Л hew computing technique in system identification, /. Comput. and System Sci., 2 A968), 102—116. 15]* On a now computing technique in optimal control, SI AM J. Control, 6 A968), 149—173. Б а л а к р и ш н а и, Л и о h с (Balakrishnan A. V., Lions J.-L.) [1] State estimation for infinite dimensional systems, /. Comput. and System Sci., 1 A967), 391—403. Б е л л м a h P. [1] Динамическое программирование, ИЛ, М., 1960. Б е л л м а н, Г л и к с б е р г, Гросс (Bellman R., G 1 i с k s- b о г g Т., G г о s s О. А.) [11 On the «bang-bang» control problem, Quart. Appl. Math., 14 A9,16), 11-18. [2]* Некоторые вопросы математической теории процессов управления, 11 Л, М., 1962. Б е л л м а и, К а л а б а, В и и г A3 е 11 m a n R., К а 1 a b а В.., Wing G. М.) [1] Invariant imbedding and mathematical physics. Particle processes, /. Math. Phys., 1 A960), 280—308. Бенсуссан (Bensoussan A.) [1] Une methode d'identification do valour initiale, C.R. Acad. Sci. Paris, 265 A967), 724-727. [2]* Equations integrales operationnelles stochastiques, СП. Acad. Sci. Paris, 269 A969), 423—42,1; Sur les proprietes do la solution d'une equation integralo operationelle stochastique, C.R. Acad. Sci. Paris, 269 A969), 457-459. 3]* Sur l'indentification et le filtrago de systemes gouvernos par des equations aux derivoes partielles, Cahier IHIA, 1 A969), 1—233. [41* Filtrage optimal des systemes lineaires, Paris, 1971. Б е и с у с с а и, Б о с с а в и , Неделек (Bensoussan А., В о s- savit A., Nedelec J. С.) [1]* Approximation des problemes de controle, Cahier IRIA, 2 A970). Бенсуссан, Кеннет (Bensoussan A., Kenneth P.) [1] Готовится к печати. Бенсуссан, Ломарсшаль (Bensaussan A., LeMare- с h a 1) [1] Готовится к печати. Борковиц, П о л л а р д (В о г к о w i t z L. D., Pollard H.) [1]* A non classical variational problem arising from an optimal filter problem, Arch. Ration. Mech. and Anal., 26 A967), 281—304. [2]* A variational problem related to an optimal filter problem with self correlated noise, Trans. Amer. Math. Soc, 142 A969), 155—175. Болтянский В. Г. [1]* Математические методы оптимального управления, изд-во «Нау- «Наука», М., 1969.
Библиография 395 Б о с с а в и (Bossavit A.) [1] These, Paris, 1971. Б р а у д е р (В г о w d о г F. Е.) [1] Коп linear monotone operations and convex sets in Banach spaces. Bull. Amer. Math. Soc. 71 A965), 780—785. [2] On the unification of the calculus of variations and the theory of monotone поп linear operations in Banach space, Proc. Nat. Acad. Sci. USA, 56 A966), 419—425. [3]* Non linear operators and поп linear equations of evolution in Banach spaces, Proc. Symp. on non linear functional analysis, Chicago, 1968. Брезис (Brezis H.) [1] Equations et inequations non lineaires dans les espaces vectoriels en dualite, Ann. lust. Fourier, 18 A968), 115—175. [21* These, Paris, 1970. [3] Functions duales relativement a une forme bilineairc, C'.R. Acad. Sci. Paris, 264 A967), 284—286. [4]* Inequations variationnelles associees a des operateurs d'evolution, в книге «Theory and applications of monotone operators», Nato Sum- Summer School, Venise, 1968. 15]* Semi-groupes non lineaires et applications, Colloque Bome, 1970. Брезис, Лионе (Brezis П., Lion s J.-L.) [1] Sur certains problemes unilateraux hyperboliques, C-R. Acad. Sci. Paris, 264 A967). 928-931. Брезис, С и б о н и (Brezis II., S i b о п у М.) [1] Methodes d'appvoximation et d'ilcralion pour les operateurs mono- monotones, Arch. Ration. Mech. and Anal., 28 A968), 59—82. Брезис, Стампаккья (Brezis II., Stampacchia G.) [1]* Sur la regularity de la solution d'inequations elliptiques, Bull. Soc. Math. France, 96 A968), 153-180. Броган (Brogan W. L.) [1] Optimal control theory applied to systems described by partial diffe- differential equations, Ph. D. Thesis, U. C. L. A., 1965. Бруновский (В r u n о v s k у Р.) [1]* Controllability and linear closed-loop controls in linear periodic systems, /. Diff. Equat., 6 A969), 296 313. Б у р б а к и. [1] Интегрирование, изд-во «Наука», М., 1967. Б у т к о в с к и й А. Г. [1] Теория оптимального управления системами с распределенными параметрами, изд-во «Наука», М., 1965. Б у т к о в с к и й А. Г.. Полтавский Л. Н. [1] Оптимальное управление волновыми процессами, Автоматика и телемеханика, 27 A966), 553—563. Б ю с и, Д ж о з с ф (Вису В. S., Joseph P. D.) [1] Filtering for stochastic processes with applications to guidance, Inter- science, New York, 1968. Балле (V a 1 1 ё е A.) [1] Un prohleme de controle optimum dans certaines equations diffe- rentielles d'evolution, Ann. Sc. Norm. Sup. Pisa, 20 A966), 25 — 30. Варга (VV а г g a J.) [1] Relaxed variational problems, /. Math. Anal, and Appl., 4 A962), 111—128. В а р е Й я (V а г a i у a P. P.) [1] On the existence of solutions to a differential game, SI AM J. Con- Control, 5 A967), 153-162.
396 Библиография [2]* Ли extremal problem in Banach space with application to optimal control (готовится к печати). В и б е р г (\V i b е г g U. М.) [1| Feedback control of linear distributed systems, /. Basic Engineering* 890 A967), 379—384. В и ш и к М. И. [1] О сильно -эллиптических системах дифференциальных уравнений, Машем, сб., 29 A951), 615—676. [2] О разрешимости краевых задач для квазилинейных параболи- параболических уравнении высших порядков, Матем. сб., 5 9 A962), 289—325. В о н г (VV а л g P. К. С.) [1] Control of distributed parameter systems, в книге «Advances in cont- control systems. Theory and applications», ed. by C. T. Leondes, v. 1, Acad. Press. New York —London, 1964. 75—172. [2]* Control of a distributed parameter system with a free boundary, Int. J. Control, 5 A967), 317 — 329. [3]* Optimal control of a class of linear symmetric hyperbolic systems- ¦with applications to plasma confinement. /. Math. Anal, and Appl.,. 28 A969), 594—608. В о и х а м (W о n h a m W. M.) [1]* On pole-assignement in multi-input controllable linear systems, IEEE" Trans. Automatic Control, AC-1'2 A961). 660—6f>5. [2]* On a matrix Riccati equation of stochastic control, SI AM J. Control? 6 A968). 681--607. Г а б а с о в Р., Кириллова Ф. [1]* Качественная теория оптимальных процессов, изд-во «Наука», М., 1971. Г а м к р е л и д :! е Р. В. [1] On some extremal problems in tlio theory of differential equations with applications to the theory of optimal control, SI AM J. Control, 3 A965). 106-128. Г а р и п о в (G a t i p о v R. M.) [1] On the linear theory of gravity waves: the theorem of existence and uniqueness, Arch. Ration. Mech. and Anal., 2Л A967), 352—362. Гарнир (G a r n i г II. G.) [1] Les problemes aux limites de la physique matheroatiques, Stuttgart, 1958. Г е й u ц... (H cinz K.) '[1] tJber die Kindeugkeit beim Cauchyschen Anfangswcrtproblem einer elliptischen Differentialgleichungen zweiter Ordnung, Nachr. Akad. Wiss. Gottingen, I A9o5), 1 — 12. Г е л т> ф а и д И. М., Фом и п С. В. [1] Вариационное исчисление, Физматгиз, М., 1961. Г е л ь ф а н д И. М.. III и л о в Г. Е. [1] Обобщенные функции, т. 1, 2. 3, физматгиз, М., 1958. Г л о в и и с к и и. Л и о н с. Т р е м о л ь е р (G 1 о w i n s k i R., Lions J.-L.. T г о m о I i e г с s R.) [1]* Methodes mimeriques de resolution des problemes d'ineqiiations en mecanique et en physique (готовится к печати). Госсе (Gossez J. P.) [1]* Existence of optimal controls for some nonlinear processes, /. Optimiz* Theory and Appl., 3 A969), 89—97. [2]* Optimisation pour certains problemes aux limites non lineaires,. Boll. Unione Mat. Ital., 2 A969), 167—182. Г р и в a p (G r i s v a r d P.) [11 Problemes aux limites rosolus par le calcul operationnel, C. R. Acad. Sci Paris, 262 A966), 1306—1308.
Библиография 397 [2] Equations operationnelles abstraites dans les espaccs de Hanach ot problemes aux limiles dans dos ouvcrts cylindriques, A nn. Sc. Norm. Sup. Pisa, 21 A967), 307—347. Грин (G r e e u J. W.) [1] An expansion method for parabolic partial differential operators, /. lies. Net. Bur. Stand., 51 A953), 127 — 132. Д а п ф о р д Н., Шварц Дж. [11 Линейные операторы, т. I, ИЛ, М., 1962; т. II, изд-во «Мир», М., 1966. Да П р а т о (Da Р r a t о G.) [1]* Equations devolution dans des algebres (Voperateurs et application a des equations quasi lineaircs, J. Math. Pures et Appl., 48 A968), 59 — 107. [2]* Equations non lineaires dans des cones et applications a l'equation de Riccati operationnelle (готовится к печати). Д а у н п и г, X а у с х о л д е р (Downing А. С, II о u s о h о 1- d с г A. S.) [1]* Some inverse characteristic value problems, /. Assoc. Comput. Mach., 3 A956), 203—207. Дегтярев Г. Л., Сиразотдипов Т. Г. [11 Об оптимальном управлении одномерными процессами с распре- распределенными параметрами, Автоматика и телемеханика, 28 A967), 29—38. Д е л ф у р , М и т т е р (D е 1 f о и г М. С, М i t t e r S. К.) [1]* Reachability of perturbed systems and min-snp problems, SI AM J. Control, 7 A969), 521—533. Д е м и д о в Г. В., М а р ч у к Г. И. [1]* Теория существования решения задачи краткосрочного прогноза погоды, ДАН СССР, 170 A966), 1006—1008. Д ж о и (,Т о li n V.) \l] Extremum problems with inequalities as subsidiary conditions, Courant anniversary volume, 1948, 187- 204. Д и к с м ь е (D i х m i e r 3.) [1] Les algebres d'operateurs dans les espaces Hilhertiens, Paris, 1957. Д о и с к с )i (D о n s k e r M. D.) [1] On function space integrals, в книге «Analysis in function space», ed. by W. T. Martin and I. Segal, M. I. T. Press, 1964, 17—30. Допскер, Лионе (D о n s k e r M. D,, Lion? J.-L.) [1] Frechet-Volterra variational equations, boundary value problems and function space, integrals, Ada Math., 108 A962), 147-228. Д у б о в и ц к и й А. Я., М н л ю т и п А. А. [1]* Задачи па экстремум при наличии ограничений, Ж. пычисл. машем. и машем, фия., 5 'A965), 395—453. [2]* Необходимые условия слабого экстремума в общей задаче опти- оптимального управления, изд-во «Наука», М., 1971. Д ь е д о н н е Д ж. [1] Основы современного анализа, изд-во «Мир», М., 1964. Дюво, Лионе (Duvaut С, Lions J.-L.) [1]* Les inequations en mecanique et en physique, Paris, 1971. |2]* Sur de nouveaux problemes d'inequations variationnelles poses par la mecanique. Le cas stationnaire, C.R. Acad. Sci. Paris, 269 A969), 510—513; Le cas devolution, C.R. Acad. Sci. Paris, 269 A969), 570-572.
398 Библиография [3]* Nouvelles inequations variationnolles rencontrees en tliermique et on thormoelasticite, СП. Acad. Sci. Paris. 269 A969), 1198—1201. [4]* Ecouloment d'un fluid e rigide viscoplastiqnc incompressible, C.H. Acad. Sci. Paris, 270 A970), 58—61. [5]* Sur les equations de Maxwell des milieux polarisables et sur la mag- netodynainique des fluides dc Bingliam, С R. Acad. Sci Paris, 270 A970), 1600—1603. Егоров Л. И. [1] Необходимые условия оптимальности для систем с распределен- распределенными параметрами, Машем, сб., 69 A966), 371—421. Егоров Ю. В. [1] Некоторые задачи теории оптимального управления, Ль. еычисл. машем, и машем, физ., 3 A963), 887- 904. [2] Необходимые условия оптимальности управления в банаховом пространстве, Машем, сб., 64 A964), 79 -101. 3 е й д м а и (Z a i d m a n S.) [1] Convexity properties for weak solutions of some differential equations in Hilbert space, Can. J. Math., 17 A965), 802—807. И в о li (I v о n J. P.) [11* Application de la penalisation a la resolution d'un probleme de con- trole optimal, Cahier IRIA, 2 A970), 4—50. Ильин А. М. [1] Об одном классе ультрапараболических уравнений, ДАН СССР* 159 A964), 1214- 1217. И л ь и н А. М., Калашников А. С, О л е й н и к О. А. [1] Линейные уравнения второго порядка параболического типа, УМП, 17 A962), 3—146. И о с и д а К. [1] Функциональный анализ, изд-во «Мир», М., 1967. Иоффе А. Д., Т и х о м и р о в В. М. flj* Расширения вариационных задач, Труды Моск. Машем. Об-ва, 18 A968), 187 246. [2]* Двойственность выпуклых функций и экстремальные задачи, У МИ, 23, № 6 A968), 51—116. К а п м а п (К а 1 in a n R. Fa) [1] Contributions to the theory of optimal control, Bol. Soc. Mat. Mexi- cana, 5 A960), 102—119. [21 The theory of optimal control and the calculus of variations, в книге- «Mathematical optimization techniques», ed. by R. Bellman, Univ. of California Press, Berkeley, 1963, 309—331. [3] Об общей теории систем управления, в книге «Труды I конгресса ИФАК», т. 2, ивд-ио АН СССР, М., 1961, 521—547. К а л м а и Р., Б ю с и Р. [11 Новые результаты в линейной фильтрации и теории предсказания, Труды Америк. Об-ва Инж.-Мех., сер. Д, N° 1 A961), 123. К алла и Р., Ф а л б П., А р б и б М. [11* Очерки но математической теории систем, изд-во «Мир», М., 1971. Кастам (С a s t a i n g С.) [1] Les multi-applications mesurables, These, Paris, 1967. К а т о Т. [1] Теория возмущений лииейпых операторов, изд-во «Мир», М., 1972. К о н в е й, X о п ф (С о n w а у Е. D., II о р f E.) [1] Hamilton's theory and generalized solutions of the Hamilton-Jacobi equation, /. Math. and. Mech., 13 A964), 939—986.
Библиография 399s Копти (Со nt i R,) . i [1] Contribution to linear control tlieory. /. Diff. Equat., 1 A965), 427 — 445. [2] On some aspects of linear control theory, в книге «Mathematical theory ol control», ed. by Л. V. Balakrishnan and L. Neustadt, Acad. Press, New York, 1967, 285—300. К о р д е с (С о r d e s II. О.) [1] t'ber dip Bestimmtheit der Losungen elliptischer differentialgleichuii- gen durcli Anfangsvorgaben, Nachr. Akad. Wiss. Gottingen, 11 A956), 239-258. К р а с о в с к и й II. II. [11* Игровые задачи о встрече дввдкепий, изд-во «Наука», М., 1970. К р е й н С. Г. [11 О классах корректности для некоторых граничных задач, ДЛ1Г СССР, 114 A957), 1162—1165. [2] Линейные дифференциальные уравнения в банаховом пространстве,. изд-во «Наука», М., 1967. Кристеску (Cristescn N.) [1] Dynamic plasticity, North Holland, 1967. Куп, Танкер (Kiilin II. W., T uckcr A. W.) [1] Non linear programming, Proc. Symp. Math. Stat., Univ. Cal. Press,. 1951, 481—492. Купер (С о о p e I J. F.) [1] Готовится к печати. Курант (С о u r a n 1 К.) [1] Variatioiial methods for the solution of problems of equilibrium and vibrations, Bull. Amcr. Math. Soc, 49 A943), 1—23-. Kymnep (Kushnor II. J.) [1]* On the optimal control of a system governed by a linear parabolic equation with white noise inputs, SI AM J. Control, 6 A968), 596 — 614. Л а б о р д (L a b о r d e F.) [1]* Sur un problcme inverse d'un probleme de valours propres, C.R. Acad. Sci. Paris, 268 A969), 153—156. Л а в р у к, Р о л е в и ч (L a w г u k В., Rolewicz S.) [1] The minimum time control problem for a certain class of linear para- parabolic partial differential equations controlled by the boundary con- condition, Bull. Acad. Polon. Sci., 16 A968), 489—493. Л а л ы ж с н с к а я О. А. [1] Смешанная задача для гиперболических уравнений, Гостехнздат, М., 1953. Л а д ы ж ейская О. А., С о л о и и и к о и В. А., Ура л щепа Н. Н. [1] Линейные и квазилинейные уравнения параболического типа, изд-во «Паука», М., 1967. Л а к с, М и л ь г р а м (Lax P. D., M i I g r a m К.) [1] Parabolic equations. Contributions to the tlieory of partial differential equations, Ann. Math. Studies, 33 A954), 167-190. Л а и д и с ТС. М. [1] Некоторые вопросы качественной теории эллиптических и пара- параболических уравнений. УМН, 14 A959), 21—85. Л а и ш о п, Д ю в о (L а п с h о п И., Duvaut G.) [1] Sur la solution du probleme de torsion elastoplastique d'une barre cylindrique de section quelconque, C. R. Acad. Sci Paris., 264 A967), 520-523.
400 Библиография [2[* Sur la solution du problerne do la torsion eJastoplastique, C. R. Acad. Set Paris, 269 A069), 791-794. Л а-Са л л ь (L a Sa lie J.) [1] The time optimal control problem, в книге «Contributions to the theory of non linear oscillations», v. 5, Princeton Univ, Press, 1960, 1-24. •ЛаттссР., Лионе Ж .-Л. [1] Метод Квазиобращеиия л его приложения, изд-во «Мир», М., 1970. Лоре (L с г'а у J.) [11 Etude do diverses equations integrals non lineaires el de quelques problemfis que pose l'hydrodynamique, /. Math. Pares el AppL, 12 A933), 1—82. [2] Essai sur les mouvements plans d'un liquide visqueux que limitent des parois, /. Math. Pares el AppL, 13 A934). 331—418. [3] Sur les mouvoments d'un liquide visqueux emplissant 1'espace, A eta Math., 63 A934), 193—248. с, Л и о и с (L с г а у J., Lions J.-L.) 1] Quelques resultats de Visik sur les problemes elliptiques non lineaires par les inethodos de Minty-Browder, Bull. Soc. Math. France, 93 A965), 97—107. -Л и, Маркус (L о е Е. В., М а г k u s L.) • [1] Foundations of optimal control theory, J. Wiley, 1967. ¦Л и о ii с (Lions J.-L.) [I] Sur le controls optimal de systemes decrits par des equations aux derivees partielles lineaires, С. B. Acad. Sci. Paris, 263 A966), I: 661—663; II: 713—715; III: 776-779. [2] Optimisation pour certaines classes d'equations devolution non lineaire, Ann. Mat. Рига ed AppL, 72 A966), 275—294. [3] Equations differentielles operationnelles et problemes aux limites, Berlin-- Heidelberg—New York, 1961; Operational differential equations and boundary value problems, 2 ed., Berlin —Heidelberg — New York, 1970. [41 Problemes aux limites en tlieorie des distributions, Ada Math., 94 A955), 13—153. |o[* On some non linear partial differential equations related to optimal control theory, Proc. Symp. on non linear functional analysis, Chicago, 1968. [6] Quelques resultats d'existence dans des equations aux derivees partiel- partielles, Bull Soc. Math. France, 87 A959), 2o4 —273. [7] Sur certaines equations paraboliques non lineaires, Bull. Soc. Math. France, 93 A905), 155-175. |8] On some optimization problems for linear parabolic equations, в кни- книге «Functional analysis and optimization», od. by E. Caianiello, Acad. Press, New York, 4966, 115—131. 19] Sur certaines equations aux derivees partielles a coefficients ope- rateurs non bornes, J. Anal. Math., 6 A958), 333—335. [10] Equations differentielles operationnielles dans les espaces de Hil- bert, Ce-ntro Int. Mat. Estivo, Varenna, 1963. (Equazioni differenziali astratte, Cremonese, Roma, 1963.) [II] Approximation par des systemes du type Cauchy—Kowalevska, Ecole d'ete GEA-EDF, 1965; cours CIME, 1967. [12] Sur le feedback non lineaire, Rapport IRIA, 1968. [13]* Quelques methodes A» resolution des problemes aux limites non lineair-es, Paris, 1969.
Библиография 401 [14]* Sur certains problemes non lineaires lies au controle optimal de sys- temes gouvernes par des equations aux derivees partielles, Colloq. Bruxelles, CBRM, 1970, 99—107. [15]* Sur l'approximation do la solution d'inequations devolution, C. R. Acad. Sci. Paris, 263 A966), 55—57. [16]* О неравенствах в частных производных, УМН, 26, № 2 A971), 205— 263. Лиопс, Маджепес (Lions J.-L., Magencs Е.) [1] Problemes aux limites non homogenes ct applications, v. 1, 2, 3, Paris, 1968. (Русский перевод первого тома: Неоднородные гранич- граничные задачи и их приложения, изд-во «Мир», М., 1971.) [2]* Controle optimal ot espaces du type de Gevrey, Atti Accad. Naz. Lincei Rend., 44 A968), I: 34-39; II: 151-157. Лионе, М а л: ь г р а п ж (Lions J.-L., Malgrange B.) [1] Sur l'unicite retrograde dans les problemes mixtes parabolique, Math. Scand., 8 A960), 277—286. Лионе. С т а и н а к к ь я (Lions J.-L., Stampacchia G.) [1] Variational inequalities, Comm. Pure and Appl. Math., 20 A967), 493-519. [2] Inequations variationnelles non coercitivos, C. R. Acad. Sci. Paris, 261 A965), 25—27. Л и о ii с, Т е м а м (Lions J.-L., Те ma m R.) [1]* line methode d'eclatemont des operateurs et desconstraintes on calcul des variations, C. R. Acad. Sci. Paris, 263, A966), 563—565. Лионе, Штраус (Lions J.-L., Strauss W. A.) [1] Some non linear evolution equations, Bull. Soc. Math. France, 93 A965), 43—96. Л и т т м а н (L i t t m a n W.) [1] The wave operator and LP-norms, /. Math. and. Mech., 12 A963), 55—68. Л о p a ii (Laurent P. J.) [1] Approximation convex, Seminaire d'analyse numerique, Grenoble, 1967. [2]* Cones de deplacement admissibles, cos gradients et approximation convexe dans un espace norme, Summer School OTAN, Venezia, 1968. [3]* Approximation et optimisation (готовится к печати). Лурье К. А. [1] Оптимальное управление проводимостью жидкости, движущейся по каналу в магнитном поле, Прикл. машем, и мех., 28 A964), 258— 267. Л у к е с (Lukes D. L.) [1]* Optimal regulation of non linear dynamical systems, SIAM J. Cont- Control, 7 A969), 75—100. Л у к е с, Расселл (Lukes D. L., Russell D. L.) [1]* The quadratic criterion for distributed systems, SIAM J. Control, 7 A969), 101—121. M а к -К а м и, М и з е л, 3 e й д м а н (М а с С a m у R. С, М i z e 1 V. J., Seidman T. I.) [1]* Approximate boundary controllability for the heat equation. /. Math. Anal, and Appl., I: 23 A968), 699-703; II: 28 A969), 482-492. Мак-Шейн (М с S h a n e E. J.) , [1] Optimal controls, relaxes and ordinary, в книге «Mathematical theory of control», ed. by A. V. Balakrishnan and L. Neustadt, Acad. Press, New York — London, 1967, 1—9. M а л a h о в с к и й (Malanowski К.) [1]* On optimal control of vibrating string, SI AM J. Control, 7 A969), 260—271. 26—1230
402 Библиография Мандельбройт (Mandelbrojt S.) [1] Sur lcs fonctions convexes, C.R. Acad. Sci. Paris, 209 A939), 977 — 978. Маркус (Markus L.) [1] Controllability and observability, в книге «Functional analysis and optimization», ed. by E. Caianiello, Acad. Press, New York, 1966, 133-143. [2] The bang-bang principle, в книге «Lecture series in differential equa- equations», Georgetown Univ., 1965, 25—45. Мизел, Зсйдман (M i z e 1 V. J., Seidman T. I.) [1]* Observation and prediction for the heat equation, /. Math. Anal. and Appl., 28 A969), 303—312. M и з о x а т a (M i z о h a t a S.) [1] Unicitc du prolongement des solutions pour quolques operateurs differentiels paraboliques, Mem. Colloq. Sci. Univ. Kyoto, ser. A, 31 A958), 219-239. M и ii т и (M i n t у G. J.) [1] On the generalization of a direct method of the calculus of variations, Bull. Amer. Math. Soc, 73 A967), 315—321. [2] Monotone (non linear) operations in Ililbert space, Duke Math. J., 29 A962), 341-346. Миранкер (Miranker W.) [1] Approximate controllability for distributed linear systems, /. Math. Anal, and Appl, 10 A965), 378—387. Минер (M i t t e г S. К.) [1] Theory of inequalities and the controllability of linear systems, в книге «Mathematical theory of control», ed. by A. V. Balakrishnan and L. Neustadt, Acad. Press, New York 1967, 203—212. Мищенко Е. Ф., П о н т р я г и и Л. Ф. [11* Линейные дифференциальные игры, ДАН СССР, 174 A967), 27—29. [2]* Задача об уклонении от встречи в линейных дифференциальных играх, Дифференц. уравнения, 7 A971), 436—445. Моисеев Н. Н. [1) Optimization, в книге «Mathematiques appliquees a la physique», Roubine ed., Unesco Publication. M о р о (М о r e a u J. J.) [1] Proximite ot dualite dans un espaco Hilbertien, Bull. Soc. Math. France, 93 A965), 273—299. M о р т e h с о и (М о r t e n s e n R. Б.) fl] A priori open loop optimal control of continuous time stochastic systems, Int. J. Control, 3 A966), 113—127. [2] Stochastic optimal control with noisy observations, Int. J. Control, 4 A966), 455—464. M о с о л о в П. П. [1]* О проблеме минимума функционалов, Изв. АН СССР, сер. машем. 31 A967), 1289—1310. Мосолов П. II., Мясников В. П. [1] Вариационные дтетоды в теории течений вязкопластической среды, Прикл. мате.ц. и мех., 29 A965), 468—492. Мюллер (М и 11 е г С.) [1] On the bohavoir of the solutions of the differential equation Au = -- F (x, u) in the neighborhood of a point. Comm. Pure and Appl. Math., 7 A954), 505—515. Неделек (N ё d e 1 e с J. С.) [1]* Schemas d'approximation pour des equations integro-differontielles do Riccati, These, Paris, 1970.
Библиография 403 Нейштадт (N eust adt L.) [1] Ли abstract variational theory with applications to a broad class of optimization problems, SI AM J. Control, I: 4 A966), 505—527; II: 5 A967), 90-137. Нельсон (N о 1 s о n E.) [1] L'equation de Schroedinger et les integrates do Feynman, Colloq. Int. C.N.R.S.. Paris, 1962, 151—158. [2]* Feynman integrals and the Schroedinger equation, /. Math. Phys., 5 A964), 332-343. H e ч а с (Necas J.) [1] Sur methodes diroctcs dans la theorie des equations elliptiques, Acad. Tehecoslovaque des Sciences, Prague, 1967. О б и н (А и b i n J. P.) [1]* Characterization of the set of constraintes lor which the necessary conditions for optimization problems hold, SI AM J. Control, 8 A970), 148-162. [2]* Filtrage optimal des systemes lineaires, Paris, 1970. О г а з о (Н a u g a z e a u I.) fl]* Sur des inequations variationnelles, C.R. Acad. Sci. Paris, 265 A967), 95-98. [2]* Sur les inequations variationnelles et la minimisation de fonctionnel- les con vexes, These, Paris, 1968. Олей h и к О. А. [1]* О линейных уравнениях второго порядка с неотрицательной харак- характеристической формой, Мате.ч. сб., 69 A960), 111 —140. О л е й и и к О. А., Р а д к е в и ч Е. В. fl] Уравнение иторого порядка с неотрицательной характеристиче- характеристической формой, «Итоги науки», ВИНИТИ АН СССР, Математический анализ, 1970. Педорсон (Pederson R. N.) [1] On the unique continuation theorem for certain second and fourth order elliptic equations, Comm. Pure and Appl. Math. 11 A958), 67—80. Пирсон (Pearson J. D.) fl] Duality and a decomposition technique, SI AM J. Control, 4 A966), 164-172. IT о н т р я г и н Л. С. 1П* К теории дифференциальных игр, У MB, 21, № 4 A966) 219—274. 12]* О линейных дифференциальных играх, ДАН СССР, I: 174 A967), 1278—1280; II: 175 A967), 764—706. Понтрягин Л. С, Болтянский В. Г., Г а м к р е л и д з е Р. В., М и гц е н к о Е. Ф. [1] Математическая теория оптимальных процессов, Физматгиз, М., 1961; изд-во «Наука», М., 1969. П у ч ч и (Р и с с i С.) [1] Un problema variazionale per i coefficient! di equazioni differenziali di tipo ellittico, Ann. Sc. Norm. Sup. Pisa, 16 A962), 159—172. [2] Operatori ellittici estremanti, Ann. Mat. Рига ed Appl., 72 A966), 141-170. П in e и и ч ii ы й Б. II. [1] О линейных дифференциальных играх, Кибернетика, 1 A968), 13— 22. [2] Линейные дифференциальные игры, Автоматика и телемеханика, 1 A968), 65-78. [3]* Необходимые условия экстремума, изд-во «Наука», М., 1969. Расселл (Russell D. L.) [1] Optimal regulation of linear symmetric hyperbolic systems with 26*
404 Библиография finite dimensional controls, J. Soc. Ind. Appl. Math., 4 A966), 276— 294. , [2] The Kuhn — Tucker conditions in Banach space with an application to control theory, /. Math. Anal., 15 A966), 200—212. [3] On boundary value control of linear symmetric hyperbolic systems, в книге «Mathematical theory of control», ed. by Л. V. Balakrishnan and L. Neustadt, Acad. Press, Now York, 1967. 312—321. [4]* Continuity in the strong topology of operatoryalued solutions of nonlinear differential equations with an application to optimal con- control, SIAM J. Control, 7 A969), 132—141. [5]* Linear stabilization of the linear oscillator in Hilbert space, /. Math. Anal, and Appl., 3 A969), 663—675. Рисе Ф., Секефальви-Надь Б. [1] Лекции по функциональному апализу, ИЛ, М., 1956. Розепброк (Rosenbrock II. Н.) [1]* Distinctive problems of process control, Chem. Eng. Prog., 58 A962). Рокафеллер (Rockafellar R. T.) [1] Minimax theorems and conjugate saddle functions, Math. Scand., 14 A964), 151—173. [2] Extension of Fenchel's duality theorem for convex functions, Duke Math. /., 33 A966), 81—90. [3] Conjugates and Legendre transforms of convex functions, Canad. J. Math., 19 A967), 200-205. [4]* Conjugate convex functions in optimal control and the calculus of variations, /. Math. Anal, and Appl., 32 A970), 174—222. Саймон, Миттер (Simon J. D., M i 11 о r S. K.) [1]* Л theory of modal control, Information and Control, 13 A968), 316- 353. Сакава (Sakawa Y.) [1] Solution of an optimal control problem in a distributed parameter sys- system, IEEE Trans. Automatic Control, AC-9 A964), 420—426. [2] Optimal control of a certain type of linear distributed parameter systems, IEEE Automatic Control, AC-11 A966), 35—41. Cea (Сё a J.) [11 Theorie de l'optimization, Cours Fac. Sci. Rennes, 1966—1967. [2]* Optimisation. Theorie et algorithmes, Dunod, Paris, 1971. С и. р а з е т д и н о в Т. Г. [11 Об оптимальном управлении упругими летательными аппаратами, Автоматика и телемеханика, 27 A966), 1139—1152. Сирина (С i r i n a M.) [1]* Boundary controllability of nonlinear hyperbolic systems, SI AM J. Control. 7 A969), 198-212. Соболев С. Л. [1] Некоторые применения функционального анализа в математической физике, изд-во ЛГУ, Л., 1950; изд-во Сибирского отд. АН СССР, Новосибирск, 1962. Солоппиков В. А. [1]* О краевых задачах для липейных параболических систем диффе- репциальных уравнений общего вида, Тр. Матем. ин-та им. Стек- лова, 83 A965), 3-162. Стампаккья (Stampacchia G.) [11 Formes bilineaires coorcitives sur les ensembles convexes, C. R. Acad. Sci. Paris, 258 A964), 4413—4416. [21 Le probleme de Dirichlet pour les equations elliptiques du second ordre a coefficients discontinus, Ann. Inst. Fourier, 15 A965), 189—258.
Библиография 405 Танабе (Tanabc H.) [1J On difierentiability and analyticity of solutions of weighted elliptic boundary value problems, Osaka Math. J., 2 A965), 163—190. Тартар (Tartar T.) [1] Готовится к печати. Темам (Tcmam R.) [1]* Etude directe d'une equation devolution du type de Riccali, associoe a des operatours non bornes, C- R. Acad. Set. Paris, 268 A969), 1335— 1338. [2]* Sur la solution exacte et approchee d'un probleme hyperbolique lineaire de T. Carleman, Arch. Ration. Mech. and Anal., 3 A969), 351-362. [3]* Sur la stabilite ot la convergence de la method des pas fractionnaires, Ann. Mat. Рига ed Appl., 79 A968), 191—380. [4] Sur l'equation de Riccati associee a des operateurs non bornes (гото- (готовится к печати). T и п г (Ting Т. W.) [1]* Elastic-plastic torsion problem, I: Trans. Amer. Math. Soc, 123 A966), 369—401; Arch. Ration. Mech. and Anal., II: 25 A967), 342— 366; III: 34 A969), 228—244. Тихонов А. Н. [1] О методах регуляризации задач оптимального управления, ДАН СССР, 162 A965), 763-765. Т р е в Ф. [1] Линейные дифференциальные операторы с постоянными коэффи- коэффициентами, изд-во «Мир», М., 1966. Ту Дж. ^ [1]* Совремепная теория управления, изд-во «Машиностроение», М., 1971. Фаедо (F a e d о S.) [1] Un nuovo metodo per l'analisi esistenziale e quantitativa dei prob- lemi di propagazione, Ann. Sc. Norm. Sup. Pisa, 1 A949), 1—40. Ф а л б (F a 1 b P. L.) [1] Infinite dimensional control problems, I: On the closure of the set of attainable states for linear systems, /. Math. Anal, and Appl., 9 A964), 12—22. Ф а л б, К л е й н м а и (F а 1 b P. L., К 1 ei nman D. Ь.) [1] Remarks on the infinite dimensional Riccati equation, IEEE Trans. Automatic Control, AC-11 A966), 534—536. Фатторини (Fattorini H. O.) [1] Time optimal control of solutions of operational differential equations, SI AM J. Control, 2 A964), 54—59. [2] Some remarks on complete controllability, /. Soc. Ind. Appl. Math., 4 A966), 686—693. [31 On complete controllablity of linear systems, /. Diff. Equat., 3 A967), 391-402. [4] Controllability of higher order linear systems, в книге «Mathematical theory of control» ed. by A. V. Balakrishnan and L. Neustadt, Acad. Press, New York, 1967, 301—311. [51* Boundary control systems, SIAM_ J. Control, 6 A968), 349—385. [6]*. An observations on a paper of A. Friedman. /. Math. Anal, and Appl., ¦ 22 A962) 382—384. [7]* A remark on the bang-bang principle for linear control system in infinite dimensional space, SI AM J. Control, 6 A968), 109—113. [8]* Control with bounded inputs, в кпиге «Computing methods in optimization problems», San Remo, 1968.
406 Библиография [9]* Ordinary differential equations in linear topological spaces, II, /. Diff. Equat., 6 A969), 50—70. [10]* Control in finite time of differential equations in Banach space, Comm. Pure and A ppi. Math., 19 A966), 17-34. Фельдбаум А. А., Б у т к о в с к и й А. Г. [1]* Методы теории автоматического управления, изд-во «Наука», М., 1971. Фенчел (Fonchol W.) [1] On conjugate convex functions, Canad. J. Math., 1 A949), 73—77. Ф и л л и н с о н, Миттер (Р h i 11 i p s о n G. A., Mitter S. К.) [1]* Numerical solution of a distributed identification problem via a direct method, в кпиге «Computing methods in optimization problems», ed. by L. A. Zadeh, L. Neustadt and A. V. Balakrishnan, Acad. Press, New York, 1969. [2]* State identification of distributed parameter systems, Proe. IV IFAC Congress, Warsaw, 1969. Фикера (Fichera G.) [1] Problemi eJastostatici con vincoli unilaterali: il probloma di Sig- norini con ambigue condizioni al contorno, Mem. Acad. Naz. Lincei, 7 A964), 91—140. Флеминг (Fleiming W. H.) [1] Some Markovian optimization problems, /. Math, and Mech., 12 A963), 131-140. [2] Duality and a priori estimates in Markovian optimization problems, /. Math. Anal, and Appl., 16 A966), 254—279. [3] Stochastic Lagrange multipliers, Proc. Conf. Math. Control Theory, Los Angeles, 1967. [4]* Optimal control of partially observable diffusions, SI AM J. Control, 6 A968), 194-1214. [5]* The Cauchy problem for a non linear first order partial differential equation, /. Diff. Equat., 5 A969), 515—530. Ф о р р (Faurre P.) fl]* Navigation inertielle optimale et filtrage statistique, Paris, 1971. [2] Sur les points conjugues en commando optimale (готовится к печати). Фридман (Friedman A.) [1] Optimal control in Ranach spaces, /. Math. Anal, and Appl., 18 A967), 35—55. [21 Optimal control for parabolic equations, /. Math. Anal, and Appl., 18 A967), 479—491. [31 Уравнения с частными производными параболического тина, изд-во «Мир», М., 1968. [4]* Optimal control in Banach space with fixed points, /. Math. Anal, and Appl. 24 A968), 161—181. [5]* Differential games of pursuit in Ranach space, /. Math. Anal, and Appl., 25 A969), 93—113. Фридман, III и h б р о т (Friedman A., S h i n b г о t M.) [1] The initial value problem for the linearized equations of water waves, /. Math. and. Mech., 27 A967), 107 — 180. X а д л ер (Hadeler К. Р.) [1]* Ein inverse Fjigenwertproblem, Linear Algebra and Its Applications, 1 A968), 83-101. Халанай (Halanay H.) [1] Differential equations, Acad. Press, New York, 1966. X а л к и н (Н а 1 k i n H.) [1] A generalization of LaSalle's bang-bang principle, SI AM J. Control, 2 A965), 199—202.
Библиография 407 [2] Non linear non convex programming in an infinite dimensional space, в книге «Mathematical theory o? control», ed. by Л. V. Balakrishnan and L. Koustadt, Acad. Pross, New York, 1967, 10—25. Халкин, Нейштадт (Halkin H., Neustadt L.) [1] General necessary conditions for optimization problems, Proc. Nat. Acad. Sci., 56 A966), 1066-1071. X а м м e p, P ы б и ц к и й (Hummer D. p., Rybicki G.) [1] Computational methods for non-LTE line-transfer problems, в книге «Methods in computational physics», v. 7, Acad. Press, New York, 1967, 53—127. Хартман, Стампаккья (Hartman P.,Stampacchia G.) [1] On some non linear elliptic differential functional equations, Ada Math., 115 A966), 271—310. Хестенс (Hestenes M. R.) [1] Calculus of variations and optimal control theory, Wiley, 1966. X и л л е Э., Ф и л лине Р. [1] Функциональный анализ и полугруппы, ИЛ, М., 1962. X опф (Hopf E.) [1] The partial differential equation щ Л- иих = иихх, Сотт. Риге and Appl. Math., 3 A950), 201—230. Хорват (Horvath J.) [1] Topological vector spaces and distributions, Addison-Wesley, Rea- Readings, 1966. Ц а ф е с т a c, II а й т и н г е й л (Т z a f e s t a s S. G., N i g h t i n- g a 1 о J. M.) [1]* Optimal filtering, smoothing and prediction in linear distributed systems, Proc. IEEE, 115, A968), 1207—1212. [2]* Optimal control of a class of linear stochastic distributed parameter systems, Proc. IEEE, 115 A968), 1213—1220. Цуйока (Tsujioka K.) [1]* Remarks on controllability of second order evolution equations in Hilbert spaces, SI AM J. Control, 8 A970), 90—99. Чапдрасекар (Chandrasekhar S.) [1] Radiative transfer, Oxford, Clarendon Press, 1950. Ч е з а р и (С о s a r i L.) [1] Multidimensional Lagrange problems of optimization in a fixed domain and an application to a problem magnetohydrodynamics, Arch. Ration. Mech. and Anal, 29 A968), 81 — 104. [2] Existence theorems for multidimensional problems of optimal con- control, в жпиге «Differential equations and dinamical systems», Akad. Press, New York, 1967, 115—132. Чеччопи (Cecconi J.) [1] Sulla teoria dei controlli, Colloque Analyse Fonctionnelle, Rome, 1968. Шварц (Schwartz L.) [11 Tlieorie des distributions, Paris, v. I, 1950 B ed. 1957); v. II, 1951. [2] Distributions a valours vectorielles, Ann. Inst. Fourier, 1:7 A957), 1-141; II: 8 A958), 1—209. [3] Теория ядер, Математика, 3, № 3 A959), 69—79. Шмаедеке (Schmaedeke W.) [1] Mathematical theory of optimal control for semi-linear hyperbolic systems in two independent variables, SIAM J. Control, 5 A967), 138-152. Штраус (Strauss W. A.) [1]* The initial value problem for certain non linear evolution equations, Amer. J. Math., 89 A967), 249—259.
408 Библиография Эколанд (Ekeland I.) [1]* Relaxation de problem.es de controlo pour dos systemes decrits par dcs equations aux derivees particlles, C. li. Acad. Sci. Paris, 270 A970), 1283—1286. [2]* Formes equivalentos d'un problemerelaxe, C.R. Acad. Sci. Paris, 271 A970), 289—292. Эрцбсргер, Ким (Erzberger H., К i m M.) [1] Optimum boundary control of distributed parameter systems, Informa- Information and Control, 9 A966), 265—278. Юнг (Young L. C.) [1] Generalized curves and the existence of an attained absolute minimum in the calculus of variations, C.R. Soc. Sci. et Lettres Varsovie, cl. Ill, 30 A937), 212—234. Ю э (Hu et D.) [1] Phenomenes de perturbation singuliere dans les problemes aux Hmites, Ann. Inst. Fourier, 10 (I960), 1—96. Я н е п к о Н. Н. [1]* Метод дробных шагов решения многомерных задач математической физики, изд-во Сибирского отд. АН СССР, Новосибирск, 1967.
Предметный указатель Аппроксимация гиперболических за- задач параболическими 359 — минимизирующего элемента 25, 48, 51 — параболических задач эллиптиче- эллиптическими 368 — системами типа Коши — Кова- Ковалевской 378, 384, 391 Базис 111 Вполне непрерывное вложение 94, 100, 245, 248, 250, 351 Гамильтониан 159 Двойственность 227, 279, 358 Дифференциальные игры 280, 392 Задача вариационная 7 — в вариационной форме 53, 63, 64, 75, 115, 129, 170, 172, 197, 199, 345, 384 — гиперболическая типа Дирихле 305, 334 — — — Неймана 327 — граничная односторонняя 36, 38, 40, 42, 51, 66, 101, 127, 132, 196, 208, 255, 305, 326, 331, 333, 336, 345, 356 — Гурса 358 — некорректная 184, 224 — некоэрцитивная 182, 277, 314 — нелинейная 92, 98, 243, 246, 249, 251, 256, 261, 350 — параболическая типа Дирихле 126, 190, 193, 213, 230, 262 — — — — неоднородная 202 Неймана 130, 166, 167, 171, 173, 179, 195 — смешанпая в смысле'Адамара 116, 288 — со свободной грапицей 36, 38 — стохастическая 280, 392 — типа Коши — Ковалевской 378 Задача управления 53, 119, 289, 312, 342, 362, 375 — — рогуляризованпая 370 — эволюционная 110, 281 — эллиптическая типа Дирихле 31, 59, 76, 83 — — — — неоднородная 78 Неймана 32, 64, 65, 81 Канонический изоморфизм 56, 74, > 189, 340 Квадратичное программирование 231 Конус 17, 35, 37 Коэрцитивпость 13, 52, 108, НО, 227, 281, 337 Лемма о компактности 156, 245, 248, 250, 352 Метод динамического программиро- программирования 160 — дробных шагов 164,-165 — квазиобращепия 278 — Фаедо — Галеркина 112, 150, 276, 278, 284, 294, 356, 369 — штрафов 385, 392 Минимизация функционала 13, 16 — — недифференцируемого 19, 42 — — поквадратичного 15, 17 — — некоэрцитивного 46, 225 Минимизирующая последователь- последовательность 14 Минимизирующий элемент 16 Множество допустимых управлений 7, 10, 13, 54, 119, 290 — — — невыпуклое 21 — — — пеограпичепное 73, 187 — — — совпадающее с простран- пространством управлений 17, 62, 122, 124, 125, 139, 176, 197, 241, 274, 293, 298, 300, 315, 321, 324, 330, 333, 336, 346 Наблюдаемость 279 Наблюдение 7, 10, 53, 119, 121, 214, 290, 312, 321, 342
410 Предметный указатель Наблюдение граничпоо 77, 81, 84, 195, 201, 230, 331 — локальное 87, 190 — распределенное 59, 63, 64, 121, 126, 128, 130, 166, 167, 182, 194, 290, 293, 304, 308, 329, 342 — точечное 86, 190 — финальное 123, 128, 131, 171, 173, 183, 209, 213, 221, 222, 298, 300, 303, 307, 309, 324, 335 Нахождение начального состояния 224, 279 Необходимые условия оптимально- оптимальности первого порядка 29, 103, 107, 256, 279 Неравенство вариационное 17, 18, 23, 50 — эволюциоппое 255 Нуль-управляемость 219 ¦Обратная единственность 183, 222, 278 — связь 158, 277, 279, 322 Обращение времени 184, 267, 278, 282, 324 Ограничения глобальные 67, 219 — локальные 67, 269 — на состояние 88, 231, 357 _ _ управление 7, 13, 160, 174, 231, 357 Оператор высшего порядка 40, 70, 106, 136, 210, 216, 289 — гиперболический второго поряд- порядка 288 — ипфинитезимальпый производя- производящий оператор полугруппы 117, 262, 267, 277, 337 — корректный но Петровскому 289 — коэрцитивный 52, 108, НО, 281, 337 ~- Лапласа 39, 74, 189, 210, 276, 289, 306 — Лапласа — Бельтрами 65, 84, 205, 335 — линейный 53, 108, 281 — параболический второго порядка 116 — псевдодифференциальный эллип- эллиптический первого порядка на мно- многообразии 375 — эллиптический второго порядка 58 Оптимальное быстродействие 260, 279, 353, 357 — время 260, 353 — управление 7, 10, 20, 55, 120, 290 Оптимальное управление, единствен- единственность 54, 73, 120, 176, 183, 186, 188, 212, 222, 262, 274, 290, 323, 329, 335, 343 — — неединственность 20, 46, 55, 58Ч 120, 187, 229, 324 регулярность 60, 61, 126, 129, 130, 306 релейиость 62, 83, 107, 185, 186, 193, 212, 214, 222, 262, 267, ' 280 — — существование 54, 55, 73, 92, 120, 176, 183, 185, 188, 212, 222, 244, 250, 252, 260, 274, 290, 323, 329, 335, 343, 351 — — характеристические соотноше- соотношения об, 57, 120, 122, 124, 221, 292, 297, 299, 303, 304, 312, 325, 344, 365, 372, 381 Полугруппа 117, 262, 267, 276 — сжимающая 337 Преобразование Фурье 28 Прпнцип максимума Понтрягина 104, 107, 125, 192, 257, 279, 358 Проблема моментов 358 Пространство двойственное 29 — Жеврея 280 — наблюдений 53, 119, 290 — неиормируомое 272, 280 — непрерывных линейных отобра- жепий 24 ¦— операторов типа Гильберта — Шмидта 164 — распределений (обобщенных функций) 11, 26, 50 — Соболева И, 27, 29, 30, 50 — управлений 13, 53, 119, 289 — С0([0, Т]; II) НО _ С1 (Q± E) И — С (Й) 10 — 2S(Q) 10, 26, 50 — ,2_272 — Z-(V) 273 — S'(Q) 11, 26, 50 — Z'(@, T); V) 11, 109 — 3)'4V) 272 — tfi(Q) 45, 75 — Hm(Q) 11, 27 — tfJ(Q) 74, 189 — tfm(Q) И, 30 — #iB) 205 — Я§B) 334, 335 — H>{Q) H, 29 lil) 210 H() - #-1/2(Г) 65
Предметный указатель 411 Пространство Я (Г) 84 — Я-Ч2) 205, 206 — H*,\Q) 126 ; Е) и, 369 (, У) 24 — ?2(Q) 11, 26 — LP(Q) 26 — ?«(Q) 26 — ?2@, Г; V) И, 108 — L2(S; Е) И, 67 — i°°(S; ?) 11 — W@, Г) 109, 141, 188 — Wo@, T) 188 — X 304, 328 — 0 202, 217 Разложение по собственным функци- функциям 80, 118, 184, 199, 203, 209, 329, 358 Регуляризация параболическая 315, 351, 360, 363, 391 — управлепия 369 — функционала 48, 225 — эллиптическая 368 Расцепление 143, 166, 178, 194, 197, 242, 277, 315, 322, 346, 356, 366, 376, 382 Сепарабельность 111 Сингулярное возмущение оператора 96, 246, 351 Синтез оптимального управления 158, 277, 279, 322 Система Навье — Стокса 383, 391 — обратимая но времени 324 — параболическо-ншерболическая 336, 357 — уравнений, описывающая состоя- состояние 39, 69, 134, 310, 360, 383 Следы функции 28, 80, 84, 195, 204, 251, 331, 340 Состояние 7, 8, 10, 53, 119, 289, 312, 342 — сопряженное 10, 56, 121, 123, 291, 294, 299, 300, 313, 321, 343 Суперединственность 218, 278 Суперунравляемость 218 Теорема сравнения 44 Топология индуктивного предела 10, 26 — *-слабая (слабая двойственная) 27, 92 Транспонирование 79, 188, 202, 216, 301, 328 Управление 7, 10 — граничное 65, 81, 83, 98, 130, 167, 171, 173, 195, 201, 209, 213, 230, 327, 334, 345 — допустимое 7, 10 — оптимальное см. Оптимальное управление — распределенное 59, 64, 76, 92, 126, 166, 182, 190, 304, 307, 308, 309, 312, 342 — стартовое 220, 224, 278, 323, 327 — точечное 86, 193, 358 Управляемость 85, 214, 222, 260, 278, 279, 358, 369 — и едипствепность 215 — — обратная единственность 222 — модальная 220 — при наличии аддитивных возму- возмущений 220 Уравнение Гамильтона — Якоби 160, 278 ¦— гиперболического типа 281 — гиперболическое па многообра- многообразии 378 ¦ — корректное но Петровскому 281, 308, 309 — параболического типа 108 — параболическое на многообразии 375 — переноса 357 — Риккати иптегро-диффоренциаль- ное 149, 154, 162, 167, 179, 200, 277, 318, 322, 349, 356, 367, 377, 382 — с запаздыванием 270, 358 — типа Петровского 308, 309 — Шредипгера 278, 358 — эволюционное второго порядка 281, 290, 359 — — — — сведение к системе урав- уравнений первого порядка 310, 360 — — па многообразии 373, 378 — — первого порядка 110, 282 — Эйлера 17 — эллиптическо-параболическое 357 — эллиптического тина 52 Условие граничное 116 — Дирихле 116, 327 — начальное 116 — Неймана 116, 327 — неоднородное 116 — однородное 116 — сопряжепия 34 Форма билипейпая непрерывная 13, 31, 52, 58, 108, 115, 281, 286 — коэрцитивная 13, 31, 52, 108, 110, 227, 281
412 Предметный указатель Форма некоэрцитивпая 47, 228 — несимметричная 23, 31,44, 47 — полубилинейная эрмитова 17 — симметричная 13 Формула Грипа 32, 41, 79, 194 Функция двойственная 227 — Дирака 26, 86 — опорная 230 — стоимости 7, 10, 54, 119, 290, 293, 298, 300, 312, 321, 342 Функция стоимости не дифференциру- дифференцируемая 273 — — неквадратичыая 17, 238 — — регуляризованная 370 — строго выпуклая 14 Штраф 387, 392 Ядро оператора 166, 348, 377 — отображения 30, 50 — Пуассона 87
Оглавление От редактора перевода .... Предисловие к русскому изданию Введение Осяовпые обозначения .... 5 6 7 10 Глава 1. Минимизация задачи . . функционалов и односторонние граничные § 1. § 2. § 3. § 4. §5. Минимизация коэрцитивных форм Прямое решение некоторых вариационных неравенств Примеры Теорема сравнения Некоэрцитивные формы Глава 2. Управление системами, описываемыми уравнениями с част- частными производными эллиптического типа § 1. Управление в эллиптических вариационных задачах . . . § 2. Непосредственные приложения § 3. Примеры для случая N = 0, множество Ч1ь произвольно § 4. Граничное наблюдение § 5. Граничные управление и наблюдение. Случай задачи Дирих- Дирихле . , ....... § 6. Ограничения на состояние системы § 7. Теоремы существования оптимального управления .... § 8. Необходимые условия первого порядка Глава 3. Управление системами, описываемыми уравнениями е частны- частными производными параболического типа § 1. Эволюционные уравнения § 2. Задачи управления § 3. Примеры § 4. Расцепление и интегро-дифференциальное уравнение Рик- кати (I) § 5. Расцепление и иптегро-дифференциальпое уравнение Рик- кати (II) § 6. Поведение при Т ->- оо § 7. Задачи, не обязательно коэрцитивные § 8. Другие типы наблюдения и управления § 9. Граничное управление и граничное или финальное наблю- наблюдение для системы, описываемой смешанной задачей. Дирихле § 10. Управляемость § 11. Стартовое управление § 12. Двойствеппость , 13 13 22 25 44 46 52 52 58 73 76 83 88 92 103 108 108 119 126 139 166 175 182 190 201 214 220 227
414 Оглавление § 13. Ограничения на управление и на состояние 231 § 14. Неквадратичные функции стоимости 238 § 15. Теоремы существования оптимального управления . . . 243 § 18. Необходимые условия первого порядка 256 § 17. Оптимальное быстродействие 260 § 18. Некоторые обобщения • 270 § 19. Недифференцируемая функция стоимости 273 Глава 4. Управление системами, описываемыми уравнениями с част- частными производными гиперболического типа или корректны- корректными по Петровскому 281 § 1. Эволюционные уравнения второго порядка 281 § 2. Задачи управления 289 § 3. Применение метода транспонирования в задачах управления 301 § 4. Примеры 304 § 5. Расцепление 310 § 6. Стартовое управление 323 § 7. Граничное управление (I) 327 § 8. Граничное управление (II) 334 § 9. Параболическо-гинерболические системы 336 § 10. Теоремы существования оптимального управления .... 350 Глава S. Регуляризация, аппроксимация и метод штрафов 359 § 1. Регуляризация 359 § 2. Аппроксимация системами типа Коши — Ковалевской . . 373 § 3. Метод штрафов 385 Библиография 393 Предметный указатель . 409
Ж.-Л. Л И О II С ОПТИМАЛЬНО!-1, УПРАВЛЕНИЕ СИСТЕМАМИ, ОПИСЫВАЕМЫМИ УРАВНЕНИЯМИ С ЧАСТНЫМИ ПРОИЗВОДНЫМИ Редакторы И. А. Маховая, Л. В. Штейппресс Художник Д. В. Орлов Художеотвеиный редактор В. И. Шаповалов Технический редактор М. М. Матюшина, Т. А. Максимова Сдано в набор 24/ХП 1971 г. Подписано к печати 1/VI 1972 г. Бумага кн. жури. 60x90l/i6=13 бум. л., 26 печ. л. Уч.-изд. л. 23,15 Иад. К« 1/5818. Цена 1 р. 81 к. Заи. 1230. ИЗДАТЕЛЬСТВО «МИР» Москва, 1-й Рижский пер., 2 Ордена Трудового Красного Знамени Москопская типография Л» 7 «Искра революции» Главполиграфпрома Комитета по печати при Совете Министров СССР г. Москва, Трехпрудный пер., 9
Уважаемый читатель! Ваши замечания о содержании книги, ее оформлении, качестве перевода и другие просим присылать по адресу: 129820, Москва, И-110, ГСП, 1-й Рижский пер., д. 2, издательство «Мир».