Текст
                    А. И. ЕГОРОВ
ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ
ТЕПЛОВЫМИ
И ДИФФУЗИОННЫМИ
ПРОЦЕССАМИ


ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ТЕХНИЧЕСКОЙ КИБЕРНЕТИКИ МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1978
А. И. ЕГОРОВ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ТЕПЛОВЫМИ И ДИФФУЗИОННЫМИ ПРОЦЕССАМИ МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1978
6ф6.5 ЕЗО УДК 62-50 Оптимальное управление тепловыми и диффузионными процесса- ми. Е г о р о в А. И. Серия «Теоретические основы технической кибер- нетики», Главная редакция физико-математической литературы изда- тельства «Наука», М., 1978, 464 стр. Книга посвящена математическим методам решения задач опти- мизации процессов тепло- и массообмена. На конкретных примерах, взятых из теории ядерных реакторов, теплопроводности и химической технологии формулируются различные задачи оптимизации для объ- ектов с распределенными параметрами. Основное внимание уделяется различным математическим методам решения таких задач (динамиче- ское программирование, принцип максимума, проблема моментов). Дается обстоятельный анализ каждого из этих методов с целью прак тического их применения для построения оптимального управления или его приближений. В заключение рассматривается одна задача ин- вариантности для теплообменного аппарата. В основу книги положе- ны работы автора и его учеников. Книга вполне доступна студентам старших курсов, специализиру- ющихся по прикладной математике и теории автоматического регули- рования. Она будет полезна математикам и специалистам по тепло- и массообмену, интересующимся проблемами оптимального управ- ления. Илл. 28, библ. 153. ЭРЗШ-ОМ. 478 053(02)-78 © Главная редакция физико-математической литературы издательства «Наука», 1978
ОГЛАВЛЕНИЕ Предисловие ................................................. 8 Введение ..................................................... И Глава I. Математическое описание тепловых и диффузионных процессов.....................................................30 § 1.1. Распространение тепла..............................34 § 1.2. Диффузия...........................................44 § 1.3. Односкоростной перенос частиц............56 § 1.4. Тепло- и массоперенос в бинарных газовых смесях и жидких растворах ................................ 62 1. Основные предположения. Уравнения сохранения массы (63). 2. Уравнение сохранения энергии. Граничные условия (68). 3. Тепло- и массообмен в жидких растворах (73). § ,1.5. Диффузия нейтронов и теплоперенос в слабо погло- щающих средах........................................74 § 1.6. Формальное решение линейных краевых задач теории теплопроводности и диффузии..........................77 1. Формулировка основных краевых задач. Формальное ре- шение задач для уравнений эллиптического типа (77). 2. Формальное решение краевых задач для уравнений пара- болического типа (87). Глава II. Простейшие задачи оптимизации.......................95 § 2.1. Основные соотношения в неклассических методах теории оптимальных систем.................................98 1. Принцип максимума Понтрягина (98). 2. Метод момен- тов (105). 3. Динамическое программирование (Ш). § 2.2. Критический диаметр цилиндрической трубы .. ИЗ § 2.3, Критические размеры ядерного реактора . . 121 1. Реактро в форме шара (122). 2. Реактор в форме цилиндра (123). Прйминение принципа максимума Понтрягина (128). § 2.4. Кинетика реакторов на запаздывающих нейтронах 133 1. Вывод основных уравнений (134). 2. Диффузия нейтронов и теплоперенос в нестационарном процессе (138). § 2.5. Оптимальное по быстродействию управление ядер- ным реактором ...........................................139 1. Постановка задачи (139). 2. Применение принципа макси- мума (146). § 2.6. Математическое описание переноса газа в псевдо- ожиженном слое...........................................164 1. Постановка задачи (165). 2. Дискретизация по простран- ственным переменным (169).
6 ОГЛАВЛЕНИЕ Глава Ш. Управление с минимальной энергией и задача об управляемости................................................172 § 3.1. Формулировка задачи в терминах проблемы момен- тов .................................................... 174 1. Постановка задачи (174). 2. Формулировка задачи в терми- нах проблемы моментов (180). 3. Решение задачи об управ- лении с минимальной энергией в простейших случаях (184). § 3.2. Вариационные методы решения уравнений первого рода.....................................................191 1. Случай положительного определенного оператора А (193). 2. Случай положительного оператора А (196). 3. О прибли- женном решении уравнения (3.2.2) с положительным операто- ром (198). 4. Регуляризация решения уравнения с положи- тельным оператором (209). § 3.3. Управление с минимальной энергией .... 211 1. Управляемый процесс, описываемый краевой задачей с неоднородными граничными условиями (211). 2. Предвари- тельный анализ проблемы моментов (213). 3. Подпростран- ство Яд, (216). 4. Применение вариационных методов (219). 5. Условия неразрешимости задачи об управлении с мини- мальной энергией (226). 6. Приближенное решение задачи об управления с минимальной энергией (232). § 3.4. Об управляемости процесса теплопроводности с по- мощью граничного управления ....................... 236 1. Формулировка задачи (236). 2. Формулировка задачи в тер- минах проблемы моментов (238). 3. Решение задачи (241). Глава IV. Оптимальные быстродействия..........................247 § 4.L Оптимальное по быстродействию управление одно- мерным ядерным реактором............................248 1. Плоский реактор. Постановка задачи (249). 2. Анализ за- дачи (252). 3. Применение принципа максимума Понтрягина (257). 4. Управление сферическим реактором (261). § 4.2. Управление реактором произвольной формы . . 264 1. Постановка задачи (264). 2. Предварительный анализ за- дачи 2 (269). Гл а в а V. Применение динамического программирования . . 273 § 5.1. Дифференцирование функционалов......................274 § 5.2. Синтез оптимального управления......................279 1. Постановка задачи. Формальный вывод уравнения Велл- мана (279). 2. Построение оптимального управления (287). 3. Разрешимость краевой задачи (5.2.1)—(5.2.3) на оптималь- ном управлении (5.2.36) (294). 4. Приближенное решение за- дачи синтеза оптимального управления (297). 5. Конечномер- ная аппроксимация (303). § 5.3. Синтез оптимального управления при управляющей функции, зависящей только от времени .... 308 1. Постановка задачи. Уравнение Веллмана (309). 2. Примене- ние метода прямых (314). § 5.4. Управление по границе объекта ,.....................320 1. Постановка задачи. Уравнение Веллмана (320). 2. Краевая задача типа Риккати (323).
ОГЛАВЛЕНИЕ 7 § 5.5. Оптимальная стабилизация систем с распределенны- ми параметрами............................................326 1. Постановка задачи (326). 2. Уравнение Веллмана (330). 3. Применение второго метода Ляпунова (331). Глава VI. Задачи управления с квадратичными критериями оптимальности..................................................336 § 6.1. Условия оптимальности в форме принципа максиму- ма. Распределенное управление ...... 337 1. Постановка задачи. Условия оптимальности (337). 2. По- строение оптимального управления (342). 3. Решение задачи с управлением вида p=q(x)r(t) (346). 4. Решение задачи с управлением вида p=q(t)r(x) (353). § 6.2. Управление по границе ..............................356 1. Постановка задачи. Условия оптимальности (357). 2. По- строение оптимального управления (367). 3. Приближенное ре- шение задачи (373). 4. Пример (379). § 6.3. Обобщение задачи. Связь с задачей об управлении с минимальной энергией....................................384 1. Постановка задачи. Интегральное уравнение относительно оптимального управления (385). 2. Управление с минималь- ной энергией. Формальное решение (390). 3. Приближенное ре- шение задачи об управлении с минимальной энергией (397) § 6.4. Синтез управления с минимальной энергией . . . 401 1. Управление с минимальной энергией (402). 2. Оптимальное быстродействие с ограничением на энергию управления (408). Глава VII. Разные задачи.......................................415 § 7.1. Управление индукционным нагревом ...................416 1. Общая характеристика некоторых задач управления (419). 2. Формулировка задач оптимального управления (422). 3. Уп- равление индукционным нагревом при фиксированной дли- тельности процесса (425). 4. Решение вспомогательной зада- чи (428). § 7.24 Оптимальная стабилизация реактора на тепловых нейтронах.................................................434 1. Постановка задачи (435). 2. Управление Веллмана (437). 3. Допустимые управления не зависят от пространственных координат (441). § 7.3. Об инвариантности теплообменного аппарата . . 442 1. Инвариантность теплообмена в стационарном режиме (443). 2. Нестационарный процесс (450). Литература.....................................................456
ПРЕДИСЛОВИЕ Предлагаемая вниманию читателей книга предназна- чена инженерам и математикам, которые интересуются теорией оптимального управления и ее приложениями. Она посвящена основам этой теории для систем с распре- деленными параметрами, а точнее, той ее части, которая относится к задачам управления тепловыми и диффузи- онными процессами. Инженер найдет здесь разнообраз- ные задачи, на анализе которых сможет проследить применение различных методов аналитического исследо- вания оптимальных процессов, уяснить смысл математиче- ских формулировок задач оптимизации и, что особенно важно, разобраться в возможностях каждого из рассмот- ренных здесь методов. Все это, по мнению автора, может оказаться полезным инженеру при выборе математических моделей управляе- мых процессов, при формулировке других подобных за- дач оптимизации и выборе методов аналитического их исследования. Рассмотренные здесь конкретные примеры взяты из разнообразных областей применения тепловых и диффу- зионных процессов. Эти примеры (весьма идеализиро- ванные) предназначены для иллюстрации того или иного математического метода. Поэтому полученные результаты ни в коей мере нельзя рассматривать как конкретные рекомендации при конструировании той или иной оп- тимальной системы. Исключение составляет лишь пример, относящийся к управлению индукционным нагревом (см. гл. 7), в котором аналитические расчеты проверены экспериментально. Тот факт, что книга предназначена инженерам, в зна- чительной мере повлияло на глубину математического анализа решения прикладных задач. В ряде случаев пришлось ограничиться изложением формальной про-
ПРЕДИСЛОВИЕ 9 цедуры метода без корректного его математического обо- снования. Тем не менее в каждом из таких случаев ука- зывается на те опасности, которые могут возникнуть при формальном использовании того или иного конкретного метода. Там, где это возможно, указываются пути прео- доления возникающих трудностей. Вместе с тем в других случаях эта неполнота в реше- нии различных задач имеет другие причины. Дело в том, что в настоящее время еще не завершены исследования по обоснованию различных методов решения задач опти- мального управления системами с распределенными па- раметрами. В частности, не исследована полностью проб- лема управляемости таких систем, отсутствует коррект- ное обоснование динамического программирования и т. д. В каждом из таких случаев по ходу изложения приводят- ся соответствующие разъяснения. Эти нерешенные; вопросы могут быть предметом тео- ретических исследований и послужить основой для фор- мулировки новых математических задач по теории опти- мального управления системами с распределенными па- раметрами. Именно поэтому автор надеется, что книга будет полезна математикам, работающим в области тео- рии оптимального управления. Следует также отметить, что для них должны быть интересны и приводимые в книге конкретные примеры из разнообразных применений теории теплопроводности и диффузии. Их анализ позво- ляет, во-первых, лучше понять специфику задач управле- ния системами с распределенными параметрами. Во-вто- рых, эти примеры помогут сформулировать другие содер- жательные задачи оптимального управления, в решении которых можно объединить усилия математиков и инже- неров, что, несомненно, окажется полезным в развитии теории и расширении области ее разнообразных прило- жений. Излагая различные методы решения рассматривае- мых задач, автор не ставил своей целью формулировать наиболее общие результаты. В частности, здесь не при- водятся теоремы о необходимых условиях оптимальности в форме принципа максимума для процессов, описывае- мых нелинейными краевыми задачами. Такие теоремы читатель может найти в других монографиях по опти- мальному управлению системами 'с распределенными
10 ПРЕДИСЛОВИЕ параметрами*). Здесь рассматриваются лишь задачи управления линейными системами, когда критерием оп- тимальности служит либо быстродействие, либо квадра- тичный функционал. При этом основное внимание уделя- ется анализу (различных способов практического по- строения оптимальных управлений или их приближений. Автор считает своим приятным долгом выразить ис- креннюю признательность А. Б. Куржанскому за весьма полезное обсуждение монографии, ее рецензирование и критические замечания. Хочется также поблагодарить сотрудников лаборатории управляемых процессов и си- стем Днепропетровского института инженеров железно- дорожного транспорта им. М. И. Калинина за их помощь при подготовке рукописи к печати. А. Егоров *) Бутковский А. А., Методы управления системами с рас- пределенными параметрами. Изд-во «Наука», 1975. Лурье К. А., Оптимальное управление в задачах математической физики. Изд-во «Наука», 1975. Лионе Ж.-Л., Оптимальное управление системами, описываемыми уравнениями с частными производными. Изд-во «Мир», 1972.
ВВЕДЕНИЕ Известно, что передача тепла и диффузия играют важ- ную роль в различных технологических процессах, а так- же при производстве и преобразовании энергии. Для ил- люстрации достаточно привести лишь некоторые при- меры. С этой целью прежде всего следует отметить химико- технологические процессы, где тепло- и массоперенос яв- ляется доминирующим при получении той или иной про- дукции (см., например, [1—3]). Велика роль тепло- и мас- сопереноса в различных процессах, связанных с сушкой влажных материалов (см., например, [4—6]). Значительное место занимает теплопередача и диф- фузия в различных сферах металлургического производ- ства. С точки зрения излагаемой здесь теории следует различать два типа производственных процессов в ме- таллургии. К первому из них относится плавка металла, когда в результате термического воздействия происхо- дят фазовые превращения обрабатываемого материала, сопровождающиеся довольно сложными химическими реакциями. Такой процесс пока не поддается достаточ- но точному математическому описанию, и поэтому сейчас нет возможности широко использовать методы теории оптимального управления с целью его интенсификации. Ко второму типу относятся различные процессы термиче- ской обработки металлических изделий, например, в то- мильных и индукционных печах. Правильная их органи- зация (продолжительность, температурный режим и т. д.) позволяет экономить энергию и затраты труда при по- лучении необходимой продукции. Эти процессы более просты и легче поддаются математическому описанию, что позволяет в ряде случаев использовать аналитиче- ские методы расчета оптимальных режимов (см., напри- мер, [7]).
12 ВВЕДЕНИЕ Решающую роль играют тепловые процессы в совре- менной энергетике. В предисловии ко второму изданию монографии С. С. Кутателадзе [8] об этом сказано доста- точно определенно. «Аэродинамический нагрев тел, охла- ждение высокофорсированных двигателей, отвод чрезвы- чайно мощных тепловых потоков в ядерных реакторах, в мишенях разрядных вентилей линий дальних электропе- редач постоянного тока, использование тепла глубинных слоев Земли и другие проблемы современной науки и тех- ники необычайно расширили область практических при- ложений теории теплообмена и поставили перед нею ряд новых исключительно сложных и глубоких физических задач». Необходимость их решения и практического ис- пользования получаемых результатов требует примене- ния разнообразных методов современной науки, в том числе и новейших достижений математической теории оп- тимального управления. Отмечая эту область использо- вания процессов теплообмена, следует иметь в виду, что они обычно достаточно хорошо формализуются и в ряде случаев могут быть описаны математическими соотноше- ниями [8—10]. Особо следует отметить роль теплообмена и диффузии в ядерной энергетике. Превращение ядерной энергии в электрическую, как известно, происходит по цепочке: ядерная энергия — тепловая — электрическая, и роль промежуточного звена в этом процессе весьма значитель- на. Поэтому вопросы тепловыделения и теплопередачи занимают одно из важнейших мест в теории реакторов. Кроме того, получение ядерной энергии в реакторах обу- словлено диффузией нейтронов, их выделением и погло- щением, что позволяет рассматривать реактор как один из наиболее ярких примеров практического использова- ния взаимодействующих тепловых и диффузионных про- цессов [11—14]. Современное состояние теории реакторов уже сейчас позволяет указать пути практического приме- нения теории оптимального управления в задачах опти- мизации ядерных энергетических установок (см., напри- мер, [15]). Все перечисленные объекты являются весьма дорого- стоящими. Поэтому в каждом конкретном случае речь идет не только о качественном их проектировании, но и о наиболее эффективной их эксплуатации, что требует
ВВЕДЕНИЕ 13 широкого применения средств автоматического регулиро- вания (см., например, [16—17, 24]) и идей теории опти- мального управления [18—23, 25]. При этом во многих случаях необходимо учитывать распределенность пара- метров оптимизируемых объектов и систем. Вместе с тем пока нет работ, в которых с единых позиций излагались бы решения различных задач оптимального управления тепловыми и диффузионными процессами. В настоящей монографии сделана попытка осветить вопросы управления такими процессами с позиций тео- рии оптимальных систем с распределенными параметра- ми, указать пути использования каждого из методов этой теории, а также проанализировать трудности корректного математического обоснования различных процедур фор- мального решения прикладных задач. Бурное развитие теории оптимального управления связывают обычно с принципом максимума Понтрягина [26] и динамическим программированием [27]. Математи- ческая теория оптимальных процессов, базирующаяся на принципе максимума и прилегающих к нему исследова- ниях, послужила теоретически обоснованной базой мно- гих работ по анализу разнообразных прикладных задач оптимального управления, когда состояние управляемо- го объекта в каждый конкретный момент времени можно задавать вектором в конечномерном пространстве. При этом поведение объектов во времени должно описываться обыкновенными дифференциальными или дифференци- ально-разностными уравнениями. Примерно тот же круг задач управления исследовался с помощью динамическо- го программирования. Существенным здесь является тот факт, что динамическое программирование обычно ока- зывалось эффективным лишь при решении задач, в ко- торых управляемая система имеет конечное (относитель- но небольшое) число степеней свободы. Значительные успехи в исследовании различных задач оптимального управления конечномерными системами были достигну- ты с помощью развитого Н. Н. Красовским и его учени- ками метода [28], основанного на использовании класси- ческой L-проблемы моментов. Применение всех этих методов в случае бесконечно- мерных систем натолкнулось на существенные трудности, которые заключались, во-первых, в том, что для таких
14 ВВЕДЕНИЕ систем не удалось найти достаточно универсальную фор- мулировку задачи, для которой можно было бы выписать эффективно проверяемые и достаточно полные необхо- димые условия оптимальности. Во-вторых, даже для тех случаев, когда такие условия были получены, возникали существенные, а подчас и принципиальные трудности при их практическом использовании для построения опти- мального управления или его приближений. Многочисленные исследования такого типа задач за- ложили основы специальной ветви теории оптимального управления, которую называют теорией оптимального управления системами с распределенными параметрами. Переходные процессы в таких системах обычно можно описать дифференциальными и интегро-дифференциаль- ными уравнениями с дополнительными (начальными и граничными) условиями. При решении прикладных задач теории оптимально- го управления такими системами часто используется сле- дующий способ. Исходную систему уравнений в частных производных с соответствующими граничными условиями заменяют подходящим образом подобранной систе- мой т обыкновенных дифференциальных уравнений. Для этого обычно аппроксимируют краевую задачу мето- дом прямых или ограничиваются конечной системой урав- нений относительно коэффициентов Фурье искомого ре- шения. Тем же способом аппроксимируют (если это нуж- но) минимизируемый функционал. В итоге получается задача об оптимальном управлении процессом, который описывается системой т обыкновенных дифференциаль- ных уравнений. Ее решение берется в качестве /n-го при- ближения решения исходной задачи. Для уточнения полученного результата увеличиваются т. Тем самым исходная задача не решается точно, а для построения ее приближенных решений используется аппарат теории оптимального управления конечномерными системами. Однако этот способ решения таит в себе ряд опасностей. На одну из них указал Н. Н. Красовский [29], и заклю- чается она в следующем. Предположим, что в рассматриваемой задаче для бес- конечномерной системы ищется оптимальное по некото- рому критерию управление при ограничении ||м||^Л^. После конечномерной аппроксимации системы это огра-
ВВЕДЕНИЕ 15 ничение сохраняется. Для построения приближений оп- тимального управления в соответствии е принципом мак- симума составляем функцию H{t, ф"*(/), и), где хт — фазовый вектор аппроксимирующей системы, а фт — сопряженный ему вектор. Обычно оказывается, что при любом т функция Н фактически зависит от и и, тем самым, условие максимума Н дает достаточную ин- формацию для определения m-го приближения ит(1) оптимального управления. Если даже устанавливается сходимость um(t) к оптимальному управлению в исход- ной бесконечной системе, то она во многих случаях но- сит достаточно нерегулярный характер. На языке прин- ципа максимума это означает, что функция H(t, i|>m(Z), xm(t), и) вырождается в пределе при т-^-оо, т. е. она оказывается не зависящей от и *). В итоге функция Н не дает необходимой информации для определения опти- мального управления и°(0- В подтверждение этих слов рассмотрим следующий пример ([30], стр. 194—195). Пусть управляемый процесс описывается уравнением - = и, (1) di v ’ в котором х — вектор с компонентами xlt ..., хп... удовлетворяющими условию 2 £< 00. П=1 Компоненты и1( ..., ы„, ... вектора и пусть также удов- летворяют условию 2 «?<оо. 1=1 Допустимыми управлениями будем считать измеримые функции u = u(t), в каждый момент времени принимаю- *) Более подробно с вопросом о вырождении функции Н в бес- конечномерных задачах читатель может ознакомиться по работе Fattorini Н. О. [39].
16 ВВЕДЕНИЕ щие значения из области управления / 1 1 \ U я | Zw === Wi, • • • > •••}•! I “Ь* " > s 1» 2, • • • I \ п п2 / (2) Задача состоит в том, чтобы найти допустимое управле- ние и°(0 такое, что соответствующее ему решение х°(0 уравнения £-«•(0 (3) at с начальным условием х(0) = {0, 0, ... О, ...} (4) удовлетворяло бы условию *(7'Н144...........(ч ( Z О П ) при минимальном положительном Т. Уравнение (1) с условием (4) можно записать в виде t хп(0 = J Un_{x)dx, п =1, 2, ... О Отсюда с учетом (2) находим, что минимальное время перехода от значения хя(0)=0 к значению хп(Т) = — п 1 1 получается при выбореun(t)~—|—-и это минимальное п пг . время равно п(п+1)-1. Эта величина стремится к 1 при п—>-оо. Таким образом, время Т оптимального быстро- действия в рассматриваемой задаче не может быть мень- ше 1. С другой стороны, управление .....4 (6) & и о л .) является допустимым, а соответствующая ему траекто- рия x(t), определяемая соотношениями (3) — (4), удов- летворяет условию (5) при Т=1. Следовательно, управ- ление (6) является оптимальным.
ВВЕДЕНИЕ 17 Проанализируем теперь принцип максимума для рас- сматриваемой задачи. С этой целью строим функцию Я=^ф((/)ы4, где функции ф<(0 определяются уравне- ниями Из этих уравнений находим, что (0 и в соответст- вии с принципом максимума не все константы равны ну- лю. Однако если же при некоторых k, то из ус- ловия максимума функции Я по и k-я компонента оп- тимального управления должна иметь вид = (l-]--L\signih. \ Л я2 j Ни одна из компонент оптимального управления (6) это- му условию не удовлетворяет. Следовательно, оптималь- ное управление (6) не удовлетворяет принципу макси- мума. Будем теперь решать задачу приближенно, используя конечномерную аппроксимацию исходного уравнения (1). В качестве /n-го приближения этого уравнения будем брать систему — = ип, п = 1, ..., т. (7) За допустимые управления будем брать вектор-функции Mm=«m(0, компоненты которых ut, ..., ит — измеримые функции, удовлетворяющие условиям |«„|^п-‘+п-,) п=1, (8) В качестве /n-го приближения u°(f) берем управление йт(0 такое, что соответствующее ему решение уравнений —-=u„, п=1, ..т, (9)
18 ВВЕДЕНИЕ с начальными условиями хп(0)=0, п—1, ..., т, (10) удовлетворяет условиям хп(Г)=л_‘, п=1,...,т (11) при наименьшем положительном Т. Управление йт(1) будем строить следующим образом. Система (7) с условиями (10) эквивалентна соотно- шениям t xn(t) = § ип di, п =1, ..., т. О Отсюда следует, что минимальное время перехода коор- динаты хп из состояния хп=0 в состояние х„=п_| при ус- ловии |ы„| =^п-|+п-2 получается при и„(/)=п-1+л-г, и это минимальное время Т„ = п(п+1)-1. Очевидно, что Т,<_Тг<... .<ZTm. Поэтому время пере- хода всей системы (7) из состояния (10) в состояние (11) не может быть меньше Тт, а любое управление «"•(/) = = {ы1(/), ..., которое переводит систему (7) из (10) в (11) за время Тт, будет оптимальным. Таким образом, его можно искать из соотношений С un(t)dt = —, п = 1, .... /и, Тт = т(\+ т)-1. J п О Отсюда йт(0 находится однозначно: ит(0 =т~1+/и~2- Для определения остальных компонент вектора um(i) имеем т—1 первых соотношений Тт un{t)dt = п=Л, ..., т —1, Тт =m(l-|- т)-1, О (12) и любой вектор {«ДО» • • • > является оптимальным управлением, если u^t), .... ит_4 удовлет-
ВВЕДЕНИЕ 19 воряют условиям (12) и (8). Поэтому управление = ....—*--------, —1 (13) 1ГЖ’2ГЖ ттт] является оптимальным. Соответствующее ему решение задачи (9) — (10) имеет вид 4 xn(t) —---1, n = l, m. я^т * Проверяем теперь, что на um(t) и xm(t) = {Xi(/), ••• .xTO(f)} принцип максимума выполняется. Строим функцию Я(фт(0> xm(t), «)=ф1и1+.. .+фт(0ыт, где определяются из уравнений *=0, л=1..........т. di Полагая фД/) = ... =фт-»(0 =0, ф«(0 = 1, находим, что на управлении йт функция Я(ф”*(0, xm(t), и) достигает своего максимума. Более того, она достигает этого макси- мума на управлении {u^t), ..., т~1+т~2}, где ы<(0 (t= 1> • • •. т—1)—любые измеримые функции, удов- летворяющие условиям (8) и (12). Таким образом, при каждом т функция Я(фт(/), xm(t), и) не вырождается, в то время как функция Н (Ф (0> х° (£), и) = Ф1Ы1 ~Ь .. -|- фот (0 чт • • • вырождается. Другая опасность конечномерных приближений со- стоит в том, что во многих задачах процесс аппроксима- ции u°(t) с помощью функции um(0 является неустойчи- вым относительно погрешностей в промежуточных вы- числениях. Суть этого явления состоит в следующем. Пусть бесконечномерная управляемая система каким- либо способом аппроксимируется конечномерными систе- мами и для определения «’(/) с помощью аппроксими- рующих систем получаем /n-е приближение um(t), т = \, 2, ... Зачастую возникает следующая ситуация (см., например, гл. III). Приближения um(t) сходятся к u°(t) при т-^-оо. Однако практически um(t) при каждом т можно определить лишь приближенно. Это означает,
20 ВВЕДЕНИЕ что вместо um(t) практически получаются управления «”*(/)+6m (О, где 6“ — величина, получаемая в результа- те погрешностей в промежуточных вычислениях. При этом оказывается, что с возрастанием т малые погреш- ности в промежуточных вычислениях приводят к значи- тельному по величине бт(0> т. е. практически um(t) вы- числяются с большими погрешностями. Наконец следует отметить, что, как правило, в зада- чах управления бесконечномерными системами большие трудности возникают при доказательстве сходимости ко- нечномерных аппроксимаций. Все это послужило достаточно веским основанием для вывода, сделанного Н. Н. Красовским в 1968 г. (см. [29], стр. 240). «Вообще задача об аппроксимации управляе- мых систем с распределенными параметрами подходящи- ми конечномерными системами представляется весьма важной проблемой, разрешение которой открыло бы но- вые эффективные пути и для теоретического исследова- ния и для конкретного численного решения». С тех пор опубликовано много работ по управлению такими систе- мами. Однако указанная проблема аппроксимации оста- ется по-прежнему актуальной. Корректному математическому исследованию опти- мальных процессов в системах с распределенными пара- метрами посвящена монография [31], в которой показа- но, что такое исследование линейных процессов можно выполнить с помощью аппарата обобщенных функций. Другой подход к решению более общих задач предложен В. И. Плотниковым [32]. Здесь не представляется возмож- ным хотя бы кратко изложить содержание этих исследо- ваний. Однако следует отметить, что несмотря на обилие разнообразных публикаций, в теории управления систе- мами с распределенными параметрами пока не удалось получить удовлетворительные ответы на многие вопро- сы, которые для конечномерных систем являются эле- ментарными. В частности, рассмотренный выше пример показывает, что в бесконечномерной задаче функция Я(ф°(0, х°(0» «) вырождается и принцип максимума не дает необходимой информации для определения опти- мального управления. Естественно возникает вопрос: ка- ковы же необходимые условия оптимальности для такого типа вырожденных задач? Не менее важно знать доста-
ВВЕДЕНИЕ 21 точные признаки, по которым можно было бы проверить в каждом конкретном случае, является ли задача вырож- денной или нет? Анализ исследований по управлению си- стемами с распределенными параметрами показывает, что бесконечномерность фазового пространства во мно- гих случаях приводит к тому, что функция И строится весьма своеобразно и далеко не всегда по виду задачи ее можно «угадать», чтобы предложить практический спо- соб построения оптимального управления. Более того, часто оказывается (см. [32]), что для определения сопря- женных переменных, фигурирующих в Н, не удается по- лучить соотношения, подобные уравнениям для конеч- ных систем дН di дх{ * i = 1, 2, .... п. Следует также отметить, что для систем с распреде- ленными параметрами почти не исследована проблема управляемости. Ее сложность заключается прежде все- го в том, что в окрестности любого состояния, в которое можно попасть, имеются состояния, которые невозможно достичь (при граничном управлении и при управлении, зависящем лишь от одной переменной). Имеется много нерешенных вопросов, относящихся к существованию и единственности оптимального управления даже в прос- тейших задачах. Перечень таких «белых пятен» в теории управления системами с распределенными параметрами можно продолжить. Они имеются как в проблеме при- ближенного решения, так и в вопросах корректного обос- нования различных необходимых, а также достаточных условий оптимальности. Обилие прикладных задач управления такими систе- мами вызывает острую необходимость в достаточно пол- ном обзоре существующих методов их исследования и возможностей их применения при расчете конкретных оптимальных систем. Однако рассмотреть все эти вопро- сы в одной монографии невозможно. Здесь мы ограни- чиваемся анализом сравнительно узкого круга задач, а именно, рассматриваем лишь задачи управления тепло- выми диффузионными процессами, не касаясь исследо- ваний, которые достаточно полно освещены в моногра-
22 ВВЕДЕНИЕ фиях [33, 38]. Тем не менее здесь указываются и более или менее подробно анализируются разнообразные ма- тематические методы решения такого типа задач (клас- сические вариационные методы, принцип максимума, L-проблема моментов, динамическое программирование). Особое внимание уделяется анализу конкретных задач управления процессами в ядерных реакторах, индукци- онным нагревом и т. д., взятых из разнообразных прило- жений теории тепло- и массообмена. Некоторые из них исследованы с достаточной полнотой и их математиче- ское решение можно считать завершенным. Другие лишь сформулированы или решены чисто формально и требуют корректного математического анализа. В теоретической части работы автор не стремился к изложению максимально общих результатов по каждому из рассмотренных методов решения, а ограничился лишь анализом линейных систем с простейшими критериями оптимальности. Однако даже для них далеко не всегда удалось получить исчерпывающие результаты. В част- ности, пока не полностью исследована задача об управле- нии с минимальной энергией, во многих случаях не обос- нована процедура вывода функционального уравнения Веллмана. Хочется надеяться, что незавершенность ис- следований в указанных и других подобных случаях бу- дет источником новых работ по теории оптимального управления системами с распределенными параметрами и ее разнообразным приложениям. В основу книги положены работы автора и его уче- ников (§§ 2.5, 3.3, гл. IV—VII). Часть § 3.3 написана по материалам докторской диссертации В. И. Плотникова. Прикладные задачи оптимизации тепловых и диффузи- онных процессов, изложенные в гл. II (исключая § 2.5), сформулированы и в различной мере исследованы в ра- ботах других авторов. Здесь они приводятся, как прави- ло, без дополнительных исследований. В книге, к сожа- лению, не удалось осветить весьма важные исследования В. И. Плотникова [32], Фатторини [39], Чезари [40] и ряда других авторов, которые пока недостаточно полно изло- жены в книгах по оптимальному управлению системами с распределенными параметрами. В ней также не дается более или менее полный обзор литературы по рассматри- ваемым здесь вопросам, ибо он в значительной мере по-
ВВЕДЕНИЕ 23 вторял бы обзоры, приведенные в [31, 33, 38]. В список литературы включены лишь самые необходимые для из- ложения, по мнению автора, источники. Монография состоит из семи глав, о содержании ко- торых можно судить по оглавлению. Поэтому здесь не будем перечислять всего того, о чем идет речь в каждой главе, а ограничимся лишь обсуждением тех соображе- ний, по которым тот или иной материал включен в соот- ветствующую главу. Прежде всего нам хотелось, чтобы изложение мате- матической теории оптимальных тепловых и диффузион- ных процессов было максимально приближено к анали- зу конкретных и разнообразных прикладных задач. Поэтому в первой главе излагается математическое опи- сание различных тепловых и диффузионных процессов, чтобы в дальнейшем давать разумную постановку раз- личных задач оптимизации. Сначала выводятся класси- ческие краевые задачи для уравнения теплопроводно- сти и диффузии. Затем рассматривается математическое описание процесса тепло- и массопереноса в бинарных газовых смесях и жидких растворах, а также процесса диффузии нейтронов. Все эти вопросы достаточно полно изложены в отечественной литературе. Одни из них мож- но найти в математической учебной литературе, другие взяты из различных специальных книг по тепло- и мас- сопереносу и теории ядерных реакторов. Включение это- го материала в отдельную главу преследовало цель изложить с единых позиций математическое описание различных тепловых и диффузионных процессов. Это поз- воляет указать разнообразные прикладные области, где возможна (и даже целесообразна) формулировка задач оптимального управления такими процессами, основан- ная на использовании краевых задач математической физики. Ясно, что круг этих задач можно существенно расши- рить, включив в него задачи управления нагревом метал- лов в различных печах [7], сушкой влажных материалов и т. д. Мы ограничились анализом некоторых из них, что- бы в последующих главах показать возможность мате- матических методов решения задач оптимального управ- ления тепловыми и диффузионными процессами. Кроме того, этот анализ, как нам кажется, может быть полезен
24 ВВЕДЕНИЕ инженерам при выборе математического описания дру- гих управляемых процессов и в математической форму- лировке конкретных задач оптимального управления. Пока же дело обстоит таким образом, что эти специалис- ты старательно избегают пользоваться уравнениями в частных производных для описания управляемых про- цессов. Вводя различные упрощения, процесс обычно описывают обыкновенными дифференциальными урав- нениями и тем самым решают задачи управления для ко- нечномерных систем. Этот прием далеко не всегда оправ- дан и, как показано в последующих главах, часто может приводить к заведомо ложным выводам. Это, в частно- сти, можно объяснить тем, что задачи оптимального управления, по терминологии А. Н. Тихонова, являются некорректно поставленными и, следовательно, малые из- менения в исходных данных задачи могут приводить к весьма существенным изменениям в окончательном ее решении. Следует отметить, что в монографии рассматривают- ся главным образом неустановившиеся процессы, когда состояние управляемого объекта изменяется во времени. Вопросы оптимизации установившихся процессов весьма подробно изложены в монографии [33]. Анализ рассмотренных в этой главе задач показыва- ет, что во всех интересующих нас случаях процесс опи- сывается краевыми задачами для уравнений с частны- ми производными. Поэтому оказалось целесообразным изложить некоторые общие факты, относящиеся к пост- роению формальных решений этих задач, а также дать краткие сведения об обобщенных решениях. Включение этого материала в монографию обусловлено не стремле- нием автора к тем или иным обобщениям. Все дело в том, что известные в настоящее время решения задач опти- мального управления системами с распределенными па- раметрами неизбежно приводят к необходимости исполь- зовать обобщенные решения краевых задач. Во второй главе рассматриваются простейшие зада- чи оптимизации тепловых и диффузионных процессов, которые решаются либо элементарными классическими методами, либо с помощью принципа максимума для ко- нечномерных систем. Значительная часть этой главы по- священа анализу ядерных реакторов на тепловых нейт-
ВВЕДЕНИЕ 25 ронах. Помимо того, что рассмотренные здесь вопросы оптимизации реакторов интересны сами по себе, следует отметить, что материал этой главы существенно исполь- зуется для формулировки задач оптимального управле- ния нестационарными процессами. Простейшая из них рассмотрена в этой же главе. Другие более сложные за- дачи анализируются в последующих главах. Третья глава, посвященная задаче об управлении с минимальной энергией, содержит некоторые результаты по применению L-проблемы моментов к решению про- стейшей задачи. Известно, что подобная задача для ко- нечномерных систем элементарна и легко решается клас- сическими методами. Выполненный здесь анализ пока- зал, что для бесконечномерных систем она далеко не проста. В частности, имеются трудности в доказательст- ве существования ее решения. Если же она разрешима, то обычно используемая процедура построения прибли- женного решения оказывается неэффективной. Она не- устойчива относительно погрешностей в промежуточных вычислениях. Поэтому для аппроксимации оптимального управления предлагается один из способов регуляриза- ции, основанный на использовании штрафных функций. Изложение этой процедуры, кроме всего прочего, позво- ляет установить связь гл. III с гл. VI, в которой рассмат- риваются различные задачи оптимального управления с квадратичными критериями оптимальности. Таким образом, содержание этой главы дает представ- ление о возможностях и трудностях, которые возникают при исследовании процессов с помощью L-проблемы мо- ментов. Мы ограничились анализом лишь простейшей за- дачи, а именно задачи об управлении с минимальной энергией. Поэтому ясно, что в более сложных задачах указанных трудностей будет не меньше. Тем не менее, исследование нельзя считать бесперспективным. Теория по классической проблеме моментов располагает доста- точно богатым арсеналом методов (см., например, [34]), позволяющих рассчитывать на успешное решение многих задач оптимального управления бесконечномерными си- стемами с помощью L-проблемы моментов. В четвертой главе решается задача об оптимальном быстродействии при управлении диффузией нейтронов в атомном реакторе с учетом его распределенности.
26 ВВЕДЕНИЕ Специфические ограничения, определяемые физическим содержанием процесса, позволяют значительно упростить задачу и полностью применить метод ее исследования, когда не учитывается распределенность реактора. В ито- ге оказывается, что в том случае, когда избыточная ре- активность зависит только от времени, задача решается полностью, а именно,— удается синтезировать оптималь- ное управление. Глава V посвящена применению метода динамическо- го программирования. Рассмотрено несколько задач управления линейными процессами с различными кри- териями оптимальности. Их анализ показывает, что с формальной точки зрения нет принципиальных трудно- стей в применении этого метода. Во всех рассмотренных случаях формально можно получить уравнение Веллма- на. Способ его получения показывает, что аналогичное уравнение можно получить и в том случае, когда про- цесс описывается нелинейной краевой задачей для урав- нений с частными производными. Для этого необходимо лишь, чтобы обобщенное решение краевой задачи было единственным и определялось соответствующим инте- гральным тождеством. Если же процесс линеен, а кри- терием оптимальности служит интегральный квадра- тичный функционал, то для решения задачи удается получить интегро-дифференциальную краевую задачу, которая является бесконечномерным аналогом известного уравнения Риккати для конечномерных систем. В заклю- чение в этой главе кратко анализируется задача об опти- мальной стабилизации одного типа систем с распреде- ленными параметрами. Показывается, что синтез дина- мического программирования и теории устойчивости для бесконечномерных систем [35, 36] открывает новые воз- можности в решении такого типа задач. Следует отме- тить, что в этой главе не дается корректного математи- ческого обоснования предлагаемой процедуры. Указыва- ется лишь, как это можно сделать в различных частных случаях и даются соответствующие ссылки на лите- ратуру, где это сделано подробно. В главе VI рассматриваются различные задачи опти- мального управления, описываемые краевыми задачами для уравнения теплопроводности с квадратичными кри- териями оптимальности, которые решаются с помощью
ВВЕДЕНИЕ 27 необходимых условий в форме принципа максимума. В итоге оказывается, что в ряде случаев такой подход позволяет получить достаточно полное решение задачи. Удается указать удовлетворительную процедуру постро- ения приближенных решений и оценить допускаемую по- грешность на каждом шаге аппроксимации. Сравнение процедур, изложенных в гл. V и VI, позволяет получить представление о достоинствах и недостатках динамиче- ского программирования и принципа максимума в их применении к системам с распределенными параметра- ми. Вместе с тем содержание этой главы увязывается с тем, о чем речь шла в гл. III. Некоторые из рассмотрен- ных здесь задач тесно связаны с задачей об управлении с минимальной энергией. В заключительной, седьмой главе рассматриваются различные задачи управления, которые по разным при- чинам было нецелесообразно включать в предыдущие главы. Сначала анализируется одна задача об управле- нии индукционным нагревом. Точная ее математическая формулировка приводит к довольно сложной задаче об оптимальном управлении взаимодействующими электро- магнитными и тепловыми процессами, которые к тому же сопровождаются изменением кристаллической структу- ры обрабатываемого материала. Поэтому здесь предла- гается упрощенная задача, решение которой во многих случаях оказывается более приемлемым по сравнению с другими рекомендациями. Затем рассматривается одна задача управления ядер- ным реактором. С помощью динамического программи- рования выводится уравнение Веллмана. Однако оно не решается, ибо для этого требуется использовать специ- фические приближенные методы, анализ которых выхо- дит за рамки, ограничивающие содержание данной кни- ги. Излагая этот материал, автор стремился привлечь внимание математиков к разнообразным задачам управ- ления, которые имеются в теории реакторов. В заключение исследуются две задачи об инвариант- ности теплообменных аппаратов. Аппараты такого типа играют важную роль во многих энергетических объектах. Достаточно указать тепловые и атомные электростанции. Поэтому их исследование с позиций теории управления представляет несомненный практический интерес. Здесь
28 ВВЕДЕНИЕ мы ограничились изложением лишь вопросов их инвари- антности. «В двух словах» суть рассматриваемых задач состоит в следующем. В рассматриваемом аппарате про- исходит теплообмен между двумя движущимися жидко- стями. Холодная жидкость движется, например, по тру- бе большого диаметра D, а горячая — по трубе малого диаметра d, помещенной внутри первой трубы. Холодная вода имеет линейную скорость W, а горячая — скорость w. В результате воздействия случайных помех горячая вода поступает на вход объекта с нестабильной темпера- турой. Рассматриваемая здесь задача состоит в том, что- бы в допустимом интервале скоростей W и w выбрать такие скорости, при которых процесс теплообмена между жидкостями был нечувствителен (или наименее чувстви- телен) к колебаниям температуры горячей жидкости по некоторому заранее выбранному критерию. Приведенные в монографии результаты показывают, что для простей- ших типов аппаратов такая задача решается точно в случае стационарных помех. Если же помехи не стацио- нарные (зависят от времени), то теплообменник, вообще говоря, представляет собой объект с распределенными параметрами. В этом случае предлагается способ при- ближенного решения задачи, который с математических позиций требует своего обоснования. Следует отметить, что при решении задачи как для стационарного, так и для нестационарного процесса условия инвариантности получались путем вычисления приращения функциона- ла— критерия инвариантности. Включение этого мате- риала в книгу по управлению тепловыми и диффузионны- ми процессами преследовало две цели. Во-первых, хоте- лось показать, что методом, основанным на вычислении приращения функционала, можно решать не только за- дачи оптимизации таких процессов, но и задачи инвари- антности. В конечном счете все зависит от того, являет- ся ли выбранный функционал критерием оптимальности или показателем инвариантности объекта. Поэтому для многих из рассматриваемых в предыдущих главах про- цессов можно сформулировать содержательные задачи инвариантности и выполнить их исследование, вычисляя приращение соответствующего функционала. Мы отказа- лись от такого пути, ибо он приводит к излишним повто- рениям в аналитических построениях. Вместо этого здесь
ВВЕДЕНИЕ 29 рассматриваются задачи об инвариантности теплообмен- ных аппаратов, когда процессы описываются системами уравнений первого порядка в обыкновенных или частных производных. Такой подход позволил в какой-то мере достигнуть второй цели. Способ решения задачи об инвариантности теплообменного аппарата показывает, что аналогично можно исследовать различные задачи оптимизации та- ких объектов. Для этого нужно вычислять приращение минимизируемого функционала подобно тому, как это де- лается в гл. VI, когда процесс описывается краевой зада- чей для уравнения второго порядка. Следует также от- метить, что в этом случае не возникает формальных трудностей при использовании динамического програм- мирования. Можно воспользО|Ваться методом, который изложен в гл. V, и получить соответствующее уравне- ние Веллмана для каждой задачи оптимального управ- ления теплообменным аппаратом. Таким образом, мето- ды, изложенные в монографии, в значительной мере можно использовать для исследования оптимальных про- цессов в теплообменниках. Более того, теми же методами можно решать подобные задачи управления, когда од- новременно следует учитывать диффузионные процессы и процессы, происходящие в теплообменных аппаратах. Такого типа задачи представляют определенный инте- рес при управлении ядерными реакторами. Следует также отметить, что в монографии не дается анализа задач оптимального управления процессами, ко- торые описываются системами уравнений параболиче- ского типа, хотя примеры таких процессов приведены в гл. I. Однако даже поверхностный анализ изложенных методов показывает, что их без особых трудностей мож- но использовать и в этом случае. Здесь это не делается из-за нежелания увеличивать объем монографии. По тем же соображениям мы ограничились анализом лишь одной задачи управления системой, содержащей элементы с распределенными параметрами (см. гл. VI), когда управ- ляемый процесс описывается системой, содержащей урав- нения в обыкновенных и частных производных.
ГЛАВА I МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ Эта глава посвящена выводу и краткому анализу математических соотношений, описывающих теплопро- водность и диффузию в различных средах. Значитель- ное место в ней уделяется анализу простейших примеров из теории тепло- и массообмена, индукционного нагрева металлов, теории ядерных реакторов и т. д. Излагаемые здесь факты можно найти в учебниках и монографиях по математической физике, теплопроводности и диффу- зии. Тем не менее представляется целесообразным на- чать изложение задач оптимального управления с ана- лиза математического описания конкретных процессов. Основная цель, которая при этом преследуется, состоит в том, чтобы, во-первых, подготовить читателя к физиче- ски обоснованным постановкам задач оптимизации и, во-вторых, показать на простейших примерах большое многообразие управляемых процессов теплопроводности и диффузии, которые рассматриваются в прикладных науках. Правильное понимание каждого такого процесса играет решающую роль в выборе разумной формулиров- ки задачи оптимизации. Изложение материала начнем с того, что приведем некоторые факты из теории поля, необходимые в даль- нейшем при описании различных процессов. Аппарат теории поля позволяет достаточно просто выводить ос- новные уравнения теплопроводности и диффузии, так как при этом нет необходимости пользоваться конкрет- ной системой координат. Под вектором будем понимать направленный отре- зок в евклидовом пространстве. Обозначать векторы бу- дем так называемыми полужирными буквами (g, w, ...). Длину вектора будем обозначать теми же буква- ми обычного шрифта (g, v, w,...). Векторным полем бу- дем называть область, каждой точке которой ставится в
ГЛ. I] ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ 31 соответствие некоторый вектор. Аналогично скалярным полем называется область, каждой точке которой ста- вится в соответствие некоторая скалярная величина. Простейшим примером скалярного поля является тем- пература физического объекта в любой конкретный мо- мент времени. Здесь каждой точке М объекта соответст- вует своя температура и(М). Предположим, что функция и = и(М) дифференци- руема во всей рассматриваемой области D. Каждой точке M^D поставим в соответствие вектор g(M), ко- торый по величине и направлению совпадает с наиболь- шей скоростью изменения функции и(М). Полученное векторное поле однозначно определяется скалярной функцией и = и(М). Вектор g называется градиентом этой функции и обозначается g(M) =grad u(Af). Иначе этот вектор можно определить, используя его проекции на оои декартовой системы координат Ох„г. Определение 1. Градиентом скалярной функции ди ди ди и=и(М) называется вектору с проекциями—, —, —, т. е. _ ди . . ди . . ди . дх ду дг где I, J и k—единичные векторы, определяющие направление осей координат Ох, Оу, и Ог соответ- ственно. Пусть задано векторное поле, в котором каждой точ- ке М соответствует вектор v(M). Пусть, кроме того, в области D, в которой определено это поле, задана кусоч- но-гладкая поверхность S. Тогда почти всюду на S опре- делена проекция vn вектора V на направление внешней нормали п к поверхности S. Определение 2. Величина vndS называется потоком вектора v через поверхность S.
32 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. г Если S — замкнутая поверхность, окружающая точ- ку М, то можно определить величину vndS, где V — объем области, ограниченной поверхностью S. Скалярная величина Y(M) = lim у(М, 3) V-*0 называется дивергенцией вектора Ф (и обозначается diver). Если воспользоваться декартовой системой коор- динат, то понятие дивергенции можно ввести следующим образом. Определение 3. Дивергенцией вектора tr назы- вается скалярная величина дх ду dz (А) где vx, v„ и vt— проекции вектора v на соответствую- щие оси координат. В соответствии с определениями 2 и 3 устанавливает- ся следующая связь между потоком вектора через замк- нутую поверхность 3 и его дивергенцией (формула Г аусса—Остроградского) Цця</3 = J J J divudQ, з Q где Q—область, ограниченная поверхностью S. Мы не будем обсуждать здесь вопрос о наиболее сла- бых ограничениях, которые следует накладывать на по- верхность S и вектор чтобы формула (А) оставалась справедливой. Однако отметим, что она верна, если по- верхность S кусочно-гладкая, а функция div v _кусочно- непрерывна в любой области содержащей Q=Q-}-S. Если ввести символический вектор Гельмгольца дх ду дг
ГЛ. I] ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ 33 то дивергенцию вектора v можно представить с помощью скалярного произведения div о = (V, о). Тогда формулу (А) можно записать в виде ffondS= (В) s Ja Если v =k(M) grad и(М), где k(M)—скалярная функция, то o„ = fe(M):(gradu(M))„'=fe^ и, следовательно, = J J J* div (k grad и (М)) d Q dQ = = J (V, fcgrad«(M))dQ. a Если воспользоваться декартовой системой коорди- нат Oxyz, то формулу (В) можно записать в виде f f As = f f £)+1 It ’1'1 + ’k ’ifl dQ. J J dn J J J [dx \ dx) dy\ dy ) dz\ dz IJ В частности, когда k(M) =k—const, формула (В) принимает вид S й где оператор A=div (grad) называется оператором Лап- ласа. Поскольку в дальнейшем этот оператор будет часто встречаться при описании различных процессов, то умест- но указать его вид в различных системах координат. 1. В декартовой системе координат ды = ±1 + д. дх2 ду2 ' дгг 2 А. И. Егоров
34 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 2. В сферической системе координат, когда x=r sin 9 cos <р, y=r sin 0 sin <р, z=r cos 0, будем иметь 1 Г / 2 • а йв \ I д ( • а ди\ I 1 02« ------1 — (г2 sin 0 — — (sin 0 — Н-----------—- —— r2sin0|.0r\ dr ) 00 \ 00/ sina0 0<р2 Если функция и обладает сферической симметрией, т. е. зависит лишь от г, то Ди = 1 d /2 du\ г2 dr \ dr) 3. В цилиндрической системе координат, когда х== р cos <р, у= р sin <р, г=г, оператор Лапласа имеет вид Ди =1А(р^ +J_^L+ №.. р 0р \ др) р2 0<р2 0г2 Если функция и обладает цилиндрической симметри- ей, т. е. она не зависит от <р, то А 1 0 (п ди\ 02« Ди х=-----р — д-------. р др \ др ) дг2 Вид оператора Лапласа в других криволинейных ко- ординатах можно получить из общей формулы, которая выведена в [1] (см. стр. 276). § 1.1. Распространение тепла Пусть в области й, заполненной некоторой средой, определено температурное поле, т. е. в каждой точке Л4ей задана температура и(М). В общем случае и не является постоянной и тогда уравнение u(Af)=const оп- ределяет поверхность (или семейство поверхностей) а трехмерном пространстве, которая называется изотерми- ческой поверхностью. Очевидно, что изотермические по- верхности заполняют всю область й. Предполагая, что функция и(М) дифференцируема в й, можно опреде- лить векторное поле, полагая V (М) =gradи(М), А1ей.
$ 1.1] РАСПРОСТРАНЕНИЕ ТЕПЛА 35 Пусть S — изотермическая поверхность, а п (М) — единичный вектор нормали к S в точке М, направлен- ный в сторону возрастания и. Тогда grad и (М) = К (М)п(М), (1.1.1) где К(М) — некоторая скалярная функция. Из этой фор- мулы следует, что ff o„(M)dS = JJ [grad u (M)]„dS = fj K(M)dS, AS(MC) AS(M.) где AS(Af0) —элемент поверхности S в окрестности точ- ки M^S. Поэтому Х(М0)- lira -i- ff [grad«(M)b<4S, (1.1.2) где | AS | —площадь элемента AS. В силу соотношений (1.1.1) и (1.1.2) вектор ® = gradiz(M) (1.1.3) целесообразно назвать плотностью температурного по- тока. Вследствие неравномерного распределения темпера- туры внутри Q в этой области имеются тепловые потоки, которые переносят тепло от одних точек к другим. Вели- чину и направление этих потоков обычно характеризуют вектором Л(А1), который называется плотностью тепло- вого потока и определяется по формуле Л(М) = -$(Л4)»(М), (1.1.4) где п — единичный вектор нормали к изотермической поверхности S, проходящей через точку М и направлен- ной в сторону возрастания и. Функция q(M) представля- ет собой количество тепла, проходящего через единицу площади изотермической поверхности S в окрестности точки А1 в единицу времени. Знак минус в формуле (1.1.4) означает, что векторы JqVin имеют противопо- ложные направления. При изучении тепловых процессов в твердых телах обычно исходят из следующего экспериментально уста- новленного закона. 2*
36 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Закон Фурье. Плотности теплового и температур- ных потоков связаны между собой соотношением _/.(М) = — fegradu(M), (1.1.5) где k — положительный коэффициент пропорционально- сти, определяемый теплофизическими свойствами тела и называемый коэффициентом теплопроводности. В общем случае k зависит от положения точки М и от температу- ры и(М). На основе этого закона можно вывести уравнение относительно температуры в каждой точке области Q. Пусть f — интенсивность источников тепла, распо- ложенных внутри тела, т. е. количество тепла, выделяе- мого единицей объема тела в единицу времени, и пред- положим, что температура тела в каждой его точке не зависит от времени. Внутри тела возьмем произвольный объем <в, ограни- ченный поверхностью а. Внешнюю нормаль к о обозна- чим через . Тогда количество тепла, выделяемого объемом со через поверхность о в единицу времени, опре- делится по формуле q = JJ имь* и согласно закону Фурье получим Q = - J J [fc grad и (M)]„ do. (Т Применяя формулу Грина—Остроградского, окон- чательно получаем Q = — J J J div [k grad и (/И)] do. (0 Количество тепла, выделенного внутренними источни- ками, определится по формуле
$ 1.1] РАСПРОСТРАНЕНИЕ ТЕПЛА 37 Так как температура объема ® остается неизменной, то Q=Qi, т. е. J J J {div [k grad и (М)] + /} cfo =0. (О Это равенство должно выполняться в любом объеме осй, и, следовательно, div(fcgrad«(M)]+f=O, Мей. (1.1.6) Полученный результат означает, что температура тела в любой его внутренней точке М должна удов- летворять уравнению (1.1.6), если для него справедлив закон Фурье. В общем случае коэффициент теплопроводности k и плотность источников f зависят от положения точки М и от температуры. Поэтому уравнение (1.1.6) является нелинейным. Однако в достаточно широких пределах пренебрегают зависимостью k от и. Если, кроме того, оказывается, что плотность источников является линей- ной функцией переменных и и grad и, то это уравнение становится линейным уравнением с частными производ- ными второго порядка. Из физического смысла рассматриваемой задачи сле- дует, что уравнение (1.1.6) не определяет однозначно функцию ы(М). Для того, чтобы это уравнение опреде- ляло единственную функцию ы(М), необходимо задать некоторые дополнительные условия. Здесь мы укажем простейшие из таких условий, определяющих темпера- турный режим тела на его границе. 1. Условие Дирихле. Заданы значения функ- ции и(М), которые она должна принимать на границе 3 области Q, т. е. и(М)==ф(М), M&S, (1-1-7) где ф(М) —заданная функция. 2. Условие Неймана. Заданы значения ди на S, дп т. е. ^Ь=Ф(М), МеЗ, ().1.8)
38 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 где ф(Л1) —заданная функция. Легко усматривается фи- зический смысл этого условия. Согласно закону Фурье количество тепла q, проходящего через единичную пло- щадку поверхности S в единицу времени, определяется по формуле Поэтому условие Неймана означает, что задан поток тепла в каждой точке поверхности S. Чтобы сформулировать третье краевое условие, бу- дем исходить из следующего экспериментально установ- ленного закона, определяющего теплообмен тела с окру- жающей средой. . Закон Ньютона. Количество тепла q, теряемого телом через единичную площадку внешней поверхности 3 в единицу времени, определяется по формуле q—h(u—и0(М)), где и — температура тела в точке М поверхности S, Mo(Af)—температура окружающей среды вблизи точки М, h — положительный коэффициент пропорционально- сти, называемый коэффициентом теплообмена, кото- рый, вообще говоря, может зависеть от положения точ- ки М, от и(М) и С помощью этого закона легко устанавливается фи- зический смысл следующего краевого условия. 3. Третье краевое условие выражается соот- ношением k — ~[h[(uQ (М)1— и (М)), М е= 3, (1.1.9) дп где п — направление внешней нормали к S в точке М, k — коэффициент теплопроводности. Это условие пред- ставляет собой баланс тепла на поверхности S, состав- ленный на основе законов Фурье и Ньютона. Перечисленные условия не исчерпывают всех тех естественных условий, которым обычно подчиняется функция и (М) на границе 3. Однако в достаточно широ: ких пределах уравнение (1.1.6) совместно с одним из граничных условий (1.1.7), (1.1.8) или (1.1.9) одно-
51.11 РАСПРОСТРАНЕНИЕ ТЕПЛА 39 значно определяет температуру тела в каждой его точке. В этом параграфе не рассматривается вопрос о сущест- вовании и единственности решения уравнения (1.1.6) с каждым из полученных выше граничных условий. Здесь лишь отметим, что на этот вопрос далеко не всегда уда- ется получить исчерпывающий ответ. Рассмотрим теперь нестационарную задачу, когда температура тела изменяется с течением времени и= —u(t, М). Для вывода уравнения в этом случае, кроме закона Фурье, нужно воспользоваться еще одним экспе- риментально установленным законом, который формули- руется следующим образом. Количество тепла, необходимое для повышения тем- пературы единицы объема тела с ut до «2, определяется по формуле q=cp(ut—Ut), (Г.1.10) где р — объемная плотность тела, а с — положительный коэффициент пропорциональности, называемый коэффи- циентом теплоемкости, который не зависит от темпера- туры и определяется физическими свойствами тела. Внутри тела рассмотрим произвольный объем <о с границей а. Количество тепла, утраченного этим объемом через границу о за отрезок времени [/0, fj, согласно за- кону Фурье определяется по формуле fl fl Qx = J da d/ = - J JJJ div (k grad и (t, M)) ds> dt. t9 о t9 © С другой стороны, этот объем приобретает некоторое количество тепла за счет внутренних источников: /0 © За отрезок времени [Zo, М температура тела в этом объеме изменилась с и(4, Af) до u(tlt М). Количество тецда, необходимое для того, чтобы произошло это из- менение температуры, можно подсчитать следующим об.- разом.
40 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Количество тепла, необходимое для повышения тем- пературы объема со за малый отрезок времени dt, соглас- но закону (1.1.10) определится по формуле dQ = JJcP [и (t 4- dt, М) — и (t, М)] do = JJJcP - M)da>dt, Ш Ш где т — некоторая точка из отрезка (7, t+dt]. Поэтому общее количество тепла, необходимое для того, чтобы обеспечить изменение температуры объема со с и (t0, М) до u(tlt М), будет равно t„ <й Согласно тепловому балансу Q=Q2—Qi. Так как объем о и отрезок времени [/0, Ц произвольны, то получаем уравнение cP — = div (k grad и) + f, Af&Q. (1.1.11) dt Для однозначного определения решения этого урав- нения, кроме граничных условий, нужно указать еще на- чальное условие, которое определяет температуру тела в некоторый начальный момент времени, например, при 7=0: ы(0, М)=ф(М), MeQ, (1.1.12) где ф (М) —заданная функция. Можно указать много различных физических задач, в которых для описания тепловых процессов использу- ются приведенные выше уравнения (1.1.6) и (1.1.11) с соответствующими дополнительными (граничными и на- чальными) условиями (см., например, [2]). Ограничимся рассмотрением лишь одного примера, который нам по- требуется в дальнейшем. Пример. Используем уравнение теплопроводности для описания тепловых процессов в индукционной печи. Схематически индукционная печь может быть описана следующим образом. На полый цилиндр намотан изоли-
§ 1.1] РАСПРОСТРАНЕНИЕ ТЕПЛА 41 рованный проводник, концы которого подсоединены к источнику переменного тока. Внутри этого цилиндра по- мещается металлическая заготовка цилиндрической фор- мы (рис. 1). Электрический ток, проходя по проводнику, создает внутри полого ци- линдра переменное магнит- ное поле, которое индуциру- ет внутри заготовки источ- ники тепловой энергии, в ре- зультате чего заготовка на- 1 гревается. Закон распреде- ления тепловых источников || определяется частотой тока, диаметром заготовки и ее Ф теплофизическими характе- ристиками. Возникающий в Рис* • заготовке тепловой режим обычно разделяют на три ха- рактерных этапа (холодный, промежуточный и горячий) (см. [3]). На каждом этапе теплофизические характе- ристики заготовки считаются постоянными, а процесс распространения тепла в ней предполагается линейным. В итоге на каждом этапе температура подчиняется ли- нейному неоднородному уравнению теплопроводности cP- = Mu+F(t М), di (1.1.13) где W(t, М) — функция, характеризующая плотность тепловых источников внутри заготовки. Если диа- метр заготовки мал по сравнению с ее длиной, то тем- пературный режим у концов заготовки не оказывает существенного влияния «а тепловой процесс во внутрен- них ее точках, достаточно удаленных от ее концов. Предполагая, что продольные оси полого цилиндра и заготовки совмещены, получим, что электромагнитное поле имеет радиальную симметрию относительно про- дольной оси заготовки. Поэтому уравнение (1.1.13) можио записать в виде й ’ф r dr / где г — расстояние точки М. от продольной оси заготовки.
42 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Функция W(t, г), определяющая плотность внутрен- них источников, обычно берется в виде [4] W«,r)_(0('')P(0nP" (1ЛЛ5) ' I О при 0<г<₽— х. Здесь Q(r) и p(t)—заданные функции, причем p(t) зависит от мощности электромагнитного поля, a Q(r) оп- ределяется физико-термическими свойствами материала. х— заданная постоянная. Q (г) их различны для различ- ных этапов нагрева. Граничное условие при г—0 определяется из условия радиальной симметрии теплового поля =о. (1.1.16) дг Граничное условие при r=R определяется темпера- турным режимом на поверхности заготовки. Если, на- пример, на поверхности тела происходит теплообмен с внешней средой согласно законам Фурье и Ньютона, то ок где ис — температура внешней среды. Замечание. При практическом использовании уравнения (1.1.11) для анализа конкретных процессов нужно иметь в виду следующее обстоятельство. Закон Фурье достаточно точно описывает процесс распростра- нения тепла лишь при условии, что температура тела достаточно медленно изменяется с течением времени. При интенсивном нагреве материалов нужно пользовать- ся обобщенным законом Фурье, устанавливающим связь между /, и grad и (см. [5], стр. 12), /? = -*grad>—гА, (1.1.17) т где тг — положительный коэффициент, называемый по- стоянной времени или временем релаксации, t — время. Если исходить из этого закона, то уравнение балан- са, составленное изложенным выше методом, приводит
§ 1.11 РАСПРОСТРАНЕНИЕ ТЕПЛА 43 к следующему соотношению: = (1.1.18) /0 (О /о <° 4 О и, следовательно, i t f JJ С,° = f JJJ + d*v + /0 €0 /о <0 t Z( ° Дифференцируя no t равенство (1.1.18), находим, что О (О Следовательно, равенство (1.1.19) можно записать в виде (тг считается постоянной) /(, 10 da dt. = nW[/ + dl,(fegraii“)+5 (О Так как со и t произвольны, то отсюда получаем диф- ференциальное уравнение сР(^+ t'^^s=div(^grad“) + ^ + Ale=Q, \at at* / at (1.1.20) которое служит для определения температуры тела на основе обобщенного закона Фурье. Это уравнение содер- жит d2uldt2, для однозначного определения его решения нужно задавать два независимых дополнительных усло- вия в некоторый начальный момент времени, например,
44 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 при /=0: Ы(0,М) = ф0(М), ^Ц^-=ф0(М), 01 где <р0 (Af) и фо (/И) заданные функции. Простейшие граничные условия для этого уравнения формулируются аналогично тому, как это делалось вы- ше для уравнения (1.1.6). В частности, условие Дирихле состоит в том, что задается значение температуры на границе S рассматриваемого тела M<=S, где <р(/И) —заданная функция. § 1.2. Диффузия Пусть некоторая область й евклидова пространства, ограниченная кусочно-гладкой поверхностью S, заполне- на жидкой или газообразной смесью нескольких ве- ществ. Под концентрацией данного вещества в точке /Ией понимается величина и(М) == lira , v ' дг-о ДУ где &V — объем элементарной окрестности точки /И, а AQ — количество выбранного вещества в этой окрест- ности. Предполагая, что функция и(М) дифференцируема, определим в области й векторное поле, положив v(M)>'gradu(M). (1.2.1) Пусть о — поверхность в й, определяемая соотноше- нием и(М)=с, где с — некоторая фиксированная посто- янная. Обозначим через п (М) единичный вектор норма- ли к о в точке М. Пусть, далее, Х(М) —скалярная неот- рицательная функция, которая в каждой точке М равна количеству выбранного вещества, проходящего через единичную площадку поверхности о в окрестности точки М в единицу времени. Тогда вектор Jq — K(M)n (1.2.2) называется плотностью потока данного вещества.
$ 1.2) ДИФФУЗИЯ 45 При описании процессов диффузии будем исходить из следующегр экспериментально установленного за- кона. Закон Фика. Векторы (1.2.1) и (1.2.2) связаны соотношением Л = -£>;gradu(M), (1.2.3) где D — положительный коэффициент пропорциональ- ности (коэффициент диффузии), который в общем слу- чае зависит от концентрации и данного вещества н физи- ко-химических свойств смеси. С помощью закона Фика и на основе уравнения мате- риального баланса легко выводится уравнение относи- тельно и (М). Предположим сначала, что концентрация вещества в каждой точке рассматриваемой области не зависит от времени, а смесь неподвижна. Обозначим через f интен- сивность внутренних источников (стоков) вещества. Та- кие источники обычно имеются в смеси и определяются химическими реакциями, радиоактивным распадом и другими причинами. Тогда имеет место следующее урав- нение баланса вещества: <L2-4> 9 (О для любой области cocsQ, ограниченной поверхностью о. Здесь первое слагаемое в левой части равенства рав- но количеству вещества, попавшего в область © через поверхность о в единицу времени, а второе слагаемое равно количеству вещества, появившегося в о за счет внутренних источников в течение того же отрезка време- ни. Согласно формуле Гаусса—Остроградского равенст- во (1.2.4) можно записать в виде JJJ [div (Dgradu) 4- f] da =0, (О и в силу произвольного выбора области © отсюда полу- чаем уравнение div[£> grad u(Af)]+f=O, MeQ, (1.2.5) которое по форме совпадает с уравнением (1.1.6).
46 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Для однозначного определения и(М) с помощью уравнения (1.2.5) необходимо учесть дополнительные условия, которые должны выполняться на границе S об- ласти Q. Если граница S непроницаема для данного вещества, то согласно закону Фика -=0, Mett. дп Не останавливаясь на выводе различных граничных условий, отметим, что в простейших случаях они имеют тот же вид, что и граничные условия для уравнения теп- лопроводности. Если концентрация вещества изменяется с течением времени, то уравнение, описывающее процесс диффузии, можно получить с помощью того же закона Фика. Для того чтобы в элементарном объеме ДУ за время Д/ кон- центрация вещества изменилась на величину Ди, требу- ется количество этого вещества с ДиДV, где с — положи- тельный коэффициент, определяемый физико-химически- ми свойствами среды, в которой происходит диффузия. Так как сДиДУ = с^^-ДМУ, + М dt то уравнение баланса вещества можно представить в виде t, в t, V if V где а — поверхность, ограничивающая область V. Отсю- да получается уравнение диффузии с = div(Dgradи) + f, Мей. (1.2.6) dt Для однозначного определения концентрации и (t, М), удовлетворяющей этому уравнению, кроме гра- ничных условий, теперь требуется еще учесть начальную концентрацию в некоторый начальный момент времени,
§ 1.2] ДИФФУЗИЯ 47 «-ИЯ- t, а например, при t=0 и(О,М)=<р(М), МеЙ, где <р(М) —заданная функция. Рассмотрим теперь процесс диффузии вещества в ста- ционарном движущемся потоке. Пусть в точке М скорость потока равна v (М). В об- ласти й, ограниченной поверхностью S, возьмем произ- вольную малую окрестность и точки М, ограниченную поверхностью о. Через п (М) обозначим единичный век- тор внешней нормали к поверхности о в точке М. Со- гласно закону Фика плотность потока рассматриваемого вещества в этом случае определится по формуле jq — — Dgrad« + wo. Следовательно, количество вещества, покидающего объем со через поверхность а в течение времени с момен- та /0 до Л. определится по формуле D- + «on'|dod/ = dt J = J J J J [—div (D grad u) + div (u®)] da> dt h ca Внутренние источники дают количество вещества, равное /о ® В результате за отрезок времени (70, ^i] в объеме со количество вещества изменится на величину (О Таким образом, получаем уравнение материального баланса Q=Q2—Qi- Из него обычным способом находим
48 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I дифференциальное уравнение с ди(/, М) _ д-у иу —djv _|_ д е й, (1.2.7) dt описывающее изменение концентрации u(t, М) в стацио- нарном движущемся потоке на основе закона Фика. Если в рассматриваемой области й нет источников вещества, т. е. f=0, то уравнение (1.2.7) принимает вид = div (Dgrad и) — div (uv). (1.2.8) Его можно рассматривать как частный случай урав- нения (1.2.6), в котором функция f имеет вид f = —div (uv), т. е. это плотность внутренних источников, опреде- ляемых стационарным движением смеси, имеющей ско- рость V. Полученные уравнения широко используются при описании процессов в химических реакторах (см. напри- мер, [6, 7]) и при исследовании диффузии тепловых нейтронов в ядерных реакторах [8, 9]. Ограничимся ана- лизом диффузии тепловых нейтронов. Пример. Пусть область й с границей S заполнена замедлителем (например, водой), в котором произволь- ным способом размещены молекулы урана. Атомы ура- на в результате ядерных превращений выбрасывают нейтроны, которые при движении в замедлителе прак- тически разделяются на две группы. Нейтроны первой группы, не успев потерять своей энергии, сталкиваются с другими ядрами и вызывают их деление. В результате таких столкновений зарождаются новые нейтроны. Вто- рая группа нейтронов при движении в замедлителе теря- ет значительную часть своей энергии и в конце концов их энергия становится сравнимой с кинетической энер- гией молекул замедлителя. В дальнейшем энергия таких нейтронов не уменьшается. Они либо поглощаются яд- рами урана, либо продолжают перемещаться в замедли- теле. Эти нейтроны называются тепловыми. Выведем уравнение, описывающее диффузию таких нейтронов. При этом будем исходить из предположения,
I $ 1.2] ДИФФУЗИЯ 49 что все тепловые нейтроны имеют одинаковую по вели- чине (но не по направлению!) скорость. Обозначим их плотность через N и в Q возьмем произвольную малую область со, ограниченную кусочно-гладкой поверхностью б. Тогда количество нейтронов в этой области будет равно Изменение этого количества за время At будет равно ’=£ШЛГЛ',“- (0 Оно вызывается несколькими причинами. Во-первых, часть нейтронов покидает область о через ее границу ст. В соответствии с законом Фика их число определяется формулой 1 <h = — JJ D do At = — JJJ div (D grad N) At, * co где n — внешняя нормаль к ст. Во-вторых, часть нейтронов исчезает в результате поглощения. Их число можно найти следующим образом. Пусть То— время жизни нейтрона. Тогда количество поглощенных нейтронов во всем объеме со за время At будет равно В-третьих, число нейтронов изменяется за счет их рождения, т. е. за счет того, что замедляющиеся нейтро- ны становятся тепловыми. Если обозначить через Q чис- ло тепловых нейтронов, рождающихся в единице объема за единицу времени, то общее число таких нейтронов, родившихся в объеме © за время At, будет равно <7з = JJjQdwAt
50 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Следовательно, уравнение баланса нейтронов мож- но записать в виде <7=<7з—<7г— Так как область <в и отрезок времени Д/ произвольны, то отсюда получаем дифференциальное уравнение отно- сительно плотности нейтронов dN- = divTDgradAO---------N + Q, Mg=Q. (1.2.9) dt т9 По форме оно совпадает с уравнением (1.2.6), а вы- ражение 1 о представляет собой плотность внутренних источников. Если в результате поглощения нейтронов ядро не порождает быстрых (не тепловых) нейтронов, то Q«0 и уравнение (1.2.9) принимает вид dN = div (Dgrad N) — — N, M e Q. (1.2.10) dt Ta Подсчитаем теперь величину Q для случая, когда в результате поглощения тепловых нейтронов рождаются быстрые нейтроны. Количество тепловых нейтронов, по- глощенных в малой окрестности точки AG, вычисляется по формуле Тогда число рожденных быстрых нейтронов будет равно Адг(/, moiaq ы, * о где k — положительный коэффициент, называемый коэф- фициентом размножения быстрых нейтронов. Если обозначить через W(M, вероятность того, что быстрый нейтрон, рожденный в точке Mt, становится
ДИФФУЗИЯ 51 § 1.2) тепловым в точке М, то получаем, что Q = JL JJJ kW (М, Mt)]N (t, Мг) ° fi Следовательно, уравнение диффузии нейтронов в этом случае принимает вид dN-$'M}- -= div (D grad N)--N.+ dt Tq + y- JJJ k (Mi) IF (Л4, MJ N (t, Mi) dQ (Mi), (1.2.11) которое должно выполняться при всех AfeQ. В случае установившегося процесса (W не зависит от I) плотность нейтронов N (М) удовлетворяет уравнению div (D grad JV) — — N + П + k (Mi) W(M, Mi)N(Mi)dQ (ЛМ=0. (1.2.12) о Относительно функции IF(Af, М,) обычно предпола- гается, что она непрерывна и симметрична, т. е. IF (А1, ДЦ ss IF(Af t, М). Получение решений каждого из уравнений (1.2.11) и (1.2.12) при естественных граничных условиях представ- ляет собой довольно трудную и зачастую практически неразрешимую задачу. Поэтому на основе различных физических гипотез эти уравнения заменяются более простыми уравнениями, которые проще решать либо точ- но, либо приближенно. В частности, при анализе установившихся процессов в неограниченной среде это упрощение обычно выполня- ется следующим образом [8]. Предположим, что неограниченная однородная среда заполняет все трехмерное пространство. Тогда функция W’(M, Mt) имеет вид IF (Al, Afj) = (4ят)~ 8 е “ , JlF(Al, Mi)dV(Mt)-1,
52 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 где |MMi | —расстояние между точками М и Мь а та— положительная постоянная, которая определяется равен- ством 6т=г2 (см. (8], стр. 41), где г — средний пробег ней- трона от момента времени его зарождения до момента времени, когда он стал тепловым. Разлагая функцию N(Mi) в ряд Тейлора, будем иметь АГ (Мх) - N(M) 4- 2 ^^-(х} -х) + Z=1 ( f./=l ‘ 1 где х,1 и х< — координаты точек Mt и М соответственно. Так как функция W(M, Mt) симметрична, то J W (М, Mt) (х| — х.) dV (Mi) = - J W (M, Mi) (x} — x^1 (x) — Xj)m dV (MJ = 0 при и любых нечетных l и m. Здесь интеграл берется по всему пространству переменных xj, х^, xj. Далее, ве- личина х? ~= J W (М, Mi) (xj — х{)2 dV (Mi) при любом i является квадратом проекции г на ось х{, r2=Sx?, и в силу однородности пространства Зх?=г*. В теории реакторов установлено, что г2=бт. Поэтому, считая k постоянной, будем иметь J kW (М, МО N (Mi) dV (Mi) = = kN(M) + kx(— + dW I d*N ^2 где точками отмечены слагаемые, содержащие производ- ные функции N, начиная с третьего порядка. Подставляя
ДИФФУЗИЯ 53 § 1.21 это выражение интеграла в уравнение (1.2.12), получаем div(DgradJV)+ + \n + ... =о. Л) Так как среда однородна, то, игнорируя слагаемые, отмеченные точками в этом уравнении, окончательно по- лучаем &N + a2N =0, а2 = , (1.2.13) DT0 + xk v где AW=div (gradW), а постоянная а2 называется лапла- сианом или материальным параметром. Уравнение (1.2.13) приближенно описывает устано- вившийся процесс диффузии нейтронов в однородной сре- де, заполняющей все пространство. Однако им успешно пользуются и в том случае, когда наименьший диаметр рассматриваемой области значительно превосходит ве- личину Ут (см. [8]). В ряде практически важных случаев оказывается по- лезным привести уравнение (1.2.12) к эквивалентной ему системе уравнений, когда D и k можно считать постоян- ными, т. е. среда считается однородной, a D и k не за- висят от N. Эта система имеет вид (см. [8], стр. 61—62). D kN — —N = — п (тт, Л4), A# = n(p,M)=kN(M), Т дт (1.2.14) где п — плотность замедляющихся нейтронов, т — вспо- могательный параметр, зависящий от энергии нейтрона и называемый возрастным параметром, тт — значение этого параметра для энергии теплового нейтрона. В заключение рассмотрим вопрос о характеристике граничных условий, которые необходимо учитывать при определении плотности нейтронов в области Q с по- мощью уравнений (1.2.12) или (1.2.13). Если среда, в которой происходит движение нейтро- нов, граничит с вакуумом, то на некотором расстоянии lt от границы этой среды плотность нейтронов N будет равна нулю. Величина lt будет постоянной относительно времени, если диффузионный процесс является устано-
54 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I вившимся, т. е. плотность А нейтронов удовлетворяет уравнению (1.2.13). Поэтому для описания установивше гося процесса диффузии нейтронов в области Q, грани- чащей с вакуумом, решается следующая задача. Найти функцию N(M), определенную и непрерывную в замкну- той области Q1, которая внутри этой области удовлетво- ряет уравнению (1.2.13), а на ее границе S1 удовлетво- ряет условию JV(A4)=O, AfsS*. (1.2.15) Граница 5* называется «эффективной» границей обла- сти Q. В литературе по теории тепловых нейтронов име- ются указания для определения «эффективной» границы при различных геометрических характеристиках области Q. Поэтому можно считать, что область Q* и ее граница заданы. Рассмотрим теперь случай, когда область Q граничит с другой областью йь которая не является вакуумом. При этом на границе раздела этих областей не происхо- дит накопления или поглощения нейтронов. Тогда в Qi плотность TV, нейтронов будет подчиняться уравнению, аналогичному уравнению (1.2.13), ДАГХ (М) + аЖ(А1). = О, М е Qt, в котором лапласиан а* определяется физическими свой- ствами среды, заполняющей область Qt. На границе раз- дела областей Qi и Q должны выполняться следующие два условия: N =1^1. дп дп (1.2.16) ,(1.2.17) Условие (1.2.16) выражает непрерывность плотности нейтронов на границе между Qt и Q, а условие (1.2.17) — равенство потоков нейтронов в двух средах у границы их раздела и указывает на отсутствие поглощения или накопления нейтронов на границе. Представляет практический интерес случай, когда па границе раздела двух сред расположен тонкий слой ве- щества, поглощающего нейтроны. В этой ситуаций поток
§ 12] ДИФФУЗИЯ 55 нейтронов через, границу S из области Q определится по формуле Q —— D— (1.2.18) дп (п — внешняя к Q нормаль поверхности S) и не будет совпадать с потоком нейтронов, попадающих в через S. Количество этих нейтронов определяется по формуле дп где п — та же нормаль, что и в (1.2.18). Величина <7 = Q-Qi. (1-2.19) равна количеству нейтронов, которые поглощаются еди- ничной площадкой поверхности S в единицу времени. Если через d обозначить толщину поглощающего слоя, а через Ц—длину поглощения в этом слое, то лег- ко показать, что где v — скорость нейтронов. Поэтому граничное условие (1.2.19) для рассматриваемого случая принимает вид р + (1.2.20) дп ' дп ld Если процесс неустанрвившийся, то плотность ней- тронов удовлетворяет уравнению 1 дЛГ(^М) = ДМ + а’М, М €= Q, (1.2.21) D dt ' ’ которое получается из (1.2.11) при гипотезах, исполь- зованных для получения уравнения (1.2.13). Для одно- значного определения решения этого уравнения нужно, кроме одного из перечисленных выше граничных усло- вий, еще задавать плотность нейтронов в некоторый на- чальный момент времени, например, при f=0: М(0, М)=ф(Л1), A4®Q, где <р (7И) — заданная функция.
56 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I § 1.3. Односкоростной перенос частиц В предыдущем параграфе было выведено уравнение диффузии тепловых нейтронов и проанализированы со- ответствующие граничные условия в предположении, что потоки нейтронов подчиняются закону Фика, а их плот- ность не зависит от их скорости. Однако практика пока- зывает, что последнее предположение не оправдывается, если плотность нейтронов значительно изменяется на протяжении длины свободного пробега частиц (см., на- пример, [8], стр. 17). В этом параграфе будем рассматривать вопрос о ма- тематическом описании движения тепловых нейтронов в предположении, что все нейтроны имеют постоянную по величине (но не по направлению) скорость V, а плот- ность N нейтронов зависит от этой скорости, т. е. N=N(t,M,v). Кроме того, будем также предполагать, что рассматриваемые нейтроны при столкновении с ядра- ми не изменяют своей энергии, а изменяют лишь направ- ление скорости. Исключение составляют лишь те нейтро- ны, которые поглощаются ядрами. Итак, будем рассматривать движение нейтронов в не- которой области Q, ограниченной кусочно-гладкой по- верхностью S. В каждом элементарном объеме dQ с центром в точке М выделим нейтроны, движущиеся в на- правлении вектора V. Каждому новому направлению, определяемому другим вектором соответствует свое множество нейтронов, находящихся в данный момент в области Поэтому удобно рассматривать движение нейтронов в фазовом пространстве, определяемом поло- жением точки М и направлением вектора®. Точки этого пространства будем обозначать через (М, ®). При этом согласно предположению v=vn, (1.3.1) где v — фиксированная постоянная, а п—произвольный единичный вектор, т. е. п= 1. Плотностью N (t, М, ®) нейтронов в точке (М, ®) фа- зового пространства в момент времени t будем называть количество нейтронов в единице объема в окрестности точки (М, ®) фазового пространства, движущихся в на-
§ 1.31 ОДНОСКОРОСТНОЙ ПЕРЕНОС ЧАСТИЦ 57 правлении я. В соответствии с этим определением плот- ность всех нейтронов в точке М трехмерного пространства определяется по формуле N0(t, М) = ^N(t,M,v)dv, где интегрирование выполняется по множеству всех зна- чений вектора V. Вектор (1.3.2) называется током нейтронов. Если о — некоторая кусочно-гладкая, замкнутая по- верхность, ограничивающая область ® в й, то величина о представляет собой количество нейтронов, имеющих ско- рость V и покидающих а в единицу времени. Здесь п — внешняя нормаль к о. Отсюда следует, что количество всех нейтронов, покидающих а в единицу времени, рав- но величине а где внешний двойной интеграл берется по множеству всех значений вектора V, Используя введенные величины, составим баланс ней- тронов в области со за отрезок времени от t0 до ti9 ско- рости которых лежат в произвольно малой окрестности dv направления, определяемого вектором V. Полное из- менение количества этих нейтронов равно величине /о ю Это изменение обусловлено несколькими причинами. Часть нейтронов, находящихся в области а, покидает эту область с прежней скоростью (т. е. их скорость в те-
58 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I чение отрезка времени [£0, Л] не изменяется). Число та- ких нейтронов согласно определению вектора J (см. (1.3.2)), определяется по формуле dN1 = / И (*• v)]nd0dtdv, h 9 и согласно формуле Гаусса — Остроградского имеем dlVi JJJ(V, J) d<s>[dt dv =J JJj(®, graded© dt dv. t9 <0 /о © Другая часть нейтронов остается в области ©, но в результате столкновения с ядрами изменяет направле- ние своего движения так, что вектор скорости покидает окрестность dv направления V. Количество таких ней- тронов можно подсчитать следующим образом. Пусть I, — средний пробег нейтрона до его столкнове- ния с ядром, в результате которого нейтрон изменяет на- правление своей скорости. Число таких столкновений за время dt будет равно ~ . Следовательно, общее число рассеянных в © нейтро- нов, имеющих скорость в окрестности dv направления V, определяется по формуле dNt = M,v)dadtdv. (1.3.3) tv © Аналогично вычисляем количество поглощенных ней- тронов. Пусть 1с — средний пробег нейтрона до столкновения с ядром, в результате которого происходит поглощение нейтрона. Тогда число поглощенных нейтронов опреде- ляется по формуле = J JJJ у- N(t, М, п) d©didv. /о © C
$ 1.3] ОДНОСКОРОСТНОЙ ПЕРЕНОС ЧАСТИЦ 59 Подсчитаем теперь количество тех нейтронов, кото- рые в результате столкновения с ядрами приобрели ско- рость, лежащую в окрестности dv направления V. С этой целью обозначим через —^(е1, <0 плотность ве- роятности рассеяния нейтронов. Поскольку вероятность того, что после столкновения с ядром нейтрон будет пе- ремещаться в каком-либо направлении, равна едини- це, то где интеграл берется по всем значениям вектора V. Вероятность того, что нейтрон, имеющий скорость с1, после столкновения приобретает скорость, лежащую в окрестности dv вектора V, будет равна ±-g\v\ v)dv. Общее число рассеянных в со нейтронов, имеющих скорость в окрестности dv1 направления ‘, определя- ется по формуле (см. (1.3.3)) dN\ = -у- J JJJ W (*, М, vl) d<i> di do. S /о <0 Следовательно, число рассеянных нейтронов, попав- ших в окрестность dv направления я, равно dNi = J JJJ |jyg (о1, и1) du1 j dadtdv. s <e Обозначим теперь через Q плотность источников тех тепловых нейтронов, которые имеют скорость V. Тогда общее число таких нейтронов, появившихся в области со и имеющих скорость, лежащую в окрестности dv направ- ления V, будет равно 6 dNt = J jjjQd<od/dc. /а ©
60 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ (ГЛ. J Составляя уравнения баланса нейтронов, находим, что q = - (dl^ + dNa + dNa)'+ dH< + dNa. Так как отрезок времени |70, f,] и область © произволь- ны, то отсюда получаем интегро-дифференциальное урав- нение линейной теории односкоростного переноса тепло- вых нейтронов (транспортное уравнение Больцмана) dN (t.M, *>) + (Р) grad + JL дт = at I = *57 JJ 8 с®1» N м' dvl+ X = 4- + -L. (1.3.4) Если процесс установившийся, т. е. N не зависит от t, то уравнение (1.3.4) принимает вид (о, grad N) + — N = — f f g (о1, о) У (М, о1) dvl + Q. / 4«ZS J J (1.3.5) Часто оказывается удобным получить зависимость N от вектора п, определяемого формулой (1.3.1). В этом случае, вводя обозначение <р(М, п) = N(M,v) и учитывая, что dv — vdn, из уравнения (1.3.5) получаем (v, grad <р) 4- <р = JJ g (п1, п) ф \М, п1) dnl + Q, (1.3.6) поскольку о2^»1,®) =g(nx, я). Функция g (п1, п) представляет собой вероятность того, что частица при столкновении с ядром изменяет направ- ление своёго движения с п1 на п. Обычно предполагается, что g(nx, п) зависит лишь от угла между п1 и п, т. е. от величины скалярного произведения (я1, я), которая
§ 1.3] ОДНОСКОРОСТНОЙ ПЕРЕНОС ЧАСТИЦ 61 обозначается через ц0(см., например [11], стр. 20): Но = (я* 1, л). Тогда ~ ; ' g(n\ л) =£(ц0). (1.3.7) Если рассеяние нейтронов является изотропным, т. е. все направления я равноправны, то £(1x0) = ! и уравне- ния (1.3.4) и (1.3.6) принимают вид ?> + („, grad <р) + -у Ф = f f ф (/.М.я1) dnl. 4-Q, dt I mls J J (1.3.8) (яз,ёгааф) + 4<Р = »«l)dnl + Q, MeQ. l Щ JJ (1.3.8') Другим важным частным случаем уравнений (1.3.4) и (1.3.6) являются уравнения, описывающие перенос ней- тронов в чисто поглощающих средах. Для таких сред g (v1, v) s0 и, следовательно, уравнения (1.3.4) и (1.3.6) принимают вид а<Р(<’Яв)- + (v, grad Ф) + т- Ф = Q> 0-3.9) at l (ф, grad ф) +-у-ф = Q. (1.3.10) Функция Q, характеризующая плотность внутренних источников, определяется конкретной ситуацией, для ко- торой рассматривается описание процесса переноса ней- тронов. В математической теории переноса часто предпо- лагается, что Q является функцией тех же переменных, что и ф, т. е. Q = Q(t, Af, л) (см., например, [10]). Если область £2, в которой происходит изучаемый про- цесс переноса нейтронов, является достаточно большой по сравнению с длиной свободного пробега нейтрона, то оказывается, что с практически приемлемой точностью процесс описывается уравнением (1.3.4), в котором М— любая точка трехмерного пространства. Для однознач- ного определения решения этого уравнения нужно задать
62 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I начальное распределение плотности нейтронов в некото- рый начальный момент времени, например, при t—0. Если уравнение (1.3.4) решается для ограниченной области й, то, кроме начального распределения, нужно еще задать некоторые условия относительно плотности нейтронов на границе S области й. В частности, для изу- чения процесса распространения нейтронов в среде, за- полняющей область й и граничащей с вакуумом, эти условия можно получить из следующих соображений. Так как область й окружена вакуумом, то на некотором удалении от нее плотность нейтронов равна нулю. По- этому уравнение (1.3.4) рассматривают в некоторой обла- сти й‘, включающей й, и предполагают, что на границе S* области Й1 выполняется условие (t, М, V) = (Гпри^М £ S1. (1.3.11) Полученная таким образом функция N (t,M, v) (определяемая уравнением (1.3.4) в области й‘, гранич- ным условием (1.3.11) и начальным условием) достаточ- но точно определяет плотность нейтронов внутри й. Мож- но указать различные типы других граничных условий, которые естественным образом возникают при матема- тическом описании переноса нейтронов в ограниченной области. Не останавливаясь на этом, отметим лишь, что плотность N нейтронов в й единственным образом опре- деляется уравнением (1.3.4) в й, начальным значением N и распределением излучения, падающего на S извне (см. {10], стр. 28). Из этого утверждения, в частности, следует, что для однозначного решения уравнения (1.3.4) с соответствующим начальным условием можно посту- пить следующим образом. В каждом конкретном случае источники нейтронов, находящиеся вне й, можно заме- нить излучением, падающим на S по специально подоб- ранному закону. § 1.4. Тепло-и массоперенос в бинарных газовых смесях и жидких растворах В первых двух параграфах были описаны процессы теплопроводности и диффузии. При этом предполага- лось, что они не взаимосвязаны. Например, при рассмот- рении процесса диффузии мы исходили из предположе-
S 1.4] ТЕПЛО- И МАССОПЕРЕНОС 63 ния, что он подчинен закону Фика, а следовательно, про- текает при постоянном давлении смеси и постоянной температуре. Однако можно указать многие технологиче- ские процессы (сушка влажных материалов, термодиф- фузионное разделение красителей, нефтепродуктов и т. д.), в которых диффузионные и тепловые процессы оказываются взаимосвязанными. Тепло распространяется не только за счет его передачи от одной частицы к дру- гой. Оно также переносится самими частицами в про- цессе их диффузии (эффект Дюфо). С другой сто- роны, неравномерное распределение температуры смеси обусловливает так называемую термическую диффу- зию (эффект Соре). В результате оказывается, что при- веденные выше уравнения теплопроводности и диффу- зии становятся непригодными для описания таких про- цессов. Аналитическое исследование термодиффузионных про- цессов в различных реальных ситуациях (сушка, тепло- обмен в разреженных газах, конвективный теплообмен и т. д.) занимает значительное место в теории тепло- и массообмена (см., например, (12—15]). Основой матема- тического описания передачи тепла и вещества являются законы термодинамики необратимых процессов. Поэтому детальный вывод достаточно общих уравнений тепло- и массообмена неизбежно приводит к необходимости при- влекать значительный материал из термодинамики. Что- бы не усложнять содержание этой главы и не увеличи- вать ее объем, ограничимся рассмотрением лишь от- дельных примеров, которые в дальнейшем будут ис- пользованы для иллюстрации различных математических задач оптимального управления процессами тепло- и массообмена. Детальный их анализ может быть полез- ным для формулировок и решения других подобных за- дач оптимизации в этой области. Сначала рассмотрим процесс тепло- и массообмена в бинарной (двукомпонентной) газовой смеси. 1. Основные предположения. Уравнения сохранения массы. Пусть область Q, ограниченная кусочно-гладкой поверхностью S, заполнена бинарной газовой смесью, состоящей из компонентов аг и а2. Пусть, далее, о — не- которая изотермическая поверхность в Q, а п (М) — единичный вектор нормали к ст в точке Mso, направлен-
64 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I ный в сторону возрастания температуры. Вектор называется плотностью теплового потока (см. (1.1.4)). Скалярная функция q(M) представляет собой количе- ство тепла, проходящего через единичную площадку изотермической поверхности в единицу времени. Обозначим через и{(М) концентрацию компонента а,- в точке Мей, через р — плотность смеси. Тогда р=и, + ы2 и для характеристики диффузионного процесса, проте- кающего в смеси, достаточно знать закон изменения ве- личины о - “1 р„-7. которая называется относительной концентрацией ком- понента а2. Если положить то будем иметь Рю+р2»= 1 • (1.4.1) Пусть Ci — поверхность одинаковой концентрации первого компонента смеси, a (М) — единичный вектор нормали к оь в точке Afeob направленной в сторону возрастания концентрации этого компонента. Вектор Л = -А(А1)«1(Л4) называется плотностью диффузионного потока массы первого компонента. Функция mJAf) равна количеству первого компонента, проходящему через единичную пло- щадку поверхности сг, в окрестности точки М в единицу времени. При выводе дифференциальных уравнений, описыва- ющих процесс тепло- и массообмена в смеси, будем ис- ходить из следующих предположений. 1. Процесс протекает при постоянном давлении.
§ 1.41 ТЕПЛО- И МАССОПЕРЕНОС 65 2. Появление или исчезновение того или другого ком- понента смеси обусловлено лишь фазовыми или хими- ческими превращениями в смеси, т. е. если 1к(М) —плот- ность источника k-ro компонента смеси, то Л (Af) + /2 (М) =0 для всех Мей. (1.4.2) Эти превращения не сопровождаются выделением или поглощением тепла. 3. Процесс распространения тепла в смеси подчиня- ется следующему закону jq = —k (М) grad Т — DPQ’grad Р10, (1.4.3) где Т — температура смеси по шкале Кельвина, k(M) — коэффициент теплопроводности смеси, D — коэффици- ент взаимной диффузии смеси, Q* — положительный ко- эффициент, называемый удельной теплотой изотермиче- ского переноса и определяемый как количество тепла, переносимого единицей массы в изотермических усло- виях. 4. Плотность диффузионного потока массы первого компонента подчиняется следующему закону /1 = — DP (grad Рю + grad , (1.4.4) где kT — положительный коэффициент, называемый тер- модиффузионным коэффициентом. Для вывода уравнений тепло- и массообмена исполь- зуем обычный прием, основанный на составлении урав- нений материального и энергетического баланса смеси. Сначала выведем уравнения баланса вещества. В области й возьмем произвольную подобласть со, ограниченную кусочно-гладкой поверхностью а. Обозна- чим через vk скорость k-ro компонента смеси. Тогда ко- личество этого вещества, покидающего область <в через границу о за отрезок времени [Л>, ^], определится по формуле = / И j JJJ div(u*c*)do)df, to a to ® 3 А. И. Егоров
66 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 где п— направление внешней нормали к о. Количество этого вещества, появившегося в ш за счет внутренних ис- точников в течение того же отрезка времени,будет равно <hk = /о ю где /л — плотность внутренних источников £-го компо- нента смеси. Полное изменение количества этого компо- нента за то же время вычисляется по формуле /о <0 Согласно балансу вещества получаем J j*JJ Ц-- + div (“*%) — dt = О to to и,следовательно, ^ = - div (ukvk) 4- Ik, £ = 1,2. (1.4.5) dt Введем вектор о = —(«i(A4)®i + «2(A4)o2), (1.4.6) Р где р — плотность смеси. Легко видеть, что <о представ- ляет скорость центра масс смеси, находящейся в единич- ном объеме в окрестности точки М. Из уравнений (1.4.5) согласно (1.4.6) следует, что * = — div (РФ), (1.4.7) dt поскольку w1 + iz2=p, а/, + /2=0 (см. (1.4.2)). Учитывая, что div (Рф) = (ф, grad Р) + Р div ф, (1.4.8)
$ j 4] ТЕПЛО- И МАССОПЕРЕНОС 67 из (1.4.7) получаем — + . grad Р) = — Р div v. (1.4.9) dt Если обозначить через б удельный объем смеси, т. е. б= 1/р, то из уравнения (1.4.9) получим P^=dive, (1.4.9!) где величина ^=^+(®,gradd) (1.4.10) называется полной или субстанциональной производной функции б по времени t. Так как вектор V представляет собой скорость потока смеси в точке М, то плотность диффузионного потока массы &-<го компонента смеси можно представить в виде Jk = uk(vk — V), (1.4.11) и, согласно (1.4.6), получаем (очевидное из других сооб- ражений) равенство Ji + /з == 0. Из соотношений (1.4.5) и (1.4.11) получаем = —div (ukv) — div /* + /*. (1.4.12) at Так как pM=uk/p, то с учетом (1.4.7) и (1.4.8) нахо- дим, что р +(®. grad Рло) 1= -div Jk+h, 6 = 1,2. L at J (1.4.13) Отсюда согласно (1.4.4) получаем Р 4- (v, grad Р1о)1 = div [dp fgrad Pw + grad tY| 4-Д. L dt J L \ * } \ (1.4.14) 3'
68 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Это первое уравнение, которое связывает между собой две неизвестные величины: относительную концентрацию первого компонента смеси и ее температуру. Если вос- пользоваться субстанциональной производной в соответ- ствии с формулой (1.4.10), то его можно переписать в виде Р = div dt (k'f> ' grad Pi0+ —grad? + 4- (1.4.14') 2. Уравнение сохранения энергии. Граничные условия. Второе уравнение относительно р10 и Т можно получить из уравнения баланса энергии. В общем случае оно по- лучается на основе законов термодинамики необратимых процессов (см., например, [12] или [16], стр. 146—152). Однако, в соответствии с принятыми нами допущениями, в смеси нет превращения тепловой энергии в другие ее виды. Поэтому интересующее нас уравнение можно по- лучить исходя из уравнения баланса тепловой энергии. Обозначим через h( удельную энтальпию (удельное теплосодержание) компонента а(, т. е. количество тепло- ты, которое содержит единица массы этого компонен- та *). Тогда величина будет равна удельной теплоемкости i-ro компонента смеси. Величина A = fttp10 + /l2P20 (1.4.16) представляет собой удельную энтальпию смеси. Легко также видеть, что С—С^ю + СгРго (1.4.17) есть удельная теплоемкость смеси. В соответствии с этими определениями, находим, что вектор htji равен плотности потока тепловой энергии, пе- ♦) Здесь полезно проследить аналогию между и величиной б, фигурирующей в уравнении (1.4.91).
$ UJ ТЕПЛО- И МАССОПЕРЕНОС 69 реносимой i-м компонентом смеси в процессе диффузии этого компонента. Поэтому общая плотность потока теп- ловой энергии (обозначим ее через /в), переносимой за счет теплопроводности и диффузии, определяется по формуле Je — Jq + ^1/1 + ^2/2- Так как, Ji = — У3, то А-Л+(Й1-Л1)Л. (1.4.18) Возьмем произвольную область ©, ограниченную ку- сочно-гладкой поверхностью ст. Количество тепловой энергии, потерянной областью со через поверхность ст за счет процессов теплопроводности и диффузии в течение отрезка времени |70, М, равно Qi = J J j (jE)ndc dt = J J J j* div jE da dt. to © to © Кроме того, часть тепловой энергии выносится пото- ком смеси, скорость которого, по предположению, равна V. Обозначим через ст(А1) единичную площадку плоско- сти, проходящей через точку М и ортогональную векто- ру V. Количество вещества смеси, проходящего через эту площадку в единицу времени, равно ро, а следова- тельно, количество переносимой тепловой энергии будет равно hpv, где ст=|п|. Поэтому количество тепловой энергии, унесенной из области © за отрезок времени [/., М, в результате движения смеси со скоростью V, бу- дет равно Q2= f J J (Phv)nd<ydi = j J J J div (PM da dt. и 0 t„ ш Далее, внутри © происходят химические или фазовые превращения одного компонента смеси в другой. Интен- сивность этих превращений характеризуется плотностью источников Л и /2, между которыми существует зависи- мость (1.4.2). Так как эти превращения, по предположе- нию, не сопровождаются поглощением или
70 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ. [ГЛ. f выделением тепла, то внутренние источники вещест- ва не являются источниками тепла. Если предположить, что внутри области а нет никаких тепловых источников, то можно выписать уравнение баланса тепловой энергии в виде Q + Qi + <?2=0, где Q представляет собой полное изменение количества тепловой энергии и имеет вид to (О Отсюда обычным способом получаем уравнение ^ + div(P/it») + divy£ = O. (1.4.19) dt Так как р удовлетворяет уравнению (1.4.7), то с уче- том равенства (1.4.10) и div (Р/и>) — Р (о, grad h) + hdiv (Pv) последнее уравнение можно записать в виде Р- = — div Л, (1.4.20) dt которое называется уравнением сохранения тепловой энергии. Преобразуем его с учетом соотношений (1.4.1) и (1.4.15) — (1.4.17). Имеем Р ? = p(^-pio + ^p2o)?+p^-^%L = at \аТ al J at at = pc5+p(A1_4fe.. at at Согласно формулам (1.4.18) и (1.4.8) находим, что div J£ = div Л + div (/ii — ft.j) Л = - div Jq + (cx — c3) (Д, grad T) + (ftj — hj div Jv
$ 1.4] тепло- и млссопЕренос 71 Если теперь учесть уравнение (1.4.13), то из (1.4.20) по- лучаем cP £ = - div jq - (С1 -с£ (Л, grad Т) — (Л, — М Л- at (1.4.21) Разность Ci—с2 оказывается очень малой для реаль- ных газовых смесей и поэтому в соответствии с формулой (1.4.3) это уравнение заменяют уравнением cP = div [k grad Т + DPQ* grad Plo] — (/ц — h2) /ь dt (1.4.22) которое связывает температуру Т газовой смеси и относи- тельную концентрацию р10 первого компонента. Пара уравнений (1.4.14') и (1.4.22) описывает про- цесс тепло- и массообмена в газовых смесях при тех че- тырех предположениях, которые были сформулированы в начале параграфа. Если дополнительно предположить, что все теплофизические параметры, входящие в эти уравнения, постоянны, то эта система упрощается. Так как температура Т измеряется по шкале Кельвина, то в течение всего времени протекания процесса величина kT/T изменяется незначительно и ее считают постоянной. Если теперь обозначить температуру среды по шкале Цельсия через 0, то при таких предположениях система уравне- ний (1.4.14'), (1.4.22) принимает вид ^ = РДР10 + ^-Д9 + /1, - =—де + —др10 —Л, dt ср с ср (1.4.23) где A = divgrad — оператор Лапласа, а выражения, стоя- щие слева, представляют собой субстанциональные производные, определяемые формулой (1.4.10). Если же рассматривается процесс тепло- и массообмена, про- текающий в неподвижной среде, то уравнения (1.4.23)
?2 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I принимают вид ^- = РДр1о + ^-Д0 + 71, от 1 — =—де + — дрщ—д. dt ср с ср (1.4.24) Для того чтобы каждая из полученных систем урав- нений имела единственное решение в рассматриваемой области Q, необходимо указать начальные и граничные условия, которым должны удовлетворять функции р и 0. Начальные условия определяют значение температуры 6 и относительной концентрации р10 первого компонента смеси в некоторый начальный момент времени, напри- мер, при t=0: Q(0, Af) =<р(Л4), рю(0, Л4) =ф(Л4) для всех AfeQ, (1.4.25) где <р(М) и ф(М) — заданные функции. Вид граничных условий определяется конкретной си- туацией, в которой протекает процесс. Рассмотрим не- которые из них. 1. Процесс протекает в замкнутом объеме и полностью теплоизолирован от внешней среды. Отсюда следует, что на границе S области Q плотности тепловых и диффу- зионных потоков равны нулю. В силу формул (1.4.3) и (1.4.4) получаем два граничных условия: (k (Л4) grad 0 + DPQ* grad Р1о)„ =0, ft grad 0 +grad Рм)„ = 0 при всех MeS, (1-4.26) которые можно рассматривать как систему уравнений относительно неизвестных _grad„0 и gradnp10. Ее опре- делитель k(M) ^pQ Aj. Т
§ 1.4] ТЕПЛО- И МАССОПЕРЕНОС 73 для реальной смеси обычно отличен от нуля, и поэтому условия (1.4.26) эквивалентны следующим условиям: gradn0 = O, gradnplo=O при AfeS. (1.4.27) 2. Процесс протекает в замкнутом объеме и, следо- вательно, смесь не покидает область й через ее границу S. В то же время происходит теплообмен смеси с внеш- ней средой по закону Ньютона. В этом случае вместо (1.4.26) получаем условия (k (М) grad 0 + DPQ* grad Р1о)„ — Т), уgradn0 + grad„P10 = О при всех AfeS. (1.4.28) Отсюда находим, что gradn0=y1(T1—Т), gradnpio=y2(Tt—Г) при всех Af<=S, (1.4.29) где _ hT V1 = kT — DpQ*kT' hkT Ya = DpQ*kT — kT' Таким образом, в каждом из рассмотренных случаев мы получаем для определения температуры смеси и от- носительной концентрации первого компонента систему двух дифференциальных уравнений в частных производ- ных с двумя начальными и двумя граничными условия- ми. Кстати отметим, что если в системе уравнений (1.4.14х) и (1.4.22) пренебречь взаимным влиянием теп- ловых и диффузионных потоков, то эта система разде- ляется на два независимых дифференциальных уравне- ния: уравнение теплопроводности и уравнение диффузии, которые были рассмотрены в §§ 1 и 2. Граничные усло- вия для них можно задавать также раздельно (см. (1.4.27) и (1.4.29)). 3. Тепло- и массообмен в жидких растворах. При опи- сании диффузионных процессов в жидких растворах при неизотермических условиях, когда раствор состоит из
74 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ (ГЛ. I растворителя и растворенного вещества, используются законы, аналогичные тем, которые были приведены выше для бинарной газовой смеси. Плотность теплового потока определяется вектором (1.4.3), в котором р10 является относительной концентрацией растворенного вещества, т. е. отношением объемной концентрации этого вещест- ва к плотности раствора. Аналогично плотность диффу- зионного потока растворенного вещества определяется формулой (1.4.4). В результате уравнения, описывающие процесс тепло- и массопереноса в каждом растворе, и соответствующие дополнительные условия оказываются аналогичными уравнениям (1.4.14') и (1.4.22) и перечисленным выше дополнительным (начальным и граничным) условиям для бинарной газовой смеси. Поэтому на их выводе здесь останавливаться не будем (подробнее об этом см., на- пример, [12]). § 1.5. Диффузия нейтронов и теплоперенос в слабо поглощающих средах В § 2 в качестве одного из примеров применения тео- рии диффузии был рассмотрен процесс переноса нейтро- нов в среде, когда он подчиняется закону Фика (такая среда называется слабо поглощающей). При этом не учитывался тот факт, что в результате захвата нейтрона ядром, вызывающего расщепление ядра, выделяется теп- ловая энергия. Эта энергия (если она отводится недо- статочно интенсивно) повышает температуру внутри ре- актора, что в свою очередь приводит к изменению физи- ческих свойств среды, влияющих на процесс зарождения и диффузию нейтронов. Таким образом, при недостаточ- но интенсивном отводе тепла диффузия нейтронов и теп- лопроводность оказываются взаимосвязанными, подоб- но тому, как это происходит при тепло- и массопереносе в бинарных газовых смесях и жидких растворах. В этом параграфе речь пойдет о математическом опи- сании диффузии нейтронов с учетом тепловых процессов, протекающих в среде. Ограничимся выводом уравнений при выполнении следующих предположений.
| 1.5} ДИФФУЗЙЯ ЙЕЙТЁ0Й0В И ТЁПЛОПЁРЕнОС 75 1. Диффузия нейтронов подчиняется закону Фика, т. е. плотность их потока определяется по формуле J=—D grad N, где N — число нейтронов, находящихся в единице объ- ема, D — коэффициент диффузии. 2. Диаметр реактора много больше длины свободного пробега нейтрона. 3. Запаздывающие нейтроны не оказывают сущест- венного влияния на процесс диффузии и ими можно пренебречь. 4. Плотность источников тепла пропорциональна плот- ности источников нейтронов. 5. Тепло распространяется по закону Фурье, т. е. плотность теплового потока определяется по формуле Jq = — к grad Т, где К — коэффициент теплопроводности, а Т — темпера- тура среды. При выполнении перечисленных условий уравнение диффузии нейтронов имеет вид (см. (1.2.11)) — = div (D grad N) — dt ~T0N + TB№k(M1) w(M’ M1) N{t> M1)(M1)’ (1.5.1) при этом последнее слагаемое в правой части уравнения представляет собой плотность внутренних источников (но не стоков!) тепловых нейтронов. В § 2 было показано, что для случая установившего- ся процесса при больших размерах однородного (гомо- генного) реактора с достаточной степенью точности мож- но считать, что JjJ W(М, Mx) /V (Mx)(Afx) = АГ (М) 4-1 AW, где т — положительная постоянная, однозначно опреде- ляемая средним пробегом нейтрона от момента времени
?6 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ пйоЦёссов (hrt. 1 его зарождения до того момента времени, когда он ста- новится тепловым; Д — оператор Лапласа. Поэтому если считать, что это равенство остается справедливым и при неустановившемся потоке нейтронов, то для гомогенного реактора вместо уравнения (1.5.1) можно брать урав- нение dN dt + + k—N, > TJ To (1.5.2) в котором сумма ^ДУ+Aaz Т, Тв (1.5.3) представляет собой плотность внутренних источников (но не стоков!) нейтронов. С другой стороны, в соответствии с результатами § 2 процесс теплопроводности описывается уравнением cpg' = UT + Q, at где Q — плотность внутренних источников тепла, с — удельная теплоемкость среды, а р — ее плотность. Так как, по предположению, плотность источников тепла про- порциональна плотности нейтронов, т. е. то для описания процессов диффузии нейтронов и тепло- проводности получаем систему уравнений ™ = (D + -\bN + k—N, dt \ ^То) То j СР- =ХДТ + у(-ДУ+ — лЛ. dt \Т0 То У Дополнительные (начальные и граничные) условия для этой системы определяются независимо, т. е. нужно отдельно указать условия для плотности нейтронов (на основе законов диффузии) и для температуры (на осно- ве законов теплопроводности).
§ 1.61 РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 77 § 1.6. Формальное решение линейных краевых задач теории теплопроводности и диффузии 1. Формулировка основных краевых задач. Формаль- ное решение задач для уравнений эллиптического типа. Анализ простейших задач, связанных с математическим описанием процессов теплопроводности и диффузии, по- казывает, что эти процессы, как правило, описываются либо одним уравнением вида — = div (fe grad и) + f, (1.6.1) dt либо системой таких уравнений. Исключение составляют лишь процессы диффузии нейтронов (см. § 3), когда их плотность существенно изменяется на протяжении длины свободного пробега нейтрона. Граничные условия, кото- рым должны удовлетворять искомые функции, также оказываются сходными для всех рассмотренных типов задач. Поэтому представляется целесообразным рассмот- реть некоторые общие свойства полученных краевых за- дач и указать хотя бы формальные приемы их решения. Корректное обоснование формальных методов представ- ляет собой довольно сложную задачу. Здесь мы ограничимся лишь изложением одного важ- ного метода решения краевых задач, не затрагивая воп- росов его обоснования. Поскольку этот метод достаточ- но универсален и применим к решению более общих задач, чем те, которые были получены в настоящей главе, то сначала определим основные краевые зада- чи для уравнений эллиптического и параболического типов. Пусть Q — ограниченная область в n-мерном евклидо- вом пространстве Еп векторов х= {Xi....хп}, aS —гра- ница этой области. Множество Q = {0^/<:7’, xeQ} бу- дем называть цилиндром в («+1)-мерном пространстве переменных / их. Множество Q0={/=0, xeQ} называ- ется основанием (нижним) цилиндра Q, а множество Q.= {0^/^T, xsS} его боковой поверхностью. На Q
78 0ПЙСАЙЙЁ ТЁПЛОВЁ1Х И ДЙФфУЗЙОННЫХ ПРоЦЁССОЙ (ГЛ. 1 определим дифференциальный оператор л д I ди \ /) Lu= s 3 bi(x)-^- + c(x)u, XGQ, ,’'~1 (1.6.2) в котором atl(x), bi(x) и c(x) —заданные вещественные функции. Определение 1. Дифференциальный оператор L называется эллиптическим в й, если в этой области вы- полнены условия: 1) ац=а1{, i, j=\.n; 2) существует положительная постоянная у такая, что 2 a</W«<a/>Y3a*’ + (1.6.3) i,i=i i=i для любых вещественных чисел cct....a„, 2 а z #=0. Если L — эллиптический оператор, то уравнение Lu=—f(x), x<=Q (1.6.4) называется эллиптическим, а уравнение - = Lu + f(t,x), лей, />0, (1.6.5) dt — параболическим. Из этих определений следует, что если функция k, входящая в уравнение (1.6.1), удовлетворяет условию fe^y>0, то это уравнение является параболическим, ибо в декартовой системе координат div (k grad и) = ± (k + — [k — (k Y \ dxi J дх3 \ dx3 j dx3 \ dxt / Таким образом, неустановившиеся процессы тепло- проводности и диффузии при плотностях источников, за- висящих лишь от t и х, описываются линейными диффе- ренциальными уравнениями параболического типа. При этом должно выполняться условие: коэффициенты тепло- проводности и диффузии не зависят от искомой функ-
РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 79 § 16] ции (температуры и концентрации соответственно) и имеют положительные нижние грани. Установившиеся процессы теплопроводности и диф- фузии при тех же предположениях описываются линей- ными уравнениями эллиптического типа (см. (1.1.6) и (1.2.5)). Для однозначного определения решения каждого из уравнений (1.6.4) и (1.6.5) нужно указать дополнитель- ные условия, которым должна удовлетворять функция и на границе рассматриваемой области изменения незави- симых переменных t и х. Здесь мы ограничимся рассмот- рением лишь тех условий, которые обобщают соответст- вующие условия для уравнений теплопроводности и диф- фузии. Сначала рассмотрим уравнение (1.6.4). 1. Условие Дирихле. На границе области Q функция и (х) должна удовлетворять условию «(х)=ф(х), xeS, (1.6.6) где <р(х)—заданная функция. Задача отыскания реше- ния уравнения (1.6.4) среди функций некоторого задан- ного класса (например, дважды непрерывно дифферен- цируемых в Q и непрерывных в Q+S), которое удовлет- воряет условию (1.6.6), называется задачей Дирихле. Для формулировки второго условия предположим, что поверхность S является кусочно-гладкой. Обозначим через п единичный вектор внешней нормали к S. 2. Второе, краевое условие (условие Нейма- на). На границе S области Q функция н(х) должна удов- летворять условию п , ац. — cos (я, X/) + hu — ф (х), xe'S, (1.6.7) ijii дХ{ где Л (х) и q>(x) —заданные функции. Задача отыскания решения уравнения (1.6.4) среди функций некоторого заданного класса, удовлетворяющих условию (1.6.7), на- зывается задачей Неймана. Для решения каждой из этих краевых задач оказы- вается полезным понятия так называемых сопряженных краевых задач, которые можно ввести, используя форму- лу Грина.
80 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 Будем исходить из известной формулы Гаусса — Ост- роградского С л р п \ 2 —l-dx— I 2 Acos (rt> xi) n l=idxi S /=1 которая справедлива в предположении, что S — кусочно- гладкая замкнутая поверхность, а функции А( непрерыв- ны в £2+S и кусочно-непрерывно дифференцируемы в Q. Предположим, что коэффициенты ait3, b{ и с операто- йа7 дЬ, pa L непрерывны в Q+5, а — кусочно-непрерывны в Q+S. Тогда для любых функций и(х) и о(х), непре- рывных в Q+S и имеющих кусочно-непрерывные про- д2и д2о „ , - изводные ------ и ----- в Q, согласно формуле Га- dxtdxj dXfdxj усса — Остроградского, получаем формулу Грина J (vLu — uL*v) dx — а — и где оператор L*, определенный формулой называется оператором, сопряженным с L. Если Ь3(х) =0, i=l....п, то, очевидно, L—L*. В этом случае оператор L называется самосопряженным. Вводя обозначения " а Ри = V ац — cos (я, xt) + hu, (1.6.9) дХ! Qv &io)cos(n, Xi) 4- ho, (1.6.10)
§ 1.6] РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 81 Формулу (1.6.8) можно записать в виде (vLu — uL*v)'dx ~ (vPu — uQv) dS. (1.6.11) о s Если воспользоваться введенными обозначениями, то вторую краевую задачу можно сформулировать следую- 1 щим образом. В заданном классе функций требуется най- ти функцию и(х), которая внутри области Q удовлетво- ряет уравнению (1.6.4), а на границе S условию Р«=<р(х) на S, (1.6.12) где ф(х) — заданная функция. Задача отыскания функции v(x), удовлетворяющей соотношениям ! L*o = f1(x), xsQ, (1.6.13) фо = ф(х), xeS, (1.6.14) i называется задачей, сопряженной с (1.6.4), (1.6.12). i Здесь Д и ф — заданные функции. Для первой краевой задачи (1.6.4), (1.6.6) сопряжен- ' ной является задача отыскания функции V, удовлетворя- ющей уравнению (1.6.13) и дополнительному условию ц=ф(х), x<=S. (1.6.15) Один из наиболее эффективных способов решения указанных краевых задач как для уравнений эллиптиче- ского, так и параболического типа основывается на аппа- рате собственных функций. Определение 2. То значение параметра %, при котором краевая задача Lu = — Xu(x),Jxe[Q, 1 (1.6.16) } Ра = 0, х J < имеет ненулевое решение щ(х), называется собственным значением этой краевой задачи, а само решение ик(х) называется собственной функцией этой краевой задачи. ‘ Так как задача однородна, то всегда можно считать, что 1 \ul(x)dx=l. (1.6.17)
82 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. I Функции «х(х), удовлетворяющие условию (1.6.17), будем называть нормированными. Если под решением задачи (1.6.16) понимать дважды непрерывно дифференцируемую по совокупности пере- менных х( функцию, то для самосопряженного оператора L (L=L*) можно указать достаточно общие ограничения, накладываемые на коэффициенты а„, с и границу S, при выполнении которых имеют место следующие факты. 1. Существует счетная система собственных значений краевой задачи (1.6.16). Все они вещественны и облада- ют свойством 0<Л,< . . . <кп< • • • , Хп~*"°О ПРИ П-+ОО. 2. Каждому собственному значению соответствует собственная функция и„(х) такая, что J ul(x)ui(x)dx = f>{bZjJi.e б,/= Р ПрИ ‘ (1.6.18) 3. Система всех собственных функций {«,(*)} полна в пространстве L2(Q), т. е. любая функция f(x), удов- летворяющая условию f2 (x)dx< ос, однозначно представима в виде (1.6.19а) и при этом знак равенства понимается в том смысле, что J f (•*)— 2 dx-+0 при N Коэффициенты f{ ряда (1.6.19а) определяются по фор- муле fi = ^f(x)Ui(x)dx, а сам ряд называется рядом Фурье функции f(x).
ЙёшеНЙЕ КРАЕВЫХ ЗАДАЧ 83 § 1.61 Система функций {ип(х)}, удовлетворяющая услови- ям (1.6.18), называется ортонормированной. Аналогичные факты имеют место и для задачи Ди- рихле. Если найдена полная ортонормированная система собственных функций, то формальное решение краевой задачи Lu = f(x), x€=Q, Ри = 0, х е S, легко найти следующим образом. Разлагая f (х) в ряд Фурье СО = 5} fiUi (х), fi = J / (х) Uf (x) dx, решение u(x) ищем в виде “ w=2anUn n=l Тогда формально находим Lu = L | = ^nLun = — \n==l J n=l 71=1 и, следовательно, согласно уравнению Lu=f имеем Lu = L । (x) j anLun = 2 \ n=l J n=i n=i 2 ^П^пЦп (x) = 2 fn^n (я). n=l n=l Отсюда следует, что —an==fn^n1 и функция ОО £ = (1.6.19)
84 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ (ГЛ. 1 формально удовлетворяет уравнению Lu=f. Так как ип(х) удовлетворяет условию Ри=0, то функция (1.6.19) также формально удовлетворяет этому условию. Для обоснования этого метода в каждом конкретном случае нужно доказать, что ряд в (1.6.19) сходится и его можно почленно дифференцировать необходимое число раз в каждой точке области и на ее границе S. Однако анализ условий, при выполнении которых это можно делать, здесь проводить не будем, так как речь идет о построении формальных решений. Аналогичным способом можно построить формальное решение краевой задачи Lu = 0, x<=Q, 1 (1.6.20) Ри = ф (х), х е S. J Пусть и» — решение этой задачи и 00 и0(х) = 2 “«“я (*)» где а« = J “о (*) ип (*) dx- (1 -6-2!) п—1 Q Так как, по предположению, оператор L является само- сопряженным (L = L*), то формула (1.6.11) имеет вид J (vLu — uLo) dx = (оРи — иРо) dS. (1.6.22) q s Полагая и=и0, v — uK и учитывая, что £«*=— Рим=О, из (1.6.22) получаем %* J Uq (х) ик (х) dx = J ф (х) ик (х) dx, U S или, что то же самое, Kkak = ^(x)uk(x)dS. Таким образом, решение (1.6.22) имеет вид ДО А “oW=S (1.6.23) п $
5 161 РЁШЁЙЙЕ КЁАЁвЫх ЗАДАЧ 85 Из этой формулы легко видеть, что если даже ряд (1.6.23) сходится и его можно 'почленно дифференциро- вать, то функция и0(х) не будет удовлетворять условию Ри=<р в обычном смысле слова, ибо Ри = 2 у- JФ W Un(x)dS • Рип = 0. n=i п § Однако удается показать, что условию Ри=<р можно придать такой смысл, в терминах которого ряд (1.6.23) будет удовлетворять этому условию. Чтобы заострить внимание на своеобразии возникшей ситуации, полезно проанализировать следующий элемен- тарный пример. _ Известно, что система функций {У2 sin пах} является полной ортонормированной на отрезке [0, 1], т. е. любая функция f(x), удовлетворяющая условию J/* (x)dx< оо, однозначно представима в виде = fnUn(x), (А) где 1 ип = У~2 sin пях, fn = J f (х) tin (х) dx. О При этом 1 lim [ [f (х) — Sn (х)]2 dx = 0, JV-кхз J О где — частичная сумма .ряда, стоящего справа в (А). Пусть f(x) = l, 0^х<1. (В)
$6 ОПЙСАЙИЁ ТЁПЛОВЫХ Й ДЙФФУЗИОЙНЫХ ПРОЦЕССОВ [f Л. i Тогда из (А) получаем A-V sin (2ft +1) яг л 2п + 1 П=1 (С) Ряд, стоящий в правой части этой формулы, равен нулю в точках х=0 и х=1, а следовательно, равенство (С) в этих точках не выполняется. Этот результат объясняется следующим образом. Ряд в (С) определен на всей числовой оси —оо<х< <оо и является нечетной периодической функцией с пе- риодом 2, а с функцией f(x) = l он совпадает лишь при 0<х<1. Поэтому чтобы определить сумму ряда в (С) для любого х, продолжаем f(x) = l, 0<х<1, на всю чис- ловую ось, чтобы получить нечетную периодическую функцию. Сначала полагаем —/(«)» 0<х< 1, — 1<х<0. Затем строим функцию F(x) = ’ f(x-2k), — f(x—2k—1), 2k <Z x < 2k + 1, 2k + 1 < x < 2k + 2, k=0, ±1, ±2,... Она определена на всей числовой оси, за исключением точек x=k. Ряд в (С) является разложением функции F(x), и, согласно теореме Дирихле из теории рядов Фурье, его сумма равна Г(х), если в точке х эта функция непре- рывна. Если же х — точка разрыва функции F(x), то сум- ма ряда равна F(x — 0)4-F(x + 0) 2 Отсюда следует, что равенство (С) в точках х=0 и х=1 можно понимать в том смысле, что f(0) = iim Ау-^РАА^, ' ' Х-+0 л 2ife+1 f(l) = щи AvAHAt1)^-. ' V ’ x—*i~o л 2k + 1 3 i
§ 1.6J РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 87 Такого типа истолкование значений ряда в граничных точках х=0 и х=1 вполне приемлемо при исследовании краевых задач с помощью рядов Фурье. Объяснить это можно следующими рассуждениями. Если, например, речь идет о распространении тепла в стержне длины I (О^х^/), а процесс описывается урав- нением теплопроводности с граничными условиями и(0, t) =<ро(О и u(l, t) =ф1(0, то здесь под u(0, f) и u(l, t) понимают следующие предельные значения функции: и’(0, 0 = lira u(x, t), ujl, t) = lim u(x, t). x-*+o * X—>Z—о Рассмотренный пример разложения функции f(x) = l в ряд Фурье поучителен еще и тем, что, хотя функция f(x) имеет производную любого порядка внутри отрезка [О, 1], ее ряд Фурье нельзя дифференцировать почленно даже один раз. Отсюда, в частности, следует, что если задача (1.6.20) имеет дифференцируемое решение, то разложение этого решения в ряд Фурье по формуле (1.6.23) может оказаться недифференцируемым. Приведенные результаты по формальному решению второй краевой задачи без каких-либо существенных из- менений можно получить и для задачи Дирихле. 2. Формальное решение краевых задач для уравнений параболического типа. В предыдущем пункте были рас- смотрены краевые задачи для уравнения (1.6.4). Теперь обсудим постановку краевых задач для уравнения (1.6.5) и способ построения формального их решения. Для однозначного определения решения u(t, х) не- обходимо указать, кроме граничных условий, которые выполняются на боковой поверхности цилиндра Q = = хей}, еще одно условие, определяющее начальное значение функции u(t, х), и(0, х) = иа (х), хей, (1.6.24) где иа(х) — заданная функция. Граничные условия будем брать лишь в форме Ди- рихле или Неймана. Таким образом, речь будет идти об отыскании формального решения уравнения (1.6.5), удовлетворяющего начальному условию (1.6.24) и одно- му из граничных условий (1.6.6) или (1.6.7). Так же,
88 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 как и в предыдущем пункте, ограничимся подробным анализом лишь второй краевой задачи. Итак, пусть оператор L является самосопряженным (£ = £*, т. е. в (1.6.2) Ь((х)==0, i=l, 2,..., п), и требу- ется построить формальное решение краевой задачи — =Lu + f(t,x), xeQ, f>0, dt u (0, x) = u0 (x), ХЕЙ, Ри = ф(/, x), xgS, f>0, (1.6.25) где f(t, x), ил(х) и <р(/, x) —заданные функции, а опера- тор Р определен формулой (1.6.9). Пусть {ы,(х)}—полная ортонормированная последо- вательность собственных функций задачи (1.6.16), а {XJ — соответствующая последовательность собственных значений. Решение задачи (1.6.25) будем искать в виде и(^х)=2 ц„(0ц,(х), (1.6.26) где . Vn (0 = f « (<» *) “n (*) dX. й Отсюда следует, что t J J [Э“й Х}' — Lu~f & *)] «п (х) dx Л = 0. (1.6.26') о О Так как оператор L самосопряжен, то согласно фор- муле (1.6.22) J un (х) Lu (/, х) dx = u (t, х) Lu„ (х) di 4- J (tinPu —uPun) dS. a a s По определению функций u(t, х) и ы„(х) Pu(t, х) =ф(^, х), Рып = 0, Lun=—knun(x).
§ 1.61 РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 89 Поэтому ип (х) Lu (f, x)dx = J <р (/, x) un (x) dS—Knvn (0. a s Полагая и учитывая, что fn(t) = f f(f, x)un(x)dx J at at Q из формулы (1.6.26) получаем ~~jj~ 4- ^>n®n ~ (L x) Un (x)dS 4~ fn (f)t n — 1, 2, ... s (1.6.27) Эти соотношения представляют собой обыкновенные дифференциальные уравнения относительно оп(0. По- скольку функция (1.6.26) должна удовлетворять началь- ному условию и (0, х) =«о(х), то о„(0) = t4, u* = f Мх)un(x)dx, п = 1, 2, ... (1.6.28) Из (1.6.27) и (1.6.28) находим, что о«(0 = е^ (1.6.29) Совокупность формул (1.6.26) и (1.6.29) определяет фор- мальное решение задачи (1.6.25). Подставляя значение Цп(0 из (1.6.29) в (1.6.26), получаем U(tx) = JG(X, ltf№)dl+ J[JG(X, §,/-<)/(<» 5)4 + a о Ln + f G (jq, S, t — г) ф (r, g) dS] dx, (1.6.30)
90 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [Гл. I где =3 е^ип(х)ип(1). п=1 Таким образом, предполагая существование полной ортонормированной системы собственных функций крае- вой задачи (1.6.16) и принадлежность функций и0(х), f(t, х) и <р(/, х) пространству £2, всегда можно формаль- но построить функцию (1.6.30). Это можно сделать и при более слабых условиях, накладываемых на данные задачи (1.6.16). Однако изложенная процедура получе- ния функции (1.6.30) еще не дает оснований утверждать, что u(t, я) является решением краевой задачи (1.6.25). Для такого вывода нужно, во-первых, определить, что понимается под решением, а во-вторых, доказать, что выражение, стоящее справа в (1.6.30), удовлетворяет всем требованиям, предъявляемым к такому решению. Мы не имеем возможности подробно обсуждать раз- личные понятия решения краевой задачи типа (1.6.25), да это и вряд ли целесообразно делать в монографии, по- священной задачам управления, ибо все это можно про- читать в литературе по уравнениям с частными произ- водными (см., например, [17, 18]). Тем не менее некото- рые факты нам потребуются, ибо при анализе задач управления неизбежно приходится пользоваться различ- ными понятиями обобщенных решений. Дело в том, что под классическим, решением краевой задачи типа (1.6.25) понимается функция u(t, я), которая, будучи подставленной в соотношения (1.6.25), обращает их в тождества. Такая функция должна обладать производ- ными необходимого порядка внутри области £2 и на ее границе (подробнее об этом см. [19]). Как показано вы- ше, при неоднородных граничных условиях построенное формальное решение обычно не удовлетворяет этим тре- бованиям. Более того, если граничное условие однородно (<р=0), мы не можем говорить о классическом решении задачи, когда f(t, x)eL2(Q). Объясняется это тем, что для такой функции f ее значение в точке однознач- но не определяется. В задачах управления наиболь- ший интерес представляют те случаи, когда f^Lt или Ф^О.
S 1-61 РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 91 Чтобы естественным способом определить одно из понятий обобщенного решения, проделаем следующие преобразования. Пусть «’(£ х) — классическое решение задачи (1.6.25), существование которого установлено каким-либо спосо- бом при соответствующих предположениях относитель- но всех данных задачи. Подставляя его в (1.6.25), по- лучим тождества d±^Lur+f{t,x), хе Q, 0</« (1.6.31) ы® (0, х) = и0 (х), /ЕЙ, (1.6.32) Ри° = ф(/, х), хей, 0<и ZT. (1.6.33) Тогда, очевидно, будет справедливо равенство ф[^.°x)ldxdf = 0 (1.6.34) L dt J /о я для любой функции Ф==Ф(/, x)eL2(Q), Q={O^/^T, xgQ}, и любых t0 и ti из отрезка [О, Т]. Если Ф имеет первые производные по t и х, принадлежащие L2(Q), то интегрированием по частям из (1.6.34) будем иметь J(<Mi с dx - S a^’^ + ^ldxdf- , " дх{ dxf Z,/=i » / — J j Ф (Ри° — huv) as = 0. Здесь для упрощения формулы предполагается, что оператор L является самосопряженным, т. е. £=£*. Если теперь учесть, что и° удовлетворяет условию (1.6.33), то последнее равенство можно записать в виде ^(Фи^сЛх-^ Й t0 Й «о дф V! ди<> дф . ?Л 1.1=1 1 ’ xdxdt — J | Ф(<р — hua)dSdt = 0. (1.6.35) i,b
92 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ 1ГЛ 1 Таким образом, если и0 — классическое решение за- дачи (1.6.25), то оно удовлетворяет тождеству (1.6.35) для любой дифференцируемой функции Ф(дФ/ЛеЛ2, дФ/дх{^Ь2) и начальному условию и (0, х) = и0(х). Легко видеть, что справедливо также и обратное ут- верждение: если 1) имеет место тождество (1.6.35), 2) справедливо равенство ы°(0, х)=ы0(х), 3) функция и? (t, х) имеет непрерывные производные второго поряд- ка d^/dXidXj и 4) производные dif/dt и daiSldxi непре- рывны, то «°(/, х) является классическим решением краевой задачи (1.6.25). Чтобы в этом убедиться, достаточно тождество (1.6.35) преобразовать к виду (1.6.34). Эти рассуждения показывают, что если (1.6.35) рассматривать как уравнение относительно и0 (при любой функции Ф из указанного класса) вместе с начальным условием и” (0, х) = ы0 (х), то оно в некотором смысле эквивалентно исходной краевой задаче (1.6.25). Однако (1.6.25) не содержит durfdt и d2u°/dx(dXj. Более того, можно расширить класс функций Ф, фигурирую- щих в (1.6.35), поступая следующим образом. Пусть {Ф„} — произвольная последовательность из выбранного класса (т. е. Ф„<=£2, дф„/д/е£2, дФ„]дх{<= eL2), обладающая свойствами т — Om]2dQd/->0 при п, т—► оо, О Q о Q ой при И, 7П->О0. Тогда в силу полноты пространства L2 существуют функ- ции Т(t, х), v(t, х) и Vi(t, х) из L2 такие, что t т lim С С [Ф„ — W]*dxdt — lim С ("Г^-— о| dxdt = п-*х> J J п-*оо J J L J ой ой Т = lim f f —о/| dx dt — О, n-*OO J J L &Xl J О Й
5 1.6] РЕШЕНИЕ КРАЕВЫХ ЗАДАЧ 93 a v и Щ называются обобщенными производными функ- ции ¥ и обозначаются 0(f,x) = ^, v ’ dt V ’ dXi Множество тех и только тех функций Чг(/, х), которые удовлетворяют перечисленным условиям и для которых скалярное произведение определяется формулой, т . п \ т, =f f V.+з * л образует пространство Соболева W\ (Q) (см., например, [17, 18]). Следовательно, определяя классическое решение u*(f, х) через тождество (1.6.35), можно вместо Ф брать любую функцию ТеWl (Q), т. е. это решение опреде- лить следующим образом. Функция u°(t, х) называется классическим решением краевой задачи (1.6.25), если она 1) непрерывна в замкнутой области хей}, 2) внутри области Q имеет непрерывные производные — , , i, i = 1, ..., п, dt dxtdxj 3) на границе а= {O^tsgzT, xeS} имеет непрерыв- ные производные du° дх1 ' 4) удовлетворяет начальному условию и (0, х)=ы0(х) и интегральному тождеству (1.6.35) Q t, Я *1 Г fY(<p — hu°)dSdi = 0 (1.6.36)
94 ОПИСАНИЕ ТЕПЛОВЫХ И ДИФФУЗИОННЫХ ПРОЦЕССОВ [ГЛ. 1 для любой функции VelTj (Q) и любых to и из отрез- ка [О, Т]. Ясно, что для существования такого решения нужно предполагать непрерывную дифференцируемость функ- ций ai} и гладкость поверхности S. Первые три пункта в этом определении требуются лишь для того, чтобы от (1.6.36) перейти к (1.6.34). В определении обобщенного решения этого не требуется. В основу кладется интегральное тождество (1.6.36) и от этого решения требуется лишь, чтобы тождество (1.6.36) имело место и в некотором смысле выполнялось начальное условие. Обобщенным решением краевой задачи (1.6.25) на- зывается функция u(t, х) из A2(Q), имеющая обобщен- ии г . , ные производные —el2) t= 1, ..., п, которая 1) удовлетворяет интегральному тождеству (1.6.36) для любой функции 'FeW’a (Q) и любых и из отрез- ка [0, 7], 2) удовлетворяет начальному условию и (0, х) = = Мо(х) в том смысле, что С [и (t, х) — и0 (х)] Y (х) dx -> 0 при f -> 4- О о для любой функции T(х) eL2 (й). Оказывается, что с чисто инженерных позиций такие решения представляют несомненный интерес. Они ока- зываются также полезны и при исследовании задач оп- тимального управления, ибо позволяют математически анализировать наиболее интересные задачи управления процессами, которые можно описать уравнениями в част- ных производных параболического типа. Существование и единственность такого решения u(t, х) удается дока- зать при достаточно слабых ограничениях на функции ai}, q>, f и границу S (см., например, (20]). При этом, что очень важно, u(t, х) можно обычно представить в виде (1.6.30).
Г Л A В A It ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ В предыдущей главе были рассмотрены некоторые процессы, связанные с переносом массы и тепла. При этом было показано, что обычно они описываются диф- ференциальными или интегро-дифференциальными урав- нениями в частных производных с дополнительными (начальными и граничными) условиями. В некоторых, довольно частных случаях процесс можно описать обык- новенными дифференциальными уравнениями (стацио- нарное тепловое поле со сферической симметрией; диф- фузия нейтронов в предположении, что их плотность не зависит от пространственных координат и т. д.). В этой главе речь пойдет о наиболее простых задачах оптими- зации таких процессов в этих частных случаях. Однако каждый раз мы будем стремиться к тому, чтобы исход- ная формулировка задачи была получена в наиболее общей форме, и лишь после этого более или менее пол- ный анализ задачи будет проводиться для простейшего случая. Этот анализ будет сделан для нескольких задач, взятых из теории теплопроводности, диффузии нейтро- нов и теории тепло- и массообмена. Их число, несомнен- но, можно увеличить и привести другие не менее инте- ресные примеры, в которых широко используются ма- тематические методы. Однако мы этого не делаем, поскольку намерены на ограниченном числе примеров показать разнообразие практических задач оптимизации процессов теплопроводности и диффузии, а также про- иллюстрировать различные методы их решения, начиная с самых элементарных и кончая неклассическими мето- дами вариационного исчисления. Прежде чем переходить к формулировке частных за- дач оптимизации, изложим общие положения, которые характеризуют все эти задачи. Главное их содержание заключается в том, чтобы из различных возможных
96 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II реализаций рассматриваемого процесса выбрать такую, при которой процесс был бы наилучшим по некоторому заранее указанному критерию. Возможность выбора раз- личных реализаций процесса обусловливается наличием «рулей», изменяя положение которых можно вмешивать- ся в его протекание и направлять по нужному руслу. Математически эта ситуация выражается тем, что в сово- купность математических соотношений, описывающих процесс, входят параметры, которые можно изменять в разумных пределах и тем самым влиять на поведение решения. Поскольку положение «рулей» можно изменять во времени, то выбранные параметры, вообще говоря, будут функциональными, а не числовыми. Их называют управляющими функциями. Если для характеристики процесса выбрать некото- рую величину, называемую критерием качества (или оптимальности) и зависящую от решения уравнений, описывающих процесс, то каждому способу управления будет соответствовать свое значение критерия качества. Исходя из этого, цель управления обычно формулирует- ся следующим образом. Среди всех возможных реализаций процесса требу- ется выбрать такую реализацию, при которой критерий качества принимает свое наименьшее (наибольшее) зна- чение. Например, в задаче о пуске ядерного реактора, т. е. о переводе его из заданного начального состояния в номинальный рабочий режим, цель управления в об- щих чертах может быть сформулирована следующим образом. 1. В конечный момент времени реактор должен на- ходиться в желаемом рабочем режиме. 2. Время, затраченное на его пуск, т. е. перевод из начального режима в конечный, должно быть мини- мальным. Следовательно, здесь критерием качества служит вре- мя, в течение которого реактор переходит из начального в конечный заданный режим. Кроме того, следует иметь в виду, что на процесс могут налагаться ограничения, которые непосредственно не связаны с формулировкой цели управления. Они обыч- но дают полную характеристику понятия допустимой реализации процесса и могут накладываться как на сам
ГЛ. П] ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ 97 процесс, так и на поведение управляющих «рулей» в связи с требованиями техники безопасности, технической реализуемости и т. д. Математически они обычно описы- ваются в форме равенств и неравенств относительно решений уравнений, описывающих процесс, и управляю- щих функций. Таким образом, математическая формулировка зада- чи оптимального управления включает в себя: 1) урав- нения, описывающие процесс, 2) критерий качества и 3) ограничения в виде равенств и неравенств, наклады- ваемые на решения уравнений и управляющие функции. Поэтому полное математическое описание задачи может быть получено лишь на основе анализа реального содер- жания исследуемого процесса. Математические требова- ния при этом обычно сводятся к тому, чтобы рассматри- ваемая задача имела решение в достаточно широком классе функций. При этом желательно, чтобы решение было единственным. Если единственности нет, то появ- ляется искушение «улучшить» решение путем введения дополнительных требований к рассматриваемому процес- су. Выбор класса функций, в котором ищется решение задачи оптимального управления, определяется многи- ми причинами, имеющими как физические, так и мате- матические истоки. Их общий анализ представляет собой довольно сложную задачу. Поэтому такие вопросы будем обсуждать по мере необходимости применительно к каж- дому конкретному случаю. В дальнейшем при решении отдельных конкретных примеров или более или менее общих задач оптимально- го управления будут использоваться различные методы: классическое вариационное исчисление, принцип макси- мума Понтрягина, проблема моментов, динамическое программирование и неклассические методы теории оп- тимального управления системами с распределенными параметрами. Часть этих методов (классическое вариа- ционное исчисление, принцип максимума, проблема мо- ментов и динамическое программирование) достаточно хорошо известна широкому кругу математиков и инжене- ров, работающих в области оптимизации. Кроме того, на эту тему написаны великолепные монографии и учебные пособия. Поэтому здесь ограничимся лишь общим крат- ким описанием основных соотношений этих методов 4 А. И. Егоров
98 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. И (исключая классическое вариационное исчисление), ко- торые в дальнейшем будут использованы при решении различных задач. Неклассические методы теории опти- мальных систем с распределенными параметрами менее известны, и в них нет той универсальной общности, ко- торая присуща, скажем, принципу максимума Понтря- гина. По этой причине соответствующие результаты этой теории будут подробно доказываться в последующих главах по мере необходимости, а затем использоваться при решении конкретных задач. § 2.1. Основные соотношения в неклассических методах теории оптимальных систем 1. Принцип максимума Понтрягина. Пусть состояние управляемой системы в каждый конкретный момент вре- мени определяется n-мерным вектором х={х1г ..., хп} евклидова пространства Еп, а положение «рулей» харак- теризуется r-мерным вектором и= {ut,..., иг}. Будем предполагать, что поведение управляемой си- стемы во времени описывается обыкновенным дифферен циальным уравнением — = f(x, и), di ' v ’ Допустимыми управлениями будем считать произ- вольные кусочно-непрерывные функции u=u(t), прини- мающие значения из некоторой (замкнутой или откры- той) области U r-мерного евклидова пространства Ет. Будем также предполагать, что компоненты f{ вектор- функции f дважды непрерывно дифференцируемы по со- вокупности переменных xt, ..., хп, uit ..., иг. Тогда при каждом допустимом управлении u = u(t) задача Коши -£ = /(х,«(0), х(/0) = х° (2.1.1) dt имеет единственное непрерывное кусочно-дифференци- руемое решение x=x(t),
§ 2.1] МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 99 На паре {x(t), u(t)} определен функционал /0(х,ы)< 7 = (2.1.2) в котором функция fo удовлетворяет тем же условиям, что и компоненты ft вектора f. Пусть, далее, в пространстве Еп задан вектор х‘. Требуется в классе допустимых управлений найти такое управление u(t) и соответствующее ему решение х(0 задачи (2.1.1), чтобы: 1) в некоторый (вообще го- воря, не фиксированный) момент времени выполня- лось условие х(Л)=х‘, (2.1.3) 2) функционал / принимал наименьшее возможное зна- чение. Управление u(t), которое дает решение этой задачи, называется оптимальным управлением, а соответствую- щее ему решение x(t) задачи (2.1.1) —оптимальной тра- екторией. В дальнейшем их- будем обозначать через u0(t) и хо(О- Чтобы сформулировать необходимые условия опти- мальности, введем вспомогательную функцию Н(х, ф, и) = (ф, /) =фо/о+ф1Л + .. .+фп/я, (2.1.4) в которой множители фг, 1=0, 1, ..., п, определим с по- мощью линейной системы дифференциальных уравнений -0.1........» (2.1.5) 1=1 1 Легко видеть, что каждой паре {x(t), u(t)}, связан- ной соотношениями (2.1.1), соответствует непрерывное решение {ф»(0.....ф»(0) системы (2.1.5), зависящее от (п-Ы)-й произвольной постоянной (начальные усло- вия для этой системы не заданы). Необходимые условия оптимальности в рассматри- ваемой задаче даются принципом максимума Понтряги- на, который формулируется следующим образом. 4*
100 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. II Пусть u»(t), — оптимальное управление, а х0(/)—соответствующая ему оптимальная траектория (они связаны соотношениями (2.1.1)), х0(/) удовлетво- ряет условию (2.1.3) и при этом функционал (2.1.2) при- нимает минимальное возможное значение на х=х0(/), u=ul)(t). Тогда существует не равная тождественно нулю функ- ция ф(/) = {-ф0(/), ..., фп(/)}, соответствующая паре {x0(f), uo(O} (г- определяемая из системы (2.1.5) при x=x„(i), u=u0(t)), такая, что: 1) функция /7(х0(/), ф(/), w) достигает своего мак- симального значения по и в точке u = u0(t) почти при всех t, т. е. Я(хо(0, и0 (/))(=) max Я (хо(0, ф(0,«). (2.1.6) ueV (символ ( = ) означает равенство, справедливое почти при всех /,]); 2) почти при всех t выполняются соотношения ф„(0С0, Я(х.(7), ф(0, М0)=0- (2.1.7) Мы не будем обсуждать вопрос об эффективности этих условий оптимальности. Об этом можно прочитать в соответствующей литературе (см. [1—3]) и судить по рассмотренным в этой главе примерам. Здесь сформули- руем принцип максимума для одного частного случая, который много раз будет использован в этой главе. Пусть в критерии оптимальности (2.1.2) f0»l. Тогда /=<!—/о. Поэтому, если t — время, то рассматриваемая задача оптимизации состоит в определении такого допустимого управления, которое обеспечивает минимальное время перевода системы из состояния Xй в состояние х1 (см. (2.1.1) и (2.1.3)). Эта задача называется задачей об оп- тимальном быстродействии. В этом случае (см. (2.1.4)) Н (х, ф, и) = 3? (х, ф, и) + ф0,
§ 2.1] МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 101 где = ...........................................*»}, 1-1 а соотношение (2.1.6) дает М(х0(1), 4(0, «о(0)(=)тах^(хо(О, 4(0, и), (2.1.8) и где 4(0 = {'<1’1(0> •••> 'Фп(О) есть решение системы урав- нений = ;=1............(2.1.9) Л р да, ' /=1 * при х=хо(О, «=ио(О- В силу соотношений (2.1.7) имеем Ж (хо (0. 'f(0» “о (0) = — *о> °. ♦•= const < 0- (2.1.10) Таким образом, принцип максимума для задачи об оптимальном быстродействии формулируется следую- щим образом. Пусть ы0(0 —оптимальное по быстродействию управ- ление, а х0(0 —соответствующая ему оптимальная тра- ектория. Тогда существует ненулевой непрерывный вектор ф(0, соответствующий паре {х0(0, м»(0} такой, что: 1) его компоненты удовлетворяют системе (2.1.9); 2) функция 4(0, “) достигает максималь- ного значения по и при u = u0(t), т. е. выполнено усло- вие (2.1.8); 3) почти при всех t выполняется условие (2.1.10). Существенный интерес для анализа приведенных ни- же примеров имеет случай, когда точка х1 в условии (2.1.3) не фиксирована, а принадлежит некоторому мно- гообразию St^En, размерность которого г меньше п. Для полного описания этой ситуации необходимо привести некоторые факты из геометрии пространства Еп (см., например, [3]).
102 ПРОСТЕЙШИЕ задачи оптимизации [ГЛ. п Пусть хи ..., хп—ортогональные координаты в Еп. Множество S точек х={хь х„}, которые удовлетво- ряют уравнению ф(х)=0, (2.1.11) называется гиперповерхностью в Еп. В частности, если Ф— линейная функция, т. е. уравнение (2.1.11) имеет вид atXi+.. .+a„xn+&=0, at=const, &=const, (2.1.12) то S называется гиперплоскостью. Точка x’eS называ- ется неособой точкой гиперповерхности S, если grad ф (х°) =#0. В противном случае (т. е. при grad ф(х“) = =0) она называется особой. Отсюда следует, что отсут- ствие особых точек у гиперплоскости (2.1.12) означает, (п \ 2 а|=/=0 I. i=i / Гиперповерхность 5, у которой отсутствуют особые точки, называется гладкой гиперповерхностью, а век- тор grad ф (х°), x’eS, называется нормальным векто- ром (нормалью) гиперповерхности S в точке х°. Гипер- плоскость, проходящая через х" и ортогональная векто- ру gradф(x0), называется касательной к S в точке х°. Легко видеть, что она задается уравнением (grad<p(x°), х—х°)=0, (2.1.13) где (и, v)—скалярное произведение векторов иеЕ" и оеЕ". Вектор о=х—х°, удовлетворяющий уравнению (2.1.13), называется касательным вектором гиперповерх- ности S в точке х®. Пусть St, ..., Sk— гладкие гиперповерхности, задан- ные уравнениями Ф^х)=0.......ф„(х)=0. (2.1.14) Множество М точек хеЕ", принадлежащих одновре- менно всем гиперповерхностям 5Ь ..., 3* (т. е. удовле- творяющих всем уравнениям (2.1.14)), называется (п—k) -мерным гладким многообразием в Еп, если в каж- дой точке х^М векторы grad?1(x), .... gradф*(x)
§ 2.1] МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ ЮЗ линейно независимы. В частности, если при этом все функции фь ф* в уравнениях (2.1.14) линейны, то М называется (п—k)-мерной гиперплоскостью. В соответ- ствии с формулой (2.1.13) можно определить (п—k)- мерную касательную гиперплоскость М в точке х°еЛ1. Она задается системой уравнений (grad фх (х°), х — х°) = 0, ..., (grad ф* (х°), х — х°) = 0. Вектор v=x—хй, удовлетворяющий этой системе урав- нений, называется касательным к М вектором в точке х°. После приведенного описания гладкого многообра- зия М и связанных с ним геометрических понятий можно формулировать необходимые условия оптимальности для случая, когда правый конец траектории (в момент окончания процесса) принадлежит М. Так как речь идет о необходимых условиях оптимальности, то можно рас- суждать следующим образом. Пусть u°(t)—оптималь- ное управление, a x°(t), — оптимальная траек- тория, которая в момент времени Z = удовлетворяет условию х(/,) =х‘еЛ1. Отсюда следует, что u°(t) явля- ется оптимальным управлением в задаче с фиксирован- ными данными x(t0)=x° и x(ti) =х1^М. Это означает, что uQ(t) должно удовлетворять прин- ципу максимума Понтрягина. Остается указать условия, которые должны определить положение точки х1. Ими оказываются так называемые условия трансверсально- сти, которые формулируются следующим образом. Век- тор ф(^) в точке x(tt) ортогонален касательной гипер- плоскости многообразия М. Поясним это условие. Пусть гладкое многообразие М задано уравнениями ф!(х)=0, ..., фл(х)=0, k<.n. Тог- да касательная гиперплоскость к М в точке x(/t)=x' определяется уравнениями (gradф1(x1), х —х1) — 0, ..., ^габф^х1), х —хг)= 0, (2.1.15) и условие трансверсальности заключается в том, что для любой точки х, удовлетворяющей системе (2.1.15),
104 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. II вектор ф(Л) должен удовлетворять условию (Ш), X—х‘)=0. (2.1.15') Так как система (2.1.15) определяет k независимых векторов о1( v2, ..., vh (определенных с точностью до п—k постоянных множителей), то из (2.1.15') получаем k уравнений (Ш). v.)=0, .... (ф(/1)ол)=0. (2.1.16) Пример 1. Пусть решается задача оптимального быстродействия в системе = ^ = f2(x,«), -1<«<1, (2.1.17) at at с начальными условиями x2(t0) = xl (2.1.18) Условие в момент окончания процесса задано урав- нением х4(М=0, (2.1.19) т. е. траектория в момент времени tt должна пересекать ось х2 (рис. 2). Для решения составляем функцию Н(х, ф, и) = =ф1А (х, и) 4-^2 (*, и) и систему уравнений <Ь|Ч _ dfj (х, «) df2 (х, и) dt дхх дх! dip2 _ dft (х, u) df2(x, и) di дх2 dr2 (2.1.20) Согласно принципу максимума оптимальное управле- ние м°(0> оптимальная траектория х°(0 и соответствую- щая им функция ф(0 = {‘Ф1. фг} должны быть связаны соотношениями (2.1.17), (2.1.18) и (2.1.20), а также должно быть выполнено условие максимума функции Н H(x°(t), ф(0; «°(0)= max Я(х°(/), ф(0. и)>0.
5 2.1] МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 105 В момент окончания процесса, т. е. при функции ф, и ф2 должны удовлетворять условию трансверсально- сти. Так как касательной к линии (2.1.19) на плоскости (хъ х2) является прямая х,=0, то условие трансверсальности принимает вид фг(Л) —О. 2. Метод моментов. Вторым эффективным методом решения задач оптимального управле- ния, на который мы обратим здесь внимание, является метод ([4]), основанный на использовании аппарата L-пробле мы моментов. Пусть управляемый процесс описывается уравнением — = A(t)x + B(t)u (2.1.21) с начальным условием х(4)=х°, (2.1.22) где х={хь .... хп} — n-мерный вектор фазового состоя- ния системы, и={и1г ..., иг} — r-мерный вектор управле- ния, A(t) и B(t) —заданные непрерывные матрицы раз- мерностей пХп и пХг соответственно, х°—заданный век- тор, определяющий начальное состояние. Допустимыми управлениями будем считать функции u=u(t), которые: 1) можно считать элемента- ми некоторого функционального пространства (Сг(/0, tt), Lp (to, tA, MT(t0, Л) и т. д.); 2) обладают тем свойством, что каждое допустимое управление однозначно опреде- ляет решение задачи Коши (2.1.21), (2.1.22). В дальнейшем, когда класс допустимых управлений выбран, а следовательно, указано конкретное функцио- нальное пространство, которому принадлежат эти управ- ления, через ||и|| будем обозначать норму управления в этом пространстве. Момент времени t—t2 может быть как фиксированным, так и свободным. Пусть, далее, задан некоторый вектор х‘, и рассмот- рим две следующие задачи.
106 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. И Задача 1. Среди допустимых управлений «=«(/) требуется найти u = iz0(t) такое, что соответствующее ему решение задачи Коши (2.1.21), (2.1.22) в заданный момент времени t=tt удовлетворяет условию x(t4)=x‘, (2.1.23) и при этом функционал /=11иЦ принимает наименьшее возможное значение. Здесь символом ||и|| обозначена норма допустимого управления, рассматриваемого как элемент выбранного функционального пространства. Задача 2. Среди допустимых управлений u=u{t), to^t^t, (t, не фиксировано), удовлетворяющих условию ||«||<v = const>0, (2.1.24) требуется найти управление м=ыо(О такое, чтобы соот- ветствующее ему решение задачи Коши (2.1.21), (2.1.22) в момент времени t=tt удовлетворяло условию (2.1.23) и при этом функционал 1 = 1,—to принимал наименьшее возможное значение. Сначала изложим метод решения задачи 1. Пусть W(t, t0)—фундаментальная матрица решений уравнения — = 4(t)x, dt v' нормальная при t=t0. Тогда решение задачи Коши (2.1.21), (2.1.22), соответствующее управлению u=u(t), можно представить в виде t х (t) = W (t, t0) x° + f W (t, т) В (т) u (t) dr, *0 и условие (2.1.23) принимает вид f, x)u(x)dr ~= c, (2.1.25) -0
§ 2.1] МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 107 гдеЛ(/„ т)=В’(т)^(Л, т), а c=x'—W(tl, Qx0. Обозначим через V функциональное пространство, элементами которого являются допустимые управления в задаче 1. По определению матрица h(tt, т) имеет раз- мерность гХ». Если обозначить через №<(/,, т) j-й стол- бец матрицы h, то соотношение (2.1.25) можно перепи- сать в виде ^1 Г ht (к, т) и (г) dx — i=l,2, ...,л, (2.1.26) где Ci—компоненты вектора с. Будем считать r-мерные векторы h((tlt т), i= 1,..., п, линейно независимыми и рассматривать как элементы подходящим образом сконструированного функциональ- ного пространства Н. Пространство Н должно быть та- ким, чтобы сопряженное ему пространство совпадало с V, т. е. H*=V. Тогда соотношения (2.1.26) можно рас- сматривать как значения некоторого линейного функ- ционала фи, определяемого управлением на эле- ментах hi(ti, х)^Н, т. е. <pu(M^> x))=Ct, 1=1, ..., п. (2.1.27) При этом норма этого функционала определяется формулой l<p«L = l«L т. е. совпадает с функционалом I, который служит кри- терием оптимальности в задаче 1. Таким образом, задача 1 теперь может быть сфор- мулирована следующим образом. Среди линейных функционалов, определенных на Н, требуется найти функционал <р° такой, что он удовлетво- ряет условиям (2.1.27) и имеет наименьшую норму. Процедура решения этой задачи состоит в следую- щем (4].
4 108 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II Сначала нужно найти п min 2 (<i, t) 1=1 н при условии, что векторы а= {аь ..., an} и с= {сь..., сп} связаны соотношением М=2°й = 1, где Ci—постоянные, входящие в условия (2.1.27). Пусть этот минимум достигается в точке a°={aj, ..., а,п} и положим sP°, i=l н min у aihi (tlt х) (a,c)=i h°(t1,r) = 2 l=l Затем функционал ф°, определяемый оптимальным управлением, ищется путем решения следующей задачи: Ф°(Л°) = тах<р(Л°) при условии ||ф°1 = — • (2.1.28) ф Р° Отсюда обычно легко находится оптимальное управ- ление. Кстати отметим, что проблема моментов имеет решение тогда и только тогда, когда р° положительно. Для иллюстрации этого метода приведем простой при- мер (см. [4], стр. 107—108). Пример 2. Пусть соотношения (2.1.26) имеют вид 1 1 Jru(T)dT=l, J (1—x)u(x)dx =— 1. (2.1.29) о О Требуется найти скалярное управление «=«“(/) та- кое, чтобы оно удовлетворяло условиям (2.1.29) и при
$ 2.1] МЁТОДЫ ТЁОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 109 этом max | u® (t) | = min. Функции т и 1—т будем рассматривать как элементы пространства L(0, 1), норма в котором определяется по формуле ||ft||=jlft(t)|dt. о Сначала вычисляем величину 1 Р° = min f I axt 4- a2— a2tldr, (a,c)=i J где c={l, —1} и, следовательно, (a, c)=at—a2=l. Заменяя at на 1 +a2, получаем i P® = min f ]ta2|dt, —oo<^a2<oo. “* 0 Отсюда находим, что a2 =—0,5, a? =0,5, а p°=l/4. Теперь решаем задачу (2.1.28). Имеем Л0(т) = т — 0,5, 1 Ф® (Л°) = max f и J о 1 (т — 0,5) и (т) dt = J (t — 0,5) a® (t) dr о при условии max I и (t) | < 4. Отсюда следует, что 1 ы® (t)= 4sign (t — 0, 5); ф°(Л°) = 4 J | т — 0,51 dr. о Тем самым оптимальное управление построено. В бо- лее сложных задачах наибольшие трудности вызывает построение h° (?).
110 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. И Переходим теперь к решению сформулированной выше задачи 2 об оптимальном быстродействии. Предположим, что мы умеем решать задачу 1 при моменте времени / = Тогда ми- задаче любом фиксированном нимизируемый в этой функционал /=||«|| при каждом t=ti принимает минимальное значение 7= = 70(/1), определяемое оп- тимальным управлением u=uQ(tl, т) *). На плос- кость (4,у) наносим две кривые **) (рис. 3) г/=/°(^) и у=у, (2.1.30) где v — постоянная, фигу- рирующая в условии (2.1.24). Абсцисса самой левой точки пересечения этих двух кривых является временем оптимального быстро- действия. В самом деле, при любом /“(/,)>v, а сле- довательно, для любого другого управления, переводя- щего систему из точки (2.1.22) в (2.1.23), будет спра- ведливо неравенство Поэтому все эти управления (оптимальное и неопти- мальное) не удовлетворяют условию (2.1.24), а среди управлений, удовлетворяющих этому условию, нет тако- го, которое переводило бы систему из точки (2.1.22) в точку (2.1.23). При ti = ti таким управлением является « = «’(/?, t). Оно переводит систему из начальной точки в конечную (см. условия (2.1.22) и (2.1.23)), и соответ- ствующее ему минимальное значение функционала /= = /(/,) равно Следовательно, управление удо- влетворяет условию (2.1.24). *) Для того чтобы подчеркнуть зависимость оптимального уп- равления от момента окончания процесса это управление обо- значено через «°(^1, О- **) Можно показать, что функция непрерывна по Гь
МЕТОДЫ ТЕОРИИ ОПТИМАЛЬНЫХ СИСТЕМ 111 § 2.11 Эта процедура дает практический путь решения за- дачи 2. Сначала решается задача 1 при произвольном Затем по линиям (2.1.30) находится точка t\, которая является моментом окончания процесса при оптималь- ном по быстродействию управлении. 3. Динамическое программирование. Будем рассмат- ривать управляемый процесс, который описывается урав- нением (2.1.31) с начальным условием х(М=х°, (2.1.32) где х и f — n-мерные векторы, х°—заданный вектор, а u={Ui, ..., иг}—r-мерный управляющий вектор, кото- рый может принимать значения из некоторой открытой или замкнутой области U в пространстве («ъ .... иг), определяемой видом наложенных ограничений. В каче- стве допустимых управлений будем брать измеримые функции u=u(t), которые почта при всех t из отрезка [/0, Т] удовлетворяют условию и(/)ей. Будем также предполагать, что каждое допустимое управление определяет единственное решение x=x(t) задачи Коши (2.1.31), (2.1.32), которое является абсо- лютно непрерывной функцией. На допустимых управле- ниях и соответствующих им решениях задачи (2.1.31), (2.1.32) определен функционал т /= jG(x, и, t)dt, (2.1.33) где Т фиксировано. Рассматриваемая задача оптимального управления заключается в том, чтобы найти такое допустимое управ- ление и соответствующее ему решение задачи Коши (2.1.31), (2.1.32), которые давали бы функционалу (2.1.33) наименьшее возможное значение.
112 простейшие задачи оптимизации [ГЛ. и В основе метода динамического программирования лежит принцип оптимальности Р. Веллмана, который в применении к сформулированной здесь зада- че выглядит так. Пусть u=u*(t)—оптимальное управление, а х= =x°(t)—соответствующее ему решение уравнения (2.1.31), удовлетворяющее условию (2.1.32). Пусть, да- лее, t,— произвольная точка из отрезка |/0, Г], а «° (/t) и х’(^) —значения и0(t) ux°(t) nput=ti. Оптимальная траектория x=x°(t), и опти- мальное управление u = u°(t), обладают тем свойством, что при произвольном Л они миними- зируют функционал т I = JG(x, и, t)dt при условиях ^ = f(x,u,t), х(<0 = х*(4). т. e. остаток оптимальной траектории x°(Z), и остаток оптимального управления ua(t), t^t^T, явля- ются оптимальными независимо от того, каким способом система переведена в состояние х° (/,). Если ввести обозначение т S [х (0, fl = min Г G (х (г), и (г), г) dr, «ей J то с помощью принципа оптимальности можно доказать, что S удовлетворяет следующему уравнению Веллмана: —~ = min {G (х, и, 0’+ <grad S, f>}, ot и где <а, by, означает скалярное произведение векторов а и Ь. Формальный вывод этого уравнения можно найти во многих работах (см., например, (3, 5—7]). Корректное обоснование метода динамического программирования дано В. Г. Болтянским [2].
§ 2.2] КРИТИЧЕСКИЙ ДИАМЕТР ТРУБЫ 113 § 2.2. Критический диаметр цилиндрической трубы Будем рассматривать стационарный тепловой про- цесс, протекающий в стенках цилиндрической трубы с постоянным коэффициентом теплопроводности и посто- янными коэффициентами теплообмена на внутренней и наружной поверхности трубы. Изучение таких процессов представляет практический интерес для исследования теплообмена в прямо- точных и противоточ- ных теплообменниках, а также в вопросах термоизоляции труб {8]. Пусть внутри круг- лой цилиндрической трубы с постоянной »»»»»% Рис. 4. скоростью протекает жидкость, имеющая постоянную температуру; вне трубы среда имеет также постоянную температуру. Тогда в стенке трубы устанавливается стационарный тепловой поток. Если длина трубы велика по сравнению с толщи- ной стенки, то влиянием торцов трубы на тепловой про- цесс в стенке можно пренебречь. При этом очевидно, что внутри стенки не происходит накопления или потерь теп- ла, т. е. количество тепла, проходящего через внутрен- нюю стенку, равно количеству тепла, проходящего через внешнюю стенку. Будем предполагать, что эти стенки представляют собой концентрические цилиндры радиусов Л и г2 соответственно (рис. 4). При этих условиях темпе- ратура и в любой точке М стенки трубы зависит лишь от ее расстояния г от центральной оси трубы, а закон ее из- менения определяется стационарным уравнением тепло- проводности div grad и (Л!) =0. Так как и—и (г), то это уравнение в цилиндрических координатах принимает вид 4(г^=0, гх<г<г2. (2.2.1) аг \ аг } Пусть температура внешней среды у внутренней и внешней стенок трубы равна 01 и 02, а коэффициенты
114 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. И теплообмена у этих стенок равны oci и а2. Тогда гранич- ные условия можно записать в виде k v = ai (и — 0Х) при г = гх, (2.2.2) аг k — = -~a2(u — 02) при г = га, (2.2.3) dr где k — коэффициент теплопроводности трубы. Пусть тепло передается от внутренней стенки к на- ружной, т. е. 04>02. Для характеристики величины этого тепла введем следующее определение. Линейной плотностью теплового потока qt в стенке трубы будем называть количество тепла, переданного единицей длины трубы в единицу времени. Таким обра- зом, по определению <7/=у. (2.2.4) где Q — количество тепла, проходящего в единицу вре- мени через участок трубы длины I. Рассматриваемая нами задача оптимизации теплово- го процесса состоит в следующем [8]. Задан внутренний диаметр трубы. Требуется выбрать ее внешний диаметр так, чтобы максимизировать линей- ную плотность теплового потока. Для ее решения сначала найдем зависимость qt от тг. Общее решение уравнения (2.2.1) имеет вид ««сДпг+й» (2.2.5) где g и с2—произвольные постоянные, которые опреде- ляем через значение температуры на внутренней и внеш- ней стенках трубы: U(r,) =Г11ПГ1 + С2, и{гг) = <?4 in Г2-|-С2. Отсюда находим, что где dt и d2— внутренний и внешний диаметры трубы.
$ 2.21 КРИТИЧЕСКИЙ ДИАМЕТР ТРУБЫ 115 Следовательно, формулу (2.2.5) можно записать в виде 1П^ «(г) = и (П) - [и (г.) - и (г2)] * , d = 2г. (2.2.6) 1п=2- «1 Согласно закону Фурье тепловой поток через элемент площади F цилиндрической поверхности определяется по формуле Q==^k — F = ^k — 2nrl, dr dr и, согласно формуле (2.2.6), имеем Q=J^-lu(r1)-«(r8)]- In — Поэтому формулу (2.2.4) можно теперь записать в виде 9/ = _2^_[ы(Г1)_ц(Г2)]. (2.2.7) 1п~ «1 Из краевых условий (2.2.2) и (2.2.3) находим, что «(/i)-«e8)=(0i-02)+^ — т Вычисляя du/dr в соответствии с формулой (2.2.6), получаем u(rx) —и (г 2) = (01 — 0а)—й (—— 4 \ «V1 1 \и(п) — и(гг) «Л/ in ^2. di и, следовательно, «(Г1) —ы(Гг) = 1 oVi 1 + k 1 di In — Л1 J (01 "в,)-
116 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. 11 Таким образом, формула (2.2.7) принимает вид * = 1 /(0176а) 1 • <2-2-8) 2k dy aidi a2d2 Тем самым получено явное выражение линейной плот- ности теплового потока для цилиндрической трубы в за- висимости от внешнего диаметра цилиндрической стен- ки. Величина Ri (<Q = 1 In %- + Ц- + -А- (2.2.9) 2Zs di otidi называется линейным термическим сопротивлением, а обратная ей величина 1/Ri—линейной термической про- водимостью. Формула (2.2.9) позволяет легко найти решение сформулированной выше экстремальной задачи. В самом деле, так как 0t и 02 фиксированы и 0i>62, то qt достига- ет своего наибольшего значения при том значении d2, при котором Ri достигает своего минимума. Следователь- но, задача сводится к отысканию минимума функции (2.2.9). Величина Ri{d2) достигает своего минимального значения в единственной точке d2 = -. (2.2.10) a2 Тем самым доказано, что поставленная экстремаль- ная задача имеет единственное решение и это решение дается формулой (2.2.10). Значение d2, определяемое этой формулой, называется критическим диаметром трубы. Полученный результат находит широкое применение в вопросах конструирования теплообменных аппаратов, так как разумный выбор труб в этих аппаратах позво- ляет повысить эффективность их работы (подробнее об этом см. в [8]). До сих пор мы рассматривали однослойную стенку. Однако большой практический интерес представляет ре- шение аналогичной экстремальной задачи для много- слойной и, в частности, для двухслойной стенки.
$ 2.2] критический диаметр трубы 117 Закон распределения температуры в каждом i-м слое определяется по формуле (сравните с (2.2.6)) In — d, и (г) = и (rz) — [u (г<) — и (гi+i)]-т----, rt < г<г<+1. , “i+1 h7" di (2.2.11) Согласно закону Фурье линейная плотность теплово- го потока равна величине q‘i = —[и (r<) — и (r<+1)]. , “r+i n-7“ di Так как, по предположению, в стенке трубы отсут- ствуют тепловые источники и стоки, то = -. . = <7" = = qh и можно записать 4i 7Г1п “Г’ = я 1“ (п) — «(г,+1)1, 1=1,2, п. (2.2.12) Условия теплообмена с внешней средой ся соотношениями = ai [w (г 11 А] >52 kn | ==— а2[«(Гп+1)—&]•! '•-'n+i определяют- (2.2.13) Выражения, стоящие слева в этих равенствах, мож- но выразить через qt, используя закон Фурье: 21 = 2пг1г I \dr! 41 = 2ягп+1, (2.2.14)
118 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. П где Qi— количество тепла, протекающего в единицу вре- мени через боковую поверхность цилиндра радиуса г{ и высоты I. Поэтому из (2.2.13) и (2.2.14) следует, что -Ц- = л [0Х - и (гх)], —Ц-----= л [и (гп+1) - 0а]. (2.2.15) 0&1Я1 ^2^71+1 Суммируя левые и правые части равенств (2.2.12) и (2.2.15), получаем <7,7?1=л(01-02], (2.2.16) где величина (2.2.17) называется линейным термическим сопротивлением мно- гослойной цилиндрической стенки. Если теперь рассматривать задачу о критическом диаметре многослойной стенки, то легко устанавливает- ся, что линейная плотность теплового потока будет мак- симальной, если 2k а2 т. е. если диаметр верхнего слоя будет критическим. В результате минимальное линейное термическое сопро- тивление определяется по формуле d _ 1 _i_ 1 _1_ 1 Vi 1 in 1 axdj a2d“+1 2 2 kt <f> ’ d? = d{, t = l, ...,n. (2.2.18) В качестве интересного применения полученного ре- зультата рассмотрим задачу о выборе тепловой изоля- ции цилиндрической трубы. Пусть dt и d2—внутренний и внешний диаметры тру- бы, a kt—коэффициент внутренней ее теплопроводности, at—коэффициент теплообмена с внешней средой. Пусть, далее, k2—коэффициент внутренней теплопроводности
§ 2.2] КРИТИЧЕСКИЙ ДИАМЕТР ТРУБЫ 119 материала, который берется в качестве изолятора, а а2— коэффициент теплообмена изолятора с внешней средой, d3—диаметр двухслойной стенки. Задача заключается в том, чтобы при данных dt и d2 выбрать оптимальную тол- щину изолятора с целью минимизации линейной плот- ности теплового потока. Рассмотрим возможные случаи: 1. d2<.dl,, где dj—критический диаметр двухслойной стенки. Тогда с возрастанием d3 от d2 до d°3 термическое сопротивление Я/ = —+ —+ -V —1п^- a1dl a.-dg 2 d( будет убывать, а, следовательно, линейная плотность теплового потока qt будет возрастать и достигнет своего максимального значения при d,=dj. При дальнейшем увеличении d3 величина qi = qt(d3) будет убывать и при некотором значении d3=d3 достигнет значения qt = = q(dt)\a,^it, т. е. того значения qt, которое она прини- мает при отсутствии изолятора. При d3—d3 будем иметь qi>qi- Таким образом, слой изоляции, соответствующий зна- чению d3=d3, является неэффективным (отдача тепла такая же, как и при отсутствии изоляции). 2. d2^d3. В этом случае термическое сопротивление Ri(d3) монотонно возрастает с увеличением d3 и, следо- вательно, линейная плотность теплового потока будет монотонно убывать. В заключение рассмотрим задачу о критическом диа- метре трубы с переменным коэффициентом внутренней теплопроводности, т. е. в предположении, что k=k(r) формула (2.2.18) может служить в этом случае для при- ближенного вычисления критического термического со- противления, которая строится путем аппроксимации k(r) с помощью кусочно-постоянных функций. Чтобы по- строить точную формулу для термического сопротивле- ния, преобразуем выражение
120 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. П Так как di+i=^i+A^b то по формуле Тейлора нахо- дим, что In Atl = in (di 4- Adt) — In dt = — Mt + 0 (Mi), di di где o (Ad-) + 0 при Mt-*0. &dt Поэтому формулу (2.2.17) можно представить в виде Ri = |(rL + —+ 2 -гл)+ 01(Дг)> где Дг = шах Дг/ и -> 0 при Дг -> 0. 1<<<п Дг Отсюда, переходя к пределу при Дг->0, получаем Rl = T\~ 2 \ а_г_ (2.2.19) где г- и г+—внутренний и внешний диаметры трубы, а а_ и а+— коэффициенты теплообмена у внутренней и внешней ее стенок. Для вычисления критического диаметра имеем = ---1_+_!_) = 0 dr+ 2\ a+r‘ r+k (r+)J и, следовательно, получаем уравнение г - fe<r+> г + „ а+ определяющее критический радиус внешней стенки тру- бы. Так как это уравнение в общем случае может иметь несколько корней, то с помощью второй производной нужно выяснить, какой из этих корней определяет мини- мальное значение 7?;(г+).
5 2.31 КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 121 Замечание. В этом пункте подробно проанализи- рована задача о критическом диаметре стенки прямой цилиндрической трубы. Аналогично исследуется задача о критическом диаметре шаровой стенки (см. [8]). § 2.3. Критические размеры ядерного реактора В этом параграфе рассматриваются простейшие за- дачи оптимизации из теории ядерных реакторов (см. [9—11]), когда плотность нейтронов в нем подчиняется уравнению (см. гл. I, § 2) Atf(Af).+aW(M)=O, M(=Q, (2.3.1) Здесь не обсуждаются вопросы о практической при- менимости этой теории. С этим можно ознакомиться по специальной литературе (см., например, [9, 10]). Нас интересует лишь математическая формулировка задач оптимизации, которые встречаются в этой теории, и пути их решения. Из этих задач здесь будут рассмотрены лишь так называемые задачи на определение минималь- ных критических размеров реакторов различных конфи- гураций. По физическому смыслу функции N, входящей в урав- нение (2.3.1), нас будут интересовать лишь такие его решения, которые удовлетворяют условию У(Л4)^0 при Л1ей (2.3.2) и ограничены. Общая словесная формулировка первой из рассмат- риваемых здесь задач состоит в следующем. Пусть область й имеет заданную форму (шар, ци- линдр, параллелепипед и т. д.). На ее границе S заданы некоторые граничные условия, однозначно определяю- щие решение уравнения (2.3.1) в области й. Тре- буется указать такую область й (выбранной конфигура- ции), чтобы это решение удовлетворяло условию (2.3.2) и было ограничено, а объем области й был мини- мальным. Вторая задача является в некотором смысле обобще- нием первой задачи и заключается в следующем. Пусть й имеет заданную форму так же, как и в пре- дыдущей задаче. Процесс распространения нейтронов
122 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. И описывается уравнением ДАГ(М)+а(Л4)ЛГ(Л1)=О, М<=Й, (2.3.3) в котором v (М) — произвольная кусочно-непрерывная Функция, удовлетворяющая условию 0^о(Л4)<и0, (2.3.4) где v°—заданная постоянная. Заданы также граничные условия, которые вместе с уравнением (2.3.3) при каж- дом конкретном управлении v = v(M) однозначно опре- деляют функцию N=N(M). Требуется найти такую функцию o=u0(Af), чтобы соответствующее ей решение N=N0(M) уравнения (2.3.3) с выбранными граничными условиями удовлетво- ряло условию (2.3.2), было ограниченным и при этом объем области Q был минимальным. Каждую из этих задач мы проанализируем для неко- торых частных типов конфигураций области Q. 1. Реактор в форме шара. Пусть реактор имеет фор- му шара, радиус которого обозначим через R, а на его границе S выполняется условие Af|s=O. (2.3.5) Процесс описывается уравнением (2.3.1). Задача со- стоит в определении минимального R (R>0), при кото- ром краевая задача (2.3.1), (2.3.5) имеет ограниченное решение, удовлетворяющее условию (2.3.2). Так как граничное условие однородно, а в уравне- нии (2.3.1) лапласиан а2 считается постоянным, то N за- висит лишь от г (ОгСг^Я). Поэтому в сферических ко- ординатах уравнение (2.3.1) можно записать в виде — —(г2 —^-)-сЛУ=0. г2 dr I dr } Вводя замену rN=u, это уравнение можно привести к виду — + а2« = О
5 2.3] КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 123 и, следовательно, получить его общее решение N(r) = As^-+Bc^^, Q^r^R, г г где А и В — произвольные постоянные. Так как нас ин- тересует лишь ограниченное решение, то В=0. Согласно граничному условию (2.3.5) находим, что sin cd?=0. От- сюда следует, что <xR=kn, k=\, 2, ..., и ограниченными решениями краевой задачи (2.3.1), (2.3.5) будут функ- ции Nk(r) = -^sin —г, fe = 1, 2, .... (2.3.6) г к где Ah—произвольные постоянные. Поскольку интере- сующее нас решение, кроме того, должно удовлетворять условию (2.3.2), то из (2.3.6) находим, что оно имеет вид y1(r) = ^-sin^r, где Л,— положительная постоянная, а величины а и R связаны соотношением /?=-. (2.3.7) ОС Объем области й в этом случае определяется одно' значно У = ^-/?з = ^^8. (2.3.8) 3 3 U / Следовательно, при заданной величине а существует единственный шар (его радиус определяется формулой (2.3.7)), в котором краевая задача (2.3.1), (2.3.5) имеет положительное ограниченное решение. Это означает, что для шаровой области сформулированная выше экстре- мальная задача сводится к решению краевой задачи (2.3.1), (2.3.5) с ограничением (2.3.2). 2. Реактор в форме цилиндра. Предположим теперь, что область й представляет собой прямой круговой ци- линдр радиуса R и высоты 2Н. Процесс описывается
124 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. и уравнением (2.3.1) с граничным условием (2.3.5). Лап- ласиан а2 считается заданной постоянной. Требуется найти минимальные R и Н такие, чтобы краевая задача (2.3.1), (2.3.5) в Q имела ограниченное решение, удовле- творяющее условию (2.3.2). Поместим начало координат в центр цилиндра. В си- лу симметрии граничного условия (2.3.5) находим, что N=N(r, z), —H^.z^H, а уравнение (2.3.1) можно записать в виде + = 0. (2.3.9) г дг \ дг / дг3 Согласно методу разделения переменных решение этого уравнения ищем в виде tf=<D(r)4f(z). Подставляя эту функцию в уравнение (2.3.9) и разделяя переменные, получаем 1 д / дФ \ , 2 1 „2 ------г — 4- ст — - аг, Фг дг\ дг Ч dz3 где а*—неопределенная постоянная. Отсюда следует, что — (r —'j +а2гФ = 0, а? 4- а22 = а2, dr \ dr / ^-4-^ = 0. dz3 (2.3.10) Согласно граничному условию (2.3.5) имеем Ф(/?)=0, Т(—Я)=Т(+Я)=0. (2.3.11) Общее решение второго уравнения (2.3.10) имеет вид Т=A cos <xtz+B sin atz, где А и В — произвольные постоянные. Поскольку нас интересует лишь положительное решение, то В=0 и ъН-я, (2.3.12)
§ 2.3] КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 125 и, следовательно, V (z) = A cos—z, н Д>0. Ограниченным решением первого уравнения из (2.3.10) является Ф(г) = с/0(а,г), где Л—функция Бесселя нулевого порядка, а с —про- извольная постоянная. Из краевого условия (2.3.11) на- ходим, что Л>(агЯ)=0. (2.3.13) Так как нас интересует лишь положительное реше- ние Ф(г), то „ _ 2,405 «г-—. (2.3.14) ибо остальным корням уравнения (2.3.13) соответствуют функции /о(агг), принимающие отрицательные значения на отрезке Таким образом, положительное решение уравнения (2.3.1), удовлетворяющее нулевому граничному условию (2.3.5), имеет вид tf(r,z)^cosfezUP^M. (2.3.15) \Н / \ К / где А — произвольная положительная постоянная, а объ- ем цилиндра й, согласно (2.3.13) и (2.3.14), равен V = 2л/?2Я = л (—W , (2.3.16) \“«/\ «г / где a*'+aj=a2, или, что то же самое, ( 2Д05 у +’(-? = а2. (2.3.17) Отсюда следует, что при любых R и Н, связанных равенством (2.3.17), краевая задача (2.3.1), (2.3.5) име- ет положительное решение в цилиндре й={0^г^/?, и это решение имеет вид (2.3.16).
126 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. и * ч Для определения минимального объема й формулу (2.3.16) запишем в виде v = 2лааа / «*+аг У7* / °4 + осг\ а8 \ а* ) а8 ) ’ где а=2,405. Согласно соотношениям (2.3.12) и (2.3.14) эту фор- мулу можно переписать в виде v 2л«Я|7Я\а . /а \2]в/> а8 R |_\Я / \я / J (2.3.18) Обозначим через Vo критический объем шарового ре- актора, вычисленный в предыдущем пункте (см. (2.3.7)), и введем обозначения г = ь=«. V, ’ Н' я Тогда формулу (2.3.18) можно записать в виде z = —'—— 2 х Эта функция достигает своего наименьшего значения в точке 2 Следовательно, цилиндрический реактор имеет наимень- ший объем при — = /26’= /21,08. Н - я Величина этого объема равна Vs=l,45V0 = 1,93л (—У. \а / Таким образом, в случае цилиндрической области сформулированная экстремальная задача решается одно- значно, однако ответ получается нетривиальным.
S 2.31 КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 127 Для полноты анализа этой задачи полезно рассмот- реть ее приближенное решение, исходя из предположе- ния, что плотность нейтронов N не зависит от г. Тогда задача формулируется следующим образом. Процесс описывается уравнением — Ц-aW^O, — Я<г<Я, dz2 с граничными условиями N(—Я)=Я(Я)=0. Требуется найти наименьшее Н, при котором эта краевая задача имеет единственное решение. Легко видеть, что это значение Н определяется по формуле Я = -, а а положительное решение краевой задачи имеет вид =А cos| — z|, где А — произвольная положительная постоянная. Обозначая через R радиус цилиндра, находим, что критический объем реактора определяется по формуле V = 2лЯ2Я = — 7?2. а Следовательно, такой путь аппроксимации ничего не дает для решения рассматриваемой задачи, ибо вычис- ленный критический объем зависит от параметра R. Замечание. Аналогично можно проанализировать эту задачу для реакторов других геометрических форм. Однако на этом останавливаться не будем. Аппарат ис- следования, изложенный в этом и предыдущем парагра- фах, позволяет решать задачу об определении оптималь- ных размеров цилиндрического отражателя. Не останав- ливаясь подробно на решении этой задачи, ограничимся лишь ее формулировкой. Пусть высота 2Я цилиндриче
12fe ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II т. е. при z=—Н ского реактора достаточно велика, чтобы можно было пренебречь влиянием граничных условий в его торцах, 'т и z=+H. Тогда можно считать, что плотность N нейтронов зависит лишь от г, т. е. N=N(r), 0^r<R. Пусть, далее, реактор окружен цилиндрическим отражателем, толщина стенок которого равна А (рис. 5). Тогда плотность АГ, ней- тронов в отражателе также зави- сит только от г, т. е. Nl=Nl(r), R<r^Ri=R+A. Предположим, что эта конструкция окружена ва- куумом. Тогда АГ,(^)=О. В результате получаем следующее описание процесса: г dr \ dr / о г dr \ dr J D— — , N = Nt dr dr при 0 < r < R, при P<r</?1, при г — R, ВДх)=0. Так же, как и в § 2, определим линейную плотность потока нейтронов в отражателе (см. (2.2.4)): где Q — количество нейтронов, проходящих в единицу времени через участок отражателя длины I. Теперь задача оптимизации может быть сформулиро- вана следующим образом. Пусть задан диаметр 2R ре- актора. Требуется определить Rt так, чтобы максимизиро- вать линейную плотность потока нейтронов в отражателе. Аналогично можно сформулировать эту задачу для реакторов других геометрических форм, например для шарового реактора. 3. Применение принципа максимума Понтрягина. Рассмотрим теперь задачу о критическом диаметре ша-
§ 2.3) КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 129 рового реактора в предположении, что а2 = а(г), где а (г) —произвольная кусочно-непрерывная функция, удо- влетворяющая условию 0^а(г)<Л2, (2.3.19) где А — фиксированная постоянная. Как было показано в § 2 гл. I (см. (1.2.13)) лапласиан а2 зависит от коэф- фициента размножения нейтронов и поэтому определя- ется концентрацией источников нейтронов (горючего в реакторе). Поэтому ограничение (2.3.19) имеет опреде- ленный физический смысл. В рассматриваемом случае процесс описывается урав- нением ±_£p^A + a(r)tf = o, 0<г<£, (2.3.20) г2 dr \ dr I с граничным условием N(R)=Q. (2.3.21) При этом по физическому смыслу функции N (г) должно выполняться условие 0<У(г)<оо, (2.3.22) Задача оптимизаций состоит в отыскании кусочно-не- прерывного управления а (г) такого, чтобы оно удовле- творяло ограничениям (2.3.19), соответствующее ему нетривиальное решение задачи (2.3.20), (2.3.21) удовле- творяло условию (2.3.22) и при этом функционал R о принимал наименьшее возможное значение. Для решения задачи вводим замену rN=x. Тогда уравнение (2.3.20) принимает вид Полагая г - г - г 5 А. И. Егоров
130 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. II получаем каноническую систему уравнений ^ = ха, «(')%» 0<г<Я, (2.3.23) dr dr с дополнительными условиями xt(/?)=0, xt(0)=0. (2.3.24) Первое из этих условий непосредственно следует из (2.3.21). Второе получается из условия ограниченности N(r) при г=0 (см. (2.3.22)). Таким образом, задача оптимизации состоит в оты- скании такого допустимого управления в системе (2.3.23), чтобы соответствующее ему решение задачи (2.3.23), (2.3.24) удовлетворяло условию (см. (2.3.22)) х£(г)>0 (2.3.25) и при этом функционал I принимал наименьшее возмож- ное значение. Для отыскания оптимального управления составляем функцию Н=Хг’ф 1—а (г) Х1ф2. Тогда внутри области, определяемой неравенством (2.3.25), переменные фь ф2 и а связаны соотношениями = аф2, = — фь (2.3.26) dr dr а оптимальное управление а0(г) определяется из усло- вия максимума функции Н по переменной а, т. е. а(г)=(Л2 Ч>ифл<0, ° 1 0 при > 0. Согласно условиям трансверсальности ф1 и ф2 удо- влетворяют граничным условиям Фг(/?)=ф2(0)=0. (2.3.27) Если внутри отрезка функцияxt (г), соответ- ствующая оптимальному управлению, выходит на грани- цу области (2.3.25), то, поскольку в нашем примере
S 2.3] КРИТИЧЕСКИЕ РАЗМЕРЫ РЕАКТОРА 131 g(x) =х, находим, что Р (х) = (grad g (х), 1)=хг, и, следовательно, условие регулярности в граничных точ- ках не выполняется. В силу этого обстоятельства мы не можем пользоваться принципом максимума для опреде- ления оптимального управления в тех точках г, в ко- торых х,(г)=0. Предположим сначала, что xt(r)>0 при 0<г<8, где s — некоторая положительная постоянная. Если при этом ф2(г) <0, то а0(г) =А2 и, согласно соотношениям (2.3.23) и (2.3.24), имеем хДг) = с sin 4г, (2.3.28) где с — произвольная положительная постоянная, а из (2.3.26) и (2.3.27) следует, что ф2(г) =ysin Лг, у>0. Таким образом, произведение ф2х, сохраняет знак при всех г из отрезка [0, л/Л]. Нас интересует минимум функ- ционала I. Исходя из этого, возьмем R^л/Л. Тогда функ- ция (2.3.28) должна удовлетворять первому условию (2.3.24), и, следовательно, будем иметь Ct=O при л/Л, а это противоречит неравенству ф2х,<0. Поэтому пред- положение о том, что ф2Х1<0 при 0<г<8 приводит к тому, что R = -. (2.3.29) А Допустим теперь, что ф2Х!>0 при 0<г<е. Тогда x6(r)=Q при 0<г<8, и, согласно соотношениям (2.3.23), (2.3.24) и (2.3.27), (2.3.26), находим, что xl(r)==clr, ф2(г)=уг при 0<Г<8 и х1ф2=с2г2, где clt с2 и у — произвольные постоянные, причем с2>0. Отсюда следует, что произведение фгХ, не может обратиться в нуль при возрастании г от 0 до R. Согласно условию (2.3.24) с,=0, a xt(r)=0 для всех ге е[0, RJ. Таким образом, предположение флХ) при 5*
132 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. И 0<г<е неизбежно приводит к выводу, что х,(г) лежит на границе области (2.3.25) при 0<г<8. Допустим, что х4(г)=0 при ОСгСв. Тогда на интер- вале e<r<ZR процесс описывается уравнениями (2.3.23) и дополнительными условиями хД2?) =Xj(e) =0, и нужно минимизировать функционал I. Если ф2х,<;0 при е<г<е+6, где б — произвольное малое число, то изложенным выше способом приходим к выводу, что х, = с sin А (г—е), и, следовательно, А Сравнивая полученный результат с (2.3.29), находим, что найденное R не является минимальным. Если ф2Х1>0 или Xt(r)=0 при е<г<е + 6, то изло- женный анализ повторяем для е+б<г<е + б+б1. В ре- зультате приходим к одному из двух выводов. 1. Из всех управлений, удовлетворяющих принципу максимума, управление а0(г)=Л2, 0^г<7?, дает наи- меньшее значение функционалу I. 2. Решение х4(г)=0, краевой задачи (2.3.23), (2.3.24) является допустимым (принадлежит границе области (2.3.25)), и ему соответствует произ- вольно малое значение функционала I. Так как второй из этих выводов дает решение рас- сматриваемой экстремальной задачи, которое не пред- ставляет интерес с точки зрения приложения, то оконча- тельно получаем: оптимальное управление имеет вид а0(г)=Л2, 0<г<₽, (2.3.30) а соответствующий ему критический радиус сферическо- го реактора определяется формулой (2.3.29). Замечание. Изложенный метод можно применить к отысканию критического радиуса прямого кругового цилиндрического реактора, если предположить, что а=- = а(г), и плотность нейтронов считать зависящей лишь
§ 2.4] КИНЕТИКА РЕАКТОРОВ 133 от г, т. е. N=N(r) (см. (11]). Случай, когда плотность N нейтронов в цилиндрическом реакторе и лапласиан а изменяются лишь в зависимости от z, —Ht^z^H, где 2Н — высота реактора, также рассмотрен в [11]. Более общая задача, когда а=а(г, г), не позволяет использо- вать принцип максимума Понтрягина, ибо в этом случае процесс описывается уравнением в частных производных. § 2.4. Кинетика реакторов на запаздывающих нейтронах В § 2 гл. I было дано описание процесса распростра- нения нейтронов в диффузионном приближении и было показано, что в достаточно широких пределах для опи- сания стационарного (установившегося процесса можно пользоваться уравнением (см. (1.2.13)) D ДДТ + hzl N = О, То где Z)0=D + ^—эффективный коэффициент диффузии, То—время жизни теплового нейтрона, k — коэффициент размножения. В предыдущем параграфе было показано, что если этим уравнением пользоваться для описания стационарных процессов в реакторах ограниченных объ- емов, то при заданной геометрической форме и заданном объеме реактора стационарный процесс будет происхо- дить лишь при некоторых, вообще говоря, фиксирован- ных значениях лапласиана а2, зависящих от формы и размеров реактора. В частности, для шарового реактора радиуса R эта зависимость дается формулой 2?а=л (см. (2.3.7)). Так как а2 и k связаны соотношением (см. (1.2.13)) то каждое такое значение лапласиана однозначно опре- деляет коэффициент размножения k, который называет- ся критическим коэффициентом размножения и обозна- чается через ЛкР.
134 простейшие задачи оптимизации (ГЛ. п Следовательно, установившийся процесс в реакторе описывается уравнением ь ___ 1 D^No+^—No = O. (2.4.1) *0 1. Вывод основных уравнений [9]. Если для данного реактора коэффициент размножения ka отличен от &кр, то в реакторе будет происходить нестационарный про- цесс диффузии нейтронов. Его математическое описание существенно зависит от того учитываются или не учиты- ваются так называемые запаздывающие нейтроны. Глав- ной особенностью этих нейтронов является то, что они испускаются из осколков ядер не непосредственно при делении ядра, а лишь с некоторым запаздыванием, и в нестационарных процессах они могут играть существен- ную роль. Их влияние на процесс может оказаться до- вольно значительным, и при исследовании задач опти- мального управления их следует учитывать. Если пренебречь влиянием запаздывающих нейтро- нов, то нестационарный процесс будет описываться урав- нением ^.=D0\N + ^N, (2.4.2) где k0—коэффициент размножения без учета запазды- вающих нейтронов. При расчете переходных процессов в реакторе с учетом запаздывающих нейтронов использу- ется следующая методика. Эти нейтроны разбивают на пг групп, обычно т^б. Через kt обозначают коэффициент размножения i-й группы. Тогда общий коэффициент раз- множения определится по формуле п k = k0 + kt. /=.1 Уравнение (2.4.2) составлено на основе баланса ней- тронов (см. § 2 гл. I). Выражение, стоящее в левой ча- сти этого уравнения, определяет изменение плотности нейтронов во времени. Первое слагаемое в правой части определяет изменение плотности нейтронов, вызванное
КИНЕТИКА РЕАКТОРОВ 135 S 2.4) их потоком через поверхность S, ограничивающую про- извольно малую область. Второе слагаемое характеризу- ет плотность внутренних источников, определяемую плот- ностью быстрых нейтронов. Если учесть запаздывающие нейтроны и через N обозначать общую плотность тепло- вых нейтронов, включая и запаздывающие, то выраже- ние, стоящее слева в уравнении (2.4.2), останется в том же виде. Прежний вид будет иметь первое слагаемое. Внутренние источники, определяемые быстрыми нейтро- нами, дадут слагаемые того же вида, что и в уравнении (2.4.2). Определим теперь ту часть плотности внутрен- них источников, которая обусловлена запаздывающими нейтронами. Возьмем произвольный момент времени t—т, пред- шествующий моменту времени t. Плотность нейтронов в этот момент равна N(M, t—т). Следовательно, в единич- ном объеме за малый промежуток времени du ядрами dx поглощается—Af(A4, t—т) нейтронов. В результате это- го поглощения рождается k, — N(M,t — x)dx Tq нейтронов i-й группы. Количество этих нейтронов умень- шается по экспоненциальному закону Поэтому общее количество запаздывающих нейтронов i-й группы, которое выделилось в единице объема в момент време- ни равно ^lN(M,t — x)e-KiXdx, т» J о где величина 1Д{ представляет собой время жизни за- паздывающих нейтронов i-й группы. Отсюда следует, что баланс тепловых нейтронов дает интегро-дифференци- альное уравнение , л m t. 4 °? — V — — x)e~K(tdx. T0 T0 J 1=1 n (2.4.3)
136 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. П Так как функция ri9 определяемая формулой k р = N(M,t—r)е~к‘хdr, (2.4.4) То J удовлетворяет уравнению dr,. kt W Tq то вместо уравнения (2.4.3) можно брать одну из сле- дующих систем уравнений: = JV+З Ur, '.'Ll....m di To ИЛИ — =£>0ДМ + ^^-У— V dt ° TB dt dr{ kt di 1\> (2.4.6) где ka—коэффициент размножения без учета запазды- вающих нейтронов, kt—коэффициент размножения i-й группы запаздывающих нейтронов, а к=кв+^к1. Приведенный анализ процесса диффузии нейтронов показывает, что запаздывающие нейтроны влияют лишь на интенсивность внутренних источников и не вносят корректив в законы прохождения нейтронов через по- верхность, ограничивающую заданный объем. Поэтому граничные условия для уравнения (2.4.3) формулируют- ся точно так же, как и в случае, когда игнорируются за- паздывающие нейтроны. Переход от уравнения (2.4.3) к любой из систем (2.4.5) или (2.4.6) не влечет за собой преобразования граничных условий.
§ 2.4] КИНЕТИКА РЕАКТОРОВ 137 Чтобы сформулировать начальные условия и дать более полное описание переходного процесса, предполо- жим, что до момента времени to = O в реакторе был уста- новившийся стационарный процесс. Следовательно, при /<0 плотность нейтронов описывалась уравнением (2.4.1). Пусть в момент времени t=0 критический коэф- фициент размножения йкр получил приращение 5k и в реакторе возник переходный процесс с общим коэффици- ентом размножения k = kKp+5k. Таким образом, началь- ное значение N определяется формулой N(M, 0)=ЛГо(Л4), где No—решение уравнения (2.4.1). Для определения начального значения гД/, М) можно воспользоваться формулой (2.4.4) при N=No(M). Для исследования переходных процессов и, в частно- сти, для решения задач оптимального управления удоб- но пользоваться уравнениями вида (2.4.5), в которых указана явная зависимость й0 и k( от приращения 5k. В соответствии с определением имеем k = &кр 4" = ^0 “Ь i=i и, следовательно, т kft == &кр 4~ ki. 1=1 Полагая &4=0Л, находим, что — (&кр 4- bk) । 1 У Р< \ i=i Физический смысл коэффициента состоит в том. что он представляет собой долю запаздывающих нейтро- нов i-й группы в общем их потоке.
138 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II Поэтому уравнения (2.4.5) можно записать в виде (\Р + Ы)|1-3 М-1 ^=о,Д*+--------------2—»+2v<. dri ₽i (*кр +ЭД . =----*-----N-hrt, i = l.......т. (2.4.7) Если не учитывать зависимость нейтронов от про- странственных координат, то ДА^О, ^ = 1. Последнее равенство легко получить из системы (2.4.6), с учетом того, что в стационарном состоянии ре- актора dN dr Q dt dt Таким образом, если W не зависит от пространствен- ных координат, то система уравнений (2.4.5) принимает вид т dN di (1+^)2 ------+2 Vo ° /=1 (2.4.8) dri (1 + ЭД dt To 1 = 1, ..., tn. 2. Диффузия нейтронов и теплоперенос в нестацио- нарном процессе. В § 5 гл. I рассмотрен вопрос о тепло- переносе в реакторе, заполненном слабо поглощающей средой. Полученные там уравнения (1.5.4) были выведе- ны в предположении, что запаздывающие нейтроны не оказывают существенного влияния на процесс диффу- зии. Более точные уравнения получаются тем же мето- дом, но с учетом запаздывающих нейтронов. В этом
§ 2.5) ОПТИМАЛЬНОЁ УПРАВЛЁНИЕ ЯДЕРНЫМ РЕАКТОРОМ 139 случае вместо уравнений (1.5.4) получим систему урав- нений = (D + ДАТ + N + 3 Ъп, — — N — к{Г1, dt То + + 2 V?|. от ^т0 т0 1=1 у Здесь в последнем уравнении слагаемое, содержащее множитель у, характеризует плотность внутренних теп- ловых источников с учетом запаздывающих нейтронов. § 2.5. Оптимальное по быстродействию управление ядерным реактором В предыдущих параграфах рассмотрены некоторые простейшие задачи оптимизации стационарных тепловых и диффузионных процессов. Их число можно увеличить. Однако и без того ясно, что подобные задачи представ- ляют несомненный практический интерес и зачастую ре- шаются элементарными методами. В этом параграфе рассматривается одна задача оптимального управления переходным процессом в ядер- ном реакторе. Она уже не решается элементарно и тре- бует современных методов исследования. Те предполо- жения о диффузии нейтронов, которые здесь вводятся, делают ее весьма отдаленной от чисто практических за- дач управления ядерными реакторами. Однако ее специ- фика представляет интерес с точки зрения теории опти- мальных процессов, а излагаемый здесь метод оказыва- ется применимым при решении более естественных задач управления переходными процессами в реакторе. Изучение подобного типа задач представляет несом- ненный интерес и им посвящена обширная литература (см., например, [12—17, 22]). 1. Постановка задачи. Как было показано в пре- дыдущих параграфах, стационарный (установившийся) процесс диффузии нейтронов в ядерном реакторе при
140 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. П соответствующих предположениях можно описать урав- нением (см. (2.4.1)) ъ — 1 D0AAf(M)+ -------У0(М) =0, Мей, (2.5.1) П с некоторым граничным условием, которое для опреде- ленности будем считать линейным и однородным, на- пример, M>ls = o, (2.5. Г) где S — граница области Q. Если критическому коэффициенту размножения £кр в момент времени /=0 дать некоторое приращение 6k, то в реакторе возникает нестационарный процесс. Он будет описываться уравнением dt 0 То (2.5.2) с тем же граничным условием. При этом k = kKp fife = k0 + fa, (2.5.3) i=l где kt и k(—коэффициенты размножения мгновенных и запаздывающих нейтронов i-й группы соответственно. Очевидно, что интересующее нас решение уравнения (2.5.2) удовлетворяет начальному условию при /=^0, (2.5.4) где Л^о(Л1)—решение стационарного уравнения (2.5.1) с выбранным граничным условием. Выбирая избыточную реактивность 6k в качестве управляющей функции, можно воздействовать на про- цесс. Допустимыми управлениями будем считать кусоч- но-непрерывные функции 6k(M, t), удовлетворяющие
§ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 141 ограничению |66|^6£т.х, (2.5.5) где б^шах— некоторое фиксированное число. Одна из задач оптимального управления, а именно, задача об оптимальном быстродействии, может быть сформулирована следующим образом. Пусть Nt (М) — некоторое стационарное распределе- ние нейтронов в реакторе, отличное от No(M), которое также удовлетворяет уравнению (2.5.1) и выбранному граничному условию. Требуется найти допустимое управление такое, что- бы соответствующее ему решение уравнения (2.5.2), удо- влетворяющее условию (2.5.1'), в конечный момент вре- мени t=ti>G совпадало с Nt(M), т. е. N(M, tt)=Nt(M), M=Q, (2.5.6) и при этом tt было бы минимальным. Кроме того, по фи- зическому смыслу функции N(M, t), как плотности ней- тронов, должно выполняться неравенство N (М, f)s>0 ПРИ ^[0, (2.5.7) Этому же неравенству, очевидно, должны удовлетворять функции No(М) uNt(M). Кроме того, требуется, чтобы после момента времени t{ достигнутое стационарное распределение Nt(M) оста- валось неизменным при $k(M, t) =0 для всех t>ti. Последнее требование является естественным для рассматриваемой задачи по следующим соображениям. Стационарное распределение нейтронов может неогра- ниченно долго оставаться неизменным лишь при крити- ческом коэффициенте размножения k=kKV. Рассматри- ваемая же задача заключается в том, чтобы за кратчай- шее время перевести реактор из одного стационарного состояния в другое, также стационарное состояние. Условие (2.5.5) определяется физическими ограниче- ниями на избыточную реактивность и, следовательно, число 6&тах задается, исходя из требований безопасности работы реактора. Допустимыми управлениями выбраны кусочно-непрерывные функции для того, чтобы иметь возможность использовать безынерционные «рули» управ- ления. С математической точки зрения более удобными
142 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ / [ГЛ. II являются, быть может, измеримые функции 6k (М, t), которые почти всюду в области Q={AfeQ, удовлетворяют условию (2.5.5). Однако, как показывает дальнейший анализ, в рассматриваемых здесь случаях достаточно ограничиться кусочно-непрерывными управ- лениями. Этой задаче можно придать некоторые специфиче- ские черты, если к указанным ограничениям на 6&(Af, t) добавить еще требование о том, чтобы допустимые управ- ления каким-либо специальным образом зависели от пространственных координат и времени. Например, мож- но потребовать, чтобы в течение всего промежутка вре- мени (0, допустимые управления не зависели от про- странственных координат, а были бы функциями только времени t. Такого типа ограничения указывают на то, что избыточная реактивность не может вводиться произволь- ным образом, а должна быть подчинена некоторым до- полнительным требованиям по ее распределению во всем объеме реактора, зависимости от времени и т. д. Исследование общей задачи в предложенной форму- лировке будет проведено в последующих главах. Здесь же мы рассмотрим лишь частный случай, а именно, пред- положим, что плотность нейтронов не зависит от про- странственных координат, а является лишь функцией времени t. Кроме того, для упрощения последующих фор- мул учтем лишь одну группу запаздывающих нейтронов, долю которых в общем потоке обозначим через р, т. е. будем считать, что £t = pA, где £ — некоторая фиксиро- ванная постоянная, которая, очевидно, меньше единицы. Тогда из формулы (2.5.3) будем иметь £„ = £(1—р), а уравнение (2.5.1), определяющее стационарное рас- пределение нейтронов, примет вид То Отсюда следует, что £кР= 1, а из (2.5.3) получаем k = l+6k, fc0=(l+'6fc)(l—р).
§ 2.5] \ ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 143 \ \ Таким образом, уравнение (2.5.2), описывающее пере- ходный процесс в реакторе, можно записать в виде at 1 q i q + f [i 4. fife (t — T)] (t — t) er* dr. (2.5.8) * 0 J 0 Начальное условие (2.5.4) в этом случае принимает вид N(t) =N9 при /<0, (2.5.9) где Na—некоторая заданная положительная постоянная. Сформулированная выше задача оптимального управ- ления в этом частном случае заключается в следующем. Пусть Nt—отличная от No заданная положительная постоянная. Требуется среди всех кусочно-непрерывных управлений 6k, из (2.5.5) найти такое, чтобы соответствующее ему решение задачи (2.5.8) — (2.5.9) удовлетворяло условию N(tt)=N, ^>fo=O. (2.5.10) При этом ti должно быть минимальным', решение N(t) уравнения (2.5.8) с начальным условием (2.5.10) при t>tt должно удовлетворять условию N(t)=Nt, (2.5.11) если 6k(t) =0 при f>tr, должно выполняться условие при всех ^/о=О. (2.5.12) Прежде чем переходить к решению этой задачи, от- метим следующий факт. Если положить Г (t) = -L f [ 1 + 6k (f — т)] N (t — r) e~Kx dr, (2.5.13) n J 0 то, очевидно, что ^LN-^r + $-6k(t)N(f). at Tq 1 о
144 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ / [ГЛ. II / Из (2.5.11) следует, что / ^=0 dt I при &k(t) =0 и t>ti. Поэтому из уравнения (2.5.8) в силу условия (2.5.10) будем иметь + + — t)-XxdT = 0. (2.5.14) J 0 J о J о Это означает, что r(t) =const при t^tlt если 6£(0=0 при Учитывая (2.5.14), отсюда на- ходим Полученный результат означает, что рассматриваемая задача оптимального быстродействия может быть заме- нена следующей эквивалентной ей задачей. Управляемый процесс описывается уравнениями “ Т* Та (2.5.15) ^.==AjV-V+ JLbkQN at 1 q 1Q с начальными условиями N(O) = No, г(0) —-Д-Уо. (2.5.16) 10А Требуется найти кусочно-непрерывное управление, удовлетворяющее условию (2.5.5), такое, чтобы соответ- ствующее ему решение задачи Коши (2.5.15)—(2.5.16) удовлетворяло условиям (2.5.17)
§ 2.5J оптимальное управление ядерным реактором 145 при минимальном положительном tt. Здесь Na и —за- данные положительные постоянные. Главная особенность полученной задачи состоит в том, что уравнения (2.5.15) содержат произведение управляющей функции dk(t) на фазовую переменную N. Как показывает дальнейший анализ, ограничение (2.5.12) оказывается несущественным и задача полностью реша- ется (хотя несколько громоздко) с помощью принципа максимума. При этом следует отметить, что здесь реше- ние дано не для произвольной системы вида (2.5.15), а лишь для такой системы, параметры которой соответ- ствуют реакторам на тепловых нейтронах. Примерные значения этих параметров приведены в следующем пунк- те настоящего параграфа. Для рассматриваемой задачи оптимального быстродействия они оказались удобными потому, что характеристическое уравнение системы (2.5.15) при 8k=±8kmaI имеет лишь вещественные корни. В (12] сделана попытка использовать L-проблему мо- ментов для решения той же задачи. Однако приведенные в этой статье рассуждения формальны и не учитывают одной весьма важной особенности задачи, если ее сфор- мулировать в терминах моментов. С помощью матрицы А+ 7-^ М1-е-*)\ ф(0 = 7 • 6 . y = x + \£(1-е-*) / V о 1 о / задачу (2.5.15) — (2.5.16) можно заменить эквивалентным ей интегральным уравнением (2.5.18) Так как решение этого уравнения должно удовлетворять условиям (2.5.17) при t=tt, то получаем моментные
146 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ / [ГЛ. II соотношения ti h 1 k = J hi. (4, т) t)k (t) N (t) dr, J ла (tt, r)t>k (r) N (r) dr, 0 0 где 4 = N1 - No, hi. (ti, т) = -±- к + 0 - y) e-vc^l, ML Vo / J l, - *, ft, t) = -L Ц- - (±- v) ('.-»!, 1 o^* * oY L-* о Vo / J которые в (12] используются для решения задачи об оп- тимальном быстродействии. Основная особенность этих соотношений заключается в том, что входящие в них функции 6^(0 и N(t) не являются независимыми. При каждом t из отрезка (0, /J они связаны уравнением (2.5.18) и, следовательно, их нельзя варьировать неза- висимо друг от друга. Именно это обстоятельство не всегда в полной мере учитывается в [12] при выполнении формальных построений. 2. Применение принципа максимума. Проведем ана- лиз рассматриваемой задачи оптимального быстродей- ствия на основе принципа максимума Л. С. Понтрягина. Предполагаем, что управляемый процесс описывается уравнениями (2.5.15) с начальными условиями (2.5.16). Допустимыми управлениями являются всевозможные ку- сочно-непрерывные функции, удовлетворяющие условию (2.5.5). Требуется найти управление bk0(t), та- кое, чтобы соответствующее ему решение задачи Коши (2.5.15) — (2.5.16) удовлетворяло условиям (2.5.10) и (2.5.17) при минимальном положительном t{. Поскольку эта задача связана с конкретным типом объектов управления, а именно, ядерными реакторами на тепловых нейтронах, то в дальнейшем полезно будет воспользоваться хотя бы примерными значениями число- вых параметров, которые определяют управляемую систе- му. Их значения возьмем изф той же статьи И. Клигера [12], хотя можно воспользоваться и другой литерату- рой (см., например, [10]): 0 — доля запаздывающих ней- тронов имеет величину, примерно, 6,5-10“*; То—среднее время жизни нейтронов равно примерно 10_3 сек-, % — по-
§ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 147 \ \ стоянная рампада, равна примерно 10-1 сек~1-, bk— из- быточная реактивность ограничивается величиной 66тах, которая всегда удовлетворяет условию 66тах<р. Докажем сначала следующую теорему. Теорема 5.1. При N0>0 решение системы (2.5.15) с начальным условием (2.5.16) остается положительным при всех положительных значениях t и любых допусти- мых управлениях, удовлетворяющих условию (2.5.5). Доказательство. Из уравнения (2.5.18) нахо- дим, что t N(f) — N0 +-—r)d^(T)JV(t)d-r, О к (о - —fa + pp—yV'4- Пу L / J Так как 'у=Х+р7’о1>0, то 1 oY 1 о С другой стороны, Af0 есть величина положительная. По- этому по крайней мере для достаточно малого интервала времени t функция N(t) остается положительной при любом допустимом управлении 6k(t). Для таких t мож- но записать * о J о 6k * < No + (1 - P) JN(x)dx. 0 Отсюда следует, что m=-“(l—P), П а это означает, что при любом допустимом управлении 66(f) соответствующая ему функция не может обращать- ся в нуль и тем более принимать отрицательные значе- ния в любой конечный момент времени.
148 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ / [ГЛ. II / Этот факт позволяет игнорировать фазойое ограниче- ние в задаче оптимального быстродействия и восполь- зоваться принципом максимума. / Составим функцию 6k\N + Хг] + 'i’J—(1+^W—Xrl, / J L'o гдеф,^) иф2(0 удовлетворяют уравнениям = (/ ~ 6Й) “ 7"(1 + *k} \70 Tq / TQ ~Г — М*1 +М)2* at (2.5.19) Из условия максимума Н по переменной &k находим, что оптимальное управление имеет вид bk (0 = S£max sign Фх + £ Фг') > (2.5.20) \ Л) / ибо по доказанному N(t) >0. Дальнейшее исследование задачи проведем по сле- дующему плану, который в общих чертах совпадает с планом решения простейших задач оптимального быстро- действия, рассмотренных в качестве примеров в работах [1, 2]. Сначала построим фазовые траектории системы (2.5.15) при управлениях bk=bkmax и 8k=—8k^. Из этих траекторий выделим только те, по которым может двигаться фазовая точка при />0, если в начальный момент она удовлетворяет условию (2.5.16). Вид этих траекторий позволит нам установить, что оптимальное управление обязательно должно иметь не менее одной точки переключения. Затем исследуем поведение системы (2.5.19) при бй=6^тах и $k=—6£тах. Этот анализ позволит установить, что функция (2.5.20) при связях (2.5.19) может изме- нять знак не более одного раза. Тем самым будет уста- новлено, что оптимальное управление имеет одну точку переключения. Характер поведения фазовых траекторий системы (2.5.15) с одной точкой переключения управ- ляющей функции позволит дать решение задачи син- теза оптимального управления.
\ J 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 149 Итак, переходим к исследованию поведения системы (2.5.15) при 6&=б/гта£ и 6£=—бйтах- Пусть сначала 6&=б£тах- Тогда характеристическое уравнение системы будет иметь вид Р2 4“ Y ——~ S&maxl Р ~ б^тах — О- 'О J 'о Его корни Pi и Pj действительны и разных знаков: Pt >0, Pt<0. Преобразуем систему (2.5.15), введя замену х+=Л#4-Вг, t/+=CN+Dr, (2.5.21) где постоянные А, В, С и D определим из уравнений А —|---6&max — Pi j 4" В (14" d&tnax) — 0» ЛА,—В (X 4-Pt/=0; . ‘ (2.5.22) С (—• —|----- Sfemax —’ Ps'l 4" (1 4" P&max) — 0, \ *о /Л) a —D(A,4-Pt) = 0. (2.5.23) Дифференцируя по t соотношения (2.5.21) и учитывая уравнения (2.5.15), (2.5.22) и (2.5.23), получим = Р*х+’ ¥ = p2j/+’ (2-5’24) Определитель каждой из систем (2.5.22) и (2.5.23) равен нулю, и поэтому с точностью до постоянного множителя находим, что Л = X 4- Pt, В = X, С = X 4- Pt, D = X, и преобразование (2.5.21) принимает вид х+= (X 4-Pt) 4-V, z/+=(X+Pt)A^ + Xr. (2.5.25)
150 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИЙ { [ГЛ. п Разделив первое уравнение системы (2.5.24) второе, получим dx* dy* Pl** Р$У+ ' Интегрируя это уравнение, находим, что (х+)4 = С(Л₽\ где С — произвольная постоянная. Поэтому в плоскости декартовых координат х+, у+ фазовые траектории си- стемы (2.5.24) имеют вид, изображенный на рис. 6. Перенесем их в плоскость декартовых координат N, г. Уравнение оси х+ имеет вид % Покажем, что 1+р+<0, т. е. эта прямая проходит через первую и третью четверти плоскости N, г (рис. 7). В самом деле, р+ является меньшим корнем ха- рактеристического уравнения системы (2.5.15) при
$ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 151 8k=6kmax и поэтому 2 (X + Pt) = 2Х - к- dfcmax -J- L т0 4" 1/ f Y—' ~S&max\ + — S&max ]<C F \ 4 J ‘ 0 J 2 fX —— Y 4-~~ S&max'j • \ ‘o' Так как y=X4-₽T’J1, to отсюда следует, что X 4- Pg -7- 4 7~~ Sfemax- ‘0 '0 Для реакторов на тепловых нейтронах fi^max<₽ и поэто- му Х4-р+ <0. Уравнение оси у+ имеет вид и, следовательно, фазовые траектории имеют вид, изо- браженный на рис. 7. Отметим еще один факт, который в дальнейшем бу- дет использоваться при анализе оптимальных траекторий системы (2.5.15). Фазовые траектории, представленные на рис. 7, пере- секают положительную полуось N под углом, тангенс которого определяется из системы (2.5.15) по формуле / dr \ ___ Р (1 4~ ^тах) \<W/f=o Р (1 4" б^тах) 1 ®^тах Так как для рассматриваемых реакторов 6^maI<P<C 1, то Если фазовая точка -при своем движении пересекает ось N при N>Q в момент времени t=x, то из рис. 7 видно, что при дальнейшем движении угол наклона ее траек- тории к оси N монотонно уменьшается, а при М-оо
152 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. II стремится к углу а, образованному осью х+ с положи- тельным направлением оси N. При этом Проведем луч OL-. T<>Kr=^N, ЛГ>0. Согласно (2.5.16) и (2.5.17) на этом луче лежат начальная и ко- нечная точки интересующей нас оптимальной траекто- рии. Обозначим через а0 угол, образованный этим лучом с положительным направлением оси N (см. рис. 7) и по- кажем, что а0>а. С этой целью рассмотрим фазовые траектории, пересекающие луч OL в момент времени t=0. Возьмем ту из них, которая проходит через точку М, определяемую соотношениями (2.5.16). В этой точке траектория наклонена к оси W под углом ю, тангенс ко- торого согласно уравнениям (2.5.15) определяется по формуле tg со = <dN)M Р 1-р ’ и, следовательно, tg <»>0. Предположим, что а0^а, т. е. что рассматриваемая траектория входит в первую четверть плоскости N, г че- рез ось N. Фазовые траектории, входящие в первую чет- верть плоскости 2V, г через ось N, имеют касательные, тангенс угла наклона которых в этой оси либо отрицате- лен, либо больше, чем ь+р| % * Поэтому неравенство а0^а будет выполняться лишь в том случае, если т. е. Р 1-Р ь+р£ 1 (2.5.26)
§ 2.5) ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 153 Так как р| является меньшим корнем характеристи- ческого уравнения системы (2.5.15) при 6& = 6&max, то 2Р| = - Y + dfcnux - 1/(V- fi^maxY + , J о г \ 7 о / 1 о и неравенство (2.5.26) можно записать в виде 1/7 1 — Ряс \2 , . 2Х . 1 — 6 «с 1/ Y ’ —S^maxl “ *“ Y 4“ ' —— в&тах« г\ *о 1 Р *о Возводя в квадрат обе части этого неравенства, полу- чаем Так как у = Х4-рГо1, то отсюда следует, что 1^ХТ04-р. Это неравенство для реакторов рассматриваемого типа невозможно, ибоХ^ОД, р^6,5-10~3, То~1О“3. Таким образом, а0>а. Рассмотрим теперь движение фазовой точки системы (2.5.15) при управлении 8k=—6£max. В этом случае оба корня р~ и р-характеристического уравнения этой системы отрицательны. Это следует из того, что 2Р1,2 — ’Y ‘ fife max dz l/' fy4-—-S&max^ ’4 —-6&max> *0 \ 'o / *o а подкоренное выражение можно представить в виде + 2 (>• + ’-^1(1 -«UlMo-il..)', 1 О J 4 1 О 1 1 0 1 о иб) y = X + -7-. Г9 Пусть Р7 < Р? < 0. Преобразованием х = (X 4“ Pi) » У ~ (X 4~ Рг) 4~ Хг
154 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. П система (2.5.15) приводится к виду а фазовые траектории этой системы в плоскости де- картовых координат (х~, у~) имеют вид, изображенный на рис. 8. Перенесем эти траектории в плоскость декартовых координат N, г. В этой плоскости уравнение оси х~ имеет вид А а оси у~ ^ + Pi г -------v^-N. X Проведем луч OL: г= ЛГ, на котором лежат на- ТоЛ чальная и конечная точки интересующей нас фазовой траектории системы (2.5.15). При этом взаимное распо- ложение оси х~ и OL будет таким, какое указано на рис. 9.
§ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 155 В самом деле, по определению р’ имеем 2р; =—Y— ййтах -1/ (y+ То \ ‘о ) ‘о Допустим, что Рг+т^О; тогда Y —’ ” Syntax ]/"6yH Й^тахУ ' — б^тах- То ' \ ‘в / 'о Возводя обе части этого неравенства в квадрат, полу- чаем Y(1-₽)^A. Так как у^^+Р^о1, то отсюда следует, что 1Г0>1—р, а это для указанных выше параметров реактора невоз- можно. Таким образом, р~+у<0 и поэтому __Р а + Р X • T0X ’ Это означает, что ось х~ проходит через первую и третью четверти и по отношению к лучу OL расположена так, как это указано на рис. 9. Покажем теперь, что ось у~ проходит через вторую и четвертую четверти плоскости N, г (см. рис. 9), т. е. выполнено неравенство -Х + р* <0. Предположим, что это не так. Тогда 2(Х+р~) ^0, а из определения числа следует, что 2Х ’ Г Y + 5^ max - 1/7Y+ Sfemax Y ~ f ^max] < 0, Г\ 'ft V 'ft J
156 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II ИЛИ (V 4 Й'^тах^ — б-? max V Н---z~ 5^ max ’ 2Х. Возводя в квадрат обе части этого неравенства, получим 6А?тах 1 , а это противоречит условию которое выпол- няется для реакторов на тепловых нейтронах. Таким образом, фазовые траектории системы (2.5.15) при 8k ——8kmia имеют вид, изображенный на рис. 9. При этом важно отметить, что они пересекают лучи OL под углом, тангенс которого можно определить соотноше- нием /dr_\ = р Мог 1-Р’ т. е. на этом луче они касаются траекторий той же систе- мы, но при 8k=8kmia. Поскольку нас интересуют траектории системы (2.5.15) при 8k=8km„ или 8k =—8km&x, исходящие из то- чек луча OL и оканчивающиеся на этом луче, то следует рассматривать только те траектории, которые располо- жены между осями х~ и х+ в окрестности луча OL (рис. 10). Под действием каждого из управлений 8k= = 6/гтах и 8k=—l8km„ эти траектории не могут покинуть угол х~Ох+. В дальнейшем каждую фазовую траекторию системы (2.5.15), соответствующую управлению —<5&Шм> будем называть траекторией первого семейства, а соответствую- щую управлению 8k=—8kma—траекторией второго се- мейства. На основе приведенного выше анализа этих траекто- рий легко можно показать, что из начального состояния (2.5.16) можно перевести систему в состояние (2.5.17) бесчисленным множеством способов, используя лишь два значения управляющей функции 6fe=6£max и 8k =—8kmax. В самом деле, пусть ЛДМ,, г0) и Pi(Nu rt) —началь- ная и конечная точки, характеризующие состояние си- стемы в момент времени f=0 и t=it соответственно. Для определенности будем считать, что они расположены так, как это указано на рис. 10. Прежде всего отметим,
§ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 157 что любая траектория первого и второго семейства толь- ко один раз пересекает луч OL. Отсюда следует важный для дальнейшего Вывод 1. Систему невозможно перевести из на- чального состояния (2.5.16) в состояние (2.5.17), исполь- зуя только постоянное управление (8k—6femax ИЛИ 8k =—66max). Покажем, что упра- влением с одной точ- кой переключения мож- но перевести систему из начального в конеч- ное состояние. Через PQ проводим траекторию первого се- мейства (соответству- ющую управлению 6&=6femax), а через Pi — траекторию вто- рого семейства. Точку их пересечения обозначим через Р2 (см. рис. 10). Желаемое управление строим следую- щим образом. Сначала берем 8k==8kmax. Под его воздей- ствием фазовая точка будет двигаться по линии P0Q вплоть до момента времени т, когда она попадает в по- ложение Р2. В этот момент времени включается управле- ние 8k=—б^тах, под воздействием которого она движется по линии P2Pi и в какой-то момент времени попадает в точку Pi. Так как траектории первого семейства описываются уравнениями (2.5.24), в которых использованы обозна- чения (2.5.25), то линия PQ может быть задана в пара- метрической форме следующими соотношениями: & + Pj)W + V = (Y + p:).v/4 (1+ Р2+)ЛМ-V = (Y + Pt)Noe**, *>o. Аналогично, используя уравнения = P1X- dt dy~ dt Pty~,
158 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II выпишем уравнения линии P2Pii (^ + P7)N + Kr^(y + P^N1e1 , (Ь+.РТН + V = (y +PZHie 2 , />о. (2.5.28) Исключая из уравнений (2.5.27) и (2.5.28) параметр t и решая их совместно относительно N и г, можно найти Рис. 13. координаты точки Р2, в которой происходит переключе- ние управления с 6&тах на —а затем и момент вре- мени /=т, в который происходит это переключение. Полученный результат можно сформулировать так. Вывод 2. С помощью управления с одной точкой переключения систему можно перевести из начального состояния (2.5.16) в состояние (2.5.15), и при M0<Ni процесс заканчивается под действием управления 6k = =—б^тах- Момент переключения т определяется путем решения системы уравнений (2.5.27) — (2.5.28). Легко можно построить фазовые траектории системы, исходящие из Ро и оканчивающиеся в Рь соответствую- щие управлениям с двумя или более точками переклю- чения. Некоторые из них изображены на рисунках 11, 12, 13. Однако детальным их анализом заниматься не будем, а займемся доказательством того, что управление с одной точкой переключения является оптимальным.
$ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 159 С этой целью систему (2.5.28), определяющую и ф2, заменой переменных L *о уо J о W = (4—г)—"Ф1 (4—т) приведем к виду £ - - £ £ - V) » + -*=* № (<.-т) ш * о V о / * о ^- = — уо + ид6(4 — *). dx (2.5.29) а систему (2.5.15) заменой х = ЛГ, Г* 1 о Р(1-тТв) -£-У —V к виду *0 (2.5.30) Системы (2.5.29) и (2.5.30) подобны, их отличие лишь в том, что в (2.5.29) отсчет времени ведется в сторону его отрицательных значений и управление 8k берется с аргументом tt—т. Поэтому легко построить фазовые тра- ектории этой системы при 6£=±6&пхах, зная фазовый портрет системы (2.5.30), который легко получается на основе изложенного выше анализа системы (2.5.15) (рис. 14 и 15). Фазовый портрет системы (2.5.29) при 8k=±6km„ изображен на рис. 16 и 17, где стрелками указано на- правление движения фазовой точки при убывании т. Так как оптимальное управление удовлетворяет условию (2.5.20), то 56(0 =—6^ sign w(/t—t). (2.5.31)
160 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ (ГЛ. II Фазовые портреты системы (2.5.29) при управлении (2.5.31), изображенные на рис. 16 и 17, позволяют опре- делить структуру оптимального управления в рассмат- риваемой задаче. Рис. 14. Рис. 15. Покажем, что функция (2.5.31) при условии, что и(т) удовлетворяет системе (2.5.29), может менять знак не более одного раза. Пусть для определенности и(^)<0. Тогда, в соот- ветствии с формулой (2.5.31), находим, что б^(/)>0, по крайней мере при достаточно малых положительных t. Если точка с координатами и (Л), о (Л) находится левее
§ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 161 линии АВ (см. рис. 17), то с возрастанием t функция —t) будет убывать и, значит, 6k(t)>0 при всех t^[t0, Ц. Поэтому, в соответствии с выводом 1, такое управление не может переводить систему из начального состояния в желаемое конечное состояние. Если точка М (с координатами и(Q, v^)) находит- ся правее линии АВ, но и(Л)<0, то с возрастанием t (уменьшением т) фазовая точка си- стемы (2.5.30) будет двигаться по кривой МС (рис. 18) и в некоторый момент времени t функция и(^—t) обратится в нуль (фазовая точка по- падает в точку N). При дальней- шем увеличении t функция и(/4—t) становится положительной. Поэто- му в момент времени t=t про- исходит переключение управления (2.5.31) с на 6k— — 6femax. ч Начиная с этого момента, фазовая точка системы (2.5.29) будет дви- гаться под действием управления 6k=—6femaI, т. е. по фазовой траект( изображенного на рис. 16 и исход; (рис. 18). Эта точка с возрастанием t уже не может пе- ресечь ось V. Таким образом, в этом случае управление может из- менять знак не более одного раза. Точно таким же способом можно показать, что при w(M>0 управление 6k(t), определяемое формулой (2.5.31), может изменять знак не более одного jjasa. Из изложенного следует сделать следующие выводы. 1. Согласно принципу максимума оптимальное управ- ление, если оно существует, определяется по формуле (2.5.31), где w(t) удовлетворяет системе уравнений (2.5.29). 2. Это управление может иметь не более одной точки из семейства, из точки АГ переключения. 3. Систему (2.5.15) можно перевести из начального состояния (2.5.16) в состояние (2.5.17) с помощью управ- ления (2.5.31), если оно имеет точку переключения. Структура этого управления указана в выводе 2, сфор- мулированном на стр. 158. 6* А. И. Егоров
162 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II Поэтому для завершения исследования задачи нужно показать, что в классе кусочно-непрерывных управлений существует управление оптимальное по быстродействию и дать по возможности более полное аналитическое опи- сание этого управления. Существование оптимального управления здесь исследоваться не / / будет. Ограничимся лишь указани- / А ем на то, что его установить можно, PiL----опираясь на теоремы, относящиеся / У к более общим задачам управления / (см., например, [21]). Из этих тео- / У' рем следует, что в рассматриваемой здесь задаче оптимальное управле- ние существует и, следовательно, оно Рис. 19. является кусочно-постоянной функ- цией с единственной точкой пере- ключения. Для более полного описания структуры этого управ- ления вернемся к выводу 2, сформулированному на стр. 158. Так же как и при формулировке этого вывода, предположим, что начальная плотность нейтронов меньше плотности нейтронов в момент окончания про- цесса (рис. 19). В этом случае оптимальное движение фазовой точки будет происходить сначала под действием управления б£(0=6£тах, а точка будет двигаться по траектории, определяемой уравнениями (2.5.40), до того момента т, когда она попадает в точку Р2. В этот момент происходит переключение управления на —66mai и точка движется по траектории, определяемой уравнениями (2.5.29). Если jV0>A^1 (рис. 20), то сначала движение фазовой точки происходит под действием управления —6femaI1 а затем происходит переключение на б£тах. На основе этого анализа можно дать решение задачи синтеза оптимального управления. В плоскости У, г про- ведем луч OL, на котором располагаются начальная и конечная точки Ро и Р4 оптимальной траектории (рис. 21). Проведем также лучи Ох~ и Ох+, определяющие угол х~Ох+, внутри которого расположены все фазовые тра- ектории системы (2.5.15) при £>0 и начальном условии (2.5.16). Если Ро и Pt таковы, что Nt>Nit то фазовая точка начинает движение под действием управления
$ 2.5] ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЯДЕРНЫМ РЕАКТОРОМ 163 fifc=—S£maI. Этот факт на рис. 21 отмечен стрелками, на- правленными влево от луча OL. Если же #0<ЛГ1( то дви- жение начинается под действием управления bk^k^-, этот факт на рис. 21 отмечен стрелками, направленными вправо от луча OL. По линиям PsPt и Р2Р, фазовая точка может дви- гаться только в точку Pi. Таким образом, оптимальная траектория может на- ходиться либо в Qt, либо в Q2 (см. рис. 21), а поскольку она имеет всего одну точку переключения, то получаем решение задачи синтеза оптимального управления. Оптимальное по быстродействию управление (/) определяется следующим образом для каждой из обла- стей Qt и Q2. Пусть сначала точка P(N, г) принадлежит Qt или линии PsPt. Тогда = ( ^тах, если Ре Qi или Ре Р^, |—dfemax. если Р принадлежит линии PJ\. Аналогично для случая, когда P(N, г) принадлежит Qs или линии Р,Р2, = f—^max, если Ре Q2 или PePiPj, I б^тах, если принадлежит линии PJ\. Таков закон оптимального управления, рассчитанный для идеального случая, когда нужное решение принима- ется мгновенно и переключение осуществляется строго 6*
164 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II <5/г°(0 = на линии Р»Рг. Реально его, очевидно, осуществить нель- зя и поэтому фазовая точка, движущаяся в области может «проскочить» линию Р^Рг. Поэтому целесообраз- но сформулировать несколько более широкий закон опти- мального управления: б^тах, если точка P(N, г) лежит ниже линии Р3Р2 либо на линии Р3 Pt, — б&тах, если точка Р (N, г) лежит выше линии Р2Р3 либо на линии PJ\. § 2.6. Математическое описание переноса газа в псевдоожиженном слое В этом параграфе рассматривается одна задача о ма- тематическом описании процесса переноса газа [18]. Процесс описывается уравнениями параболического ти- па, однако имеются существенные трудности непосред- ственного экспериментального определения некоторых коэффициентов этих уравнений. Поэтому автор указан- ной статьи предлагает проведение специальных экспери- ментов, результаты которых, по его мнению, позволяют аналитическим путем вычислить искомые коэффициен- ты, используя идеи теории оптимального управления. Он не дает окончательного решения задачи, а лишь описы- вает суть эксперимента и в общих чертах указывает про- цедуру, по которой следует выполнять аналитические расчеты. Вопросы эффективности этой процедуры и ее корректного математического обоснования в работе не рассматриваются. Здесь указанная работа излагается вкратце без ка- ких-либо существенных дополнений. Ее включение в на- стоящую монографию преследовало две цели. Во-пер- вых, хотелось указать еще одну возможную область практического применения теории оптимального управ- ления в задачах, связанных с математическим моделиро- ванием технологических процессов. Во-вторых, хотелось привести пример содержательной прикладной задачи, решение которой представляет определенный интерес с позиции теории оптимального управления. В ней есть нерешенные вопросы как существования и единственнос-
§ 2.6] ПЕРЕНОС ГАЗА В ПСЕВДООЖИЖЕННОМ СЛОЕ 165 ти оптимального управления, так и практического его построения. 1. Постановка задачи [18]. Пусть цилиндр высоты Н и радиуса R заполнен псевдоожиженной смесью, которая содержит в себе жидкость, мелкие частицы твердого вещества и газовую смесь. Смесь считается не- однородной в том смысле, что в ней происходит спонтан- ное образование газовых пузырьков, которые поднима- ются вверх. Пузырьки не содержат (или почти не со- держат) частиц твердого тела. Кроме того, в смеси происходит фильтрация газа через относительно плот- ную массу твердых частиц. При этом между указанны- ми способами прохождения газа имеется постоянная связь. Пузырьки могут исчезать и находящийся в них газ начинает выходить из смеси путем фильтрации. В то же самое время пузырьки могут образовываться в другом месте. Рассматриваемая здесь задача состоит в математическом описании движения газа в смеси. Будем исходить из предположения, что движение га- за в пузырьковой и плотной фазах подчиняется закону Фика. Обозначим через ct и с2 концентрацию газа в этих фазах. Тем же способом, который неоднократно исполь- зовался в первой главе, определим плотность потоков газа в каждой фазе Ji и J2. Тогда, в соответствии с за- коном Фика, будем иметь Ji = — D'grad съ ЛМ— £?grad’c2, где D и Е — коэффициенты диффузии. Пусть, далее, k — коэффициент массообмена между фазами, а Л и Ft— доли объема, занимаемого газом в пузырьковой и плотной фазах (Pt+Ft=.l). Тогда коли- чество газа в плотной фазе, появившегося в единице объема за единицу времени в результате перехода из первой фазы, определится по формуле — с2). г» Аналогично определяется количество газа, перешед- шего из плотной в пузырьковую фазу: (с» с1)*
166 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II Обозначим через v{ скорость фильтрации газа через смесь в i-й (пузырьковой или плотной) фазе, а через с — концентрацию газа в смеси. Тогда величина V = Vi— + ®2 — С С (2.6.1) представляет собой скорость движения смеси. Составляя уравнения материального баланса тем же способом, который, был изложен в гл. I (см., например, § 2), получим следующие уравнения: = div (D grad cj - div (cjvj — -7- (ti — ca) + <7i, 01 г I = div (E grad c2) — div fa—<?g) + Я2, Ot (2.6.2) где qt— плотность внутренних источников газа в i-й фа- зе, не учитывающая переход газа из одной фазы в другую. Если предположить, что концентрации и с2 зависят лишь от t и z(0^Z^/7), а все остальные параметры считать постоянными, то система (2.6.2) примет вид = ±(C1-C2)+ qlt dt dz2 1 dz Fi 1 27 41 — — о,— + — («a —Cj) + qt, dt дг2 дг Ft 1 v 41 (2.6.3) где v{ — скорость вертикального движения газа в i-й фазе. В реальных условиях при исследовании переноса га - за оказывается возможным экспериментально • опреде- лить все параметры в уравнениях (2.6.3), за исключени- ем D, Е и k. Для определения коэффициентов диффузии D и Е, а также коэффициента массообмена k в работе [18], предлагается следующая методика, использующая идеи теории оптимального управления. На входе в слой (т. е. при z=0) к потоку псевдо- ожиженного газа добавляют (равномерно по поперечно- му сечению цилиндра) незначительное количество дру- гого газа (индикатора). При этом масса добавляемого
§ 2.6] ПЕРЕНОС ГАЗА В ПСЕВДООЖИЖЕННОМ СЛОЕ 167 индикатора задается в виде ступенчатой функции вре- мени. Моменты времени, в которые эта функция терпит разрыв, определяются следующим образом. Сначала концентрация индикатора на входе в слой поддержива- ется на постоянном уровне до тех пор, пока в слое не ус- танавливается стационарное распределение индикатора. Затем в момент времени t=0 подача индикатора мгно- венно прекращается и одновременно начинается регист- рация концентрации m(t) индикатора на выходе из слоя, т. е. при z=H. Исходя из этого эксперимента, определя- ются коэффициенты D, Е и k. Обозначим через cj и концентрации индикатора в пузырьковой и плотной фазах в стационарном режиме, т. е. при t^O. Следовательно, cj, cj удовлетворяют си- стеме уравнений d2c? de? k л а D —1- - v —- — (с[ - 4) = О dz2 dz Л ' ,d2Cg de® dz2 (4-4) =0. Если дополнительные условия при г=0 выбрать так, что 4(0) -4(0)-с», то получим решение 4(г)=4(г)=с°, где с° —некоторая фиксированная постоянная. Если те- перь обозначить через ct и с2 концентрации индикатора в пузырьковой и плотной фазах в нестационарном режи- ме, т. е. при t>0, то функции будут удовлетворять уравнениям d«i _ р д2», dt dz2 диъ _ „ d2ut dt dz2 dz F1 . k r \ _ air + F7(“1-U2) (2.6.4)
168 простейшие задачи оптимизации [ГЛ. и и начальным условиям и,(0, z)=«2(0, z) = l. (2.6.5) В правых частях уравнений системы (2.6.4) отсутст- вуют qt (сравните с (2.6.3)) в силу того, что внутри ци- линдра отсутствуют источники индикатора. Граничные условия для функций и, имеют вид D d“l (<’0). — о1Ы1(/, 0)^0, 1 дг Е~V2U2(t, 0) =()( дг ди2 (t, Н) = ди2 (/, Н) =0 дг дг (2.6.6) (2.6.7) Таким образом, для определения и, и и2 имеем пол- ную систему соотношений при каждом конкретном выбо- ре D, Е и k. В соответствии с формулой (2.6.1) можно вычислить относительную концентрацию индикатора на выходе и (t, Н) = (t, Н) + и2 (t, Н), (2.6.8) определяемую путем решения краевой задачи (2.6.4) — (2.6.7). С другой стороны, из эксперимента находится фак- тическая концентрация этого вещества при z=H. Обоз- начим ее через Предлагаемый в работе [18] метод определения ко- эффициентов D, Е и k формулируется в виде следующей задачи. Требуется найти D, Е и k в краевой задаче (2.6.4) — (2.6.7) такие, чтобы соответствующее им решение {«i(/, z), u2(t, z)} давало минимум функционалу / = J[«(f,tf) -u°(/)]2d/, О где u(t, Н) определяется по формуле (2.6.8). Главная особенность этой задали, рассматриваемой с позиций теории оптимальных процессов, заключается в том, что управляющие параметры D и Е входят в урав-
§ 2.6] ПЕРЕНОС ГАЗА В ПСЕВДООЖИЖЕННОМ СЛОЕ 169 нения и граничные условия множителями при старших производных. При этом интуитивно можно указать ра- зумные пределы, в которых могут принимать значения управляющие параметры D^D^D,, E0^E^Elt kQ^k^klt (А) где Dit Е{ и ki — некоторые заданные постоянные. Подоб- ного типа процессы исследовались многими авторами, среди которых особо следует отметить К. А. Лурье [19]. Им указан достаточно эффективный метод получения условий оптимальности, основанный на приведении ис- ходных уравнений к каноническим уравнениям первого порядка и использовании аппарата классического вариа- ционного исчисления. Поэтому было бы интересным при- менить этот аппарат для решения полученной задачи. 2. Дискретизация по пространственным переменным. Здесь мы 'изложим вкратце один подход к приближен- ному решению задачи, .основанный на аппроксимации краевой задачи (2.6.4) — (2.6.7) системой обыкновенных дифф ер ен ци а л ьн ы х у р а вн ен и й. Отрезок разобьем на п равных частей точ- ками г0 =0, zt = — , .... = ^-Н, zn = Я, п п и введем обозначения ut(t, zf)=ut(t), u2(t, — i=0, 1,n. Полагая du (t, zt) = »(<> Zf-ц) — u (t ZP _ “i+i (0 — ui (0 dz 1 Н/п Н/п ’ № (i, z() _ _ ut+1 (0 (/) + (t) dz* ~ ui- систему уравнений (2.6.4) заменяем системой обыкно- венных дифференциальных уравнений в точках z=zt, i=0, 1, ..., п, ~ = D Д2ы (0 — v^Ui (0-----(и,- — ип+1+0, dt Ft --= E^Un+i+i (0 — ^2 АМп+i+i (0 4-----(Wi — «л+l+i) dt г 2 (i=l, n— 1). (2.6.9)
170 ПРОСТЕЙШИЕ ЗАДАЧИ ОПТИМИЗАЦИИ [ГЛ. II Аналогично заменяем граничные условия (2.6.6) и (2.6.7) DДио(0 —-0, EAun+i(0— Mn+i(0 =0, 1 6 w (0 - Д^2М+1 (0 r—0. J Система (2.6.9) состоит из 2п—2 уравнений относи- тельно 2п4-2 неизвестных функций u0(t), ..., un(Z), ••• ...»и2п+1 (0-Соотношения (2.6.10) позволяют выразить и0(О через МО, Un+i(t) через un+2(t)t un(t) через un+i(t) и u2n+i(t) через u2n+2(0- Таким образом, совокупность уравнений (2.6.9) и (2.6.10) можно рассматривать как систему 2п—2 обыкновенных дифференциальных урав- нений относительно 2п—2 неизвестных функцийщ(/),..• ..., lZn —1 (0 ’ Wn+2(0> •••> ^2п(0 • Начальные условия, которым должны удовлетворять эти функции, находим в соответствии с условиями (2.6.5): uf(0)=wn+1+i(0)=0, Z=l, ..., п— 1. (2.6.11) Полагая и (0 = -^ Un (0 + U2n+i (0 (2.6.12) V V в соответствии с формулой (2.6.8), находим, что крите- рий оптимальности I следует заменить функционалом оо О Таким образом, для приближенного решения сформу- лированной выше задачи определения коэффициентов D, Е и k получаем следующую задачу оптимального управления. Среди всех D, Е и k, удовлетворяющих условиям (А), требуется найти такие, чтобы соответствующее им ре- шение задачи (2.6.9) — (2.6.11) минимизировало функ- ционал Ilt в котором ы°(£)—заданная функция, а «(/) определяется формулой (2.6.10).
§ 2.6] ПЕРЕНОС ГАЗА В ПСЕВДООЖИЖЕННОМ СЛОЕ 171 Не менее интересна задача определения D, Е и k та- ких, чтобы функционал /2= sup |u(0 —ы°(01 0<f<oo принимал наименьшее значение. Если D и Е считать известными, а определять только k из условия минимума функционала /2, то получаем не- посредственное обобщение вспомогательной задачи, рас- смотренной в § 5. В работе [18] не указан практический способ реше- ния этой задачи. Ясно, что изложенная процедура при- ближенного решения, хотя и представляется вполне есте- ственной, требует корректного математического обосно- вания.
ГЛАВА III УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ И ЗАДАЧА ОБ УПРАВЛЯЕМОСТИ В предыдущей главе были рассмотрены простейшие задачи оптимизации тепловых и диффузионных процес- сов. В одних случаях задача сводилась к отысканию экс- тремума функции одной или нескольких переменных. В других (см. § 2.5) требовалось использовать аппарат математической теории оптимальных процессов, описы- ваемых обыкновенными дифференциальными уравнения- ми. Вместе с тем в § 2.6 была сформулирована одна из прикладных задач, для решения которой необходимы ме- тоды теории оптимального управления системами с рас- пределенными параметрами. Другие задачи подобного типа рассматриваются в следующих главах. Главной их особенностью является то, что поведение управляемого объекта описывается дифференциальными или интегро- дифференциальными уравнениями с частными производ- ными. В этой главе рассматривается простейшая из них, а именно, задача об управлении с минимальной энергией для объекта, описываемого уравнением теплопроводнос- ти. Известно (см., например, [1]), что подобная задача является элементарной, если процесс описывается ли- нейными обыкновенными дифференциальными уравне- ниями. Однако, как видно из содержания настоящей главы, она далеко не проста для линейных систем с рас- пределенными параметрами и полностью еще не иссле- дована. В ряде практически интересных случаев не уда- ется найти эффективно проверяемые достаточные усло- вия ее разрешимости. Возникающие при этом трудности определяются прежде всего сложностью проблемы уп- равляемости систем с распределенными параметрами. В том случае, когда решение существует, задача оказы- вается нерегулярной и обычно используемая процедура приближенного решения такого типа задач путем конеч-
ГЛ. Ill] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 173 номерной аппроксимации неустойчива относительно по- грешностей в промежуточных вычислениях. Все эти вопросы, связанные с задачей об управлении с минимальной энергией, рассматриваются в настоящей главе. Различные варианты ее полной формулировки приводятся в § 3.1 и дается их предварительный анализ. В итоге такого анализа устанавливается, что все рас- сматриваемые здесь задачи распадаются на две группы. К первой группе относятся те задачи, которые имеют ре- шения, легко определяемые элементарными методами (см. теоремы 1.1 и 1.2). Во вторую группу входят задачи, сводящиеся к следующей бесконечномерной проблеме моментов: найти функцию р(/)е£2(0, Г) такую, чтобы она удовлетворяла соотношениям J А* (/-Г) Je " p(t) =bn, п = 1, 2, ..., О где Ьп(^Ь*<;<х>) и — заданные постоянные, и до- ставляла минимум функционалу Для исследования этой проблемы моментов исполь- зуются вариационные методы решения операторных уравнений первого рода. Необходимые факты из этих методов излагаются в § 3.2. Они относятся как к про- блеме разрешимости таких уравнений, так и к способам их приближенного решения. Вариационные методы по- зволили получить необходимые и достаточные условия разрешимости проблемы моментов, а следовательно, и тех задач об управлении с минимальной энергией, кото- рые выше были отнесены ко второй группе (см. § 3.3). Эти условия оказались трудно проверяемыми. Поэтому здесь приводятся простые достаточные условия, при ко- торых проблема моментов не имеет решения (см. теоре- му 3.2). Этот результат используется для выделения тех задач об управлении с минимальной энергией, которые не имеют решения. Эффективно проверяемых достаточ- ных условий разрешимости задачи об управлении с ми- нимальной энергией получить не удалось. Однако отсю- да не следует, что их исследование с помощью вариаци-
174 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. П1 онных методов является бесперспективным. Те же ва- риационные методы используются для получения регу- лярной процедуры построения приближенных решений. В заключительном, четвертом параграфе кратко из- лагается содержание работы [10] по решению проблемы управляемости системы с распределенными параметрами. § 3.1. Формулировка задачи в терминах проблемы моментов Начиная с этого параграфа будем рассматривать раз- личные задачи оптимального управления неустановив- шимися процессами теплопроводности и диффузии, ко- торые описываются линейными дифференциальными и интегро-дифференциальными уравнениями в частных производных. При этом сначала будем предполагать, что управляющая функция входит только в само урав- нение, а граничные условия являются однородными. Как будет видно из дальнейшего изложения, предлагаемые здесь методы решения таких задач нечувствительны к типу граничных условий. Поэтому каждая задача будет решаться лишь при одних граничных условиях (первого, второго или третьего рода). В случае необходимости чи- татель без труда может тем же методом получить реше- ние аналогичной задачи при граничных условиях, отлич- ных от тех, которые рассмотрены здесь. Изложение материала начнем с исследования про- стейшей задачи, которую, в соответствии с установив- шейся терминологией (см., например, [1]), будем назы- вать задачей об управлении с минимальной энергией. Для систем, описываемых обыкновенными дифференци- альными уравнениями, эта задача элементарна и легко решается. Для рассматриваемых здесь бесконечномер- ных систем эта задача в ряде случаев далеко не триви- альна и, как будет видно из дальнейшего изложения, еще не полностью исследована. 1. Постановка задачи. Пусть управляемый процесс описывается функцией и(/, х), которая внутри области Q={0^x^l, удовлетворяет уравнению «(=аХх+Ж x)4-F(/, х, р), (3.1.1) а на границе Q удовлетворяет начальному и граничным
I 3.1] ПРОБЛЕМА МОМЕНТОВ 175 условиям и {0, х) = w°(x), (3.1.2) ux(t, 0)=0, ux(t, 1)+аи(/, 1)=0, (3.1.3) где f(t, х), F(t, х, р) и и’(х) — заданные функции своих аргументов, а р— управляющий параметр. Здесь будут рассмотрены задачи оптимального уп- равления для следующих различных частных случаев. a) F=p (t, х), те. допустимые управления p(t, х) удовлетворяют условию J J р2 (t, x)dxdt<C 00 > Q т. е. являются любыми функциями из L2(Q). б) F=ty(f)p(x), где ф(£)—заданная функция из Ь2 (О, Т), а допустимыми управлениями являются произ- вольные функции pe£2(0, 1). в) F=p(x)6(t—10), где ta — произвольная точка из интервала (0, 1), а допустимые управления р(х) при- надлежат L2(0, 1). г) F = q(x)p(t), где q(x)—заданная функция из £2(0, 1), a p(t) —допустимые управления, которые явля- ются произвольными функциями из £2(0, Т). д) F=8(x—Xo)p(t), где Хо — произвольная точка из интервала (0,1), 6(х)—функция Дирака, а допустимые управления принадлежат L2(0, Т). Таким образом, в каждом из указанных пяти случаев допустимые управления принадлежат L2. Что касается заданных функций, входящих в F, то в четвертом и пя- том случаях они не принадлежат L2, а являются обоб- щенными функциями. Тем не менее всегда каждое кон- кретное допустимое управление определяет единствен- ное решение, которое с помощью функции источника G (х, t) можно представить в виде u(t,x) = р(хЛ,0^(|)^ + о + J / G (x,$,t - -г) I/ (В. Т) + F (Г, В, Р) 1 di-dr. (3.1.4) О о
176 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. Ill Оставляя пока без внимания вопрос о явном пред- ставлении функции источника и дифференциальных свойствах функции u(t, х), представленной в виде (3.1.4), для каждого из указанных выше представлений функ- ции F сформулируем общую постановку задачи об уп- равлении с минимальной энергией. Пусть ф(х)—заданная функция из L2(0, 1). В вы- бранном классе допустимых управлений требуется ука- зать управление р0 такое, чтобы соответствующее ему решение и (t, х) задачи (3.1.1) — (3.1.3), представленное в форме (3.1.4), удовлетворяло условию и(Т, х)=ф(х), (3.1.5) и при этом функционал /=1К принимал наименьшее возможное значение. В частнос- ти, если в уравнении (3.1.1) F—p(t, х), то функционал / принимает вид если же F=6(x—х0)р(/), то I^p\t)dt. О Так как, по предположению, ф(х)е£2(0, 1), то в са- мом общем случае условие (3.1.5) нужно понимать в том смысле, что 1 lim f [и (Т — ЛЛ, х) — <р (х)]2 dx =0. Д£—»о % о Функция О(х, /), входящая в формулу (3.1.4), вы- числяется следующим образом. Система (— cosX.nx\ является полной в L2(0, 1) ор- I J тонормированной системой собственных функций крае- вой задачи Х"(х) 4-VX =0, 0<х<1, Х'(0)=0, Х'(1)4-аХ(1) = 0. (3.1.6)
§ 3.1] ПРОБЛЕМА МОМЕНТОВ 177 Здесь Хп — положительные корни уравнения XtgX= ==а, а (О® = £ cos®X„xdx = у Г1+ T-igX„cos2X„ 1 = a"+--+<*- • <Г 2 L 1 2(1®+<х’) (3.1.7) п=1 ---COSl„(x), юп Поэтому можно записать и° (х) = 2 «X (X), f (/, х) = 2 fn (0 Хп (X), F(0x,p) = 2 FnXn(x), Хп(х) = П—1 (3.1.8) где = j‘ue(x)X„(x)dx, Fn о Un = §F(t, X, p)Xn(x)dx, О fn(t) = $f(t,X)Xn(x)dX. О Решение задачи (3.1.1) — (3.1.3) ищем в виде ‘ и(t, х) = £ ы«(0Хп(*)> «»(0 = $и(/, х)Хп(х)dx. (3.1.9) п=1 о Подставляя ряды (3.1.8) и (3.1.9) в уравнение (3.1.1), формально получаем (с учетом граничных усло- вий Х'п (0) =0, Х'п (1) +aXn (1) =0) 2 [йп (0 + аЪгпип (0 - fn (0 - F„] Хя (х) -0. Так как система {Х„(х)} полна в Ьг(0, 1), то отсюда находим, что ия (О И- c^XnUn (0 =fn (О Н- Fn, 0=1,2, ...
178 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Поскольку функция (3.1.9) должна удовлетворять ус- ловию (3.1.2), то «я(0)=«п, п=1,2, ... Отсюда находим, что * -Л2а’(*-Т) Un(t) = u°ne п + J[f„(T) + F„]e п dr,n=l,2,... О Подставляя найденные un(t) в ряд (3.1.9) и учитывая явное представление ы®, Fn и fn(t) через м°(х), г и/(/,х), получаем формулу (3.1.4), в которой 00 cos V х cos Л-Е G(x, £, t)^yen ------2(3.1.10) “n Поскольку решение в форме (3.1.4) получено фор- мально, то для окончательных выводов необходимо знать его дифференциальные свойства и установить, в каком смысле следует понимать функцию (3.1.4) как решение краевой задачи. Лишь после этого можно говорить о дос- таточно четкой постановке задачи об оптимальном уп- равлении и о выборе методов ее точного и приближен- ного решения. Объяснить все это можно следующим образом. Формулу (3.1.4) можно рассматривать как закон, по которому каждому р^Ц. ставится в соответствие не- которая функция и(Т, х) и, когда р пробегает все значе- ния из L2, соответствующие ему и принимают все воз- можные значения из некоторого множества М функций и(Т, х). Легко показать, что для рассматриваемых пяти частных случаев функции F множество М принадлежит L2(0, 1), т. е. MczL2(Q, 1). Поэтому если функция ф(х), входящая в условие (3.1.5), не принадлежит множеству М, то задача об управлении с минимальной энергией не имеет решения и нет смысла говорить о построении при- ближенных решений, используя ту или иную аппрокси- мацию как функций u(t, х), так и р. Если же к этому во- просу подходить формально и использовать конечномер- ную аппроксимацию, то на каждом шаге аппроксимации будет получаться некоторое «приближенное» решение.
ПРОБЛЕМА МОМЕНТОВ 179 § 3.1] Однако последовательность таких решений не будет оп- ределять в пределе точного решения задачи, поскольку таковое отсутствует. В этой ситуации вместо задачи об управлении с ми- нимальной энергией следует рассматривать другую за- дачу, которая состоит в следующем. Среди допустимых управлений требуется найти управление р0 такое, чтобы соответствующее ему решение задачи (3.1.1)— (3.1.3) минимизировало функционал Д=р(ф,М) и, кроме того, функционал (3.1.6) принимал наименьшее возможное значение. Здесь р(<р, Af) —расстояние между Ф и множеством М. Эта задача имеет смысл независимо от того, замкну- то или открыто множество М. Если М замкнуто, то су- ществует элемент такой, что Р (<р, <р°) - min Р (ф, ф), и тогда требуется искать такое управление, чтобы со- ответствующее ему решение краевой задачи (3.1.1) — (3.1.3) удовлетворяло условию и(Т, х) =ф°(х) и при этом функционал (3.1.6) принимал наименьшее возможное значение. Здесь главная сложность заключа- ется в том, что о функции ф’(х) известно лишь то, что она существует. Другой информации о ней может и не быть. Если же множество М открыто*), то существует по- следовательность элементов {ф„} такая, что Р (ф, фп) -> inf Р (ф, ф) при оо, грел/ и задача, может быть сформулирована так. Найти последовательность допустимых управлений {рп} такую, чтобы соответствующие ей решения un(t, х) *) Такая ситуация, в частности, может возникнуть, если на класс допустимых управлений наложены дополнительные ограничения ти- па неравенств. 1
180 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. HI задачи (3.1.1) “-(3.1.3) удовлетворяли условиям ^(Т, х) =фп> и йри Этом для каждого фиксированного ^-функционал /(П) = 11рп1|2 принимал наименьшее возможное значение. Однако здесь, как и в случае замкнутого М, вопрос о выборе <р. требует дополнительного анализа. 2. Формулировка задачи в терминах проблемы момен- тов. В этом пункте покажем, каким образом задача об управлении с минимальной энергией формулируется как проблема моментов для всех перечисленных выше частных видов функции F. Возьмем произвольное допустимое управление. Соот- ветствующее ему решение задачи (3.1.1)— (3.1.3) пред- ставим в виде (3.1.4). Тогда условие (3.1.5) можно запи- сать в виде Т 1 J J G (х, c,T — r)F (т, р) di- dx = ф (х), (3.1.11) о о где ф(х) =<p(x)-$G(x, О Т 1 -J$G(x, %,T—r)f(x,%)d£dx. о о Функция ф(х) не зависит от управления и однознач- но определяется начальным распределением температу- ры «’(х) системы, внешним возмущением f(t, х) и же- лаемым ее распределением <р(х) в момент времени t=T. Таким образом, всякое допустимое управление, обес- печивающее выполнение условия (3.1.5), непременно удовлетворяет уравнению (3.1.11). С другой стороны, если р удовлетворяет уравнению (3.1.11), то, подставляя его в уравнение (3.1.1) и учитывая, что соответствующее ему решение задачи (3.1.1) — (3.1.3) представимо в виде (3.1.4), приходим к выводу: это управление удовлетво-
$ 3.1] ПРОБЛЕМА МОМЕНТОВ 181 ряет условию (3.1.5). Поэтому для того чтобы управле- ние р определяло решение задачи (3.1.1) — (3.1.3), удовлетворяющее условию (3.1.5), необходимо и доста- точно, чтобы это управление было решением уравнения (3.1.11). Поскольку нас интересует управление р с минималь- ной энергией, то нужно искать решение уравнения в про- странстве L2. Имея это в виду, рассмотрим все те част- ные случаи функции F, которые были указаны выше. а) Пусть F=p(t, х) и допустимыми управлениями яв- ляются функции p(t, х), удовлетворяющие условию x)dxdt<Z °°- Q Предположим, что u°(x)eL2(0, 1), ф(х)е£2(0, 1) и почти при всех te[0, Т] f(t, x)eL2(0, 1); тогда Ф(х) = 2 W) (3.1.12) где Хп (х) cos Х„х, фп = фп — е " и°п — \fn (Ф л dx, О 1 1 Ф„ = j Ф (х) Хп (х) dx, Un = и° (х) Хп (х) dx, о о fn (О •= Jf (t, х)Хп(х) dx. О Подставляя функцию (3.1.12) в уравнение (3.1.11) и учитывая (3.1.10), получаем £ -Л2а*(Г-т) \е " Pn(x)dr = фп, п=1,2, .... (3.1.13) о где 1 Pn(t) = §p(t, x)Xn(x)dx. О
182 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. III Таким образом, в этом случае задача об управлении с минимальной энергией может быть сформулирована следующим образом. Требуется найти управление р(м = 2 (3.1.14) П=1 удовлетворяющее условию Т со JJР1 (t, x)dx = J 2 (0^< оо, Q о n=i такое, чтобы последовательность {р„(/)} удовлетворяла бесконечной системе уравнений (3.1.13) и при этом функционал Т оо / = Pn^dt (3.1.15) О П—1 принимал наименьшее возможное значение. б) Пусть Г=ф(/)р(х), где ф(£)—заданная функция из £2(0, Т), а допустимые управления р(х) принадлежат L2 (О, 1). Тогда, полагая р(х) = ^рпХп(х), (3.1.16) п—1 где Рп = {p(x)Xn(x)dx, из уравнения (3.1.11) получим систему уравнений г -№«(Т-т) Рп]еп ф(т)<1т-фп, /1=1,2....(3.1.17) О и задача об управлении с минимальной энергией форму- лируется следующим образом.
ПРОБЛЕМА МОМЕНТОВ 183 § 3.11 Найти рп такие, чтобы они удовлетворяли уравнениям (3.1.17) и при этом функционал / = |р»-(х)> = 2 рг„ (3.1.18) • ] П=1 принимал наименьшее возможное значение. в) Пусть F=6(t—fo)p(x), где допустимые управле- ния принадлежат 4(0, 1). Так же как и в предыдущем случае, представляем р(х) в виде (3.1.16). Так как для любой непрерывной по t в точке t0 функции a(t) имеет место равенство [д(( -(0)а(/)<Й = а(4), О то из уравнения (3.1.11) получаем систему -Х« рпе п -фп, и = 1,2................ (3.1.19) относительно коэффициентов рп. Поэтому задача об уп- равлении с минимальной энергией в этом случае форму- лируется следующим образом. Найти рп такие, чтобы они удовлетворяли системе уравнений (3.1.19) и при этом функционал (3.1.18) при- нимал наименьшее возможное значение. г) Пусть F=q(x)p(t), где q(x) — заданная функция из 4(0, 1), а допустимые управления принадлежат 4(0, Г). Полагая <7 4) = § ЧпХп <*)’ П=1 где ........ ’ 1 qn = ^q(x)Xn(x) dx, О
184 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III из уравнения (3.1.11) получаем систему уравнений от- носительно функции p(t): qtfe п р(*)Л = ф», п =1,2, ... (3.1.20) О 1 Следовательно, в этом случае задача об управлении с минимальной энергией сводится к следующей задаче. Среди управлений р(/)е£2(0, Т) требуется найти такое, которое удовлетворяет системе уравнений (3.1.20) и при этом функционал [Г I^p\(t)dt (3.1.21) принимает наименьшее возможное значение. д) Пусть Г=6(х—Xo)p(t), где допустимые управле- ния p(t) принадлежат £2(0, Г). Тогда, так же как и в случае в), из уравнения (3.1.11) получаем систему COS(XXn) л -Х2а«(Т-т) 1 " °Ч е п р(т)йт = фп, п =1,2......(3.1.22) ? и задача об управлении с минимальной энергией сводит- ся к следующей задаче. Среди управлений р(()е£2(0, Т) требуется найти та- кое, чтобы оно удовлетворяло системе уравнений (3.1.22) и при этом функционал (3.1.21) принимал бы наимень- шее возможное значение. 3. Решение задачи об управлении с минимальной энер- гией в простейших случаях. Формулировка рассмат- риваемой задачи оптимального управления в терминах проблемы моментов позволяет получить ее полное реше- ние для частных случаев функции F, указанных в пп. а), б) ив). а) Пусть F=p(t, х). В этом случае задача сводится к отысканию функций pn(f), удовлетворяющих уравнени- ям (3.1.13) и минимизирующих функционал (3.1.15). Теорема 1.1. Пусть управляемый процесс описывает- ся краевой задачей (3.1.1) — (3.1.3), где F=p, а допус-
§ 3.11 ПРОБЛЕМА МОМЕНТОВ 185 тимыми управлениями являются произвольные функции p=p(t, X)6=L2(Q). Пусть, далее, функция ф(х), входящая в уравнение (3.1.11), удовлетворяет условию оо (3.1.23) п=1 где 1 фп = J Ф (X) Хп (х) dx. О Тогда задача об управлении с минимальной энергией имеет единственное решение и это решение представимо в виде •Л®а,(Т-0 — е п Хпг(х), ап p = cf>{t,xy-^ п=1 а соответствующее минимальное значение I = JJ p*(t, x)dxdi Q вычисляется по формуле функционала (3.1.25) I =2а* V -4№агТ n=11- е п Величины а„ в (3.1.24) обозначают интегралы f е п dt. (3.1.24) (3.1.26) О Доказательство. Так как система (3.1.13) пред- ставляет собой последовательность независимых друг от друга уравнений, а функционал (3.1.25) можно пред- ставить в виде ОО (3.1.27)
186 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. Ill где т о то задача сводится к последовательному определению рп(/), /1=1, 2, из уравнения £ -Х2а2(Г-/) р п pn{t)dt --^n (3.1.28) о и минимизирующих функционал 7„. После того как такие pn(t) будут определены, нужно найти достаточные условия, при которых функционал (3.1.27) сходится на полученных pn(t). Итак, сначала определяем оптимальные pn(t). В пространстве L2(0, Т) выделим одномерное про- странство Нп элементов qn(t), определяемых формулой -Ма«(Г-0 ч л _ Я 4— СпР » где сп — произвольная постоянная. Тогда любой элемент pn(/) <=L2(0, Т) можно однозначно представить в виде (см., например, [6], стр. 125) pn(i) =qn(t) +rn(t), (3.1.29) гдег„(/) удовлетворяет условию т \qn{t)rn(t)dt=Q (3.1.30) О и при ЭТОМ т т т ^p^dt^^q^dt^^r^di. ООО В силу условия (3.1.30) имеем Т -А,2а!(Т-/> т„ -Х2а2(Г-0 [ е п pn(t)dt = р п qn (0 dt, О о
§3.1] ПРОБЛЕМА МОМЕНТОВ 187 и, следовательно, слагаемое rn(t) не влияет на решение уравнения (3.1.28). Вместе с тем оно имеет отличную от нуля норму J r£(tydi. о Поэтому решение задачи минимизации функционала /„ при условии (3.1.28) должно принадлежать Нп. Под- ставляя функцию (3.1.29) в уравнение (3.1.28), находим, что это уравнение имеет в Нп единственное решение л Ч>„ <Гп = — е п “п где a0=Je n di. О Соответствующее ему значение функционала /„ равно В силу формулы (3.1.27) находим, что /=2а«2 /Iasi -A«a«T 1— е п Так как наименьший положительный корень X, урав- нения A tgX=a отличен от нуля, то ряде (3.1.26) бу- дет сходиться, если выполнено условие (3.1.23), и, сле- довательно, управление с минимальной энергией имеет вид (3.1.24). Теорема доказана. Замечание. Условие (3.1.23) не очень удобно при анализе конкретных примеров, так как оно связано с не- обходимостью вычислять коэффициенты Фурье функции ф(х), а затем исследовать сходимость ряда, входящего
188 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III в (3.1.23). Однако оказывается, что можно указать лег- ко проверяемые достаточные условия на ф (х), при вы- полнении которых имеет место неравенство (3.1.23). Вы- вести их можно следующим образом (см., Например, [7], стр. 137). Возьмем произвольные абсолютно непрерывные функции Т(х) и Ф(х), удовлетворяющие условиям о'(0) =0, о'(1)+ао(1) =0. (3.1.31) Тогда билинейная форма D (Ф, Т) - j Ф' (х) Т (х) dx + аФ (1) ф (1) О будет ограничена и 7)(Ф, Ф) ^0, причем равенство имеет место лишь при Ф(х) s0. Легко видеть, что D(Xn, ¥) =^фл, где ф„= j Т (х)Х„ (x)rfx, о а Х„(х) — собственные функции краевой задачи X" + VX-=0, 0<х<1, Х'(0)=0, Х'(1) + <хХ(1) =0. Полагая N Т"(х) = % ф„Х„(х), находим, что D(T (х) -Т"(х), Т (х) -(х)) = D (Т, У)- П=1 Отсюда следует, что 2 ¥). П=1
ПРОБЛЕМА МОМЕНТОВ 189 § 3.1] Следовательно, ряд, входящий в условие (3.1.23), схо- дится для любой абсолютно непрерывной функции Т (х), удовлетворяющей условиям (3.1.31). б) Пусть F=ty(t)p(x). В этом случае оптимальное управление ищется в виде (3.1.16), и для определения коэффициентов рп имеем последовательность уравнений (3.1.17). Из этих уравнений рп определяются однознач- но, если величины £ -№аг(Т-Ц а„ = je " ф(/)4#иф„ о одновременно не равны нулю. Тогда Рп = ^. (3.1.32) “п Если ф„=0, а ап=/=0, тор„=0. Если жеф„=/=0, а а„= =0, то для этого ап уравнение (3.1.17) не имеет реше- ния, и, следовательно, задача об управлении с мини- мальной энергией не имеет решения. Поскольку нас интересует решение системы (31.17), на котором функционал (3.1.18) ограничен, то согласно (3.1.32) задача об управлении с минимальной энергией будет иметь решение, если Таким образом, имеет место Теорема 1.2. Пусть управляемый процесс описыва,- ется краевой задачей (3.1.1) — (3.1.3), в которой F = =ф(/)р(х), где ф(0—заданная функция из L2(0, Г), а допустимыми управлениями являются любые функции р(х), принадлежащие L2(0, 1). Тогда, если не существует такого п (п=1, 2, ...), что ф„^=0 и а„=0 и ряд (3.1.33) сходится, то задача об уп- равлении с минимальной энергией имеет единственное решение, и оптимальное управление имеет вид Р(х) = 2 — ХП(Х). _ - «л
190 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Если же хотя бы при одном п одновременно выполне- ны соотношения ^„5^0, а„=0, то задача об управлении с минимальной энергией не имеет решения. в) В случае, когда F=6(t—ta)p(x), коэффициенты рп, согласно уравнениям (3.1.19), имеют вид К*аЦТ-1,) Рп = е фл и условие разрешимости задачи об управлении с мини- мальной энергией имеет вид Подводя итоги выполненному анализу, можно сде- лать следующие выводы. 1. Во всех рассмотренных вариантах задача об управ- лении с минимальной энергией может быть сформулиро- вана в терминах проблемы моментов. 2. Все рассмотренные здесь задачи распадаются на две группы. К первой группе относятся те задачи, кото- рые имеют решения, легко определяемые элементарны- ми методами. Они соответствуют следующим частным типам функции F, входящей в правую часть уравнения (3.1.1): a) F=p-, б) F=q(t)p(x)- в) F=d(t—t,)p(x). Соответствующие утверждения об их разрешимости сфор- мулированы в виде теорем 1.1 и 1.2. Ко второй группе относятся задачи, которые сводят- ся к следующей бесконечномерной проблеме моментов. Среди всевозможных функций p(t)eL2(0, Т) требуется найти функцию ро(О такую, чтобы она удовлетворяла бесконечной системе J е p(i)dt = bn, п = 1, 2, ... о и доставляла минимальное значение функционалу /=11рН2, где постоянные Ьп и заданы. Эти задачи соответствуют следующим типам функ- ции F в (3.1.1): г) Г=ф(х)р(0; д) F=6(x—x<l)p(t).
$ 3.2] ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 191 Их исследование проведем в § 3.3 на основе аппа- рата вариационных методов математической физики. Эти методы широко используются при решении краевых задач для уравнений с частными производными (см., на- пример, [2—3]). Как показывает содержание § 3.3, с их помощью удается получить нетривиальные результаты и в бесконечномерной проблеме моментов, возникающей при исследовании управления с минимальной энергией. § 3.2. Вариационные методы решения уравнений первого рода В предыдущем параграфе было показано, что зада- ча об управлении с минимальной энергией для уравнения (3.1.1) с дополнительными условиями (3.1.2) и (3.1.3) при F=q(x)p(t) или F=d(x—x0)p(t) сводится к отыска- нию решений системы уравнений вида £ -Кга‘(Т-1) ап\е п p(t)dt = ^n, п —1,2, ... (3.2.1) О (см. (3.1.20) и (3.1.22)). Такие же уравнения будут встречаться в дальнейшем. Поэтому естественно рас- смотреть вопросы существования их решения и единст- венности в том или ином классе функций p(t). Весьма полезным для этих целей оказывается аппарат вариаци- онных методов математической физики. Детальное изло- жение этих методов можно найти в [2, 3]. Здесь ограни- чимся лишь кратким изложением некоторых фактов этой теории и анализом иллюстративных примеров. Пусть Н — вещественное гильбертово пространство, скалярное произведение и норму в котором будем обо- значать через («, и) и ||м|| соответственно. Линейный (однородный и аддитивный) оператор А, действующий из Н в Н, будем называть симметричным, если он определен на плотном в Н множестве DA, и для любых и v^Da справедливо равенство (Au, v) = (u, Av). Если, кроме того, выполнено неравенство (Аи, и)^0,
192 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ 111 где равенство достигается лишь на нулевом элементе (т. е. при ||и||=0), то А называется положительным опе- ратором. Теорема 2.1. Если оператор А положителен, то урав- нение Au=f, f(=H (3.2.2) не может иметь более одного решения. Доказательство. Допустим, что и^Н и и2^Н — два различных решения уравнения (3.2.2). Тогда v = Ui—и2 является решением однородного уравне- ния Av=0. Отсюда следует, что (о, Av) =0 и поэтому ||и||=0, т. е. и, = и2. Теорема 2.2. При положительном операторе А реше- ние уравнения (3.2.2) минимизирует функционал F(u) = (и, Au) — 2(f, и) (3.2.3) и обратно, если ыое£)л и F (м0) = minF(M), иеН то «о — решение уравнения (3.2.2). Доказательство. Пусть «0 — решение уравне- ния (3.2.2), а V — произвольный элемент из Н. Тогда, по- лагай о—Uo—ti, будем иметь F(o) = (4(«0+t]), «о+т|)— 2(f, «о+п). Тай как Ли0=/, то F(o) =F(«0) + (Лт), г,). Отсюда в силу положительности оператора А следует, что F{u0) = minF(y). v^H Пусть теперь «о —элемент, на котором F{u) достигает своего минимального значения. В силу линейности опе- ратора следует, что DA — линеал, т. е. из того, что x\^DA, следует: при любом вещественном числе X. В си- лу определения и0 выполняется неравенство F(u0+Xi]) >/7(ы0) при любом
ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 193 § 3.2] т. е. 2Х(Лм0—f, т])+Х2(Лт], т])>0. Это неравенство должно выполняться при любом веще- ственном X, что возможно лишь при выполнении условия (Л и»—f, т])=0. которое означает, что элемент Ащ—f — ортогонален лю- бому элементу из DA. Так как DA является плотным мно- жеством Н (см. определение симметричного оператора), то элемент Ащ—f ортогонален любому элементу оеЯ и, следовательно, Ащ—f=0, что и требовалось доказать. Доказанная теорема устанавливает связь между урав- нением (3.2.2) и функционалом (3.2.3). Ее главное достоинство заключается в том, что она дает практический путь построения решения уравнения (3.2.2), основанный на использовании функционала (3.2.3). Однако она не доказывает существования тако- го решения. Необходимые теоремы существования мож- но получить на основе более детального анализа опера- тора Л и связанного с ним так называемого энергетиче- ского пространства НА, определяемого следующим об- разом. На множестве DA определим скалярное произведение и норму по формулам [и, v]= (Au, v), [н]=У(Ли, и) и пополним Da по норме [и]. Полученное полное гильбер- тово пространство называется энергетическим простран- ством оператора Л. Его свойства играют решающую роль в доказательстве существования элемента, минимизиру- ющего функционал F(y). 1. Случай положительно определенного оператора А, Положительный оператор Л называется положительно определенным в Н, если существует положительная по- стоянная у такая, что (Ли, и) >у||и||2 для любого Энергетическое пространство НА та- кого оператора не содержит элементов, не принадлежа- щих Н (см. [2], стр. 76). Поэтому для всех иеЯ* имеет 7 А» И. Егоров
194 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III место неравенство |(А 4-IW' УТ где f — элемент, входящий в правую часть уравнения (3.2.2). Из этого неравенства следует, что функционал (f, и) ограничен в Нл. Его аддитивность очевидна. Сле- довательно, он линеен в Нл и по теореме Риоса сущест- вует элемент и^Нл такой, что (А «)-(«„ «]. (3.2.4) Отсюда находим, что функционал (3.2.3) можно пред- ставить в виде F (и) =[«—«„]’—{и»]2 и, таким образом, получаем, что функционал F достига- ет своего наименьшего значения на элементе щ. Теорема 2.3. В случае положительно определенного оператора А всегда существует элемент u9^HAczH, оп- ределяемый формулой (3.2.4), на котором функционал (3.2.3) достигает своего наименьшего значения. Если ИвеДл^то «о является решением уравнения (3.2.2). Если же то этот элемент называется обобщенным ре- шением уравнения (3.2.2). Полученный результат позволяет получить аналити- ческий вид (обычного или обобщенного) решения урав- нения (3.2.2) в том случае, когда Н — сепарабельное пространство. В самом деле, в этом Случае Нл также сепарабельно (см. [2], стр. 82) и, следовательно, в нем существует пол- ная ортонормированная система {©„}, а элемент ы0, ми- нимизирующий функционал (3.2.3), можно представить в виде «0 = 5} 1«0.<М®Л- П=1 Полагая в (3.2.4) «=<вя, находим, что «о = 3 <**) <»*• (3.2.5)
$ 3.2) ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИИ 195 В качестве приближенного решения можно брать элемент N и? = 2 который по известной теореме анализа (см., например, [6]) дает наилучшее в Нл приближение элементу и0 среди всех элементов вида «= 2 ап“п- Таким образом, задача построения (точного или при- ближенного) аналитического представления элемента u# сводится к отысканию полной ортонормированной в Нл системы {(£»„}, а эта задача в свою очередь сводится к по- строению полной ортонормированной в Н системы соб- ственных элементов фп оператора А и соответствующих им собственных значений (см. [3], стр. 211, 212). Если последняя задача имеет решение, то i- -L (оЛ = Кп <рЛ, и тогда решение (3.2.5) можно представить в виде 00 «о = 2 П=1 (<рп. Я (3.2.6) а соответствующие приближения 'Ст П /Я О 74 «о=2-Г__ <Рп (3.2.7) Л—1 " будут обладать свойством ||Яи*~ Л!-*-О при У->оо. Весьма важным свойством метода аппроксимации точного решения, основанного на построении приближе- ний (3.2.7), является его устойчивость относительно ма- лых погрешностей в вычислениях, т. е. такие погрешно- сти не вносят существенных изменений в величину к» (см. {3D.
196 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III 2. Случай положительного оператора А. Будем теперь предполагать, что А — положительный оператор, однако не существует постоянной у>0 такой, что выполняется неравенство (Аи, и) >у||< для всех u^DA. В этом случае мы не можем воспользоваться теоре- мой 2.3 для доказательства существования элемента и^Нл, минимизирующего функционал (3.2.3), ибо те- перь НА содержит элементы, не принадлежащие Н. Функционал (3.2.3) запишем в виде F(H)=[uF-2(f, «) и будем рассматривать его на элементах u^DA. Множе- ство Da плотно в Я и Яа в соответствующих им метри- ках. При этом функционал (f, Я) аддитивен и однороден на Da. Если он ограничен на DA в метрике НА, т. е. I (f» “) I при всех ие£>л, (3.2.8) то его можно продолжить на все пространство НА с со- хранением нормы. Обозначая этот продолженный функ- ционал через I, вместо функционала F(u) можно рас- сматривать функционал Л(«)=[«]— 2(1, и), (3.2.9) который определен на всем пространстве НА и при этом Fl(u)=F(u) при «еРл. По теореме Рисса существует элемент и^НА такой, что (/, и) «], и, следователь- но, можно записать Л («)=[«—и0]2—(«.Г. Отсюда следует, что и, минимизирует функционал Л на НА, т. е. Л(«#)СЛ(«) при всех иеЯл. Если то Ft(«0) =F(ue) и и« является решением уравнения Au=f. В том случае, когда щ&ВА, уравнение Au—f не имеет решения на DA и элемент иа является об- общенным его решением. Главная особенность этого ре- шения заключается в том, что (Л«о, ue) <оо, т. е. оно име- ет ограниченную энергетическую норму. Таким образом,
$ 3.21 ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 197 при выполнении условия (3.2.8) уравнение (3.2.2) имеет решение (обычное или обобщенное). Можно показать (см. (3]), что это условие является также и необходимым для того, чтобы уравнение (3.2.2) имело решение в ЯЛ- Учитывая этот факт, можно сформулировать следующее утверждение. Теорема 2.4. Если оператор А положителен, но не яв- ляется положительно определенным, то для того, чтобы уравнение (3.2.2) имело решение «0 в Нл, необходимо и достаточно выполнение условия (3.2.8). Теперь рассмотрим вопрос о построении ил. С этой целью предположим, что И сепарабельно. Тогда НА так- же сепарабельно и в нем существует полная ортонорми- рованная система элементов {«>„}. Поэтому элемент и^Нл можно представить в виде «о = 3 1«о> П=1 По построению этот элемент минимизирует функцио- нал (3.2.9), в котором (/, и) можно представить в виде (Z, и) =[«0, и]. Полагая здесь ы=®„, находим, что «0 = 3 (^®п)®„. • П~1 Если п=1, 2, ..., то (/, ип) = (f, ю„) и полу- чаем «о = 3 ®»)Шп’ (3.2.10) П=1 т. е. в этом случае решение получается в том же виде, в каком оно было получено, когда А был положительно определенным оператором (см. (3.2.5)). В качестве при- ближенного решения можно брать элемент лг
198 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III который дает наилучшую в Н аппроксимацию среди всех элементов вида и = 2 а«сол. (3.2-..11) Однако этот метод аппроксимации теперь обладает весьма неприятным свойством, которое состоит в том, что он неустойчив относительно погрешностей в вычислениях: малые погрешности в вычислениях <оп и (f, оп) могут привести к существенным погрешностям в и^. При этом с возрастанием Я такие погрешности обычно могут увеличиваться (см. [2], стр. 49). Следовательно, указан- ный способ построения приближений решения и0 не- пригоден для практического использования. Нужны другие способы аппроксимации, свободные от этого не- достатка. 3. О приближенном решении уравнения (3.2.2) с по- ложительным оператором А. В этом пункте рассмотрим один из методов приближенного решения уравнения (3.2.2), устойчивый относительно погрешностей в проме- жуточных вычислениях. При этом будем предполагать, что Я сепарабельно, а спектр оператора А является чи- сто точечным (см., например, [6]). Кроме того, будем предполагать, что все собственные элементы этого опе- ратора принадлежат DA. Простейшим примером опе- ратора такого типа является оператор Фредголь- ма в Lx(0, 1), который определяется следующим об- разом. Пусть функция k(t, s) определена в квадрате 0^/, и оо; о • оператор k, определяемый формулой 11 = f k (t, s) <p (s) ds, <p <= Lt (0, 1),
§ 3.21 ВАРИАЦИОННЫЙ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ Щ называется оператором Фредгольма. Он будет положи- тельным, если k(t, s)=k(s, t) и имеет место неравенство »»Я>(ОфО)’<^^»°1Для всехрре^ДО.Ч), (3.2.12) причем равенство достигается лишь при фв^О. Прежде всего докажем, что точка Х»=0 принадлежит спектру оператора А, но не является его собственным значением. Очевидно, что Хо=О — не собственное значе- ние, ибо в противном случае для соответствующего ему собственного элемента ф0, ||<р0|| = 1, имело бы место ра- венство (Лфо, ф0) =Л,о1|фо1|2=0|1фо||2=0, что противоречит предположению о положительности оператора А. Докажем, что является предельной точ- кой для собственных значений. Предположим противное, т. е. что все собственные значения лежат правее точки %0+б, где б — некоторое фиксированное положительное число. Так как А не является положительно определенным оператором, то для любого п существует элемент ил из DA такой, что (Аап, МС-Ы2- (3.2.13) п \ По определению ортонормированных собственных эле- ментов имеем Лфж=Хяф» и,следовательно, (Л ф», фш) тб«м|Ля, где 6„т — символ Кронекера. Так как u,sH, то его можно представить в виде и» = 3 ^фт’ где 3 W = II М«Г- (3.2.14)
2бО УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Поэтому из (3.2.13) и (3.2.14) имеем зца<;2<а-. т=1 Так как, по предположению, 6<%m, m=l, 2, ..., то д2(4)2<2М4)а. т=1 /п=1 Из двух последних неравенств следует, что б<1/п при любом п. Полученное соотношение противоречит пред- положению о том, что 6 — фиксированное положитель- ное число. Таким образом, %о=О — предельная точка для собст- венных значений задачи и, следовательно, принадлежит спектру оператора А. Теорема 2.5. Если элемент f^H таков, что его коэф- фициенты Фурье f„=(f, фп) удовлетворяют условию (<pn<=DA, п=1,2,...) то уравнение Au=f (3.2.15) имеет единственное решение v^HA. Доказательство. Для доказательства доста- точно установить (см. теоремы 2.3 и 2.4), что при выпол- нении условий теоремы функционал (f, и), определенный на элементах ограничен в метрике ЯА, т. е. суще- ствует константа Я>0 такая, что |(А «)|^М«] для всех u^Da. Итак, пусть иеЯА, т. е. [ff, 2]<со. Тогда, полагая и = 2 Ипфп’ п==1
§ 3.2] ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 201 находим, что [и, и] = 2 Мп< сю. П=1 Следовательно, если ТО 00 КА «)1 = S ^“л п=1 П=1 что и требовалось доказать. Одним из естественных способов приближенного ре- шения уравнения (3.2.15) является следующий. Пусть N ад>л. П=1 Тогда в качестве приближенного решения уравнения (3.2.15) берется элемент и", определяемый из уравнения Ли=^. (3.2.16) Теорема 2.6. При выполнении условий теоремы 2.5 решение уравнения (3.2.16) сходится к решению уравне- ния (3.2.15) в метрике Нл при ЛГ->оо. Доказательство. Из (3.2.15) и (3.2.16) нахо- дим, что решения этих уравнений можно представить в виде следовательно, 00 [и — и"]2 = (Л {и — иы), и — uN) = 2 ->0 при W->-оо. /I А- zi=W+l п
202 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Теорема 2.7. Решение уравнения (3.2.15) неустойчиво в НА относительно малых в Н изменений f, т. е. если и0 и ип — решения уравнений Au=fQ и Au—fn соответственно, то из того, что ||f°—fw||->0 при п->оо, вообще говоря, не следует, что [и°—ип} 0. Доказательство. Пусть /• = ЗГлк, {«1 i=li И I - П2 = 3 (/? - f?)3 -> 0 при п -> ОО. z=i Тогда очевидно, что = 5} м’фъ ип = ? А. где и°{ = , и" = , г-i г-? и, следовательно, оо tf»___ «п\4 [и" —«"]’ = V t=i Так как %4-»-0 при п->оо, то из стремления к нулю ве- личины (ft — ftf далеко не всегда будет следовать, что "t при п—>• ОО. Теорема доказана. . Для характеристики влияния изменений оператора А на решение уравнения (3.2.15) представляют определен- ный интерес две следующие теоремы (см. [2]). Вместе с уравнением (3.2.15) рассмотрим уравнение Bu=f, (3.2.17) где В — также самосопряженный положительный опе- ратор.
«3.2] ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 203 Предположим, что энергетические пространства Нл Нв состоят из одних и тех же элементов. Теорема 2.8. Если энергетические нормы в Нл и Нв эквивалентны, т. е. существуют положительные постоян- ные аир такие, что а[«&< [«Й< Р[«& (3.2.18) то уравнение (3.2.17) имеет единственное решение щ с конечной энергией [«JB и при этом выполняются нера- венства [«о — «1]л < П [«1]а, (3.2.19) где и» — решение уравнения (3.2.15), а n-maxf 1^=11 IP"1 П П-тах| а —J. Доказательство. Итак, предполагается, что уравнение (3.2.15) имеет решение, и, следовательно, вы- полнено условие I (А «) | Мл, Л/=const. Учитывая (3.2.18), отсюда получаем | (А и) |<ЛГвИв, Nb=N^, что согласно теореме 2.4 доказывает существование ре- шения Mt уравнения (3.2.17). Если воспользоваться общим видом линейного функ- ционала (А и) в Нв, то получаем (см. формулу (3.2.4) и далее) (А «) =[«, “lb- Поэтому, рассматривая всевозможные элементы и^Нв, мы получим некоторое множество элементов f^HB, ко- торые в свою очередь определят множество решений уравнения (3.2.15) по формуле (А «) -{«, «о]л.
204 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. IH Тем самым определен оператор, отображающий ut в и0: ы0 = Ти1, который согласно двум последним равенствам ( обладает свойством [«, Ти1]л=[и, ut]B. Полагая здесь и=и1г находим, что [«!, Тщ\А = [М1]в> 0 при Ht=/= 0, ' откуда следует, что Т — самосопряженный в НА опера- ( тор, который в силу неравенств (3.2.18) удовлетворяет условиям “ [^1, Ти1]в^ — [М1]д, р а и поэтому его спектр заключен на отрезке [р~‘, а-*], а спектр оператора Т—I принадлежит отрезку [р_|—1, Отсюда следует, что [Т - I]A < max (1^11, ( а р J I ti Тем самым первое неравенство в (3.2.19) доказано, ибо | [и,—«„]=[«,—| Для вывода второго неравенства вместо В возьмем . оператор kB, где k — некоторая вещественная постоян- g ная. Тогда во всех предыдущих формулах элемент Ut I нужно заменить на -7- ut, а числа а и В — на а/£ и 0/£ со- I Я 1 ответственно. В результате вместо первого неравенства в (3.2.19) будем иметь [4-«1 — «о] <П [«о!а, где n = maxfl a~~fe' , ^7*')• 1 Lk Jx I a P ) Минимизируя величину tj* по переменной k, приходим ко второму неравенству в (3.2.19). Замечание 1. В доказательстве нигде не исполь- зованы предположения о спектре оператора А и его соб- ственных элементах.
§ 3.2] ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИИ 205 Поэтому теорема верна для любых положительных операторов А и В. Замечание 2. При практическом использовании уравнения (3.2.17) для определения приближенного ре- шения (3.2.15), нужно иметь в виду, что теорема 2.8 да- ет достаточно точную оценку погрешности лишь при ус- ловии, что аир близки к единице (см. величину т] в (3.2.19)). Кроме того, с практической точки зрения при- менение полученного результата может быть затруднено в части, связанной с доказательством того, что исход- ный А и аппроксимирующий В операторы содержат одни и те же элементы с эквивалентными энергетическими нор- мами. С вычислительной точки зрения представляет интерес анализ случая, когда в уравнении (3.2.15) оператор А и элемент f вычисляются приближенно, т. е. вместе с этим уравнением рассматривается семейство уравнений Anx=fn, fnt=H, n=l, 2, ..., (3.2.20) где операторы Ап положительны при любом п и облада- ют всеми теми свойствами, о которых говорилось в на- чале пункта. Кроме того, предполагается, что НЛ—Л„||н —>0, Ilf—f„|| ->0 при оо. В рассматриваемых нами задачах такая ситуация воз- никает, например, при построении приближенного реше- ния бесконечномерной проблемы моментов (см., (3.1.20)) т„ K*a‘(t-T) Се p(t)di = bn, n =1,2, ... (3.2.21) « Если предположить, что в некотором классе функций р (/) эта бесконечная система уравнений имеет единст- венное решение р0(/), то естественный (по крайней мере, на первый взгляд) путь приближенного решения задачи состоит в отыскании управления Pnft), которое удовле- творяет системе W уравнений Т Х4а’(/-П fen p(t)dt = bn, n=l,2,...,N. (3.2.22) О
206 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. lit В эту (укороченную) систему входят числа Кп, кото- рые удовлетворяют уравнению XtgA=a (см. (3.1.7) и выше). Практически их можно определить лишь при- ближенно и поэтому при численных расчетах мы вынуж- дены вместо (3.2.22) использовать систему Je”" p{t)dt^bn, п-1,2, ...» N, о где и Ъя — некоторые приближения чисел и Ьп со- ответственно. В результате оказывается, что при пост- роении приближений p(t) оператор А не только заменя- ется его конечномерной проекцией, но и несколько иска- жается за счет замены X» на X». Поэтому представляет интерес изучение свойств ре- шений уравнения (3.2.20) при п->оо. При этом прежде всего следует отметить, что подобные вопросы являются предметом изучения теории возмущения линейных опе- раторов (см., например [4]), а также теории устойчиво- сти численных методов приближенного решения уравне- ний (см., например., [2]). Анализ примера с проблемой моментов (см. (3.2.21)) показывает, что здесь мы не мо- жем воспользоваться предыдущей теоремой, ибо опера- торы А„ могут оказаться конечномерными, т. е. они оп- ределены лишь в конечномерном пространстве. Поэтому не имеет смысла говорить об эквивалентности энергети- ческих норм в Нл и Нап- Для детального анализа связей, которые существуют между решениями уравнений (3.2.15) и (3.2.20) и кото- рые нам потребуются в дальнейшем, рассмотрим два случая. 1. Ап является проекцией оператора на подпростран- ство, порожденное п первыми собственными элементами оператора А. 2. Ап является той же проекцией, но вычисленной с некоторой погрешностью. Итак, сначала рассмотрим первый случай. Пусть xf — i-й собственный элемент оператора А, т. е. Ах<=Х1х(, a Ht — одномерное пространство, порождаемое этим элементом, т. е. множество элементов из Н, представи- мых в виде х—ах{, где a — любое вещественное число.
5 3.2J ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИИ 207 Оператор Р(, определенный формулой Pfx= (х, xt)xt, х^Н, называется оператором проектирования Н на Ht. Его про- стейшие свойства (см. [6], стр. 249): а) Р(Р}=8(}, б«, j — символ Кронекера, б) Л = 2 п—1 Таким образом, согласно предположению, оператор Л„ можно представить в виде Л„ ~ f=l и условие ||ЛЯ—Л||->0 при п->оо будет выполняться, если £=1 Считая, что это неравенство имеет место, можно срав- нить решения уравнений. Легко устанавливается, что ре- шениями уравнений (3.2.16) и (3.2.20) являются эле- менты п f ОО f m=i т и поэтому (х”—х]->-0 при п->оо. Полученный результат означает, что если Л„ является оператором проектирова- ния Л на га-мерное пространство, порожденное п собст- венными элементами оператора Л, и выполнено условие (%), то решение n-го уравнения из (3.2.20) сходится в Нх к решению уравнения (3.2.15) при п-»-оо. Пусть теперь Л„ является результатом приближенно- го вычисления оператора проектирования на подпрост- т* ранство, натянутое на <рь ..., <р„, т. е. ЛП=В„+ГП, где Вп — оператор проектирования, а Г„ — оператор, опре- °° деляющий ошибку вычислений, допущенных при построе- нии Вп. Если, кроме того, правая часть уравнения
208 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III (3.2.20) вычисляется с ошибкой бп, то практически вме- сто уравнения (3.2.20) решается уравнение (B»+r„)x=fn+S». (3.2.23) Поэтому естественно рассмотреть, насколько решение х=уп уравнения (3.2.23) уклоняется от решения х=хп уравнения (3.2.20). Определение [8]. Процесс нахождения решений хп уравнений (3.2.20) называется о-устойчивым, если вы- полнены два следующих условия: 1) стремление к нулю отношения ^прии->оо (3.2.24) I l^nl I обеспечивает существование операторов (В„+Гп)~* (по крайней мере для достаточно больших п); I 2) стремление к нулю отношений (3.2.24), а также 1 отношения ’ ИМ обеспечивает стремление к нулю величины II*” —yn II . ИЛ Непосредственные вычисления, которые легко можно , выполнить (см. [8], стр. 22—23), показывают, что И-УЧ1 < И(Д„) Л|Г„|| |Щ ИЛ fO Jir„ll(l|B„ll 11/„ИГ и,'"'Гм гдеи(В.)=||В.||.||#||. Приведем здесь без доказательства важную теоре- му, которая дает исчерпывающий ответ на вопрос об устойчивости процедуры построения последовательно- а сти {хп}. » Теорема 2.9. Для того чтобы процесс нахождения по- 1 следовательности {хп} был о-устойчивым, необходимо и 1
5 3.2] ВАРИАЦИОННЫЕ МЕТОДЫ РЕШЕНИЯ УРАВНЕНИЙ 209 достаточно, чтобы последовательность {ц,(В„)} была ог- раниченной. 4. Регуляризация решения уравнения с положитель- ным оператором. В предыдущем пункте были приведены некоторые теоремы, позволяющие оценить меру уклоне- ния приближенных решений от точного решения уравне- ния (3.2.15). При этом теорема 2.9 дает практическую рекомендацию по выбору координатных элементов в ме- тоде Ритца. В этом пункте излагается другой способ по- строения приближенных решений этого же уравнения (3.2.15), не связанный с координатной системой. Как и прежде, будем предполагать, что А — положительный оператор с точечным спектром, причем ... > ... >0 и lim Х„=0 при п->со. Теорема 2.10. Если А — положительный оператор в Н с точечным спектром, {<рп} — его полная ортонормиро- ванная система собственных элементов, <pneZ)A, a f удов- летворяет условию теоремы 2.5, то lim [и —и (Р)] = 0, (*) р-ю где и(Р) — решение уравнения р«(р)4-Ли(р)=Д р>0. (Р) Доказательство. Уравнение (Р) однозначно разрешимо в Н при любом р>0, ибо оператор р/+Л удовлетворяет условию ((р/+Л)и, «)>р||ы||\ иеЯ и, следовательно, является положительно определенным. В силу предположения относительно f, находим, что уравнение (3.2.15) однозначно разрешимо в Нл. Остает- ся доказать, что имеет место равенство (♦). Полагая «(₽) = 3 Un фл’ f = 3 ^пфп’ П=1 П=1 из уравнения (Р) находим, что
210 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. Ill и, следовательно, fn *л+₽ фп. Так как уравнение (3.2.15) имеет решение 00 f И %п^Хп+1, то < р’ £ А+ у 1 ^+р)’£А Л!+А . Пусть е — произвольно малое число. Выберем N на- столько большим, чтобы OQ ^L<- n=N+i 2 Это можно сделать в силу предположения об элемен- те f. Зафиксируем такое N и по нему определим 0 из ус- ловия Р* £ (VI-Р)8 2 • Тогда будем иметь, что при выбранных таким способом N и 0 будет выполняться неравенство [и—а(0)]<8, что и требовалось доказать. Замечание. Из проведенного доказательства лег- ко получается практический способ выбора величины 0 для получения заданной точности аппроксимации реше- ния и уравнения (3.2.15) с помощью элемента «(0).
5 зз] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ ЧН § 3.3. Управление с минимальной энергией В § 1 настоящей главы были сформулированы раз* личные задачи об управлении с минимальной энергией для уравнения теплопроводности с однородными гранич- ными условиями (см. (3.1.1)—(3.1.3) и далее). При этом предполагалось, что управляющая функция постановкой задачи может быть подчинена различным ограничениям, а именно накладывались ограничения на форму ее зави- симости от времени t и пространственной координаты х. В результате оказалось, что в отдельных случаях задача решается элементарно. В других, более сложных ситуа- циях она может быть сведена к проблеме моментов сле- дующего вида (см. (3.1.20), (3.1.21) и (3.1.22)). Среди управлений p(f)eL»(0, Т), удовлетворяющих условиям р" p(t)dt — bn, п-1,2............ (3.3.1) О где {&п} — заданная последовательность вещественных чисел, требуется найти управление, на котором функцио- нал т (3.3.2) о принимает наименьшее возможное значение. Здесь Т фиксировано. В этом параграфе мы приведем результаты исследо- вания этой задачи, но сначала покажем, что аналогич- ная проблема моментов появляется при определении уп- равления с минимальной энергией, когда управляющая функция входит в граничное условие краевой задачи, опи- сывающей процесс. 1. Управляемый процесс, описываемый краевой зада- чей с неоднородными граничными условиями. Итак, бу- дем предполагать, что управляемый процесс характери- зуется функцией u(t, х), которая внутри области Q={0^x^l, удовлетворяет уравнению lb==U~. (3.3.3)
212 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. III а на границе Q удовлетворяет начальному и граничным условиям ы(0,х) = ux(t, 0) = 0, 1 (3.3.4) ux(t, 1) = а [р(0— u(/,l)], a = const>0, ) где p(t) —управляющая функция, принадлежащая L2(0, Т). Момент времени t=T считается фиксированным. В [5] показано, что каждому управлению p(t) соот- ветствует единственная функция u(t, (Q), кото- рая почти при всех /0 и t, из отрезка [0, Т] удовлетворяет интегральному тождеству («ф|й:л+ f + J J L дх дх ] о Q(/0.*i) + a J [p (0 — и (t, 1)] Ф (t, 1) dt = 0 (3.3.5) ^0 и условию и((, x)55-0 при /->4-0. Здесь Ф — любая функция из H7J’1 (Q), а Q(tt, tt) — = {/0<^<Л, 0<х< 1}. Функцию u(t, х), определяемую интегральным тождеством (3.3.5), можно представить в виде (сравните с (3.1.9)) ОО и (/, х) — а cos cos (V) f , . , -----------------। p (t) e ax, ып J (3.3.6) где An — положительные корни . уравнения A tg A=a, а A V + a + a2 <0„ = cos2 knxdx = n -, (3.3.7) J 2 (A.2 4-a2) (n— 1)л<А„<пл, lim 1. n-»oo An Рассматриваемая нами задача состоит в следующем.
$ 3.3) УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 213 Среди всех управлений p(t)^L2 (О, Г) требуется най- ти управление р0(1) такое, чтобы соответствующее ему решение (3.3.6) краевой задачи (3.3.3) — (3.3.4) удовле- творяло условию 1 lim f [и (t, х) — и0 (х)]2 dx = 0, (3.3.8) Т-о J о где uQ(x) —заданная функция из £2(0, 1), и на этом уп- равлении функционал (3.3.2) принимал наименьшее воз- можное значение. Прежде всего отметим, что в силу линейности крае- вой задачи (3.3.3) — (3.3.4) и выпуклости функционала / оптимальное управление единственно (если оно сущест- вует). Поэтому речь будет идти об отыскании условий, при которых такое управление может существовать, и о способах построения его приближений. Если предположить, что оптимальное управление су- ществует, то, разлагая функцию и0(х) в ряд Фурье “ „ cos Л„х . р «о (х) = 2 . «п = \ «о (*)cos ^пХ dx, (3.3.9) п=1 0J и, учитывая соотношения (3.3.6) и (3.3.8), получаем Т №(t-T) acosX„ J р (t)e " dr — Un, n = 1, 2, ... (3.3.10) о Таким образом, для определения оптимального уп- равления получаем проблему моментов, аналогичную той, которая появилась при решении задач об управлении с минимальной энергией, когда управляющая функция входит в уравнение, описывающее процесс. 2. Предварительный анализ проблемы моментов. Бу- дем рассматривать следующую проблему моментов. Найти функцию p(Z)eZ.2(0, Т), удовлетворяющую бес- конечной системе уравнений £ л ^p(t)en dt = bn, n = 1,2, ... (3.3.11) О
214 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. Ill и при этом минимизирующую функционал (3.3.2). Отно- сительно постоянных Ьп будем предполагать, что 2 bl < оо, т. е. b = {&ь Ь2, ...} е= Z2. (3.3.12) "=i Через /2 обычно обозначают вещественное гильбертово пространство последовательностей {&„}, удовлетворяю- щих условию (3.3.12) (см., например, [6]). Для решения задачи в пространстве £2(0, Т) выде- лим линейное многообразие Мк элементов, представлен- ных в виде 00 ХМ/-Л » (3.3.13) П— где ап — постоянные, которые, очевидно, должны удов- летворять условию 2 Л1пАа„а*< оо Ч+Ч ибо p(f)eL2(0, Т). Многообразие Мк замкнем в метрике пространства L2(0, Т) и полученное пространство обозна- чим через Н>.. Таким образом, к относятся все элемен- ты вида (3.3.13) и элементы p(t) из Lx(0, Т), которые определяются условием р(р> Р«) ->0 при п-*-оо, где {ря}—любая фундаментальная в L2(0, Г) последо- вательность элементов из Мк, ар — метрика в Ls. Не занимаясь пока детальным анализом структуры пространства Нк, отметим, что Я2<=£2(0, Т) и не совпа- дает с Lt (О, Т). Этот факт следует из следующих соображений. Последовательность {Хп} удовлетворяет условию (см. (3.3.7)) 1 2 V fl=l ос,
$3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 215 Г) и согласно теореме Мюнца система функций {е п } не является полной в L3(0, Т), т. е. существуют функции q(t)^Lt(O, Т) такие, что р(0’еdt = О,**Гп = 1, 2, ..., О а следовательно, для любой pK(t)eMK выполнено условие т $q(t)PK(t)'di = O. (3.3.14) • Отсюда следует, что это равенство выполняется и для любой функции из Я*.. Учитывая этот факт, можно воспользоваться извест- ной леммой из функционального анализа (см. [6], стр. 126), согласно которой произвольную функцию р(/)еЬ2(0, Г) можно однозначно представить в виде Р(0-Л(0+?(0» (3.3.15) где рх(/)еЯ*, а функция q(t) ортогональная pdf), т. е. она удовлетворяет условию (3.3.14). При этом выполня- ется равенство J ра (0 dt = J pl (t) dt + J f (0 dt. £(3.3.16) ООО После этих предварительных рассуждений вернемся к сформулированной проблеме моментов. Подставляя функцию (3.3.15) в левую часть уравне- ния (3.3.11), находим, что т„ г К2(/-Г) j p(t)en dt = ^pK(t)en dt, о о т. е. слагаемое q(f) не влияет на величину левой части уравнений (3.3.11). Вместе, с тем оно согласно (3.3.16) увеличивает величину функционала (3.3.2). Поскольку нас интересует функция p(t), минимизирующая этот функционал при выполнении условий (3.3.11), то из при- веденных рассуждений следует вывод.
216 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Если рассматриваемая проблема моментов имеет ре- шение, то оно принадлежит Нк и, следовательно, его нужно искать не в Ь2 (О, Т), а в подпространстве Нк. 3. Подпространство И\. Для детального анализа свойств функций из Ht, нам потребуются некоторые фак- ты из функционального анализа (см., например, [5]), ко- торые здесь будут сформулированы без доказательств. Пусть М — некоторое множество элементов в гиль- бертовом пространстве Н. М называется минимальной системой в Н, если вычеркивание любого элемента М сужает натянутое на него пространство. Из этого определения, в частности, следует, что любая конечная или бесконечная система ортогональных в Н элементов является минимальной, хотя она может ока- заться и неполной в Н. С другой стороны, любопытные примеры неминимальных систем в L2(0, 1) можно по- строить с помощью теоремы Мюнца, которой мы вос- пользовались выше. Согласно этой теореме последова- тельность {хх"}, Х„>0 полна в L2(0, 1), если 2 = оо. Полагая %„=п, находим, что 2— = °° п и, следовательно, последовательность {*”} полна в L2(0, 1)- Однако она не является минимальной, ибо вы- брасывание любого конечного числа ее элементов не из- меняет равенства 2~ = 0°’ где штрихом отмечено суммирование по показателям тех элементов, которые остались не выброшенными из после- довательности {хп}. Пусть {«„} — последовательность элементов гильбер- това пространства Н. Критерием минимальности этой последовательности может служить следующая (см., на- пример, [2], стр . 18)
§ 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 217 Теорема 3.1. Для того чтобы система {ип} была ми- нимальной, необходимо и достаточно, чтобы существова- ла биортогональная с ней система {un}, т. е. такая, что . (1 при п = т, п, М = . , (О при п=^т. Система {»„} определяется единственным образом, если потребовать, чтобы ее элементы принадлежали подпро- странству, натянутому на систему {«„}. Для исследования свойств функций из Нк нам потре- буется доказать неполноту в L2(0, оо) системы функций О<0<оо, n = 1, 2, ... Для этого достаточно показать, что при любом Хо, О<Ло<Х1, система функций —оо<6<оо^ «==0,1, ... (3.3.17) минимальна. С этой целью построим биортогональную с (3.3.17) систему. Так как 2^ <00, то функция /,_А\ 00 / 1 \ = П -----Л \ Kk' голоморфна при о>0 (Л=о-Н%), не тождественно равна нулю и имеет своими простыми нулями %=А*. Полагая I пл =s г /и _ 7(Х) () (1 + *)’’ () /'(W’4) ’ , находим, что 7*(М=^и, где б» — символ Кронекера. I Функция /*(Х) аналитична в окрестности бесконеч- но удаленной точки и равна в ней нулю. Поэтому она
218 УПРАВЛЕНИЕ с МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. tn представима абсолютно сходящимся интегралом Лапла- са, т. е. существует функция <р*(А) такая, что Ik (X) = J (0) e-^^dQ. (3.3.18) 0 Более того, IФ* (М ILp' < । г (у | ’ где р'— любое число, удовлетворяющее условию р'>1. Из (3.3.18) находим, что о и, следовательно, система линейных функционалов {/J, определяемых формулой 4 (ф) = J <р* (0) Ф (0) 40, Ф (0) е= Lp (0, оо), (3.3.19) О является биортогональной с {е-”***9}. Важным для дальнейшего анализа свойств Нк явля- ется следующее утверждение (см., например, [5]), кото- рое мы приведем без доказательства. Пусть N -ийЛв ^(0)=^«^ к, (3.3.20) *=i| где at — заданные постоянные. Тогда существует посто- янная с, зависящая от Т и р, такая, что I э’ие) ‘ (А р) I («I L^. Если {^(0)}— последовательность нормированных в Ар(0, оо) полиномов вида (3.3.20), которая сходится в А, (0, Т) к функции ^(0), т. е. |&N (0) -(0) |£р(0<Г)0 при N-> оо, (3.3.21)
« 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 219 то согласно теореме Монтеля (см. [5]) можно показать, что #*(0) аналитична и допускает аналитическое продол- жение ^(z), z=0-|-i(T, на полуплоскость 0>О. В силу биортогональности функционалов (3.3.19) на- ходим, что а% в (3.3.20) можно определить по формуле a" ==J^(0)<Me)de О и согласно формуле (3.3.21) a* ~*ak =j5a.(O)<P*(O)d0 при АГ->оо, о т. е. имеет место формальное равенство При этом оказывается, что ряд, стоящий справа в этом равенстве, сходится нормально в каждом угле вида (в, k), где k= ^-~|> и суммой этого ряда является iP(z). Однако сходимость здесь является групповой, т. е. ряд сходится, если его слагаемые собрать в подходящие ко- нечные группы. Отсюда получаем важный для дальнейшего вывод о структуре подпространства Ях. Оно состоит из элемен- тов вида 00 р(0 = 2«'’ , (3.3.22) П—1 где ряд сходится абсолютно и равномерно на любом по- луинтервале [0, Т—в), 0<8<Т. 4. Применение вариационных методов. Итак, будем исходить из того, что если задача об управлении с ми- нимальной энергией имеет решение, то оно имеет вид (3.3.22). Тем самым задача сводится к отысканию
220 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III решения системы уравнений £ -Х2(/-Г) р л p(t)dt = bn, и =1,2............. (3.3.23) о представимого в виде (3.3.22), норма которого 1 = 11д11х.г<о, Г) имеет наименьшее возможное значение. Имея в виду дальнейшие приложения этой задачи к теории оптимального управления, целесообразно считать, что Ьп удовлетворяют условию оо S &л<°°’ П=1 т. е. последовательность b={blt bit ...} можно рассмат- ривать как элемент гильбертова пространства /*. Чтобы воспользоваться вариационными методами для исследования сформулированной проблемы моментов, введем эквивалентную ей задачу отыскания решения бес- конечной системы линейных алгебраических уравнений. С этой целью обозначим через Q множество всевоз- можных функций р»(0> представимых конечными сум- мами N Х2(/-Г) , (3.3.24) k—1 N л где о* — произвольные вещественные числа. Очевидно, что каждая из них принадлежит L4(0, Т) и Q плотно в Н2 в метрике £4(0, Г). Кроме того, ]еп pN(t)di Mnkrf, 0 £=1 гда -/W). ^n + ^ft Обозначим через М бесконечную матрицу {^4«ft}n,ft—i.
§ 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 221 Покажем, что каждая функция p(t)^Hk представима в виде (3.3.22), причем постоянные ск удовлетворяют усло- вию АГ 00 lim у CnMnkck = У cnAfn*c*<oo. (3.3.25) АГ-юо Vй П,Й=1 П,Л==1 В самом деле, согласно построениям, выполненным в предыдущем пункте, функции p(t) из Нк являются пре- делами в норме £2(0, Г) полиномов вида (3.3.24) и име- ют вид (3.3.22). С другой стороны, если последователь- ность {ря(О} функций вида (3.3.24) является фундамен- тальной в L2 (О, Т), т. е. ||р^т(0—Рм(011£,(о,Г)->О При У^оо, ТО ; JV+tn У (а"+т - а^п) Мпк - ~с№т) 0 при N - оо, где {М 17 On при n^N, О при n>N. Функция (3.3.22) по построению принадлежит £»(0, Г) и поэтому ||р(?) ||*<оо. Ее частичные суммы N п=1 удовлетворяют, очевидно, условию ||pw(0||->-||p(0|| при оо, и поэтому N lim у CnMnifik лг-юо Л,«=1 существует и конечен, т. е. АГ оо lim у cnMnkck = у CnMnifik< оо, П,£=1 ntk^l что и требовалось доказать.
222 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ |ГЛ. III На множестве Q определим скалярное произведение и норму соотношениями N ______ . l/M/M = 2 c^iMnual, [рм] — VlPtf» РмЬ л,Л=1 а самому Q поставим в соответствие множество Ам ко- нечных . последовательностей aN = {af, ... , a*}, N = = 1, 2, ..., скалярное произведение и норму, в котором определим соотношениями [Z]=/(ZVj- Отсюда следует, что Q и Ам изометричны и изоморф- ны. Замыкая Ам по введенной норме, получим простран- ство последовательностей а={ап}, удовлетворяющих условию ЯлМnk^k °о, (3.3.26) которое изометрично и изоморфно пространству Нк, по- лученному замыканием в L2(0, Г) множества Q. Поскольку из того, что ||ря+«(0—/МО 11 = =[aN+m—a*] -> оо при N оо, следует, что I т М(/_Г) lim fe pN(t)dt^={ek N—ao * v то система уравнений (3.3.1) в Нь сводится к системе ли- нейных алгебраических уравнений 2 — Ьп, п-1,2, ...» в пространстве Ни. В результате рассматриваемая нами задача (см. (3.3.1), (3.3.2)) сводится к отысканию эле- мента а е Нм такого, что он удовлетворяет уравнению М«=&, &€==/, (3.3.27)
§ 3.31 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 223 и при этом функционал / = (3.3.28) принимает наименьшее возможное значение. Поскольку в уравнении (3.3.27) элемент b принадле- жит 1г, то, чтобы воспользоваться вариационными мето- дами, пространство Нм удобно рассматривать как замы- кание в норме Нм элементов а из 4. Иначе говоря, Ни нужно рассматривать как энергетическое пространство, построенное с помощью элементов а е 4 на основе ли- нейного оператора, определяемого матрицей М. Пока- жем, что этот оператор положителен. Из того, что для любого а е 4 п—1 ”00 "I2 00 | 00 J 00 _fc=l J П==1 Ь=1 /=1 следует, что М отображает /х в lt. Кроме того, 4 плотно в 4 и (Ма, 6) = (a, Mb) = Mnkdnbk, а<=12, Ь<=1г. ntk=l Поэтому оператор, определяемый матрицей М (его в дальнейшем будем обозначать через М), симметричен в 4- Остается показать, что (Ма, а) >0, (3.3.29) причем равенство достигается лишь на нулевом элемен- те а»0. Пусть а — произвольный элемент из 4- Положим 03 к*а-т) я KUt-T) Л«1
224 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III 4 00 00 4 т 3 * S V’0 ZI=^+l п~ У+1 п Тогда очевидно, что Р (0 — Pn (О Г = 2 Mniflnak < (ОО \ V -М 2| % I п-W+i п / при jV->0 и, следовательно, l/to+HO—/МОР = 2 Mnkanak-^Q при JV-юо. tl,k=aN+l Таким образом, последовательность а={а„}е/2 так- же принадлежит Нм и в силу изометричности прост- ранств Нк и Нм имеем |p(0lL<».D = (a,Ala)>0. Так как по доказанному выше последовательность |е п(‘-г)} минимальна в Нк, а равенство ||р(ОИ=О воз- можно лишь при p(t) =0 почти всюду на [0, Т], то равен- ство в (3.3.29) достигается только на нулевом элементе а из 4. Тем самым доказано, что оператор М является положительным в 1г. Докажем, что он не является положительно опреде- ленным в 4» т. е. не существует постоянной у такой, что (а, А4а)>у||а|Р (3.3.30) для всех а е 12. С этой целью возьмем последовательность элементов а" е 4, определяемых формулой aN = {0, ..., 0, 1,0,...}. N^. Тогда Ца1Г|||2“1 и, кроме того, (aN, М<?) =» — (1 —/**’) -> 0 при У-* оо, 21J, что противоречит неравенству (3.3.30).
5 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 225 Отсюда следует, что 12с=.Нм и для решения уравнения (3.3.27) в Нм нужно рассматривать функционал F(a) = (a, Ма)—2{Ь,а), а^1г. Кроме того, согласно теореме 2.1 это уравнение не может иметь более одного решения в Нм, и поэтому экстремаль- ная задача (3.3.27) — (3.3.28) сводится к решению только уравнения (3.3.27). Этот вывод весьма важен для исследования задачи об управлении с минимальной энергией, поскольку при- веденный анализ позволил в какой-то мере упростить задачу, а именно, свести ее к решению линейной системы уравнений, к которой можно применить вариационные методы математической физики. В соответствии с этими методами можно сформули- ровать следующий важный результат. Теорема 3.2. Если в (3.3.1) последовательность & = {Ьь ..., Ьп, ...} принадлежит пространству /2, то проблема моментов, определяемая условиями (3.3.1) — (3.3.2), сводится к отысканию функции 00 Х2(/-Т) р(0=За„е" , в которой последовательность а= {аь ..., ап, ...} явля- ется элементом пространства Нм, доставляющим мини- мальное значение функционалу Г (а) в Нм. Необходимым и достаточным условием существования этого элемента является существование постоянной N такой, что нера- венство (*) справедливо для всех а <= 12. Казалось бы, что полученный результат дает исчер- пывающий ответ на вопрос о разрешимости проблемы моментов. В каждом конкретном случае, когда она опре- деляется условиями (3.3.1) — (3.3.2), нужно проверить условие (*). Если последовательность b={blt такова, что существует постоянная N такая, что (*) име- ет место, то задача разрешима и нужно искать пути прак- тического решения задачи. Если же такой постоянной Л' 8 А. И. Егоров
226 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III нет, то проблема моментов не имеет решения. Однако, к сожалению, пока не удалось найти способ проверки ус- ловия (*) для каждой конкретной последовательности {&п}. Более того, не удалось получить практически про- веряемых достаточных условий, накладываемых на Ьп, таких, чтобы функционал F(a) достигал бы своего наи- меньшего значения. Удалось лишь найти достаточные условия, при которых задача не имеет решения. Они оказались чрезвычайно простыми и даются следующей теоремой. Теорема 3.3. Если последовательность {6ПХ„} неогра- ничена, то уравнение (3.3.27) не имеет решения в Ям. Для доказательства возьмем последовательность эле- ментов Z = {О, ..., О, kNsignbN, 0,...}, #=1,2, ... Так как , n MnN\ — — л_____о^Т\ s'" _L (а , Ма ) 212 (1 в ) < , £,г“п Л то aN е Нм при любом N. С другой стороны, (6, а") = | bw| и, следовательно, условие | (Ь, aN) | не выполняется, т. е. для сколь угодно большого k можно выбрать элемент aN*такой, что \(b, aN')\ >k [а"»]. На основе этой простой теоремы можно проанализи- ровать различные задачи об управлении с минимальной энергией и указать достаточные условия, при выполне- нии которых они не имеют решения. Ясно, что такой ре- зультат не может служить инструментом для практиче- ского решения задачи. Тем не менее он полезен хотя бы тем, что позволяет «отсеивать» задачи, которые нераз- решимы. 5. Условия неразрешимости задачи об управлении с минимальной энергией. Сначала рассмотрим управляе- мый процесс, который описывается уравнением (3.3.3) с дополнительными условиями (3.3.4). При этом требуется определить управление p(t) такое, чтобы соответствую-
$ 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 227. щее ему решение u(t, х) в фиксированный момент вре- мени t=T удовлетворяло условию (3.3.8), а функционал т о принимал наименьшее возможное значение. Как показано в п. 1 настоящего параграфа, задача сводится к отысканию управления p(t) из Ь2(0, Т), удовлетворяющего уравнениям (3.3.10) и минимизирую- щего функционал I. В соответствии с результатами п. 3, находим, что эта задача в свою очередь сводится к оты- сканию p(t) из Я*, удовлетворяющего тем же уравнени- ям (3.3.10). Такое управление (если оно существует) представимо в виде 00 V(/-T) Р (О = 2 ап6 » П=1 где постоянные ап удовлетворяют условию 00 4 -(Х«+Л.*)Т 2 ОпМп^Соо, ;(1-е п k ),] n,k=i т. е. последовательность а= {а,, ..., ап, ...} является элементом пространства Нм. Из сопоставления уравнений (3.3.10) и (3.3.23) нахо- дим, что в рассматриваемой задаче Ьп = —, «п = I «о (х) cosX„a: dx, ОС COS о где и0(х) — функция, входящая в условие (3.3.8), и, та- ким образом, правая часть уравнения Ма=Ь (3.3.31) явно выражается через коэффициенты Фурье и* функ- ции иа{х). Так как числа А„ определяются уравнением 8*
228 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III A. tg k=a, то легко показать, что u° Vk* 4- а2 bn = -2-L — (_ 1)»-\ П = 1, 2, ... (3.3.32) Поэтому для рассматриваемого случая на основании теоремы 3.2 можно сформулировать следующее утверж- дение. Теорема 3.4. Если функция «о(х) такова, что после- довательность {u%V\n + а2} неограничена, то уравнение (3.3.31) с компонентами вектора Ь, определяемыми фор- мулой (3.3.32), не имеет решения в пространстве Ни. Поэтому не имеет решения задача об управлении с ми- нимальной энергией для процесса, описываемого уравне- нием (3.3.3) с дополнительными условиями (3.3.4) и (3.3.8). Для того чтобы обрисовать класс функций и0(х), удовлетворяющих условиям этой теоремы, укажем неко- торые их свойства, выраженные через соответствующие коэффициенты Фурье. Так как система функций 1 cosVx f -——, n = 1, 2, ..., где (ort-= \ cos2Xnxdx, VX о полна и ортонормирована в L2(0, 1), а 1 «п = J «о (х) cosKnxdx,_ О то согласно равенству Парсеваля получаем f KWH «о Will. n=l для любой функции u0(x) <=Л2(0, 1). Учитывая формулу (3.1.7), отсюда находим, что
УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 229 Отсюда следует, что в £2(0, 1) существуют функции «0(х), для которых последовательность {«*^„4-а8} не- ограничена. Пусть теперь «0 (х) — абсолютно непрерывная функ- ция, удовлетворяющая условиям ^^ = 0, ^^ + аыо(1)=0, (3.3.33) ассоциированным с граничными условиями в краевой задаче (3.3.3) — (3.3.4). Тогда квадратичная форма D (и, и) = J (^Jdx 4- at? (1) О ограничена при u = a0(x), а функция uQ(x) представима в виде ряда Фурье м*) = з П~1 ..0COSV Полагая D(u,v) - au(l)u(l), О находим, что D (Uq, COsXmX) —D (COSXnX, COSXpX) = , где 6nP — символ Кронекера, т. e. 1 при n = p, Q при n,=fcp. Пусть, далее, „ cos k„x uN = V Vn -~- £1 / где
230 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. III Тогда 0<D(u0 — uN, uQ — uN) = D{uQ9u0) — 2D(u09uN) + лг + D (uN, uN) - D (u0, uQ) — 2 n=l и, следовательно, 2 x:^-<d«u0) при любом N. Отсюда находим, что ряд £ (W < ^ + «’ + « X ------, (0л — ----------, G)„ 2 1 2 ! а2 П=1 п Nn а сходится, а последовательность {1$УX® + а2} является ог- раниченной. Таким образом, если функция ий{х) абсолютно не- прерывна на отрезке [0, 1] и удовлетворяет условиям (3.3.33), то она не удовлетворяет условиям теоремы 3.4. Это означает, что нет оснований утверждать неразреши- мость задачи об управлении с минимальной энергией с такой функцией в условии (3.3.8). Вместе с тем из полу- ченных результатов не следует, что эта задача непре- менно имеет решение, ибо здесь не найдены достаточные условия существования ее решения. В связи с изложенным, следует обратить внимание на широко распространенное мнение о применении про- блемы моментов в решении задач оптимального управле- ния системами с распределенными параметрами (см., на- пример, [9]), которое сводится к следующему. Необходимым и достаточным условием разрешимо- сти проблемы моментов при условии минимизации неко- торого функционала считается 'разрешимость при любом конечном п, соответствующей n-мерной проблемы мо- ментов. Если воспользоваться этим утверждением в рассмат- риваемой задаче, то можно прийти к противоречию сле- дующим образом.
§3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 231 Пусть функция и9(х) в условии (3.3.8) принадлежит Llt но не является непрерывной функцией; тогда задача об управлении с минимальной энергией сводится к сле- дующей проблеме моментов. Найти p(t) eL2(0, Т) такое, чтобы выполнялись ус- ловия I х*(т-П и® в А \рМе dt =-----------—, где и„ = I u0(x)cosX„xdr, J ь acos лп * J п = 1, 2, .... (3.3.34) и при этом ||р||£, принимала наименьшее возможное зна- чение. При указанных предположениях в соответствии с тео- ремой 3.2 находим, что эта задача не имеет решения. Этот факт легко объясняется тем, что решение крае- вой задачи (3.3.3)—(3.3.4) при каждом управлении р(0 из Lt(0, Т) является непрерывной по х функцией u(t, х) при любом t е [0, 7]. Следовательно, условие (3.3.8) ста- новится противоречивым, ибо в нем u(t, х) непрерывна, а «о (х) не является непрерывной. Если же в соотношениях (3.3.34) п принимает лишь значения от 1 до N, то легко можно показать, что при лю- бом конечном N задача имеет единственное решение N Wi-T) Р(0 = 3 с*е Zl»l где постоянные сп однозначно определяются из системы уравнений N и* Ух Mnlfik^—5—, л=1, acosXn где 1 (1-^).
232 УПРАВЛЕНИЕ с МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. 111 определитель которой отличен от нуля (как определитель (t-T) Грамма линейно независимых функций е , 6. Приближенное решение задачи об управлении с минимальной энергией. В этом пункте будем предпола- гать, что задача об управлении с минимальной энергией имеет решение. Тогда, в соответствии с результатами п. 3 настоящего параграфа, оно представимо в виде 00 V(/-T) Ро (0 = 2 ’ П=1 где постоянные ап удовлетворяют бесконечной системе линейных уравнений 00 «° 2 Mniflk~bn, п-1,2, ...» Ьп = —?—, (3.3.35) Si acos%„ и при этом 2 anM,;^<oo. (3.3.35') n,k—l Таким образом, задача об управлении с минималь- ной энергией сводится к отысканию решения системы (3.3.35), удовлетворяющего условию (3.3.35'). Поэтому естественно рассмотреть вопрос о способах решения этой задачи. На первый взгляд представляется целесообразным строить ее приближения с помощью «усеченной» системы лг 2 Mnkak — Ь&, п= 1, ... , N. (3.3.36) k=l Определитель этой системы является определителем А»2 (/—Г) Грамма линейно независимых функций еп , п=1, ..., N, и поэтому отличен от нуля. Следовательно, система (3.3.36) имеет единственное решение Л1, ..., а^.
§ 3.3] УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 233 С другой стороны, это решение можно рассматривать как АГ-е приближение системы (3.3.35), построенное по методу Ритца на основе базисных элементов еп = {0, ..., О, 1,0, п-1 В самом деле, записывая эту систему в виде Ма = Ь, ее N-e приближение по Ритцу ищем в виде N _ V] N п___f N N -ч n=i Тогда для нахождения этого приближения получаем уравнение Ритца MNaN = bN, где MN = {Mnfc)5=i. (3.3.37) которое в развернутом виде совпадает с системой (3.3.36). Согласно общей теории этого метода, в рассмат- риваемом случае N-e приближение Ритца сходится к точ- ному решению системы в метрике пространства Нм, т. е. [а—aw]->-0 при AZ->oo. Это является несомненным достоинством метода Ритца. Однако специфика рассматриваемой задачи делает такой способ аппроксимации мало эффективным при вы- полнении практических расчетов. Объясняется это сле- дующими причинами. Корни трансцендентного урав- нения Xtg% = a можно вычислить лишь приближенно, и поэтому матрица MN и вектор bN практически определя- ются также приближенно. Поэтому при определении ая практически приходится решать не уравнение (3.3.37), а некоторое его приближение (Afw+rrr)aw=&w+Yw, где Г" и у" — ошибки, допускаемые при вычислении MN и bN соответственно. Если обозначить через а у решение
234 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III этого уравнения, то вопрос о его сходимости к решению системы (3.3.35) при Af->oo нужно решать с помощью методов, изложенных в п. 3 предыдущего параграфа. Од- нако специфические свойства матрицы М не позволяют получить удовлетворительную процедуру для практиче- ского построения приближений этой системы, основанную на методе Ритца. В самом деле, в соответствии с известной связью меж- N ду корнями р/ характеристического уравнения матрицы Afw и ее следом, находим, что -ГЗ-Т*1-6 n) = Pf+ •••+Рх- (3.3.38) Так как числа удовлетворяют условию (см. (3.3.7)) Нт __Al_ = 1, (3.3.39) л-юо (п — 1) л то сумма в левой части равенства (3.3.38) стремится к конечному пределу при N-^eo. Поэтому наименьшее соб- ственное значение матрицы Мя стремится к нулю при N-+OO. Отсюда следует, что inf (*Г*У> о при АГ оо, лЛ I где хя — Af-мерный вектор, a |xw| —его длина. Следовательно, определитель системы Ритца (3.3.37) стремится к нулю при N-*-co, а процедура Ритца отыска- ния приближенного решения уравнения (3.3.35) оказы- вается неустойчивой относительно погрешностей Гк и у*. Малые погрешности FN и у* при больших N могут при- водить к сколь угодно большим уклонениям решений уравнения (3.3.37) от точных решений системы (3.3.36). Это обстоятельство значительно снижает эффективность метода Ритца при практическом построении приближен- ных решений бесконечной системы (3.3.35). Может показаться, что этот недостаток нивелируется тем, что коэффициенты а„ нам нужны для построения
УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 235 § 3.3] управления /(0 = 2Jfl£en . (3.3.40) П=1 f/ V~T) где ап стоят множителями при е , и при большом п влияние ап сказывается лишь на величину pw(T). Одна- ко такое мнение является слабым утешением по следую- щим причинам. Нас интересует полное исследование задачи, при ко- тором нужно найти не только приближения оптимально- го управления, но и вычислить приближенные значения нормы оптимального управления, квадрат которой пред- ставляет собой критерий оптимальности. Величина квадрата нормы управления (3.3.40) опре- деляется по формуле N n,k=l Следовательно, значительные погрешности в вычислении а%, обусловленные неустойчивостью процедуры Ритца, могут дать значительный разброс значений ||pw||2, вычис- ленных для различных N. Тем самым на основе числен- ных расчетов не удается определить хотя бы приближен- но величину нормы управления с минимальной энергией. Кроме того, важно знать и следующее. Пусть (3.3.40) определяет приближение оптимального управления, а uN(t, х) является соответствующим ему решением крае- вой задачи (3.3.3)—(3.3.4). Тогда нужно вычислить ве- личину (T,x) — u0(x)]2dx, которая характеризует точность выполнения условия (3.3.8). Ее значения (это можно показать непосредственными вычислениями) чувствительны к погрешностям в вычис- лениях ак.
236 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III Поэтому отмеченные недостатки изложенного метода 1 приближенного решения системы (3.3.35) требуют изве- | стной осторожности в его практическом использовании, I’ что вовсе не означает его полную несостоятельность в | решении рассматриваемой задачи. Может оказаться, что | в отдельных конкретных случаях можно ограничиться ’’ третьим или даже вторым приближением, а тогда вопро- сы устойчивости метода не играют существенной роли I и метод оказывается достаточно эффективным. § 3.4. Об управляемости процесса теплопроводности с помощью граничного управления Выше неоднократно подчеркивалось, что многие не- , решенные вопросы теории управления системами с рас- j пределенными параметрами связаны, в конечном счете, со сложностью проблемы управляемости для таких си- стем, которая к настоящему времени еще полностью не исследована. Здесь нет возможности обстоятельно ана- лизировать разнообразные публикации по этому весьма j важному вопросу. Поэтому ограничимся лишь кратким изложением отдельных результатов X. О. Фатторини и Д. Л. Рассела [10], которые в известной мере примыка- ют к содержанию предыдущего параграфа. i 1. Формулировка задачи. Пусть управляемый процесс описывается функцией u(t, х), определенной в области Q(0^.x^X, где постоянные X и Т заданы. . Эта функция удовлетворяет уравнению | + + 0-4.1) at ох [ ах J ! при 0<х<Х и граничным условиям Аои(t, 0) + Во= а(0, А2Л + В?^0, Axu(f,X)^B1^^ = A\ + Bl^b OX при 0<Zt^T. Здесь а(х)—положительная на [0, X], | дважды непрерывно дифференцируемая функция, q(x)— | (3.4.2)
§ 3.4] УПРАВЛЯЕМОСТЬ ПРОЦЕССА ТЕПЛОПРОВОДНОСТИ 23? непрерывная неположительная на [О, X] функция*), а b(x)eL2(0, X). Вещественные функции p(t), a(t) и р(/) являются управляющими функциями и считаются допу- стимыми, если каждая из них принадлежит L2(Q, Т). Функция p(t) называется распределенным управлением, а а(0 и P(Z) — граничными управлениями. Предполагается, что уравнение (3.4.1) с граничными условиями (3.4.2) и начальным условием и (0, х) = и0 (х) е£2 (О, X) (3.4.3) имеет единственное решение в следующем смысле. 1. и (t, х) е L2 (О, X) для каждого t <= (О, Г], и если t>0, du(t, х) d2u(t, х) л , , то —L2— и —i-J—- как обобщенные дх дх2 функции и принадлежат L2 (0, X). 2. Функция u(t, х), рассматриваемая как отображе- ние отрезка [0, 7] в пространство L2(0, X), является не- прерывной по t и непрерывно дифференцируемой по t в том смысле, что функция <р(О = И«(*. х) непрерывна и непрерывно дифференцируема при /<=[0, Т]. В частности, условие (3.4.3) удовлетворяется в том смыс- ле, что lira [и (/, х) — и0 (х) I = 0. /-Н-0 3. Для каждого fe(0, Т) уравнение (3.4.1) удовлетво- ряется почти для всех х е [0, X]; при этом dujdx и д2и/дх2 понимается в том смысле, как отмечено в п. 1, a dujdt определяется, как отмечено в п. 2. 4. Граничные условия (3.4.2) удовлетворяются для Ге(0, Г]. Наиболее общая проблема управляемости для систе- мы (3.4.1) —(3.4.3) состоите следующем. Пусть заданы начальное условие (3.4.3) и конечное условие и(Т, x)=«1(x)eL1(0, X). (3.4.4) *) В [10] не предполагается, что q(x)^0. Здесь это условие введено лишь для того, чтобы содержание этого параграфа теснее увязать с тем, что излагалось в предыдущих параграфах.
238 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ (ГЛ. 1П Требуется установить существуют ли допустимые уп- равления p(t), а (0 и р(^) такие, чтобы соответствующее им решение задачи (3.4.1) — (3.4.3) удовлетворяло усло- вию (3.4.4). Непосредственно из предположения 1 следует, что ответ на этот вопрос не может быть всегда утверди- тельным. Изучение общей проблемы управляемости облегчает- ся путем рассмотрения специальных случаев, когда ио(х)=О или ut(x)=0, которые в дальнейшем будем на- зывать случаями нуль-достижимости и нуль-управляе- мости. 2. Формулировка задачи в терминах проблемы момен- тов. Пусть А — оператор, определяемый формулой Au=[au']'+q(x)u, областью определения которого являются всевозможные функции из Lt такие, что и' и и", понимаемые в смысле теории распределения, принадлежат £г(0, X), и Лои(О) + +Вои'(О) +BiU'(\) =0. Оператор А является самосопряженным, а его после- довательность собственных значений {X*} удовлетворя- ет условиям А? < ... <А„ < ...» lim =<ю. В частно- сти, если интеграл х J V а(х) сходится, то существует постоянная а такая, что An = _5_(n _{_ а) 4-о(1), га->оо. (3.4.5) Ортонормированная система собственных функций {<ря} является полной в L2 (О, X). Поэтому можно записать b (х) = М>п> «о W = 2 и’<Рл’ = S “”<Рп’ (3-4-6) П=1 П=1 п-1
$ 3.4] УПРАВЛЯЕМОСТЬ ПРОЦЕССА ТЕПЛОПРОВОДНОСТИ 239 где X X bn-= \b(fn(x)dxt Un-= ^Ui<pn(x)dx, i = 0, 1; о о 0=1,2, ... Полагая и (t, х) = Un (0 ф„, (3.4.7) Л=1 находим, что управления p(f), a(t) и P(f) обеспечивают достижение состояния (3.4.4) тогда и только тогда, когда = Ж п=1,2, ... (3.4.8) Функция wn (t, х) = <р„ (х) е п бесконечно дифференцируема по t при каждом и=1,2,... и является решением сопряженного с (3.4.1) уравнения dw ~di д Г dw 1 — Я — — дх I ан в области Q (0</<Т, 0<х<Х) с однородными (а=р = О) граничными условиями (3.4.2). Учитывая предположения 1—4, можно записать — qu — bp Н- dw„ д [dw„ д Г 1 1) — 4- — а —— 4" qwn 1 dx di = dt дх дх I dt дх ди\1 , д г +'Z” dxdt — дх / J dt ) — JJ bwnp (0 dx dt =
240 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. III X = J [и (Т, х) wn (Т, х) — и (0, х) wn (0, х)] dx + о + ([а (X) Iи (f, X) ((, X) - J L \ дх дх ] о — а (0) (и (t, 0) -п-~~ — wn (t, 0) — — J J bwnp (0 dx dt. Q Учитывая (3.4.6) и (3.4.7), отсюда получаем -VT Т ^(t-T) ип(Т) = и^ п + J е п [6„р (0 + &* а (0 + 6АР (0] dt, О где а(1)В1-1Ф„(1) -а(1)ДГФ;(1) Ъп = а(0)5о1фл(0) | а (О)4о-*Ф;(О) при Вг =[= О, при Вх = О, при Во=^0, при Во = 0. Если мы хотим достичь состояния (3.4.4), то должны удовлетворяться условия (3.4.8), и поэтому f [ЬпР (0 + bh (0 + № (01 di = и'п - и°пе^Т, о (3.4.9) п = 1, 2, ... Тот факт, что функции Ф„(х) удовлетворяют линейному однородному уравнению второго порядка, позволяет по- казать, что, вообще говоря, Ь°п^=0, ^ ,¥=0, п=1, 2, . Ясно также, что если множество всех состояний, которые нуль-достижимы (или нуль-управляемы) с помощью рас- пределенного управления, является плотным в В»(0, X), то следует считать, что &n=0, n= 1, 2,... Таким образом, для решения общей задачи об управ- ляемости достаточно рассмотреть задачу отыскания
§ ЗА] УПРАВЛЯЕМОСТЬ ПРОЦЕССА ТЕПЛОПРОВОДНОСТИ 241 функции Т), удовлетворяющей моментным условиям fe hi(f)dt = cn, п=1,2........... (3.4.10) о которые неоднократно использовались нами при иссле- довании задачи об управлении с минимальной энергией. Здесь же не требуется искать ht(t) с минимальной нор- мой. Поэтому целесообразно искать hi(t) иначе, не ис- пользуя ее разложение по базисным функциям {е }. 3. Решение задачи. Пусть система .{ф„(/)} биортого- нальна с последовательностью {е }, т. е. I Г.ь /А?^л а [1прип = /п, фт(г)е dr = onm = r г J (0 при пфт. На существование такой системы указывалось выше (см. § 2). Полагая т=Т—t, соотношения (3.4.10) при- водим к виду j Je nh(x)dx = cn, n«l, 2, ..., (3.4.11) О где h(x)=ht(T—т). Тогда формальное решение момент- ной проблемы (3.4.11) можно записать в виде М*)-3 М.М. hn = cn. (3.4.12) rt=l । Если же этот ряд сходится в L2(0, Т), то он представляет собой фактическое решение задачи. Проблема характеристики всех последовательностей {с,,}, для которых ряд (3.4.12) сходится, является очень сложной. Здесь мы ограничимся исследованием после- довательностей, для которых ряд (3.4.12) абсолютно схо- дится в том смысле, что S 1С»НМ.<00- (3.4.13) л=®1
242 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. Ill Ясно, что выполнение условия (3.4.13) влечет за собой сходимость в Lz ряда (3.4.12). Для получения соотно- шения (3.4.13) необходимы оценки нормы ||ф„||. Ясно, что эти оценки зависят от асимптотического поведения последовательности Л= {%«}. Пусть — наименьшее замкнутое подпространство из L2(0, Т), образованное функциями е , n—1, 2, ... В [11] показано, что если 5J —<°° и Ап = {А4| &=/=»}, то Нлп представляет собой наименьшее замкнутое подпространство из La (О, Т), содержащее функ- ции е , Kk s Ла, не включающее е п. Тогда стандарт- ными рассуждениями теории гильбертовых пространств можно показать, что существует единственная функция гп(0еНл„, которая является ближайшей к е " в метри- ке La(0, Т), а функции ф„(0> представимые в виде ^(0 = « n-rn(t) (3.4.14) -М образуют биортогональную с {е п) систему. _ -X2t Если {ф„} — любая другая биортогональная с {е "} система, то легко проверить, что Фп = фп + <Рп, п-1, 2, где <р„ принадлежит ортогональному к Нк подпростран- ству, и таким образом, 1^"кио.г)’ n = 1, 2, ... Поэтому естественно считать {ф„} оптимальной биорто- тональной с {е "} системой. Ясно, что ф„еЯд,
$ 3.4j УПРАВЛЯЕМОСТЬ ПРОЦЕССА ТЕПЛОПРОВОДНОСТИ 243 п=1, 2,..., а из (3.4.14) следует, что п=1,2, ... (3.4.15) Л. Шварцем [11] показано, что 4>ЯГ<£(ос), где Кт — постоянная, определяемая величиной Т, а П' означает произведение по всем i, исключая Мп. Та- ким образом, из (3.4.15) получаем и ,h b IIL,(o,T) 2 (3.4.16) Бесконечные произведения, входящие в правую часть неравенства, вычисляются с помощью следующей леммы, доказательство которой здесь приводить не будем. Лемма. Пусть 0>1, и предположим, что X* =К(п+а)р+о(/?-‘), п->оо. (3.4.17) Тогда существуют постоянные Р» и Q» такие, что П f1 + 4 V ехр 1(/Г1/₽Рр + 0(1)Х"₽)Ь п °0’ п' (1 - 4)=ехр 1(*’1/э&+®(1) л. «оо.
244 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. IH При этом Pt>-Qt для всех р> 1 и lim (Pg —Qb) = 0, lim (Р₽ —Qp) = ©о, Р2 —Qa = jt. 3-кю р—*1+0 (3.4.18) Отсюда непосредственно вытекает следующее Следствие. Предположим, что имеет место (3.4.17). Тогда моментные соотношения (3.4.11) имеют решение в виде абсолютно сходящегося ряда (3.4.12), если для некоторого т]>0 с = 2 Iс*IехР {РГ/(5(Рр -Qp) + л] Л< оо. (3.4.19) П=1 С другой стороны, если с=оо для некоторого tj, то ряд (3.4.12) не является абсолютно сходящимся. Возвращаясь к исходной проблеме управления, сфор- мулированной в п. 1, находим, что для нее постоянная К в (3.4.17) равна n2/L2 (см. (3.4.5)), а ₽=2. Таким обра- зом, моментные соотношения (3.4.11) имеют абсолютно сходящееся решение (3.4.12), если для некоторого т)>0 а (т|) = 2 Cnexp [(L + т[)Л.„] < оо, (3.4.20) П=1 и не имеют абсолютно сходящегося решения, если ст (т)) =оо для некоторого т]>0. Так как из (3.4.17) следует, что Кпр = (га + а)(1 + о(—при га-> оо, \ \ п // то можно заменить на га в любой из формул (3.4.19) и (3.4.20). При этом не имеет значения тот факт, что если сп удовлетворяют условию (3.4.19), то мы можем ут- верждать существование более гладкого решения h(t) проблемы моментов (3.4.11). Если для произвольного положительного т произведения {кптсп} также удовле- творяют условию (3.4.19), то, используя сформулиро- ванное выше следствие, можно найти решение hm(t)
§3.41 УПРАВЛЯЕМОСТЬ ПРОЦЕССА ТЕПЛОПРОВОДНОСТИ 245 проблемы моментов Р nhm(f)dt =К%"сп, п-1, 2, ... О Более того, поскольку дополнение пространства Яд явля- ется бесконечномерным и нет полиномов по t, принадле- жащих Ял (11], то можно предположить, что т fe = О, 1, .... m — 1. О Тогда интегрированием по частям легко показать, что функция t {tn — 1)! J о является решением проблемы моментов (3.4.11). Для рассматриваемой проблемы управления последо- вательность {сп} задаётся соотношениями (см. (3.4.9)) гх — °п — °п сп — —— , сп — — *п Ъ vn 1 о Сп = — , Vn — <4 — «пв я , Ьп п- 1,2, .... в зависимости от того, какое берется управление ₽(/), а (0 или p(t). Очевидно, что асимптотическое поведение будет зависеть от bn, Ьп, Ь„. Обычно рассматриваются случаи, когда и Ь„ отличны от нуля для всех п. С дру- гой стороны, как следует из хорошо известных асимпто- тических выражений собственных функций дифференци- альных операторов, имеют место соотношения ' ~ СдХп, Ьп С^п при соответствующих константах с0 и сь Теорема 4.1. Начальное состояние и0(х) может быть переведено в конечное состояние н,(х) за время Т>0 с помощью непрерывно дифференцируемых граничных
6 УПРАВЛЕНИЕ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ [ГЛ. Ill управлений а (0 и 0(0, если , а ~ЧГ \ul-Une К М exp [—-(L + i])n], п ~ 1, 2, .... для некоторых ЛГ>0 и т]>0. Каждое состояние ut(x), для которого | и„ | < М ехр [—- (L + я)«], n = 1, 2, при некоторых М>0 и т)>0 является нуль-достижимым в любой момент времени Г>0. Каждое начальное состоя- ние из L»(0, X) является нуль-управляемым с помощью лишь граничного управления. Фактически то же самое будет справедливым для всех обобщенных функций at(x), которые могут быть представимы рядами Фурье с коэффициентами Un, удовлетворяющими условиям е п | «п | •< А1 ехр [— (£ + я)«], п=1,2, при некоторых М>0 и т)>0. Следует отметить, что в сформулированной теореме речь идет о граничном управлении с помощью a(t) (или 0(/)) в то время, когда 0(/)=О (или a(i)^O). Резуль- таты, аналогичные этой теореме, справедливы и для слу- чая лишь распределенного управления, если предполо- жить, что коэффициенты Фурье Ьп функции Ь(х) удов- летворяют условию lim inf | bn | е’1'* > 0 n-*oo для всех я>0.
ГЛАВА IV ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ В этой главе рассматриваются некоторые задачи уп- равления процессами теплопроводности и диффузии, ког- да критерием оптимальности служит время, необходимое для перевода системы из одного заданного состояния в другое также заданное состояние. При этом предполага- ется, что управляемый процесс описывается уравнения- ми в частных производных. Известно, что подобные за- дачи для конечномерных систем (систем с сосредоточен- ными параметрами) часто встречаются в инженерной практике, а их исследование занимает значительное ме- сто в общей математической теории оптимальных процес- сов. Для систем с распределенными параметрами иссле- дование этих задач наталкивается на ряд принципиаль- ных трудностей, и даже сама постановка задач может быть более разнообразной и содержать особенности, ко- торых нет в случае систем с сосредоточенными парамет- рами. В силу этих и ряда других обстоятельств задачи оптимального быстродействия для таких систем к на- стоящему времени исследованы недостаточно. Пока мож- но говорить лишь о более или менее полном перечне частных разрозненных результатов в этой области, кото- рые не связаны между собой общностью методов иссле- дования и поэтому не могут составлять единое целое, на- зываемое обычно теорией. В настоящей главе излагаются лишь некоторые ре- зультаты по задаче оптимального быстродействия при управлении процессом диффузии нейтронов в атомном реакторе. Эта задача подобна той, которая исследовалась в § 2.5. Отличие состоит лишь в том, что здесь учитыва- ется зависимость плотности нейтронов от пространствен- ных координат. Это вносит существенные особенности в формулировку задачи, ибо исследуемый процесс теперь описывается уравнениями с частными производными.
248 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV Однако, как показывает приведенный ниже анализ зада- чи, она решается тем же методом, который был приме- нен в § 2.5. Следует отметить, что пока удалось исследовать лишь частный случай, когда избыточная реактивность 6k, рас- сматриваемая как управление, может зависеть лишь от времени и должна не зависеть от пространственных коор- динат. Кроме того, пришлось ввести еще одно неприят- ное ограничение: коэффициент диффузии нейтронов в нестационарном процессе предполагается не зависящим от избыточной реактивности. Все эти ограничения безус- ловно сказываются на общности полученных здесь ре- зультатов. Тем не менее даже при этом видна зависи- мость времени быстродействия от распределенности па- раметров объекта. § 4.1. Оптимальное по быстродействию управление одномерным ядерным реактором В этом параграфе рассматривается задача оптималь- ного быстродействия для простейших случаев, когда ре- актор, как объект с распределенными параметрами, име- ет простейшую геометрическую форму, а плотность ней- тронов в нем зависит только от одной пространственной координаты. Та же задача для других реакторов анали- зируется в следующем параграфе. Главная ее особен- ность в каждом из рассматриваемых здесь случаев за- ключается в том, что управляемый процесс описывается уравнениями с частными производными. Однако можно показать, что она сводится к задаче, которая подобна рассмотренной в § 2.5. Тем самым для ее исследования можно использовать изложенный выше метод. Это уда- ется сделать лишь в предположении, что избыточная ре- активность может зависеть только от времени, а коэффи- циент диффузии в нестационарном режиме должен не зависеть от этой реактивности. В этом случае удается определить меру влияния распределенности параметров объекта, а также его геометрических форм и типа гра- ничных условий как на само оптимальное управление, так и на продолжительность оптимального переходного процесса.
§ 4.11 УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 249 1. Плоский реактор. Постановка задачи. Пусть реак- тор представляет собой круговой цилиндр высоты 2а (—a^z^+a) и достаточно большого радиуса /?. Будем предполагать, что он граничит с вакуумом. Тогда, обозначая через W плотность нейтронов в реакторе, бу- дем иметь ЛГ|8=О, где S — граница цилиндра. Так как, по предположению, R много больше, чем 2а, то с достаточной для практики точностью можно считать, что реактор представляет со- бой неограниченную пластину толщины 2а (—a^z^a), плотность нейтронов N в которой зависит от z в стацио- нарном режиме и от z и t в нестационарном режиме. При этом N удовлетворяет граничным условиям ЛГ|*-«=О. (4.1.1) Внутри пластины стационарная плотность нейтронов Ый удовлетворяет однородному уравнению диффузии (см. (2.5.1)) Ро^-О-'Чг^Л?о = °- (4-1-2) Из физического смысла функции Уо следует, что долж- ны выполняться соотношения Na{z) 2>0 и Nt,(z) ФО при —a^zs^a. (4.1.3) Таким образом, No является нетривиальным решением краевой задачи типа х"+Л.2х=0, х(—а)=х(а)=0. Известно, что такая задача имеет нетривиальное ре- шение лишь при изолированных значениях %=Х„, назы- ваемых собственными ее значениями. Непосредственны- ми вычислениями находим, что , п = 1,2, ... 2а
250 ОПТИМАЛЬНЫЕ быстродействия (ГЛ. IV и соответствующие нетривиальные решения х—xn(z) имеют вид xn(z) = 4ncos — г . \2а ) Так как функция Na(z} должна удовлетворять условию (4.1.3), то отсюда следует, что AM2)>YoCOs(^A (4.1.4) \2а / \2Д/ где уо — некоторая положительная постоянная. Если критическому коэффициенту размножения kK9 в момент времени t—О дано приращение 8k(t), то в ре- акторе возникает нестационарный процесс, который опи- сывается уравнением (см. (2.5.2)) *) о, оо — = D0 — N + V, -Ц ki(t~^x)N(t—x, z) е~к‘ Xdx dt 0 To /-1 Го P ' ’ ‘=“l о с граничными условиями (4.1.1) и начальным условием « ад, z)=y0(z) при /<0, (4.1.5) ‘ где NB(z) определяется из (4.1.4), kB — коэффициент размножения мгновенных нейтронов, kt — коэффициент | размножения запаздывающих нейтронов i-й группы, — постоянная распада i-й группы запаздывающих ней- тронов. В дальнейшем ради упрощения формул будем учитывать лишь одну группу запаздывающих нейтронов и, следовательно, предполагать, что нестационарный процесс описывается уравнением = D,^- + N + A U (I - г) N (I - г, z) di dz Tq Tq J (4.1.6) с начальным условием (4.1.5) и граничными условиями (4.1.1). *) Здесь предполагается, что коэффициент размножения ие влия- ет на величину коэффициента диффузии D.
§ 4.1] УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 251 Обозначая через k общий коэффициент размножения нейтронов в нестационарном режиме, можно записать k=ka+^k, где величина р представляет собой долю за- паздывающих нейтронов, которую в дальнейшем будем считать постоянной. С другой стороны, коэффициент k можно представить в виде £=£кР+б£. Поэтому можно записать k— 1 = (&кр+6&) (1—р)—1, p^=p(^Kp + 6fe), и уравнение (4.1.6) принимает вил 4- ру ц — т, z) e~udx + ° о |- t + - (1— + №[bk(t — x)N(t-x,z)er^dx To J L о J (4.1.7) так как dk(t), очевидно, равно нулю при /<0 (избыточ- ная реактивность была введена в момент времени t=0). Пусть Ni (z) — отличная от Nt (z) стационарная плот- ность нейтронов в том же реакторе. Она, очевидно, удов- летворяет условиям (4.1.1) и уравнению (4.1.2). Поэтому A\(z) = YiCos^z, где Yi — положительная постоянная, отличная от у» (см. (4.1.4)). Избыточную реактивность dk будем счи- тать управлением, а в качестве допустимых управлений будем брать кусочно-непрерывные функции 8k—6k(t) с точками разрыва первого рода, удовлетворяющие условию |6^(0|<бЛша1, (4.1.8) где 6km„ — заданное число. Рассматриваемая здесь задача оптимального управ- ления заключается в следующем.
252 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV Требуется найти допустимое управление 6k—6k(t) такое, чтобы соответствующее ему решение уравнения (4.1.7) с начальным условием (4.1.5) и граничными усло- виями (4.1.1) удовлетворяло условию N^z^N^z) (4.1.9) при минимальном положительном t^. При этом: 1) для всех t из отрезка [О, должно иметь место неравенство N(t, z)^0 и 2) если положить 6k(t)=0 при t>tt, то должно иметь место равенство Жг)=ВД при/>/„ (4.1.10) Физический смысл требования 1) состоит в том, что N(t, z) является плотностью нейтронов и поэтому не мо- жет принимать отрицательных значений. Требование 2) означает, что Nt(z) представляет собой плотность ней- тронов в новом стационарном режиме, в который нужно перевести реактор за время tx. Сформулированная задача подобна той, которая была рассмотрена в § 2.5. Отличие ее состоит лишь в том, что здесь рассматривается процесс, в котором плот- ность нейтронов зависит от пространственной координа- ты z. Однако, как и прежде, избыточная реактивность 6k предполагается зависящей только от времени. Имен- но это предположение позволяет свести задачу к более простой, для решения которой можно воспользоваться методом, изложенным в § 2.5. Вместе с тем следует отметить, что для приложений, по-видимому, более инте- ресен общий случай, когда избыточная реактивность мо- жет зависеть не только от времени, но и от пространст- венных координат. При этом могут быть наложены дополнительные требования, характеризующие естествен- ную форму зависимости/6k от пространственной коорди- наты и времени. Однако исследование столь общей зада- чи оказывается весьма сложным и автору этих строк неизвестны работы, в которых было бы дано ее полное или частичное решение. 2. Анализ задачи. В этом пункте излагается предва- рительный анализ задачи, который позволяет ее значи- тельно упростить. Полученная в результате задача ока- зывается точно такой же, как та, что рассмотрена в § 2.5.
§ 4.1] УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 253 Отличаются лишь коэффициенты уравнений, описываю- щих процесс. Итак, будем предполагать, что допустимыми управ- лениями являются кусочно-непрерывные функции bk= =6k(t), удовлетворяющие условию (4.1.8). Возьмем одно из них и соответствующую ему плотность нейтронов будем искать в виде N(t, z)=d>(t)Z(z). Подставляя эту функцию в уравнение (4.1.7) и разделяя переменные, получим Z" + P2Z = 0, Ф (0 - f Д( 1 - Р) йкр -11 - Р2£>01ф— Uo L J J feKO₽X р —-^-\Ф(«—r)r*Mt = То J о (4.1.11) t (1 — Р) dfe(f) Ф + рХ J fife (t — т) Ф (t -1) j e-^dt о (4.1.12) где р — вещественный параметр. Условия (4.1.1) дают Z(—a)=Z(a)=0, (4.1.11') и поэтому ненулевое решение (с точностью до постоян- ного множителя) уравнения (4.1.11) с граничными ус- ловиями (4.1.11') имеет вид Zn(z) = cos (2п~1)я z, л = 1,2,..., 2а и при этом Р = Р„= (2п—1)я > и=1,2, ... 2а Подставляя эти значения р=ря в уравнение (4.1.12), определим соответствующие функции Ф„(0> каждая из которых будет зависеть от одной произвольной по- стоянной.
254 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV Следовательно, формальное решение уравнения (4.1.7) с условиями (4.1.1) можно построить в виде ряда N(t,z)= 2O„(/)Z„(z), Л=1 0< i <С °о, — а. Поскольку нас интересует то решение, которое удовле- творяет начальному условию (4.1.5), то ф1(^)=у0, фп(^)=0 при /С0> п=2, 3, ... Поэтому, возвращаясь снова к уравнению (4.1.12), на- ходим, что ф„(£)=0 при />0, я=2, 3, ... и, следовательно, Лг(/, z) ^ФЛОсоэ-г, (4.1.13) 2а где функция Ф1(1) удовлетворяет уравнению (4.1.12) при p=pt и начальному условию Ф1(О=уо при/^0. (4.1.14) Если теперь учесть второе соотношение в (4.1.4), то по- л^чаем p|D = k^—L, и уравнение, виде определяющее Ф1(1), можно записать в ф(/) + ^₽ф J о Сф(/ — r)e~Ktdx = 7*о J о 1 (1 — р)дй(0Ф4-Хр J &k(t —г)Ф(*—r)e-^dr . о (4.1.15)
УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 255 § 4.11 Нас интересует та плотность нейтронов, определяе- мая формулой (4.1.13), которая удовлетворяет условию (4.1.9), где Wi(z) =YiCOs^z. Поэтому функция Ф,(/) должна удовлетворять условию Ф(Л)=У1. (4.1.16) Более того, при 6fe(/)=0 для всех функция N(t,z) должна удовлетворять условию (4.1.10). Отсюда следу- ет, что для таких 8k (t) должно выполняться условие Ф(0=?1 при (4.1.17) Так как функция Zt(z) =cos(-£-z) неотрицательна, то требование неотрицательности N(t,z) приводится к тому, что функция Ф1(/) должна удовлетворять неравенству Ф(0>0, (4.1.18) В результате- сформулированная выше задача об оптимальном быстродействии сводится к следующей задаче. Среди всех кусочно-непрерывных управлений 8k (/), удовлетворяющих условию (4.1.8), требуется найти управление 8k°(t) такое, чтобы соответствующее ему ре- шение Ф°(Л уравнения (4.1.15) с начальным условием (4.1.14) удовлетворяло условию (4.1.16) при минималь- ном положительном Ц. При этом должно иметь место неравенство (4.1.18), и если 8k(t)=0 при t^ti, то это решение должно удовлетворять условию (4.1.17). Эта задача подобна той, решению которой посвящен § 2.5. Отличие состоит лишь в том, что уравнение, опи- сывающее процесс, имеет другие коэффициенты. Поэто- му ее решение можно получить тем же методом, кото- рый использовался в § 2.5. С этой целью вводим функцию г (f) = £ f [fcKp + 8k (t —т)] Ф (/ — т) e~Kxdt. (4.1Л9) о
256 ОПТИМАЛЬНЫЕ быстродействия (ГЛ. IV Тогда, очевидно, at 1 о о и, следовательно, для описания процесса получаем си- стему уравнений ^ = _^Рф+Хг + 1=1Рд^(0Ф,' “ У° 7° • (4.1.20) -^ = Ьиф-Кг + |дМ0Ф ar т0 То ) с начальными условиями Ф(О) = Уо, r(O) = ~rYo, (4-1.21) где второе условие следует из того, что 6fe(f)=0 и ф(/)=у0 при /^0. Далее, тем же способом, который был использован в § 2.5, находим, что в момент окончания процесса долж- ны выполняться условия Ф(4) = Уп r(fi)=^Vi- (4-1.22) В итоге рассматриваемая нами задача может быть сформулирована следующим образом. Требуется найти кусочно-непрерывное управление такое, чтобы соответствующее ему решение системы уравнений (4.1.20) с начальными условиями (4.1.21) удовлетворяло условиям (4.1.22) при минималь- ном положительном tlt и при этом должно иметь место неравенство (4.1.18). Легко показать (см. п. 3 § 2.5), что Ф(0 удовлетво- ряет уравнению Ф(0 = Ъ + jK(t-'С)Ф(Т)Л, о К(0 - -7-h + v) И. 1 oY L V о / J
$ 4.1] УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 257 где т=Х+р^крТ|)_1. Отсюда следует, что при любом допу- стимом управлении функция Ф(0 остается положитель- ной. Таким образом, при решении полученной задачи можно игнорировать фазовое ограничение Ф(/)^0. Это позволяет воспользоваться принципом максиму- ма Понтрягина для задачи оптимального быстродейст- вия без фазовых ограничений. При этом приходится по- вторять все те рассуждения, которые приводились в § 2.5. Поэтому теперь изложим кратко основные этапы реше- ния задачи, ибо детали можно восстановить по содержа- нию § 2.5. 3. Применение принципа максимума Понтрягина. Со- ставляем функцию Н = ^ [— ^Ф4-Хг+ —£ дйф] + L ‘ То J + [^Ф + V + A МФ], L 'О 4# J где функции фч и ф2 удовлетворяют системе уравнений __ гР^кр Л I То ^ = -И1 + Иг. Из условия максимума функции Н по 6k находим, что оптимальное управление удовлетворяет условию 6k (0 = б&шах Sign [Ф1 + |- ф21. I Ч 'О ) Таким образом, и в случае когда реактор является объектом с распределенными параметрами, оптимальное управление представляет собой кусочно-постоянную ФУНКЦИЮ, Принимающую ЗНачеНИЯ + б&тах ИЛИ —б&тах- Поэтому нужно описать фазовые траектории систе- мы (4.1.20) при этих значениях 6k. Характеристическое уравнение системы (4.1.20) при постоянном б« имеет вид рз + Р — = 0, \ То ) То 9 А. И. Егоров
258 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV где у—%+Р^кр^1- Это уравнение подобно характери- стическому уравнению системы (2.5.15). Отличие лишь в том, что теперь величина у содержит /гкр. Однако это отличие не вносит принципиально новых особенностей, ибо в случае, когда 6/>=б£тах, уравнение имеет вещест- венные корни различных знаков pt >0>pt. Если 6£= =—б&ши, корни вещественны и одного знака 0>р?>Р7. Поэтому фазовые траектории системы (4.1.20) имеют вид, изображенный на рис. 22 и 23, где оси х+ и у+, х~ и у~ определяются уравнениями *) г=—(ось х+), r = —(ось i/+), *• л» X 4-р2 X -|- р* ---~N (ось х~), г --N (ось г/“). *) Чт°бы подчеркнуть связь приводимых здесь формул с форму- лами § 2.5 вместо Ф в дальнейшем часто используется л/.
§ 41) УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 259 При этом точно так же, как это сделано в § 2.5, мож- но показать, что при выполнении условий Р>ь ^кр(1-Р)>ХТ0 (4.1.23) *кр+б/гтах оси х* проходят через первую и третью четверти, как это указано на рис. 22 и 23. На плоскости N, г проводим луч OL, на котором расположены начальная и конечная точки искомой опти- мальной траектории. Его уравнение имеет вид T^r^k^N, W>0. Этот луч расположен между лучами Ох+ и Ох~. До- казательство этого факта является дословным повторе- нием того, что было изложено в § 2.5 для случая, когда k =1 Таким образом, интересующие нас фазовые траекто- рии расположены внутри угла, образованного лучами Ох+ и Ох~ (рис. 24 и 25). Рис. 24. Рис. 25. Если координаты произвольной точки Q луча OL обозначить через г0, No, то уравнение траекторий, изо- браженных на рис. 24, можно записать в виде (4.1.24) 9*
260 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV а для траекторий, изображенных на рис. 25, будем иметь уравнение 1 . (y + p7)M> 1 (% + p;)N + Az~| ₽2 (y+p7)at0 (4.1.25) Для построения закона оптимального управления по- ступаем так же, как и в § 2.5. / р^к У Пусть Pi у, —-2у) — конечная точка искомой фазо- вой траектории, определяемая условиями (4.1.22). Че- Рис. 26. рез нее проводим траектории PtP2 из семейства (4.1.25) при M)=Yi и PsPt из семей- ства (4.1.24) при N0=yt (рис. 26). В результате все множе- ство точек (N, г), ограничен- ное лучами Ох~ и Ох+, раз- бивается на две области Qt и Q2. При этом к Qt мы от- несем и точки, лежащие на P3Pt, а к Q2—точки, лежа- щие на P2Pi. Тогда тем же способом, что и в § 2.5, мож- но показать, что оптималь- ное управление в рассматриваемой задаче определяется формулой dJfe (N, г) = б&тах, ~Ь 6&тах, если точка Р (N, г) принадлежит Q2, еслй точка Р (N, г) принадлежит (4.1.26) ' Таким образом, построение оптимального управле- ния для плоского реактора после некоторого предвари- тельного анализа задачи сводится по существу к зада- че, рассмотренной в. § 2.5 и строится с помощью того же математического аппарата. Однако само оптималь- ное управление может существенно отличаться от опти- мального управления, построенного для случая, когда
$ 4.IJ УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 261 не учитывается зависимость плотности нейтронов от пространственной координаты. Это отличие обусловлено следующими причинами, каждая из которых существен- но влияет на структуру оптимального, управления и об- ласть его определения по переменнымNuir. 1. Линии OL, на которых располагаются начальная и конечная точки оптимальной траектории, не совпада- ют для двух раёсмотренных случаев и существенно от- клоняются друг от друга при больших значениях вели- чины |£кр—1|. 2. Области, заключенные между осями Ох~ и Ох+, различны. 3. Различны линии PtP2 и PiP)t на которых происхо- дит переключение оптимального управления. 4. Управление сферическим реактором. Рассмотрим теперь прежнюю задачу, но для сферического реактора радиуса R. Как и прежде, будем предполагать, что он граничит с вакуумом. Стационарный процесс диффузии нейтронов описывается уравнением (см. § 2.2) DobN + ^^N(r) = Q, 0<r<R, *0 где А — оператор Лапласа. Помещая начало координат в центр реактора и учитывая однородность граничного условия N(R)=Q, (4.1.27) находим, что стационарный процесс диффузии в этом случае можно описать уравнением . . fa _,4 0-W' (r))+aW(r) = О, a« = , (4.1.28) г» dr T0D0 страничным условием (4.1.27). Пусть N0(r)—стацио- нарная плотность нейтронов в реакторе. Тогда из соот- ношений (4.1.27) и (4.1.28) находим, что (см. п. 1 § 2.2) No (г) = & sin (-= A a2 = (-5Y (4.1.29) Г \ А / \ А/ где ув — заданная постоянная,
262 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV Пусть, далее, Afi(r)—отличная от No(r) стационар- ная плотность нейтронов в реакторе. Тогда JVl(r)=^sin(-|r^ (4.1.30) где Yi — заданная постоянная, отличная от у0. Если критическому коэффициенту размножения kKV дать приращение 8k (t), то в реакторе начинается неста- ционарный процесс, который описывается уравнением 00 = D^N + + А С kl (t - т) N (t-x.r) e~Kxdx. oi L 1 о ' о J о (4.1.31) Здесь мы учитываем лишь одну группу запаздывающих нейтронов, причем через kt обозначен коэффициент раз- множения запаздывающих нейтронов. Поскольку об- щий коэффициент размножения в нестационарном ре-, жиме k можно представить в виде &=&Kp-|-6fe и fe=fc04-£t, то, считая, что kt — ^k, будем иметь (1^р) (^р+б^) , kt=₽fcKp+₽Sfc. Тогда уравнение (4.1.31) можно представить в виде = D^N + “ [ N (< -r, r) + vt 7 0 Tq J о (t % (1—p)S£ (0АГ + Xp f 8k (t~x)N(i — x, r)rW, J 0 7 (4.1.32) и задача оптимального управления в этом случае может быть сформулирована следующим образом. В классе кусочно-непрерывных управлений 8k (t) с разрывами первого рода, удовлетворяющих условию |б£(О|^б£шах, требуется найти управление 8k°(t) такое, чтобы соответ-
§ 4.ij УПРАВЛЕНИЕ ОДНОМЕРНЫМ РЕАКТОРОМ 263 ствующее ему решение уравнения (4.1.32) с начальным условием N(t, r)=No(r) при при минимальном положительном удовлетворяло условию N(tit r)=Nl(r). Кроме того, решение должно быть таким, чтобы 1) N(t, г) ^0 при 2) если 8k(t)=0 при t^tlt то N(t, r)=Nt(r) при t^ti. Здесь (г) и Nt(r)—функции, определяемые фор- мулами (4.1.29) и (4.1.30). Тем же способом, который применялся для плоского реактора, задачу можно свести к следующей задаче. Управляемый процесс описывается системой урав- нений ~ + v + (о ф, аг Tq Tq •^ = ^ЕФ-^ + |йй(0Ф W Tq Tq (4.1.33) с начальными условиями Ф(0)=У0» r<°)=^Yo- Требуется найти допустимое управление такое, чтобы ре- шение задачи (4.1.33), (4.1.34) при минимальном поло- жительном tt удовлетворяло условиям Ф(М=?1, r(^i)=v?Yi. 2 ол Эта задача дословно повторяет задачу, рассмотренную выше для плоского реактора. Отличие лишь в величине критического коэффициента размножения, который для сферического реактора определяется формулой *кр= 1 + ВД,(-5У.
264 ОНТЙМАЛЬЙЫЁ Быстродействия iv Отсюда следует, что если этот коэффициент удовле- творяет условиям (4.1.23), то оптимальное управление определяется формулой (4.1.26). Проведенный анализ показывает, что построение оптимального управления для сферического реактора не встречает каких-либо принципиальных трудностей, а по форме оптимальное управление совпадает с тем, ко- торое получено для плоского реактора. Аналогичный результат можно получить для цилин- дрического реактора. § 4.2. Управление реактором произвольной формы Рассмотрим теперь ту же задачу об оптимальном быстродействии, но для реакторов произвольной геомет- рической формы. Изложенный в предыдущем парагра- фе метод, позволяет найти ее решение в этом общем слу- чае, если предположить, что коэффициент диффузии нейтронов является постоянным, а избыточная реактив- ность зависит лишь от времени. 1. Постановка задачи. Пусть реактор на тепловых нейтронах представляет собой геометрическое тело £2 с границей S. Через N (Р) обозначим плотность тепловых нейтронов в точке PeQ и будем исходить из диффузион- ной теории переноса, согласно которой плотность потока нейтронов j подчинена закону Фика J(P)=— DgradlV(P), где D — коэффициент диффузии. Пусть, далее, k^,— критический коэффициент раз- множения нейтронов, То — длина их свободного пробега, a Da — эффективный коэффициент диффузии. Тогда в стационарном режиме плотность тепловых дейтронов У0(Р) подчиняется уравнению диффузии k — 1 D0AjV 4- = 0, (4.2.1) To где А — оператор Лапласа. Всюду в дальнейшем предполагается, что D, k„t и Т» постоянны. Будем, далее, предполагать, что реактор граничит с вакуумом и, следовательно, на границе S
§ 4.2J УПРАВЛЕНИЕ РЕАКТОРОМ ПРОИЗВОЛЬНОЙ ФОРМЫ 265 выполйенно условие У|в=0. (4.2.2) Если критическому коэффициенту размножения в мо- мент времени /=0 дать некоторое приращение то в реакторе возникает нестационарный процесс, который описывается интегро-дифференциалЬным уравнением ОТ J О ,т д °о + 3“ t—c)e^iXdx. (4.2.3) Здесь — коэффициент размножения мгновенных ней- тронов, kt — коэффициент размножения запаздывающих нейтронов i-й группы, К — постоянная радиоактивного распада i-й группы. Интересующее нас решение уравнения (4.2.3), оче- видно, должно удовлетворять следующим начальному и граничному условиям: ЛГ(Р,/) = ЛГО(Р) при i<0, (4.2.4) У(Р, i)|s = 0. (4.2.5) Учитывая, что полный коэффициент размножения k нейтронов в нестационарном режиме удовлетворяет со- отношениям k (i) = Лкр + bk (i), k (Г) = k0 4- 2 kit и, полагая находим, что уравнение (4.2.3) можно записать в виде dt ° То + N(P,t-t)e-K‘xdr + iff 1- 2 tk(t)N + z=i Г° / 7°l\ i=i / т * 1 + yk (t-x)N (P, t — t) etl xdrj . (4.2.6)
266 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV Выбирая избыточную реактивность 6k(t) в качестве управляющей функции, можно управлять процессом, и одна из задач, а именно задача об оптимальном быстро- действии, может быть сформулирована следующим об- разом. В качестве допустимых управлений выберем множе- ство кусочно-непрерывных функций 6k(t) с разрывами только первого рода, удовлетворяющих условию |6*(0|^S^naz, (4.2.7) где — некоторое фиксированное число. Пусть, далее, Nt (Р) — некоторая стационарная плот- ность нейтронов в реакторе, отличная от N0(P), которая также удовлетворяет уравнению (4.2.1) и условию (4.2.2). Задача 1. Требуется найти допустимое управление 6k такое, чтобы соответствующее ему решение уравне- ния (4.2.6) с дополнительными условиями (4.2.4) и (4.2.5) в конечный момент времени £=Л>0 удовлетво- ряло условию tf(P,/t)=.Vt(P), PeQ+S, (4.2.8) и при этом ti было минимальным. Кроме того, должны быть выполнены условия: 1) если 6&(/)=0 при то N(P, t)=Ni(P) при t>tlt (4.2.9) 2) 2V(P, f)>0 при <>0. (4.2.10) Этому же условию (4.2.10), очевидно, должны удов- летворять функции N„{P) и Ni{P), что непосредственно следует из их физического содержания (плотность ней- тронов). Поясним физический смысл задачи. Речь в ней идет о переводе реактора из одного стационарного режима, определяемого функцией No(P), в другой стационарный режим Ni (Р), который определяется тем же критическим коэффициентом размножения &кр. Это означает, что недо- статочно добиться выполнения условия (4.2.8). Нужно еще, чтобы после снятия избыточной реактивности ПЛОТ’ ность нейтронов со временем не изменилась.
$ 4.2) УПРАВЛЕНИЕ РЕАКТОРОМ ПРОИЗВОЛЬНОЙ ФОРМЫ 267 Это требование выражено условием (4.2.9). С математической точки зрения сформулированная задача является задачей об оптимальном быстродействии с ограничениями на фазовое состояние объекта, которые определяются условиями (4.2.9) и (4.2.10). Сам объект является объектом с распределенными параметрами, а его поведение описывается краевой задачей для интегро-диф- ференциального уравнения с частными производными (4.2.6). Условие (4.2.7) определяется инженерными огра- ничениями на избыточную реактивность 6k (t), исходя из требования безопасности работы реактора. Допустимыми управлениями взяты кусочно-непрерывные функции для того, чтобы иметь возможность использовать безынерци- онные рули управления. Чтобы упростить последующие формулы, ограничимся простейшим случаем, когда учитывается лишь одна груп- па запаздывающих нейтронов, а, следовательно, неста- ционарный процесс описывается уравнением — = D0AAf + &кр(4~Р)-- N + f У (Р, f — x)e~Kxdx + dt TQ TQ J о (t (1—P)Mj(O^ + — x)N(P, t~ x)e-^dx » J (4.2.11) где p — доля запаздывающих нейтронов. Таким образом, будем рассматривать управляемый процесс, который описывается уравнением (4.2.11) с до- полнительными условиями (4.2.4) и (4.2.5). Для решения задачи вводим вспомогательную функцию г (Р, О = А [ [&кр + SJfe (t — т)]W (Р, t — х) e*dx. (4.2.12) То J о Непосредственным дифференцированием этого равен- ства находим, что (Р, 0 - V (Р, t) 4- 6k (0 N (Р, t). dt Tq Tq
268 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ (ГЛ. IV Так как t>k(t)=O при КО и выполнено условие (4.2.4), то из (4.2.12) следует, что r(P,t) = ^.(Р) при /<0, (4.2.13) 4 0Л и поэтому вместо уравнения (4.2.11) можно рассматри- вать систему уравнений d2L = D^N+ N + v + iziPв*(0N> 4 0 4 0 N - V 4- A SH0 N. и* Ту ТQ (4.2.14) Функции (4.2.4) и (4.2.13) удовлетворяют этой систе- ме при ts^.0. Поэтому вместо уравнения (4.2.11) с на- чальным условием (4.2.4) можно рассматривать систе- му (4.2.14) с начальными условиями ль N(P,0) = No(P), r(P,O) = ^No(P). (4.2.15) 4 0Л Далее, в соответствии с требованиями задачи 1 нас интересует плотность нейтронов JV(P,/), которая долж- на удовлетворять условию (4.2.9) при 6&(/)=0 для t>ti. Непосредственной подстановкой в систему (4.2.14) при =0 функций ль N(P,0 = Ni(P), r(P,0 = V?^(P), 1 qA находим, что они удовлетворяют этой системе. Поэтому условие (4.2.9) в задаче 1 можно заменить требованием того, что в конечный момент времени t=tl выполнены условия = г(РЛ) = ^АиР). (4.2.16) 4 оЛ» Таким образом, задачу 1 теперь можно сформулиро- вать следующим образом.
§ 4.2] УПРАВЛЕНИЕ РЕАКТОРОМ ПРОИЗВОЛЬНОЙ ФбРМЫ 2б9 Задача 2. Требуется найти допустимое управление такое, чтобы соответствующее ему решение системы (4.2.14) с начальными условиями (4.2.15) и граничным условием (4.2.5) удовлетворяло условиям (4.2.16) при наименьшем положительном и при этом функция N(P,t) оставалась неотрицательной (см. (4.2.10)). Эта формулировка задачи более удобна для дальней- шего исследования, ибо в ней не требуется учитывать предысторию процесса (т. е. значения N при #<0) и нет необходимости заботиться о том, чтобы при t>tt и б£(/)=0 функция N(P, i) оставалась независимой от t. 2. Предварительный анализ задачи 2. Функции Ne(P) и Ni (Р), определяющие начальное и желаемое распреде- ление плотности нейтронов, являются решениями краевой задачи (4.2.1), (4.2.2). Кроме того, они должны быть не- отрицательными. Это означает, что У0(Р) и Nl(P) явля- ются неотрицательными собственными функциями крае- вой задачи D0&N = — ХУ, У|5 = 0, (4.2.17) соответствующими собственному значению k — 1 Х = . (4.2.18) Так как обе функции неотрицательны, то они не могут быть ортогональными, т. е. справедливо неравенство [ЛЦР)У1(Р)<К2=£0. о Если обозначить через х0(Р) нормированную собствен- ную функцию краевой задачи (4.2.17), соответствующую собственному значению (4.2.18), то будем иметь Уо(Р)=СоХ0(Р), yt(P)=ctx4(P), (4.2.19) где Со и ct — постоянные одного знака, например обе по- ложительные. Возьмем произвольное допустимое управление 6k (t) и соответствующее ему решение краевой задачи (4.2.14),
270 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV (4.2.15), (4.2.5) будем искать в виде . (Р, 0 = 2ФДОХ (Р), г(Р, 0 = 2 гп (О ХП (Р), (4.2.20) Л*0 Л=0 где {х„(Р)}—полная система ортонормированных соб- ственных функций краевой задачи (4.2.17). Подставляя (4.2.20) в уравнения (4.2.14), получаем - k + Фп+ХГя+ Фп> dt L т0 т0 ^ = ^Фп-Кгп+^Ы(1)Ф, п = 0,1,2,..., « "о 7» (4.2.21) где Хп— собственные значения краевой задачи (4.2.17), соответствующие собственным функциям х„(Р), причем ь __1 = . (4.2.22) 1 о Согласно условиям (4.2.13) и соотношениям (4.2.19) по- лучаем Фо(О) = ^о. го(О) = ^со, Ф„(0) = г„(0) = 0, п=1,2,... (4.2.23) Отсюда следует, что Ф„(0=Гп(0®0» «=1,2,... (4.2.24) Опуская индекс «0» у функций Ф0(0 и r0(t) и учитывая соотношение (4.2.22), получаем систему уравнений f = _^Рф+Хг+^&% (0 Ф, ® ° '° (4.2.25) ± = ^₽ф—Хг+^^Ф <Й То То с начальными условиями Ф(О) = со, г(О) = ^со. (4.2.26) J аЛ
§ 4.2) УПРАВЛЕНИЕ РЕАКТОРОМ ПРОИЗВОЛЬНОЙ ФОРМЫ 271 Легко показать, что из условий (4.2.16) и соотношений (4.2.19) следует: Ф(4) = ^ (4.2.27) Следовательно, задача 2 теперь может быть сформули- рована следующим образом. Задача 3. Требуется найти допустимое управление такое, чтобы соответствующее ему решение задачи (4.2.25), (4.2.26) удовлетворяло условиям (4.2.27) при минимальном положительном tt и, кроме того, должно выполняться неравенство Ф(0>0 при Osgi'C/,. (4.2.28) Неравенство (4.2.28) обусловлено тем, что функция N{P, t) должна быть неотрицательной, а числа с0 и ct предполагаются положительными. Покажем теперь, что при любом допустимом управ- лении решение задачи Коши (4.2.25), (4.2.26) удовлет- воряет условию (4.2.28). В самом деле, с помощью фундаментальной матри- цы системы, получаемой из (4.2.25) при 6Л(/)=О, мож- но показать, что функция Ф(0, фигурирующая в нера- венстве (4.2.28), удовлетворяет уравнению t ф (/) = Сй + J К (t — т) bk (т) Ф (t) dt, (4.2.29) где К (0 = V- [ь + №кр А-Г - у) е-* I Y = * 4- 0 W71- 7»У L Vo / J Так как у>0, то ₽) С другой стороны, по условию задачи с0>9. Поэтому, по крайней мере для достаточно малого интервала време- ни t, функция Ф(/) остается положительной при любом допустимом управлении bk(t). Для таких t можно
272 ОПТИМАЛЬНЫЕ БЫСТРОДЕЙСТВИЯ [ГЛ. IV записать £ м .. t °*---- О с* 7 о J 0 Отсюда следует, что f cQe~m- < Ф (0 < т - (1 — Р). Го | Это означает, что при любом допустимом управлении г 6k (t) соответствующая ему функция Ф(/) не может обра- щаться в нуль и тем более принимать отрицательные зна- чения в любой конечный момент времени. Полученный результат позволяет игнорировать фазовое ограничение (4.2.29) в задаче 3, что значительно упрощает ее исследо- > вание. Подводя итог, можно сделать следующий вывод. Сформулированная в п. 1 задача 1 об оптимальном ( быстродействии в управлении процессом, описываемым интегро-дифференциальным уравнением (4.2.3) с допол- нительными условиями (4.2.4) и (4.2.5) и т=1, сво- дится к следующей более простой задаче. Задача 4. Требуется найти допустимое управление I такое, чтобы соответствующее ему решение задачи Коши (4.2.25), (4.2.26) удовлетворяло условиям (4.2.27) при минимальном положительном Л. Таким образом, для реактора произвольной геометри- ческой формы получается задача, подобная той, которая s рассмотрена в предыдущем параграфе. Отличие состоит ' лишь в том, что здесь коэффициент kKX> в уравнениях (4.2.25) отличен от соответствующего коэффициента в * системе (4.1.20). Поэтому, если &кр из уравнений (4.2.25) удовлетворяет условиям (4.1.23), то способом, изложен- ным в предыдущем параграфе, можно показать, что опти- мальное управление определяется по формуле (4.1.26)
ГЛАВА V ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ В этой главе показано применение метода динамиче- ского программирования к решению различных задач управления процессами теплопроводности и диффузии. Хорошо известны успехи, достигнутые в применении это- го метода при исследовании управляемых дискретных и непрерывных систем с конечным числом степеней сво- боды. Особо следует подчеркнуть результаты, получен- ные в решении задач оптимальной стабилизации, где синтез методов Ляпунова Н Веллмана позволил постро- ить стройную теорию. Иная ситуация сложилась к на- стоящему времени в теории оптимального управления си- стемами с распределенными параметрами. Здесь опыт применения метода Веллмана оказался менее богатым (см., например, [1—3]). Трудности заключаются не толь- ко в иоследовании уравнения Веллмана, но и в получе- ний удовлетворительной формы самого уравнения. Ре- зультаты, кратко изложенные в (4], показывают, что наи- более подходящим в этой ситуации является аппарат обобщенных решений краевых задач, а также понятие дифференциала Фреше. Такой подход позволяет не толь- ко развить некоторые аспекты теории оптимального управления системами с распределенными параметра- ми, но также указать пути приближенного решения за- дачи синтеза оптимального управления, по крайней мере в некоторых частных случаях [4—7]. Вместе с тем на этом пути удается показать применимость идей второго метода Ляпунова в исследовании оптималь- ной стабилизации систем с распределенными парамет- рами. Здесь мы ограничимся рассмотрением этого круга вопросов применительно к задачам управления процес- сами теплопроводности и диффузии. Однако, как пока- зано в [6], излагаемый здесь метод можно успешно
274 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V использовать при решении задач управления колебатель- ными системами с распределенными параметрами. По- лучаемое при этом уравнение Веллмана является урав- нением в функциональных производных и обычно не удается найти его точное решение. Тем не менее этот ре- зультат дает дополнительную информацию о структуре оптимального управления, и можно указать различные методы приближенного решения задачи, связывая их непосредственно с уравнением Веллмана. § 5.1. Дифференцирование функционалов Важнейшую роль в применении метода динамическо- го програМ|М,ирования к задачам управления система- ми с распределенными параметрами играет понятие производной Фреше для функционалов, определенных па гильбертовых пространствах. Поэтому изложение метода начнем с более или менее подробного анализа •вопросов дифференцируемости функционалов, имея в ®иду, что читатель знаком с основами теории гиль- бертовых пространств, например, в объеме моногра- фии [8]. Пусть Н — гильбертово пространство. Вещественным функционалом, определенным в Н, называется любой оператор f, отображающий некоторое множество М<=Н на множество вещественных чисел Q, т. е. f(x)eQ при любом хеЛ1. Функционал f называется непрерывным в точке хоеА1, если для любого числа в>0 существует число б>0 такое, что для всех х<=М, удовлетворяющих неравенству ||х—х0||<б, справедливо неравенство |f(x)—f(xQ) | <в. Иными словами, из того, что последовательность {х„} элементов из М обладает свойством ||х„—х|| -> 0, сле- дует, что f(x„) -*-f(x0). Если функционал f непрерывен в каждой точке мно- жества М, то говорят, что он непрерывен в М. Примерами функционалов можно рассматривать кри- терии оптимальности во всех задачах оптимального управления, которые изучались- в предыдущих главах. Нужно лишь соответствующим образом определить для дня гидьбертово пространство. В частности, в задаче об
§ 5.11 ДИФФЁРЁЙЦиРоВАНИЕ ФУНКЦИОНАЛОВ 275 управлений с минимальной энергией критерием опти- мальности служит функционал где p(f)—управляющая функция. Допустимыми управ- лениями считаются функции p(f), для которых /<оо. Вводя пространство L2(f0, Zt) функций p(t), суммируемых с квадратом на отрезке [/о, ^], находим, что I представ- ляет собой непрерывный функционал, определенный на всем пространстве L2(f0, ti)- Функционал f называется линейным непрерывным на Н, если он определен на всем пространстве Н и удовлет- воряет условиям: 1) f (Хх) =Л/ (х), X— вещественное число; 2) f(Xi-|-x2) =f(x1).+f(x2) для любых Xi и х2 из Н (ад- дитивность) ; 3) при ||хп—х||-4-0 (непрерывность). Приведем без доказательств несколько теорем. Теорема 1.1. Для того чтобы аддитивный функ- ционал, определенный на Н, был линейным и непрерыв- ным, необходимо и достаточно, чтобы он был ограничен, т. е. существовала постоянная М такая, что |f(x) | ||х|| для всех хеЯ. Одним из важнейших для нас результатов, относя- щихся к теории линейных функционалов, является сле- дующая теорема, которая часто будет использоваться в дальнейшем. Теорема 1.2. Всякий линейный непрерывный функ- ционал f(x), определенный на гильбертовом простран- стве Н, представим в виде f (х) = (и, х), где элемент ыеЯ однозначно определяется этим функционалом. Отсюда, в частности, следует, что если f (х) линейный непрерывный функционал на L2(0,1), то существует единственная функция y(t)^L2(Q, 1) такая, что /(х) = = J y(t)x(t)dt. О В дальнейшем теория линейных функционалов нам будет нужна лишь в связи с необходимостью дифферен- цирования функционалов при построении уравнения
2?6 ПрИМЁНЁНИЁ ДИНАМИЧЁСКОЁО ПРОГРАММИРОВАНИЯ (ЁЛ. v Веллмана для управляемых процессов в объектах с рас- пределенными параметрами. Поэтому ограничимся лишь теми утверждениями, которые сформулированы в при- веденных выше теоремах. Пусть f(x)—произвольный функционал на Н*). Определение 1. Если в точке хеЯ существует Ит J(* + th)-~f(x) = h(=Ht то функционал Vf(x,h) называется дифференциалом Гато (слабым дифференциалом) в точке х функциона- ла /. Из этого определения следует, что Vf(x, ah)=a,Vf(x,h) для любого вещественного числа а, т. е. функционал Vf(x, h) всегда однороден относительно h. Легко также доказывается следующий факт. Если дифференциал Гато функционала f(x) сущест- вует в каждой точке выпуклого множества <оеЯ, то справедлива формула Лагранжа f(x+th)—f(x) = Vf(xl+xh,h), для любых точек х и h из со. Особый интерес для нас будут представлять те слу- чаи, когда дифференциал Гато Vf(x, h) линеен по Л (при этом его обозначают через Df (х, h)). Теорема 1.3. Пусть выполнены следующие условия. 1. Дифференциал Гато Vf(xB,h) функционала f су- ществует в некоторой окрестности U (х0) точки х0 и непре- рывен в этой точке. 2) Vf(xB,h) непрерывен по h па нулевом элементе Л=0. Тогда Vf(xB,h) является линейным ограниченным функционалом, т. е. V7(x0, Л) =Z>/(x0, Л). *) Изложение последующего материала основано на содержании монографии [9], где можно найти доказательства приводимых нами фактов.
$ 5.1] ДИФФЕРЕНЦИРОВАНИЕ ФУНКЦИОНАЛОВ 277 Говорят, что функционал f(x) удовлетворяет ослаб- ленному условию Липшица, если каждому элементу й, ||й|| = 1, отвечает число 6(й)>0 такое, что из условия | /| <б следует неравенство |/(х+/й) — f(x) | ^с||/й||, где постоянная с не зависит от выбора h. Теорема 1.4. Для того чтобы имело место равен- ство Vf(xn,h)=Df(xt>,h), необходимо и достаточно, что- бы выполнялись следующие условия: 1) f(x) удовлетворяет ослабленному условию Лип- шица в точке х0; 2) Дл„л» f(*o)=°(O. W jTp"*0 ПРИ PI"*0» а А2*,, л/(хо) —f (*о4-Л1+Л2)—/(Xo+Zh)—f (х0-]-Й2) +/(хо). Таким образом, эта теорема может служить практиче- ским рецептом для проверки того, имеет ли каждый кон- кретный функционал линейный ограниченный дифферен- циал Гато. Определение 2. Если в точке хей имеет место равенство f (x-f-й) —f(x) =df(x, h) +o}(x, й), где df (х, й) — линейный непрерывный пс й функционал, и Пт 1^1А1 = 0, Н->о |Н то функционал df(x,h) называется дифференциалом Фреше {сильным дифференциалом) функционала f в точ- ке х, а ® (х, й) называется остатком этого дифферен- циала. Из этого определения, в частности, следует, что если существует df(x,h) , то Df(x,h) также существует. При этом df(x, й) =Df(x, h). Как показывает приводимый ниже пример [10], обратное не всегда верно. Пример. В качестве Н возьмем Е2 — двумерное евклидово пространство, и пусть х= {хь х2}е£!.
2?8 ЙРЙМЁНЁЙЙЕ ДЙЙАМЙЧЁСКОГО ПРОГРАММИРОВАНИЯ [Рл. v Положим f ЛЛ = /1 П₽И х1 = х*’ ' ' (О в остальных точках. Возьмем произвольный вектор йеЕ2 и вычислим вели- чину Непосредственно из определения f (х) следует, что /(0) = =0, a f(th) = 1 лишь при условии ht = thl, где ft= {ftt, h2}. Следовательно, f(th) = 1 только при единственном значе- нии параметра t: t=hi[h2 при всех остальных t имеет ме- сто равенство f(th) =0. Поэтому lim/(1, ft) = 0, /-•о и, следовательно, Vf(x,h) существует, причем Vf(x, h) = =0. Покажем теперь, что функционал f(x) не имеет диф- ференциала Фреше. Согласно определению этого диффе- ренциала должно выполняться равенство f(ft)—f(O)=df(O, ft)+co(0, Л), т. е. f (Л) =df(Q, ft) +а(0, Л), где df(O, Л)—линейный функционал, a ||ft||_‘(o(O, Л)-Н) при ||Л||->0. Из определе- ния функционала f следует, что он не допускает такого представления. Теорема 1.5. Если дифференциал Df(x0, ft) непре- рывен по х в некоторой окрестности (7(х0) точки х0, то df(x0,h) существует и при этом df(x0, h) =Df(xl), h). В заключение сделаем следующее полезное для даль- нейшего замечание. Дифференциал df{Xo,h) является по определению линейным непрерывным функционалом. Поэтому он ограничен. Так как h^H, то, согласно тео- реме 1.2, существует элемент и^Н такой, что df(xa, h) = = (и, Л). При этом и зависит от х0. Учитывая это обстоя- тельство, обычно пользуются обозначением «=Г(х0). Тогда <#(х0, ft) = (f(x0),ft),
§ 5.2] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 279 а элемент f'(xQ)^H называют градиентом функционала f(x) в точке х0. Тот элемент х0, для которого f'(xa)=Q, называют стационарной точкой функционала f(x). § 5.2. Синтез оптимального управления В этом и следующих параграфах настоящей главы излагается применение метода динамического 'програм- мирования к решению различных задач оптимального управления, когда процесс описывается краевыми зада- чами для уравнения теплопроводности или общих пара- болических уравнений. При этом из чисто методических соображений сначала рассмотрены более простые зада- чи, на которых показывается эффективность используе- мого метода и связь полученного результата с извест- ными фактами из теории оптимального управления системами, описываемыми обыкновенными дифферен- циальными уравнениями. 1. Постановка задачи. Формальный вывод уравнения Белл мана. Будем рассматривать управляемый процесс, который описывается функцией u=u(t, х), где t — вре- мя, а х — пространственная координата. Будем, далее, предполагать, что внутри области Q= {0^/^Т, О^х^ ^1} функция u=u(t, х) удовлетворяет уравнению ^ = ^- + р(/,х) + Н/,х), (5.2.1) dt dx* а на границе Q она подчинена условиям «(0,х)=$(ж), (5.2.2) диЦ, 0) du(t, 1) , ,, „ . . п ——- = —kL-- 4- аи (t, 1) = 0, а = const > 0. дх дх ' ’ (5.2.3) Здесь /(/, х) (f«=£2(Q)) и g(x) (g<=L2(0, 1)) — задан- ные функции, а р(£х)—управляющая функция. Классы допустимых управлений для прикладных за- дач могут быть различными. Укажем некоторые из них. 1. Допустимыми управлениями являются все измери- мые функции p(t, х), для которых имеет место нера- венство |р(/,х)|^М
280 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ 1ГЛ. V почти для всех точек N(t, x)eQ. Здесь М — заданная постоянная. 2. Допустимыми управлениями являются функции p(t, х), удовлетворяющие условиям: а) функция ф(0, определяемая формулой 1 ф (0 — J Р (*» •*•) 'dx, о измерима; б) |ф(0 I почти для всех /е[0, Т], где М — задан- ная постоянная. 3. Допустимыми управлениями являются функцйи р (t, х), для которых функция 1 ф (0 = J р2 х) dx о удовлетворяет условиям, указанным в предыдущем пункте. 4. Допустимыми управлениями являются все функ- ции из Lt(Q), q^l. Можно указать еще многие Другие классы допусти- мых управлений, при которых применима излагаемая ниже формальная процедура получения уравнения Велл- мана. Нужно лишь, чтобы для выбранного класса допу- стимых управлений выполнялось следующее условие: каждое допустимое управление однозначно опреде- ляет обобщенное решение (см. соотношения (5.2.8) и (5.2.9)) краевой задачи (5.2.1) — (5.2.3). Кроме того, для рассматриваемого нами критерия оптимальности должен существовать предел t+bt 1 1 lim — ? t Ц, х) dxdt = f pv(t, х) dx (А) А/—о Д< .1 J J t о о почти при всех /е[0, Г]. Требование (А) ограничивает свободу выбора до- пустимых управлений, ибо ему подчинены не в‘се функ- ции из перечисленных выше классов. Рассматриваемая задача оптимального управления состоит в том, чтобы найти допустимое управление
1 5.2) СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 281 p(t, х) такое, чтобы функционал 1 т I 1 [р] = J [и (Т, х) — ф (х)]2 dx + р J J р2 (/, х) dx dt, О 0 0 Р — const > 0, (5.2.4) принимал наименьшее возможное „значение. Здесь Т — фиксированный момент времени, а ф(х)—заданная функция из (0,1). Прежде всего отметим, что каждое допустимое управ- ление p(t,x) однозначно определяет решение краевой задачи (5.2.1) — (5.2.3), которое формально можно пост- роить в виде ряда Фурье по собственным функциям крае- вой задачи X'(x) + VX = 0, 0<х<1, | X' (0) = О, X' (1) + аХ(1) =0. ) k ‘ ' Обозначая через {Х„(х)} полную систему ортонормиро- ванных собственных функций задачи (5.2.5), а через {М —соответствующую систему собственных значений, обычным способом находим, что u(/,x) = jG(x,B,0g(9^+jjG(x,B,f-T)f(T,B)dBdr + О 0 0 i 1 +J JG (х, В, t-x) р (г, В) dB dt, (5.2.6) О о где G — функция Грина, определяемая формулой G (х, ВЛ - т) - 2 Х„ (х) Х„ (В) е~к^~х\ (5.2.7) п=1 Функция (5.2.6), вообще говоря, может и не иметь первой производной по переменной t и производной вто- рого порядка по переменной х и в обычном понимании не является решением краевой задачи (5.2.1) —(5.2.3). Ее следует понимать как обобщенное решение, обладаю- щее следующими свойствами [11]:
282 ПРЙМЁНЕНЙЁ ДЙЙАМЙЧЁСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V 1. u(t, x)eL2(Q). 2. Формально вычисленная производная du(t, х)[дх почти при всех /е[0, TJ принадлежит L2(0,1). 3. Функция u(t,x) удовлетворяет интегральному тож- деству j и (t, х) ф (t, х) О + lp(t, х) 4- f (t, x)] ф jdxdt + a Jn(f, 1)ф (t, 1)dt — 0 it (5.2.8) для любой функции ф(/, x)eIV,’(Q). Здесь t2 и t2 — про- извольные моменты времени, удовлетворяющие условию 0^7ts^2s^T. 4. Для любой функции <р(х)еА2(0,1) имеет место равенство 1 lim f [и (t, х) —g (х)] <р (х) dx = 0. /-Н-0 J (5.2.9) Для решения задачи оптимального управления вос- пользуемся принципом оптимальности Веллмана, кото- рый, как известно, заключается в следующем. Оптимальное поведение системы обладает тем свой- ством, что, каков бы ни был момент времени ta (О^/о< <Т), оно остается оптимальным относительно состояния системы в этот момент времени на всем оставшемся от- резке времени t>t0 независимо от того, каким образом система достигла состояния в момент времени t0. В соответствии с этим принципом вводим функционал S [/, и] = min { С [и (Т, х) — ф (x)f dx 4- р(х,х)еР J (t,x)sQ I • Т 1 4- р j Jр2 (г, х) dxdx , t о (5.2.10)
СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 283 § 5.2J где t — произвольный момент времени из отрезка [0, 7], а Р — область значений допустимых управлений. Положив t'=t+&t, u(t',x)=u(t,x)+&u(t,x), нахо- дим, что S[f, u(f,x)]=S[/+Af, u(t, x)H-Au(f, x)]. Предполагая, что S, как функция от t, дважды непре- рывно дифференцируема и, как функционал от и, имеет дифференциал Фреше, получаем < S [f, и it’, х)] =S ,'u] + dS [f’ М + 4- Ф (t, и (t, х), &u(t, х)) 4- о (А/) + о (t, и (/, х), Ьи (t, х)) = = и(Лх)1 А/ 4-ф (/, и (t, х), Au (I, х)) 4- о (А/) 4- dt + a(t,u (t, х) Au (t, х)) 4- [<’и (f ’X)1 — dS [Л “X)1 1а/4- |_ dt dt J + SK.U1. Здесь Ф — дифференциал Фреше функционала S, вычис- ленный в точке (t, и). Используя формулу Лагранжа, находим, что = Ф| (/, и (0 х), Au (/, х)) 4- ©х (О и (t, х), Ди). Таким образом, получаем S [f,u (Г, х)] = S [/, и (t, х)] 4- А/ + at + dS [/, и, Ди] + о (Ы) + (о2 (/, и, Ди), (5.2.11) где ^-^->0 при Д/ 0 Д^ и ^^UonpHjAuHO.
284 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Учитывая определение функционала S (см. (5.2.10)), имеем S min |J[u(T,x)—ф(х)]Мх + U /+Д/ 1 Т 1 + Р J Jр2(т, x)dxdx + р J У^*(г’ t о f+Д/ о f i+&t I min p(Ttx)^P jp J Jp2(t, x)dxdx + I t Q + min p(s,x)GP /+Д/<5<Т о<лг<1 1 т 1 . н |[м(7’,х) — ф(х)]Мя4-Р J ^p2(s,x)dxds .1 — о t+M о J {/+Д/ 1 0 f f рг (я, х) dx dx 4-S [f, и (f, x)] / A t О 0<Х<1 где P — область значений допустимых управлений р. Используя вычисленное значение функционала S[f, и (f, х) ] (см. (5.2.11)), находим, что t+ы 1 — dS[/. (d. д/ — min .0 f f p2 (x, x)dxdx-j- dt р(х,х)еР J J /<т</+д/ /о 0<Х<1 + dS [/, и, Au] 4- о (A/) + e>2 (t, u, Au) . (5.2.12) Так как &u(t, x) =u(f, x)—u(t, x) e£2(0,1) при всех /е[0, T] (по предположению, u(t, я) —непрерывная функ- ция), то dS ]/, и, Дм] = j v (t, я) Ли (I, я) dx, s
5 5.2] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 285 где v(t, х) — градиент функционала S вычисленный в точ- ке (t, и), принадлежащий L2(0, 1) почти при всех te е[0, Т]. Подставляя это выражение dS в уравнение (5.2.12), получаем (/+ДГ 1 ₽ f f p2(r,x)'dxdf + J J t о о (t, x) A« (t, x) dx + о (A/) + u,bu) . (5.2.12') Очевидно, что справедливо тождество J v (t, x)&u (t, x)dx = [ a (t, x) [«(f, x)]/+A/dx = 0 0 = J [o (t, x) w (t, x)]/+A/dx At, x) [f (t, x)]/+&/dx. 0 0 Предположим теперь, что v(t, x)eU7j (Q). Тогда, исполь- зуя предыдущее тождество, а также интегральное тож- дество (5.2.8), из (5.2.12') получим _ dS [Л и] Л min р(т,х)&Р г f+A/ri J *)<**<*< + О t+M 1 t о /+Д/ + / (*> ° (т>х) -------------- f и(т, 1)п(т, l)dr — at J Дг at о . (5.2.13)
286 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Теперь воспользуемся условием (А), которому долж- ны удовлетворять допустимые управления. Переходя к пределу в (5.2.13) при Af->0, получаем уравнение 3S Ц, и] , ч_.„ ---^-4=)™ от реР J^(t,x) + p(f,x)v(i,x)-gg- ‘ о + f(t,x)v(t,x) I dx— au(t, 1) , (5.2.14) где символ ( = ) означает равенство, справедливое поч- ти при всех /е[0, Г]. В дальнейшем в уравнениях вида (5.2.14) будем пи- сать обычный знак равенства, подразумевая под этим ( = ). Уравнение (5.2.14) является искомым уравнением Веллмана для рассматриваемой задачи оптимального управления. Поскольку v(t, х)—градиент функционала S, то (5.2.14) является уравнением в функциональных про- изводных. Непосредственно из определения функциона- ла S (см. (5.2.10)) следует, что S^O и S [Т, «] = j [u (Г, х)> ф (x)pdx. (5.2.15) о Таким образом, задача оптимального управления те- перь сводится-к отысканию р и S из уравнения Веллма- на и «начального» условия (5.2.15), причем таких, чтобы функционал S был неотрицательным. Прежде чем переходить к дальнейшему исследованию задачи, сделаем одно замечание относительно самой процедуры получения уравнения Веллмана. В общих чертах она совпадает с процедурой вывода соответствующего уравнения для управляемых процес- сов, описываемых обыкновенными дифференциальными уравнениями или уравнениями в конечных разностях. Поэтому в изложенной форме уравнение Веллмана мо- жет дать лишь необходимые условия оптимальности. Однако способ их получения нельзя считать обоснован- ным, во-первых, по тем же причинам, по которым эта процедура не является обоснованной для конечномерных
§ 5.21 СЙЙТЁЗ ОЙТЙМАЛЬЙОГО управления mt систем (отсутствует обоснование дифференцируемости функционала S по t и и). Во-вторых, в рассматриваемой задаче управления требуется не только дифференцируе- мость функционала S, но и принадлежность его гра- диента классу функций IFJ (Q). Это последнее обстоя- тельство вносит дополнительные трудности в задачу обоснования метода Веллмана в рассматриваемом случае. На основании всего изложенного можно сделать сле- дующий вывод, который обычно делают при рассмотре- нии метода Веллмана для конечномерных систем. Про- цедуру получения оптимального управления с помощью уравнения Веллмана следует рассматривать как эвристи- ческий прием, позволяющий выделить управления, «по- дозрительные» на оптимальность. Является ли выделен- ное управление оптимальным, можно установить про- веркой. В дальнейшем такая проверка не проводится ни в одной из рассматриваемых ниже задач. Поэтому при изучении содержания этой главы читателю следует пом- нить, что управления, называемые здесь оптимальными, следует рассматривать лишь как «подозрительные» на оптимальность. 2. Построение оптимального управления. Для даль- нейшего решения задачи предположим, что допустимыми управлениями являются произвольные функции из Lt(Q), т. е. множество Р совпадает с пространством веществен- ных чисел. Тогда из выражения, стоящего в правой ча- сти уравнения Веллмана, находим, что p(f,x)=-^o(f,x). (5.2.16) 2₽ Затем, исключая р из уравнения Веллмана, получим = ГГ±-&(t,x) + f(t,x)v(t, х)~ dt J L 4p о — 8v (t,x) du(t,x) 1 dx _ p u p (52 j 7) dx dx J
288 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Решение этого уравнения будем искать в виде S [/, и] = = J J К (/, х, s) [и (t, я)—ф (я)] [uj(/, s)—ф (s)] ds dx+ 0 0 + j <p (t, x) [u (t, x) — ф (я)] dx 4- r| (0, (5.2.18) 0 где K(t, x, s), <f(t,x) и т)(/) —подлежащие определению функции. Вычисляя дифференциал Фреше этого функционала, находим, что dS(t, u,h) = = J J [К (t, x,s) + К (/, s, я)] [и (/, s) — ф (s)] h (x) dsdx 4- 0 0 1 + J<p(i, x)h(x)dx, 0 и, согласно формуле dS(t, u,h)~ Jo(t, x) h(x)dx, « будем иметь о (t, x) = <p (t, x) 4- J [/< (t, x, s) 4- К (t, s, я)] [m (t, s)—Ф (s)]ds. (5.2.19) Подставляя в (5.2.17) значения S и о, определяемые со- отношениями (5.2.18), (5.2.19),получим 1 1 f f [~ Ki Х' S) ^Кхх Х’S) ^Кхх {t'S’ %) + Х’ S)]X О о х [и (/, s) — ф (s)l (w х) — ф (x)J dx ds 4-
eodojg *и *VOI •sp (s) Ф [(x ‘s7) “>/ + (s ‘x 4) »)/] У = (x7) «)/ X ‘sp (s ‘ Л / [(X ‘s7) % + (s ‘X 7) )/] J = (x •}) X ‘/?p[(/j‘x7)y + (х‘Я 7)V] I(/?‘s7)% + (s'fl 7) >/] J = (s‘x'}) ‘0 = (0‘?)« s?l(s)<N — 0 1 (S 'I) n] [(o ‘s •}) xyi + (s ‘o 7) ry] J + (o';) *<4 — I J (0 sp[(s)ck —(s7)n][(s‘i 7)№° + (s‘I + X 0 +sp [(») Ф —(s 7) n] [(I ‘S 7) 2/Ю + (l ‘S 7)x^} У + Kl ‘0 <bo + X }г о о f db p + xp(x 7) 5cb —+хр(х)ф(х 7)^(b \ — J к v ° 1 — xp(x‘;)tK(x‘;)/J — (;);U— +xp [(x)ф — (x 7)n]x X J о c ds x jsp(s 7)d> [(x ‘s'}))[ +(s ‘X 7)2!/] J — + 0 + <x 4) s% — (x 7) zy — (x '}) **<b — (x ‘f) ><b — J + 68S KHHHEaVdUA OJOH4EVWH1UO 6Я1НИЭ [5 s §
290 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V Поскольку это равенство должно выполняться для лю- бой функции u(t, х), то отсюда следует, что Kt (t,x,s) + К„ (t, X, s) + Кхх (t, s, X) = A. Ky (t,x,s), 40 (5.2.20) Kx(t,0,s) = Kx(t, l,s) + aK(t, 1,s) = 0,| Kx(t,s,O) = Kx(t,s, l)+aK(t,s, 1) = 0j 1 ’ Ф/ (t, x) + фхх (t, x) 4- K2 (t, x) + Ks (t, x) = 1 = 4 [K(*» X, s) + Кx)] Ф (/,s)ds, (5.2.22) 2p J о фж (t, 0) = фж (t, 1) + сир (t, 1) = 0, (5.2.23) %+ (t>x) dx + ]’фжж(/,х)ф(х)б£х = о 0 <p2(t,x)dx. (5.2.24) Из условия (5.2.15) и формулы (5.2.18) следует, что K(7’,x,s)=6(s—х), <р(Т,х)зО, т|(Т)=0. (5.2.25) Таким образом, для определения ядра K(f, х, s) по- лучили уравнение (5.2.20) с краевыми условиями (5.2.21) и начальным условием (5.2.25). Функция ф(/,х) должна удовлетворять уравнению (5.2.22), гра- ничным условиям (5.2.23) и начальному условию (5.2.25). После того, как эти функции удастся опреде- лить, функция т) (/) легко находится из (5.2.24) и (5.2.25). Краевую задачу (5.2.20), (5.2.21), (5.2.25) в дальнейшем будем называть интегро-дифференциальной краевой за- дачей типа Риккати. Как будет показано в дальнейшем, она является естественным обобщением уравнения Рик- кати, которое появляется при решении задач синтеза оптимального управления системами, описываемыми обыкновенными дифференциальными уравнениями.
$ 5.2J СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 291 Решение краевой задачи (5.2.20), (5.2.21), (5.2.25) ищем в виде /C(/,x,s)= 2 Сг/(0^(х)Х/(8), Хг(х) = ^, /./=0 V (5.2.26) где — собственные значения краевой задачи Х"(х) + +№Х(х) =0, Х'(0) =Х'(1) +аХ(1) =0, которые являются положительными корнями уравнения %tg%=a, а <• К? + а* + а = £ co^ kixdx = —------------. J 2(Х» + а«) Подставляя функцию (5.2.26) в уравнение (5.2.20), получим бесконечную систему дифференциальных урав- нений kty + c/i] + -у- V 4- см] [c/k + Ck/], * 4₽ So i,j = 0,1,... (5.2.27) Так как функция (5.2.26) должна удовлетворять на- чальному условию из (5.2.25), то ^/(П = б//= Р npni^}: (5.2.28) (0 при 1=£ /. Аналогично поступаем при решении краевой задачи (5.2.22), (5.2.23), (5.2.25). Функцию <р(/, х) ищем в виде <p(f,x) = 2 i=o В результате для определения at(t) получаем систему уравнений ~ (0 + 2 ^сч + ai ~~ at » г /«о — s Vi (0 1си + СЦ] > 1 = 0,1,... (5.2.29) 10*
292 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V с начальными условиями af(T)=0, (5.2.30) Здесь fi(t)—коэффициенты Фурье функции f(t,x), т. е. ft(t)^f(t,x)Xt(x)dx. о Если из уравнений (5.2.27) и (5.2.29) с дополнитель- ными условиями (5.2.28) и (5.2.30) удалось определить и то, учитывая уравнение (5.2.24) и условия (5.2.25), находим, что МО =S [(Xfo -Ша( (0+ (О] , <|(Т) = 0. (5.2.31) Таким образом, получаем уравнения, необходимые для определения всех неизвестных функций K(t, х, s), <p(f, х) и т) (0, входящих в определение функционала S по формуле (5.2.18). Если этот функционал будет найден, то по формуле (5.2.19) можно определить функцию v(t,x) (градиент функционала S), а это позволяет опре- делить оптимальное управление p(t,x) по формуле (5.2.16). В результате получим оптимальное управление как функционал на функциях состояния u(t, х). Однако следует иметь в виду, что изложенная процедура дает лишь формальное решение задачи, и требуется провести полное обоснование метода, о котором говорилось в кон- це предыдущего пункта настоящего параграфа. Это обос- нование, в частности, должно включать в себя доказа- тельство существования производных Kt(t, х, $), х, s), s, x), <pt и <px, входящих в уравнения (5.2.20) и (5.2.22), а также доказательство того, что функционал S, построенный по формуле (5.2.18), имеет градиент v(t, х), который принадлежит классу ITi(Q). Имея это в виду, прежде всего займемся отысканием функций с<,(0 и
§5.2] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 293 Непосредственной проверкой легко показать, что функции Си (0 = 2f^exp[2X|(f-T)l ... п ... ------i------1---------, Сп (t) = 0 при I =f= J 201* + 1 — exp [2Х| (/— Г)] (5.2.32) являются решением задачи Коши (5.2.27) — (5.2.28J. По- этому систему уравнений (5.2.29) можно записать в виде Чai ® -2 - K^ctt at \ Р / i = Q, 1, ... Отсюда в силу условий (5.2.30) получаем т М0 = J t 1Мт)_х!ад dXi 20^4-1-exp [21J(f-T)] 1 = 0, 1, ... (5.2.33) Подставляя эти функции в (5.2.31), находим, что П(0 = J2 [(Л(т)-Х?ф;)^W —£-«?(<)]dr. (5.2.34) Тем самым функции K(t, х, 3), <p(f, х) и т)(0 определя- ются однозначно, и по формуле (5.2.18) функционал 3 можно представить в виде Ж и]=2с«(/)[М0-'М2 + Z=o + 2ai(0[«<(0-M’d + n(0. (5.2.35) f=0 где Ui{t) и — коэффициенты Фурье функций u{t,x) и ф(х) соответственно. Функции Cu(t), at(t) и т|(/) опреде-
294 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V ляются по формулам (5.2.32), (5.2.33) и (5.2.34). Гра- диент этого функционала v(t,x) в соответствии с фор- мулой (5.2.19) можно представить в виде о = 2 at (0 Xt (х) 4-[2 2 [и, (0 — ф<] сн (t)Xf (х), i=O 1=0 а оптимальное управление, согласно формуле (5.2.16), будет функционалом, определенным на u{t, х): p(t, х) = J R(t,x,s)u (t, s)ds + <p (t, x), (5.2.36) Oi где " ' J' i “ R(t, x, s) = --t 2 си®Xt(x)Xt(s), ** i=o <p(0 x)= ₽ So 2₽ So 3. Разрешимость краевой задачи (5.2.1) — (5.2.3) на оптимальном управлении (5.2.36). Управление (5.2.36), которое получено путем формального решения уравнения Веллмана, строго говоря, мы пока не можем считать оптимальным. Необходимо провести обоснование полу- ченного результата и прежде всего показать, что оно принадлежит классу допустимых управлений, а соответ- ствующая ему функция u(t,x) однозначно определяется интегральным тождеством (5.2.8) и начальным услови- ем (5.2.9). Поэтому естественно рассматривать вопрос о разрешимости краевой задачи (5.2.1) — (5.2.3) при по- лученном управлении. Из определения собственных чисел Ъ как положи- тельных корней уравнения %tgX=a находим, что (см., например, [12])
$ 5.21 СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 295 Поэтому для функции R(t,x,s), входящей в (5.2.36), справедлива оценка J J J R*(t, х, s)dxdsdt = у J2 ООО о <==0 — + —У—1 = — f— + —1 4₽’Ро2 4₽2[XJ 6 поскольку функции с«(0> определяемые из (5.2.32), удовлетворяют неравенству |c„(0J<exp [2X?(f- T)l. Аналогично находим, что функции (5.2.33) можно оце- нить следующим образом: яж г* у* |М01<2 |ф/|+ рА(0И/ о ф-т) е > и поэтому Jj <paa,x)dxd/<-|rj2i|)?^(0df+ 00 о Т оо о <“® где под выражением ||о|| понимается норма в простран- стве L2. Тем самым доказано, что /?e£2(Q) и <pe£«(Q). Докажем теперь. разрешимость краевой задачи (5.2.1) — (5.2.3), где p(t, х) имеет вид (5.2.36). Здесь сле- дует иметь в виду, что нас сейчас может и не интересо- вать структура самой функции (5.2.35), т. е. мы можем пока не заниматься исследованием свойств управления
296 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V (5.2.36) и вести речь о разрешимости краевой задачи 1 ut = Uxx 4- J7? (/, X, s)u(t, s)ds + 4>(t, X) + f(t, x), О u(0,x)=g(x), ux (t, 0) = ux (i, 1) + au (t, 1) = 0, (5.2.37) полученной путем подстановки выражения (5.2.36) в уравнение (5.2.1). В соответствии с интегральным тождеством (5.2.8), обобщенным решением краевой задачи (5.2.37), будем называть функцию u(t, (Q), удовлетворяющую интегральному тождеству 1 j«(Z, х)ф(/, х) О dx dip (t, х) __ди dip । dt дх дх 1 т + f &*) + Ф%) + х, s)u(t, s)ds dxdt + 0 ft + а]‘и(/, 1)ф(/, l)dt (5.2.38) ti для любой функции Здесь А и 4—про- извольные моменты времени, удовлетворяющие условию При этом для любой функции <р(х)е е£2 (0,1) должно иметь место равенство 1 • lim f[«(4x)—g (х)] ф (х) dx = 0. /-*+0 J о Формальное решение краевой задачи (5.2.37) ищем в виде ряда u(tx)-2 «„(0Х„(х), (5.2.39) П~О
$ 6.2] СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 297 где Хп (х) — использованные выше собственные функции краевой задачи Х"(х) + VX(x) = 0, 0<х<1, 1 X'(0) =Х'(1) + аХ(1) = 0. J Подставляя функцию (5.2.39) в уравнение краевой задачи (5.2.37) и учитывая явное выражение ядра R и функции ф(/, х) (см. (5.2.36)), получаем уравнения для определения u„(f): Нп (О + [^n 4----- Ст (0 Un (0 — L Р J == “Т- tyncnn (0 ’ ~“й-п (0 fn (0> П = 0, 1, ... , Р Р (5.2.40) где fn(t) и ф„ — коэффициенты Фурье функций f(t, х) и ф(х) соответственно. Учитывая начальное условие, ко- торому должна удовлетворять функция (5.2.39), полу- чаем «n(0)=g„, 1 (5.2.41) где gn — коэффициент Фурье функции g (х). Соотношения (5.2.40) и (5.2.41) однозначно определя- ют функции м„(0. Тем самым формальное решение (5.2.39) краевой задачи (5.2.37) определяется однознач- но. Доказательство же того, что это решение является обобщенным в определенном выше смысле, может быть получено почти дословным повторением рассуждений, приведенных в [19]. Поэтому его приводить не будем, а перейдем к исследованию управления (5.2.36). 4. Приближенное решение задачи синтеза оптималь- ного управления. Сначала покажем, что управление, определяемое формулой (5.2.36), является допустимым. Функция u(t, х), являющаяся обобщенным решением краевой задачи (5.2.37), принадлежит £2(0,1), т. е. 1 J u®(0 x)dx< оо, О причем интеграл является непрерывной функцией от f.
298 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Так как R(t, х, s)^L2 и <p(f, x)el8 (это было дока- зано в предыдущем пункте), то из формулы (5.2.36) по- лучаем Т 1 J J р2 (/, х) dx dt О о ' 71 / 1 \ 2 7 1 £2 J JI J R (t, х, s) и (t, s) ds j dx dt + j j* <p2 (t, x) dx dt -0 0 \o / 0 0 •(71 / 1 1 \ <2 J Jl jR2(f, x, s)tfs Jt?(f, s)ds jdxdf 4- || <p||s < _0 0 \o 0 / где ____ ......... 1 M = max f u*(t, x)dx. o<t<T J О Тем самым доказано, что управление (5.2.36) принад- лежит L2. Теперь для полного обоснования предлагае- мого метода нужно показать, что это управление дейст- вительно минимизирует функционал /[р], а градиент v(t, х), определяемый формулой (5.2.19), принадлежит (Q). Прежде всего отметим, что если считать метод обос- нованным, то из определения S[f, и] (см. формулу (5.2.10)) следует, что минимальное значение функциона- ла 4р] можно найти с помощью формулы (5.2.18) min/[p] = SJO,g(x)] = р 1 1 = j j К (О, X, s) [g (X) — ф (X)] [g (s) — ф (s)J ds dx — 0 0 — J ф (0, x) [g (x) —'Ф (X)l dx + n (0). 0 Полное обоснование метода здесь проводить не бу- дем, ибо оно требует использования более тонких свойств решения краевой задачи (5.2.1) — (5.2.3), которые не тре-
$ 5.2] СЙНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 299 бовались для формального вывода уравнения Веллмана и интегро-дифференциальной краевой задачи Риккати. В заключение всего изложенного рассмотрим вопрос о приближенном решении рассматриваемой задачи. Для построения приближенного решения задачи син- теза оптимального управления ограничимся в (5.2.36) конечным числом слагаемых в рядах, определяющих ядро R(t,x,s) и функцию <р(Л х), т. е. возьмем функцию Рт (/, х) = J Rm (t, X, s) Um (t, s) ds + <Pm (t x), (5.2.42) где 1 m Rm(t, x, s) = - 2 caXi(x)X{ (s), . m m <pm (t, x) = -1- 2 (f)Xt (x) - A. 2 at (0 Xt (X), P So 2₽ So a um(t, x) —точное решение краевой задачи, получаемой из (5.2.1) — (5.2.3) путем замены р на функцию т. е. и*”(/, х) является решением краевой задачи 1 1 IZ/ == ихх + J Rm (t, X, S) и (t, s) ds + cpm (t, x) + f (t, x), I о u(0, x) = g(x), | u' (t, 0) = u' (t, 1) 4- au (t, 1) = 0. J (5.2.43) Очевидно, что um(t, x) является обобщенным решением этой краевой задачи (5.2.43) в смысле интегрального тождества, подобного тождеству (5.2.38). Это позволяет 1) показать, что pm(t, x)gL2(Q), 2) получить оценку меры уклонения um(t,x) от u(t, х) в метрике простран- ства L2(Q). Все это, в свою очередь, позволяет установить сходи- мость pm(t,x) к p(t, х) в метрике L2(Q) и оценить ско-
300 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V рость этой сходимости. Можно также оценить скорость сходимости Др»»] к минимальному значению этого функ- ционала. В [22] показано, что ||р—рт\\ •< А — __________ m +1 + д ^"* + 1 где л и В — постоянные, определяемые дан- (« + 1)а ными исходной задачи. Мы не будем останавливаться на получении этих оце- нок, так как это, видимо, не представляет серьезных трудностей. Отметим лишь, что формула (5.2.42) не явля- ется единственно удобной для аппроксимации оптималь- ного управления. Можно также порекомендовать и дру- гие, например Рп {t, х) = J Rm (t, X,x)un (t, x) dx + <pm (t, x), (5.2.44) 0 в которой un(t,x)—некоторым способом построенное n-е приближенное решение задачи (5.2.43). Такая фор- мула удобна в том случае, когда точное решение задачи получить не удается и приходится ограничиваться при- ближенным решением. Соотношения между п и т могут быть различными, в том числе может оказаться, что п=т. Представляют, видимо, интерес следующие ситуации. 1. Информация о состоянии управляемого объекта собирается в течение всего времени управления, но в от- дельных изолированных его точках х1г..., xg. На основе этой информации формируется закон управления в ин- тегральной форме, подобной (5.2.42) или (5.2.44). 2. Информация о состоянии управляемого объекта снимается в отдельные моменты времени tlt t2,..., 4 и в изолированных точках xlt..., хе. На основе этой ин- формации формируется закон управления в интеграль- ной форме, подобной (5.2.42) или (5.2.44). Задача состоит в построении такого управления и в указании величины уклонения этого управления от опти- мального, которое определяется формулой (5.2.36). При ее решении естественно рассмотреть каждый из этих случаев в отдельности. 1. Итак, пусть информация о состоянии объекта со- бирается в точках ...,xg отрезка в течение
$ 5.21 \ СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 301 \ всего времени управления Это означает, что известны функции и (t, Xt),..., и (t, xg), характеризующие состояние управляемого объекта в точках xt,..., xg. Один из возможных вариантов формирования закона управле- ния состоит в том, что управляющая функция берется в виде 1 ~ pm(t, х) = jRm(t, х, s)u(t, s)ds + x), (5.2.45) 0 где Rm(t, x, s) и <pTO(f, x)—те же функции, что и в (5.2.44). Функция u(t, s) строится с помощью какой-либо фор- мулы интерполирования исходя из условий u(t,x{) =u(t, xt), i=l,...,g. Для интерполирования можно, в частности, воспользо- ваться формулой Лагранжа u(t, х) = V «(*» xt)----------» <х~х1^х1> где ®£(х) = (х—хО (х—х2) ... (х—xg). Можно также использовать другие формулы интерпо- лирования, основанные либо на классических исследова- ниях интерполирования (см., например, [13]), либо на ре- зультатах теории сплайнов (см., например, [14]), которые в наше время широко используются в теоретических ис- следованиях и приложениях. В итоге применения управления (5.2.45) получаем, что функция u(t, х), характеризующая состояние объекта, будет описываться краевой задачей 1 ~ Ut = jRm{t, х, s) u(t, s)ds 4- фт(<, x) + f(t, x), 0 «(0, x) =g(x), uiif, 0) = ux(t, 1) 4- au(t, 1) = 0. (5.2.46)
302 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Таким образом, чтобы характеризовать качество управ- ления (5.2.45), т. е. меру его уклонения от оптимального управления (5.2.36), прежде всего нужно Оценить меру уклонения решения краевой задачи (5.2.46) от решения краевой задачи (5.2.37). Пусть u(t,x)—решение задачи (5.2.37), u^(t,x)— решение задачи (5.2.46), а Pm (Um, U) = |Um — U Тогда из (5.2.45) и (5.2.36) получим — R (t, x, s) и (t, s)] ds + |<Pm(^ X) — <p(/,x)K < J|/?m(^X,S)||Mm(<,s) —u(/,s)|ds+ j|₽m(6*,S) — — Я (/, x, s) | ] ы (f, s) | ds + | <pm (f, x) — q> (t, x) |. Отсюда следует, что Т 1 j JI An (*>*)—P$, x)^dxdi^ 0 0 M J J s)dsdxdA Pm (uw, u) + \o о 0 / + J J JI Rm (t, x,s) — R (t, x, s) Г ds dxdil и (t, x) + ООО + J J I <₽m (t x)— <P [t, x) |® dtdx. о 0 Это одна из оценок уклонения pm от р. Можно полу- чить и другие. В частности, если использовать свойство непрерывности по t функций um(t, х) и u(t,s), то легко
5 5.2] \\ СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 303 можно поручить оценку величины Рт(рт> р) = llPm Pllbj(Q)* 2. Рассмотрим теперь случай, когда информация о состоянии управляемого объекта берется в изолирован- ные моменты времени tlt..., th и в изолированных точ- ках. Это означает, что по данным наблюдения за состоя- нием объекта известна матрица /« К1. *1) ... и (6> xg) \ и = I.................I. \« (**. *1) • • •« Ка, xg) / Так же, как и в предыдущем случае, используя фор- мулы интерполирования, каким-либо способом строим функцию u(t, х), удовлетворяющую условиям u(t{, х}) =u(tt, х}), i=l...k\ j = l,...,g. После этого приближение оптимального управления можно строить в виде (5.2.45). Качество этого прибли- жения можно оценить так же, как в предыдущем случае. Однако на пути практического использования указан- ной процедуры имеются существенные трудности, кото- рые прежде всего связаны со спецификой краевой зада- чи (5.2.46). Автору этих строк неизвестны работы, в ко- торых бы проводились исследования этой задачи с целью сравнения ее решения с функцией u(t, х), определяемой соотношениями (5.2.37). Поэтому, прежде чем говорить об эффективности (или неэффективности) изложенной процедуры приближенного решения задачи синтеза опти- мального управления, следует исследовать задачу (5.2.46). Такое исследование, как нам кажется, было бы весьма полезным. 5. Конечномерная аппроксимация. В заключение рас- смотрим вопрос о приближенном решении задачи синте- за оптимального управления, когда вместо краевой за- дачи (5.2.1)—(5.2.3) берется система т дифференци- альных уравнений относительно коэффициентов Фурье функции u(t, х). Делается это следующим образом. Пусть p(t,x)—некоторое допустимое управление, а u(t, х)—соответствующее ему решение краевой задачи
I 304 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V / / (5.2.1) — (5.2.3). Тогда можно записать > U (/, X) = ип р (t, х) = 2 Рп (0-^n W» п=о п=о I 00 00 I X) = 2 fn(t)Xn(x), g(x) = 2я„Х„(х), rt=O /1=0 , (5.2.47) а функционал /[р] примет вид /оо IP] = J [Un (Т) - Фп]2 + Р J 2 р'п (0dt (5.2.48) П=0 о /1=0 Здесь Хп (х) — ортонормированные собственные функции краевой задачи X"(x)+VX(x)=O, 0<х<1, Х'(0) =Х'(1) +аХ(1) =0, а ф„ — коэффициенты Фурье функции ф (х). Подставляя функции (5.2.47) в уравнение (5.2.1) и условие (5.2.2) и ограничиваясь лишь т слагаемыми в рядах (5.2.47), получим задачу Коши относительно коэф- фициентов и0, ... ,'ит: 4“ ^nWn (0 — fn(t) -} pn(t)> un(Q) — gn, /1 = 0, ... , tn. (5.2.49) Ограничиваясь также tn слагаемыми в функционале (5.2.48), получим функционал т Т т 1т [р] = 3 [Un (Т) - Ф„]2 4- Р J 3 Р*п (0 dt. П=0 О П“0 А теперь в качестве /n-мерной аппроксимации опти- мального управления p9(t,x) возьмем управление т р°тЦ,х) = ^р°п^Хп(х), (5.2.50) /1—0
j 5.2] \ СИНТЕЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 305 в котором Лектор {р®(0> • • • > Pm(t)} минимизирует функ- ционал 1т [р] при условиях (5.2.49) на классе допустимых управлений, определяемых следующим образом. Если допустимые управления в задаче минимизации функционала (р] были функции из L2(Q), то в конечно- мерной задаче берем управления, удовлетворяющие ус- ловию т | Р?(0^"С°°> / = 0, ...,/п. о Если же функции p(t, х) таковы, что функция О(0 \ 1/2 р2(/, x)dq измерима и ограничена почти всюду на отрезке (0, Г), то в качестве допустимых р<(0 берутся измеримые и огра- ниченные почти всюду на [О, Г] управления. Таким обра- зом, класс допустимых управлений р{(/) определяется теми требованиями, которые накладываются на допусти- мые управления в исходной задаче минимизации функ- ционала!/ [р]. Задачу минимизации функционала 1т [р] решаем ме- тодом динамического программирования. Полагая рт(0 = {Р»(0> • • •»Рт(0} и ' т Т т sm [/, Р”*] = min 2 [Un(T) — + Р [ 2 р*п(0dt (5.2.51) выписываем уравнение Веллмана: дс ( т т ?dS = min р 2 Р*п (0 -1- 2 (f„ (0 + Рп (0 - (0) .
306 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V р / Если допустимые управления могут принимать всевоз- можные вещественные значения, то отсюда получаем р*(0 = __ _L^L, п = о, 1, . /. , т, (5.2.52) 20 дип т Г dS i = 2 - dt dSm\21 tn i dun) . (5.2.53) 7Z Решение уравнения (5.2.53) ищем в виде т Sm U, р”1] = 2 Cnk ® t"» — [«* — "Фл] + п,Л=о т + 2 а" (0~ 'Ы + Лт (0, (5.2.54) которое, согласно формуле (5.2.51), должно удовлетво- рять условию Sm [7" > Рт] — (^) — Фп]2 л=о Отсюда следует, что функции c„k(0> an(t) и я»(0 должны быть такими, чтобы ^(Т) = Рпри л = *’ ^(Т)«п*(Л = о, (0 при n=^k, п, k — 0, ... , т. Подставляя функционал (5.2.54) в уравнение (5.2.53) и приравнивая нулю коэффициенты при одинаковых степенях [и„—ф„], получим, что для определения cntl(t), an(t) и г]т(0 будем иметь конечные системы дифферен- циальных уравнений, которые получаются усечением си- стем (5.2.27), (5.2.29) и (5.2.31): dc^3 4 m —у/ = X? [с,-/ 4- с}1] + — 5J [с«’+ [с/л + с*/]» i,/==0, 1, ... , т,
$ 5.2] СЙНТЁЗ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 307 "Г = Mai + 2 [си + Cji] а/ — 2 U7 — k/Ф/] [сц + СЦ], * 2Р & Пт (0 - 2 [(Л?фг + ft (0) а( (0 + а] (О] • Таким образом, эти функции определяются однознач- но, причем с(} имеют вид (5.2.32), а а, — (5.2.33). Под- ставляя эти функции в функционал (5.2.54) и вычисляя производные по ил, по формуле (5.2.52) получим PU!) = -^сПп® [ип~^п] -±ап. (5.2.55) Р 2р Введем обозначение т Рт(/,Х) = ЗР*(ОХ„(Х). л=о Тогда можно записать ----“ спп (0 Г^л — Фл] Р = $P°m(t,x)Xn(x)dx, о 4 i т Pm(t, х)=-^{^nn(t)un(t)Xn(x)dx + ₽ о «=1 j ЛХ — *1 + "р* 2 о л=1 при этом u»(t) определяются как решение задачи (5.2.49) с управлением (5.2.55). Обозначая это решение через а$(0 ,...,««(/)> находим, что ~—F ^>nWn = fn (0-Т" ^пп (0 [Чп Фп] ~ Ont Оп (0) = gn > at р 2р п = 0, 1, А . , т.
308 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V Полагая т х)=2 «:(0хЛ(х), п=о находим, что управление рт (1> х) можно записать в виде Pm (t, Х) = J (t, X, S) Um (t, s)ds + фт (Л *), О где Rm и <pm — частичные суммы функций R и ф, входя- щих в управление (5.2.36). Таким образом, полученный результат показывает, что конечномерная аппроксимация рассматриваемой за- дачи оптимального управления по существу является од- ним из способов приближенного решения, основанного на использовании формулы (5.2.44), в которой в качест- ве ut(i, х) берется функция, построенная следующим об- разом. В управлении (5.2.44) берется-п=т и приближен- но решается задача (5.2.43). Ее решение ищется в виде ряда Фурье, а в качестве um(t, х) берется т-я частич- ная сумма этого ряда. § 5.3. Синтез оптимального управления при управляющей функции, зависящей только от времени В этом параграфе мы продолжаем рассматривать по существу ту же задачу, которой посвящен предыдущий параграф, но при одном дополнительном предположе- нии: управляющая функция зависит только от времени. Изложенные ниже результаты показывают, что и в этом случае метод Веллмана является достаточно эффектив- ным средством построения оптимального управления. Однако теперь результаты оказываются более скромны- ми, ибо не удается найти точное решение интегро-диффе- ренциальной краевой задачи типа Риккати. Это вынуж- дает использовать различные процедуры построения при- ближенных решений, в том числе и те, которые были указаны в предыдущем параграфе. В дополнение к ним здесь приводится еще одна процедура, основанная на
\ $ 6.31 УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ 309 аппроксимации исходной краевой задачи обыкновенны- ми дифференциальными уравнениями с помощью мето- да прямых. 1. Постановка задачи. Уравнение Веллмана. Пусть управляемый процесс описывается функцией u(t, х), ко- торая внутри области Q={O^t^.T, удовле- творяет уравнению ^ = g+rp(/W) +ИЛ*) (5.3.1) и на границе Q условиям u(0,x)=g(x), (5.3.2) и^0) = ^1) + ш р = 0> а = const > 0 (5 3 3) Здесь q(x), f(t, х) и g(x) — заданные функции, причем q и g принадлежат L2(0, 1), a f(t, х)—L2(Q), p(t) —управ- ляющая функция. Допустимыми управлениями могут быть: 1) измери- мые функции p=p(t), почти всюду на отрезке [0, Т] удов- летворяющие условию a^.p(t) ^b, где а и & — заданные вещественные числа, либо 2) функ- ции р(/)е£г(0, Г), подчиненные условию т ^p*(t)di^M, (5.3.4) О где М — заданное положительное число. Впрочем, это ог- раничение может отсутствовать. Могут быть, конечно, указаны другие классы допу- стимых управлений, но это не является существенным для изложения формальной процедуры вывода уравнения Веллмана. Конкретный класс допустимых управлений нужен для обоснования метода динамического програм- мирования. Поскольку такое обоснование здесь не про- водится, то мы ограничимся лишь следующими допуще- ниями, которые будут использоваться в дальнейшем. Для допустимых управлений указана область зна- чений управляющего параметра. Ее будем обозначать
310 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V через Р. Каждое допустимое управление однбзначно оп- ределяет единственную непрерывную функцию u(t, х), которая является обобщенным решением краевой задачи (5.3.1) — (5.3.3) в том смысле, что: 1) она удовлетворяет интегральному тождеству О Г Р Г дф дидф J J Г dt дхдх G о ч t» + [p(t)q(x) + f(t, х)]Ф|4хб» + а ^u(t, 1)Ф(/, l)dt при любой функции ФеW? (Q) и любых tt и 4, удовле- творяющих условию 2) 1 lim С \и (t, х) — g (х)] <р (х) dx = 0 t->+0 J при любой функции ф (х) eL2 (0, 1). Рассматриваемая задача оптимального управления . состоит в том, чтобы найти допустимое управление р°(0 и соответствующее ему обобщенное решение краевой за- дачи (5.3.1)—(5.3.2), на которых функционал I т = J [и (Т, х) — ф (х)]2 dx + р о о lp2(0<tt (5.3.5) принимает наименьшее возможное значение. Здесь ф(х)—заданная функция из £2(0, 1), а Т — фиксиро- ванный момент времени, определяющий область Q. Так же, как и в предыдущем параграфе, для получе- ния уравнения Веллмана вводим функционал S [/, и] — min Р<т)е₽ Г 1 [и (Г, х) — ф (х)]2 dx 4- р J р2 (т) dr t j (5.3.6)
S 5.3] УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ ЗЦ для которого выписываем уравнение (см. (5.2.14)) dS [t, и] dt = min pep 0P® (0 + P (0 J Я (x) v(t,x)dx — k о x)]dx-au(f, 1)v(i, 1) 0 (5.3.7) Из формулы (5.3.6) следует также, что а S [Г, и] = J [м (7, х) — ф (х)]2 dx. (5.3.8) О Таким образом, задача сводится к определению p(t) и S из уравнения (5.3.7) с «начальным» условием (5.3.8). Предполагая, далее, что множество Р совпадает с множеством всех вещественных чисел, находим, что оп- тимальное управление должно подчиняться условию р(Э = —^(x)o(f,x)rfx, (5.3.9) О и, следовательно, в этом случае уравнение (5.3.7) можно записать в виде Щ = f р*! x)v(t, x)ldx + dt J [dx dx v ' 'J 0 »\2 q(x)v(t,x)dx\ . (5.3.10) / Его решение будем искать тем же способом, который применялся в предыдущем параграфе. Положим S [f, и] = 11К (t, х, s) [a (t, s) — ф (s)] [u (t, x) — 0 « — i|>(x)]cfcdx+ J<p(/, x)[u(t, x) — ф(х)]4х4-т](0, (5.3.11) о
312 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V где К, <р и т] — функции, подлежащие определению из уравнения (5.3.10) и условия (5.3.8). Вычисляя дифференциал Фреше, находим, что Ф [*,«, h] = j J [Я (t, х, s) + K'Jt, s, x)]> 0 0 1 x [u (t, s) — ф (s)J h (x)dxds + J Ф x) h (x) dx, 0 и, следовательно, градиент v(t, x) функционала S имеет вид v (t, x) = <p (/, x) + J \K(t, x, s) +K(t, s, x)] [tz (t, s)—ф (s)J ds. (5.3.12) (5.3.14) Подставляя функции (5.3.11) и (5.3.12) в уравнение (5.3.10) и приравнивая коэффициенты при одинаковых степенях [«(/, х)—ф], получим + =2 Kl (t, х, s), (5.3.13) й Si" ax' sp 11 ' 1 ' aKV.o.JL = aJ<s!lij1 + aK _ =0_ dx dx s, n = 0| dx dx +K.V,x) + K, (I, X) = dt dx2 = J J[K(i, x, s) +K(t, s, x)]<p(/, y)g(s)dyds, (5.3.15) d<p(<’°2- = + a(p (t, 1) = 0, (5.3.16) dx dx ^-+ ^(x)dx+ <\f(t,x)<p(t,x)dx ^ dt J ox2 J о
5 5.3] УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ 313 где Ki (t, х, s) = j j [К (t, y,s) + K (t, s, у) [K (t, z, x) + 4- К (t, x, г)] q (y) q (z) dz dy, X2 (t, x) = $ [K (t, x, s) + X (t, s, x)] f (t, s) ds, 0 J L ds2 osa J и Из (5.3.8), кроме того, следует, что /С(7,х, s) -S(s —х), <р(Т,х) -1](Л =0, (5.3.18) где 6(х) — функция Дирака. Таким образом, интегро-дифференциальная краевая задача Риккати (5.3.13), (5.3.14) несколько отличается от аналогичной задачи, рассмотренной в предыдущем па- раграфе. Решение задачи (5.3.13), (5.3.14) с начальным усло- вием (5.3.18), будем искать в виде ряда K(t,x,s)= 2 Cnk(t)Xn(x)Xk(s), n,k=Q где {X„(s)}—полная ортонормированная система соб- ственных функций краевой задачи Х"(х)+ГХ(х) =0, 0<х<1, Х'(0)=Х,(1)4-аХ(1)==0. Обозначая через А„ ее собственное значение, соответст- вующее собственной функции Хп(х), для определения коэффициентов <?*(/) получим бесконечную систему диф- ференциальных уравнений ———s= Хп (Cnk 4* ckn) 4" 2 (Cki 4~ cik) Я] (pnf 4" с/п)> Л 4₽ п, k — 0, 1 (5.3.19)
314 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ ТГЛ. V с начальными условиями Спк (Г) — &пк — | Q при п — k, при n=fck, где q{ — коэффициент Фурье функции q (х). Аналогично, полагая <р(/, х) = 2 аЛ^хп(х), П—0 из (5.3.15), (5.3.16) и (5.3.8) получаем ~~ —’^>пОп + 2 (/* — ^йФй) (спк + с*п) = ал ~ 1 °° — "ТТ 2 (Cnk 4- Ckti), ttn(T) — 0, /1=0,1, ... 2₽ лХо (5.3.20) Таким образом, для определения функций с»*(0, an(t) и т)(0 имеем полную систему уравнений. Однако в этом случае не удается найти практический способ опре- деления cnh(t), и поэтому приходится пользоваться лишь различными приближенными методами, в частности те- ми, которые были указаны в предыдущем параграфе. В дополнение к ним изложим еще один способ, основан- ный на использовании аппроксимации краевой задачи (5.3.1) — (5.3.3) с помощью метода прямых. 2. Применение метода прямых. Приближенное реше- ние задачи синтеза будем искать, аппроксимируя крае- вую задачу (5.3.1) — (5.3.2) системой обыкновенных диф- ференциальных уравнений. С этой целью отрезок O^x^l разобьем на п+1 равных частей точками xit ..., хп и положим хв=0, *п-ц=1- Тогда xt=ih, где й=(п+1)-‘. Обозначая через «<(/) значение точного решения 4(t, х) при х=х(, аппроксимируем производные по
$ 5.3J УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ 315 следующим формулам: Wx-x< ~ h Wx-x, — Л (d*u\ ui-i Wx-x^ Л’ Полагая в уравнении (5.3.1) x—xt, получим уравнения ~ [W/+1 — 2u; + ыг-1] + QiP (0 + fi (0 + Рь at hr i=l,2, ..., п, где qi=q(xi'), fi(t)=f(t, х<), а величина р< характеризует невязку при замене производной соответствующим раз- ностным отношением. Отбрасывая эту невязку, получаем уравнения i I«/+i — 2wf + ur-i] 4- qfp (Г) 4- ft (0, i=1.«, (И h2 (5.3.21) с помощью которых будем аппроксимировать уравнение (5.3.1). Частные производные в граничных условиях (5.3.3) заменим отношениями ди(1, 0) , мх —кр du(t, 1) } «n+i (0 — “п(0 дх h ’ дх Л В итоге система уравнений (5.3.1) дополнится урав- нениями «t=«o, un+1(0— un(t)+ahun+i(t)=O. (5.3.22) Совокупность п+2 уравнений (5.3.21) и (5.3.22) содер- жит п+2 неизвестных и0,un+i, т. е. получаем полную систему уравнений для определения всех неизвестных. Необходимые начальные условия получаем из (5.3.2), полагая МО) =g(x<), t= 1, 2, .... п. (5.3.23) Известно [13], что такой способ аппроксимации дает погрешность, которая стремится к нулю при Л-»-0
316 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V И, —< U, (t) не медленнее, чем величина h2, т. е.-----------► 0 при ha h-^Q. Исключая с помощью (5.3.22) из (5.3.21) неизвест- ные «о и ип+1, получим систему уравнений = 2 + W (0 + ft (0. 1......n, (5.3.24) где матрица А={а(к} имеет вид А = — ft2 —1 1 о ... о о 1 —2 1 ... О О О 0 0 ... 1 —2 О О 1 О 0 0 ... О 1 l + 2a/i 1 + ah Систему (5.3.24) с начальными условиями (5.3.23) запишем в матричном виде ^ = Au + qP(t) + f(t), (5.3.25) at a(0) = g, (5.3.26 а функционал (5.3.5) естественно заменить функционалом «1 т I[p]=h^ [и{ (Т) - р J р* (I) dt. (5.3.27) <=1 о Таким образом, для приближенного решения исход- ной задачи оптимального управления будем решать сле- дующую задачу. В том же классе допустимых управлений требуется найти управление ph(t) такое, чтобы оно вместе с соот- ветствующим ему решением uh(t) задачи Коши (5.3.25), (5.3.26) давало функционалу (5.3.27) наименьшее воз- можное значение. Это управление ph(t) принимается в качестве прибли- жения оптимального управления, минимизирующего функционал (5.3.5) при условиях (5.3.1)—(5.3.3).
«5.31 УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ 317 Для построения управления р»(/) используем метод Веллмана. Вводя обозначение ( п т Sh [<, и] = min 1л 2 (Л ~~ ♦<]’ 4- 0 f Р4 (т)» I <—1 £ * известным способом можно получить уравнение dShV> “1 ds* ——— = mm ip/r (г) 4- p (г) У —— qt + « psp [ dut dsA " as. + S atk ~a~ Uk 4" S "a— I* ® r£i Sx d“‘ . (5.3.28) с начальным условием S*4T, «Г= h 2 [щ (7T- 'I’d4- (5.3.29) В частном случае, когда Р представляет собой мно- жество всех вещественных чисел, находим, что (5.3.29') n as, ,8 Подставляя эту функцию в уравнение (5.3.28), получим dSh Д dSh Д . dS, " dSh п д5к 1 " dSh Т i,ft=x » i=i ’ r Li=i * J (5.3.30) Решение этого уравнения ищем в виде SA [f, и] = h2 (01«< — [«* — № + itk^l п i 4- h Ф; (0 [ut — 4>d + n (0» (5«3.31) ftW) = 5«-P npiU7b’ (0 при i=hk, <МЛ = п(Л = о. (5.3.32) (5.3.33)
318 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V Подставляя функцию (5.3.31) в уравнение (5.3.30) и приравнивая коэффициенты при одинаковых степенях “i—фо получим ЛК,, " п 1 , -f - + 3 «Л + 3 (0, (5-3-34) fe=l fc=l р +2 (0 + Я’(0 = fe=l = -S-3 [^/(O + ^HOlwMO. (5.3.35) 2₽ /^=1 + А(О<рДО + Л 2 ««Ф*'(0** = а i=l <,*=1 1 / " V = i » (5.3.36) Si ) где Кц = Ла 2 {Ktk (0 + Км (0) [Кц (0 + Кц (01 q^ji, k.l K}(t) = h^ IKiiQ + KvWbh®, 7«i К?(0 = Л 2 ад[Л«(0 + Лм(0]ф/. j,k=l Прежде всего отметим, что (5.3.34) является систе- мой уравнений типа Риккати. Исследованию таких систем посвящена обширная литература (см., например, [16]). Известны различные способы их приближенного решения, исследованы различные качественные харак- теристики решения. Поэтому на таких вопросах здесь останавливаться не будем. После того как найдены функ- ции К«(0» <Р*(0 и п(0, п0 формуле (5.3.31) находим SJA а], а затем по формуле (5.3.29') вычисляем опта-
§ 5.3] УПРАВЛЕНИЕ, ЗАВИСЯЩЕЕ ТОЛЬКО ОТ ВРЕМЕНИ 319 мальное по функционалу (5.3.27) управление ph. Очевид- но, что оно будет линейной функцией состояния системы (5.3.25) и, следовательно, решает задачу синтеза опти- мального управления в этой системе. В заключение покажем, что (5.3.30) — (5.3.36) явля- ются дискретным аналогом соответствующих соотноше- ний в задаче с непрерывно изменяющейся пространст- венной координатой х (см. (5.3.17) — (5.3.20)). - В самом деле, в плоскости переменных х и s проведем два семейства параллельных прямых x(=ih, Sj=jh, i, j=Q, 1, ..., n-M; h= (n+l)~‘, где xo=so=O, xn+1=sn+1=l. Изложенным выше способом произведем аппрокси- мацию частных производных Ж(/, х, s) 3*К (t, s, х) дх* дх* разностными отношениями, а интегралы заменим по формулам 1 J Ф (х) dx = h 2 Ф (xi), О 1 1 J J Ф (х, s) ds dx = Лг Ф</* • о В итоге уравнение (5.3.13) с краевыми условиями (5.3.14) будет заменено системой, полностью совпадающей с (5.3.34). Аналогично можно показать, что дискретная аппроксимация уравнения (5.3.15) с условиями (5.3.16) приводит к системе (5.3.35). Полученный результат показывает, что такой путь приближенного решения задачи является естественным. Однако вопрос о том, сходятся ли рА к оптимальному уп- равлению при /i—>0, требует дополнительного исследо- вания.
320 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V § 5.4. Управление по границе объекта В этом параграфе рассматривается задача оптималь- ного управления того же типа, что и в предыдущем па- раграфе. Отличие лишь в том, что управляющая функция входит в граничные условия. Приведенный ниже анализ показывает, что это обстоятельство не является сущест- венным препятствием на пути применения метода дина- мического программирования. В этом случае прежним методом удается получить уравнение Веллмана и в той же, как и выше, мере провести его исследование. 1. Постановка задачи. Уравнение Веллмана. Пусть управляемый процесс описывается функцией u(t, х), ко- торая внутри области Q={Q^.t^T, O^x^l} удовле- творяет уравнению =^ + /(/,х), (5.4.1) dt *дхг1У > ' ' а на границе Q — условиям u(0, x)=g(x), (5.4.2) — о, ди -|- аи (/, 1) = ар (0, а = const >• 0, дх дх (5.4.3) где f(t, х) и g’(x) —заданные функции, причем fit, х)е e£2(Q), g(x)eL2(0, 1), a p(t) является управляющей функцией. Допустимыми управлениями можно брать функции, принадлежащие различным классам. В частности, мож- но брать функции одного из следующих классов: Р, или Р2. 1. р(/)еРь если p(f) измерима и почти всюду на от- резке [0, Т] удовлетворяет неравенству |р(0 I почти при всех t из [0, Г], где М — заданная постоянная. 2. р(/)еР2, если p(f)s£2(0, 1) и т ^p*(t)dt^M.
§ 5.4] УПРАВЛЕНИЕ ПО ГРАНИЦЕ ОБЪЕКТА 321 В дальнейшем не будем указывать конкретный класс допустимых управлений, а потребуем лишь, чтобы каж- дому управлению из выбранного класса соответствовало единственное решение краевой задачи (5.4.1) — (5.4.3), которое определим следующим образом. Непрерывную функцию u(t, х), определенную в об- ласти Q, будем называть обобщенным решением крае- вой задачи (5.4.1) — (5.4.3), если она для любой функции Ф(/, х) elFg (Q) удовлетворяет интегральному тождеству J (иф)й: dx - j j g - f (t, x) Фj dx dt + 0 to 0 fl + a J [u (t, 1) — p (0] Ф (t, 1) di = 0 (5.4.4) и условию 1 lim C [«(t, x)—,g (x)] <p (x) dx = 0 0 для любой функции q>(x) е£4(0, 1). Не останавливаясь на детальном анализе классов управлений, для которых существует обобщенное реше- ние в указанном смысле, отметим лишь, что, согласно результатам В. И. Плотникова (11], в качестве одного из таких классов может выступать множество измеримых ограниченных функций. Здесь следует еще отметить, что результат В. И. Плот- никова получен для более общей задачи. В рассматри- ваемом нами случае имеется более точный результат (см. [20]). Однако для наших целей достаточно пользо- ваться обобщенным решением в указанном выше смысле. Задача оптимального управления состоит в том, что- бы найти допустимое управление, которое вместе с соот- ветствующим ему обобщенным решением задачи (5.4.1)—(5.4.3) доставляет минимальное значение функ- ционалу 1 т I [р] = j [и (Г, х) — ф (х)]« dx + рJ рг (/) dt. (5.4.5) О о 11 А. И. Егоров
322 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V Для решения задачи вводим функционал S [/, и (/, х)] — min Р(т)еР 1 £ 1 J [и (Т, х) - ф (х)]2 dx + Р J р2 (t)dt , .0 t I (5.4.6) где через Р обозначена область значений допустимых управлений. Повторяя те же рассуждения, которые проводились в § 5.2 при выводе уравнения (5.2.14), получим уравне- ние Веллмана для рассматриваемой здесь задачи в сле- дующем виде: <?S [/, и] —- = min dt pep Pp2 (/) + ap (t) v (i, 1) — au (t, 1) v (t, 1) + 0 [f (t, x) о (t, x) — ux (i, x) vx (t, x)J dx , (5.4.7) где v(t, x) —градиент функционала S, который должен обладать свойствами функции Ф(/, х), фигурирующей в интегральном тождестве (5.4.4). Из определения функционала S (см. (5.4.6)) следу- ет, что должно быть выполнено условие 1 S [Т, и (Т, х)1 = J [ы (Т, х) - ф (х)]2 dx. (5.4.8) о Следовательно, задача сводится к отысканию S и р из уравнения (5.4.7) и дополнительного условия (5.4.8). В частном случае, когда f(t, х) s0, функционал S явно не зависит от t и уравнение (5.4.7) упрощается min pep Рр2 (t) + ар (0 v (t, 1) — au (t, 1) v (t, 1) — — J их (t, x) vx (t, x)dx = 0. (5.4.7') 0
§ 5.4] УПРАВЛЕНИЕ ПО ГРАНИЦЕ ОБЪЕКТА 323 Дальнейшее решение рассматриваемой задачи прове- дем в предположении, что множество Р совпадает с мно- жеством всех вещественных чисел. 2. Краевая задача типа Риккати. В этом случае ми- нимум в правой части уравнения (5.4.7) достигается при р(0 = -^<(М), (5.4.9) 2Р и, следовательно, уравнение (5.4.7) можно записать в виде = f [их (t, х) vx (f, х) - f (t, x)'v (t, x)J dx 4- dt J о + -o2(f, 1) + au(t, l)o (t, 1). (5.4.10) 4p Решение этого уравнения, удовлетворяющее условию (5.4.8), ищем в форме S х)] = 1 1 = J jj/C(t, х, s) [u(t,x) —ф(х)] [«(f, s)—ij>(s)]dsdx4- 0 0 + Jcp(^x)[u(/, x)—Ф(х)]ах4-1](О. 0 Тем же способом, который был изложен в § 5.2, по- лучаем необходимые соотношения для отыскания функ- ций K(t, х, s), <p(f, х) и т) (/): Ж V, х, .). W (1. .) = ^KAl,x,s), (5.4.11) й дх* ds* 4₽ ' +„х (<,!.,) д0, дх, дх = + aS((> х 1) = 0 ds ds (5.4.12) К (Т, х, s) = S (8 — х), (5.4.13) .11*
324 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V дф (/, х) dt ^^^+K2(t,x) + Xa(t,x) = дх2 l,x) + K(t,x, 1)]ф(М), 2₽ a<p(t,O) =gy(M). + q(p(t 1) = 0> дх дх (5.4.14) (5.4.15) ф (Т, х) — 0, (5.4.16) & + р (Л х) Ф (/. х) dx + j ф (х) dx = | ф2 (М), О о п(Л = о, (5.4.17) где КЛ, х, s) -= [/((*, 1, х) + K(t, х, 1)] [X(t, s, 1)+X(t, 1, s)], Ла (t, х) - J И (t, х, s) + К (t, s, x)J f {t, s) ds, О 0 Как и в предыдущих параграфах, функцию К. будем ис- кать в виде K(f,x,s)= 2 cnm®Xn(x)Xm(s), (5.4.18) n,m=o где {Xn(x)} — полная ортонормированная система соб- ственных функций краевой задачи Х"(х) +Л2Х(х) =0, 0<х<1, Х'(0)=Х'(1)+аХ(1)=0. В итоге для определения cnm(t) получаем бесконечную систему дифференциальных уравнений = [Спт (0 + <7пл(0] 4" at 4* То 2 ^п/4* ^/п1 4" (1)(1)> = 1 , •• •»
УПРАВЛЕНИЕ ПО ГРАНИЦЕ ОБЪЕКТА 325 § 5.4] с начальными условиями = 6nm, И, /71 = О, 1, . . . , где 6Пт — символ Кронекера. Решение задачи (5.4.14) — (5.4.16) ищем в виде ф(/,х) = ;£ а„(0Х„(х). (5.4.19) п—о Тогда для определения а»(/) получаем систему урав- нений ~~ = ^nfln У} (fk Xfclpl:) (Cnk 4- Cfen) 4" Л й=0 „2 00 4-^2 (cni + CiJXiWXjWaj с начальными условиями а<(Т)=0, i=0, 1, ... Если каким-либо способом коэффициенты a{(f) и c{j(t) найдены, то с помощью функций (5.4.18) и (5.4.19) из задачи Коши (5.4.17) легко находится функция п(0- Вычисляя дифференциал Фреше функционала S, нахо- дим градиент этого функционала в виде v =’ j* [К (/, х, s)4-K (t, s, х)] [и (t, s) —ф (s)J ds4-<p(f, x). 0 Поэтому с помощью формулы (5.4.9) определяем оптимальное управление в виде Р (0 = ~ Й [ S К (t’ 1 ’s) + К (t'S’ 1)1 [u s) ~ *(s)1 ds + 4-<p(/,l)]. Таким образом, формальная процедура получения оп- тимального управления с помощью динамического про- граммирования не вызывает существенных затруднений. Тем же способом, что и в предыдущих параграфах, мож- но указать различные пути получения различных при-
326 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V ближений оптимального управления. На этом здесь оста- навливаться не будем, ибо при необходимости читатель легко может сам выполнить соответствующие построе- ния. Можно также без особых трудностей исследовать некоторые свойства решения интегро-дифференциальной краевой задачи Риккати (5.4.11) — (5.4.13). Однако кор- ректное обоснование изложенной методики решения за- дачи оптимального управления представляется доста- точно сложным, ибо здесь, помимо обычных трудностей, известных для конечномерных систем, требуется еще до- казать принадлежность градиента v(t, х) функционала S функциональному пространству It7' (Q). § 5.5. Оптимальная стабилизация систем с распределенными параметрами Значительное место в теории оптимальных систем, описываемых обыкновенными дифференциальными урав- нениями, занимают методы исследования задач опти- мальной стабилизации. Общая аналитическая постанов- ка таких задач и разработка методов их решения преж- де всего принадлежат А. М. Летову [15]. Им, в частности, дано применение динамического программирования в ре- шении таких задач. Наиболее полно основы теории опти- мальной стабилизации конечномерных систем изложены Н. Н. Красовским в дополнении к монографии [16]. Не- которые частные результаты в этой области для систем с распределенными параметрами, полученные в [3, 17], можно обобщить и конкретизировать, если использовать уравнение Веллмана в функциональных производных и на этой основе применить аппарат второго метода Ляпу- нова [18]. В этом параграфе довольно схематично излагаются эти вопросы на примере управляемого процесса, описы- ваемого краевой задачей для уравнения параболическо- го типа. 1. Постановка задачи. Пусть управляемый процесс описывается краевой задачей я £idxA dxii \ дх* дхп ) хей, (5.5.1)
$ 5.5] ОПТИМАЛЬНАЯ СТАБИЛИЗАЦИЯ 327 а — + си — <р(t, х, и, Р), хео, (5.5.2) ы(/0, х) = Ф (х)> хе Q 4- ст, (5.5.3) где a<t, b(, f, с, <р и ф — заданные функции, причем п п 2 a«/l^/>Y22 & а«=ая ПРИ A:eQ+o, y=const>0, Z,/=l «=1 П / П \2-|*/» 2 2 ai/cos («•*/) Q — ограниченная область в En с кусочно-гладкой гра- ницей ст, п — внешняя нормаль к ст, a v — конормаль, аир — скалярные управляющие параметры, которые мо- гут принимать любые вещественные значения. Допустимыми управлениями будем считать функции a(t, х) и p(t, х), удовлетворяющие следующим условиям: 1) Ii(t) — Jr(/, x)a2(t, x)dx < оо, Q 0</2(0 = Уg1 (/, х)р2(f,х)dx< ос, О где г и g — заданные функции. 2) Интегралы /,(/) и /2(0 должны быть локально ин- тегрируемы на всех допустимых управлениях. Здесь не будем вдаваться в подробный анализ этих услдвий. Отметим лишь, что в каждом конкретном слу- чае, когда задан класс допустимых управлений, задача (5.5.1) — (5.5.3) должна быть однозначно разрешимой при любой паре допустимых управлений a=a(t, х), Р = Р(/, х). При этом решение должно определяться инте- гральным тождеством J [иФ]^х = С f /гч ди дф j „Ф,_ 2 * <?£ 1,1 1 dQ — — У [cu — ф](Мст (5.5.4) 4
328 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V и условием и (t, х) (х) е L2 (Q) при/->/0 4-0 (5.5.5) и принадлежать классу Q = QX[/0, 7]. Здесь Qi =QXUi> ^]> о? — боковая поверхность этого цилиндра, Ф — любая функция из Wl (Q), а Т — произ- вольное число, превосходящее /0, Функция u(t, х), определяемая таким способом, явля- ется обобщенным решением краевой задачи (5.5.1) — (5.5.3), и можно указать естественные достаточные ус- ловия [11], накладываемые на данные задачи, при кото- рых эта функция определяется однозначно. Пусть состояние объекта можно измерять в любой точке PeQ и на основе полученной информации форми- ровать управляющие функции оф, x}=a(t, х, u(t, х)) и р[/, x]=p(f, х, u(t, х)). Интуитивно «ясно», что для обеспечения оптимальности управления (по некоторому заранее выбранному зако- ну) аир следует брать функционалами, определенными на ueZ-2 (И). Чтобы подчеркнуть этот факт, аргументы t и х в функциях аир взяты в квадратные скобки. Пусть, далее, М(t, х), Afa(f, х) и N(t, х) — такие функ- ции, что d£l 4- J WuMa<oo а на решении задачи (5.5.1) — (5.5.3), соответствующем любой паре допустимых управлений, а функция /»(/) ло- кально интегрируема. Введем понятие об устойчивости и асимптотической устойчивости тривиального решения краевой задачи (5.5.1) —(5.5.2). Пусть f (t, х, 0, ..., 0) s0 и <p(f, х, 0, 0) =0. Тогда функция «е0 будет удовлетворять уравнению (5.5.1) и граничному условию (5.5.2) при а=р^0. Ее будем на- зывать тривиальным решением краевой задачи (5.5.1) — (5.5.2). Это решение будем называть устойчивым по Ля- пунову в метрике Wl (Q) при фиксированных допустимых
§ 5.5] ОПТИМАЛЬНАЯ СТАБИЛИЗАЦИЯ 329 управлениях а(/, х) и р(/, х), если для произвольно ма- лого е>0 существует 6>0 такое, что неравенства Мо. *)И£, = Цф(*)11£,<в следует, что при всех />/0, где u(t, х)—решение задачи (5.5.1), (5.5.2), соответствующее выбранным управлениям. Если, кроме того, ||ы(/, х)|| ->0 при t-^oo, Х(°> то решение u(t, х)=0 будем называть асимптотически устойчивым. Отметим, что введенное определение устойчивости естественным образом обобщает соответствующее поня- тие устойчивости для систем, описываемых обыкновенны- ми дифференциальными уравнениями. При этом фигури- рующая здесь норма в (Q) обусловлена тем, что в со- ответствии с интегральным тождеством (5.5.4) каждое обобщенное решение u(t, х) задачи (5.5.1)—(5.5.3) при фиксированном t является элементом пространства IFj(Q). Рассматриваемая здесь задача оптимальной стабили- зации состоит в том, чтобы найти управления а°[/, х] и р°|7, х] такие, при которых тривиальное решение и=0 было бы асимптотически устойчивым и функционал I Ио. «Но. *)] = f (ЫО + МО + /з(01 di г, принимал наименьшее возможное значение. Очевидно, что эта задача является естественным об- общением задач оптимальной стабилизации, рассматри- ваемых для систем, описываемых обыкновенными диф- ференциальными уравнениями. Кроме того, можно ука- зать конкретные процессы теплопроводности и диффузии (в частности, диффузии нейтронов в ядерных реакторах),
330 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ. V для которых подобная постановка задачи является есте- ственной и представляет определенный практический ин- терес. 2. Уравнение Беллмана. В соответствии с общим мето- дом вывода этого уравнения введем функционал S [t и (t, х)] = min / [t и (t, х)] а,Р(т,х) /<т<оо и предположим, что S[t ы], как функция от t, дифферен- цируема и, как функционал от u^L2(Q), имеет диффе- ренциал Фреше. Тогда S [/ + At и (t + At х)] = S [t и (t, х)] + + dt + Ф [t u(t, х), Au] -|- о (At Au), где Au=u(f+At х)—u(t, х), Ф — линейный по Ди функ- ционал в £2(Й), вычисленный в точке (t и), а о (Д/, Ди) /(ДО2+|| «||2 при Y(А/)’ +1| Дм II2 -► 0. Так как Au(t x)eL2(Q) почти при всех t из конечного интервала времени, то существует подобного же типа функция v(t, х) такая, что Ф (t и, Ли) = j* у (t х) ки (t х) dx = (t х) (u)J+4Z dx. £2 Я Следовательно, применяя принцип оптимальности Белл- мана, будем иметь S[t,u (t х)] -= min h (t) Ы + S [t и (t x)] + «Э I i + ?S.K’ “^’^1 дг + f (u^v (t x) dx + о (At A«)l. (5.5.6) dt J J Очевидно, что (Ы)'+Д'ц = (u;)?+4/— (u)^ u(t + At X). (5.5.7)
4 5 5j ОПТИМАЛЬНАЯ СТАБИЛИЗАЦИЯ 331 Предположим теперь, что v(t, Тогда, пола- гая в тождестве (5.5.4) Ф=о и учитывая (5.5.7), будем иметь ^(1, x)(u)^dx = й ди ди_ дх. дх. dQ — — J [си -<p]vdo - J(y)/+A/«(^ 4- M,x)dQ, (5.5.8) at Q где Qi = QX(/> /+Д/], a a4— боковая поверхность этого цилиндра. Из (5.5.6) и (5.5.8) следует, что w а,В | { Qi \du dv 1 dxi ^xj 1 Г M J ± [ (о)'/+1д/« (t + А/, X) dQ + 21^1 Ы J Дг Q Переходя здесь к пределу при Д/->-0, получаем искомое уравнение Веллмана в функциональных производных asR,u(f,x)L = min (2/Д0 + dt а,р I i Д ди dv ,3 ;,/=i * > + foldQ Это уравнение аналогично тем уравнениям Веллмана, которые были получены в предыдущих параграфах, и для его исследования применимы те же методы, которые там были использованы. Однако сейчас нас интересует не- сколько иной аспект проблемы оптимизации рассматри- ваемого объекта. 3. Применение второго метода Ляпунова. Для иссле- дования сформулированной задачи оптимальной стаби- лизации введем понятие о функционалах Ляпунова.
332 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ (ГЛ. V Функционал V(t, и), определенный на элементах u<=L2(Q) и зависящий от числового параметра t, будем называть функционалом Ляпунова [18], если он диффе- ренцируем по t и и и для достаточно малой величины Ci>0 можно указать величину с2>0 такую, что | V(t, u)|<c2 при всех и элементах и, удовлетво- ряющих неравенству IIU llbj(O) < Ct. Возьмем произвольные допустимые управления аир, а в качестве и в функционале Ляпунова будем брать со- ответствующее им решение краевой задачи (5.5.1) — (5.5.3), определяемое интегральным тождеством (5.5.4) и условием (5.5.5). В результате функционал будет вы- числен на конкретной функции u(t, х), т. е. получим ве- личину У[/, u(t, х)], которая будет обычно скалярной функцией времени I. Введем понятие о полной производной функционала V, вычисленного в силу краевой задачи (5.5.1) —(5.5.3) по следующему правилу: dv_= Пт У[/+д<, «(<+д<,х)ьу[/,«(<, а)] (559) dt At ' ‘ ' Из предположения о дифференцируемости V следует, что V[t + Ы, u(t + Ы, х)] — V [/, и(t, х)] = = JKHlAML At + Ф [t, u(t, х), Ди] + о(Д/, Ди), (5.5.10) где Ди=и(?+Д/, х)— u(t, х), Ф — дифференциал Фреше функционала V, а . _2ЖАц) . 0 при /(ДО2 +1 Д«F ->0. /(ДО2 + 11 Д«||2 4 ’ 11 Так как Ф — линейный по Ди функционал, а Дие eL2(Q), то существует функция w(t, х), принадлежащая L2(Q) при фиксированном t такая, что Ф [/, и (0 х), Ди] = f w (t, х) Ьи dx — [ w (t, х) (и)/+д/ dt. Q Q
§5.51 ОПТИМАЛЬНАЯ СТАБИЛИЗАЦИЯ 333 Предполагая, что w(t, х)е1^2 (Q), можно воспользо- ваться формулой (5.5.8), заменив в ней v на w. Тогда бу- дем иметь ф [/, и (t;x), Au] = f (u a4 T M Qi I i.i-1 — pjcu — ф] w da — J(a$+A'u(f+AZ, x)dQ. (5.5.11) Qt £ Учитывая, что Qt = QXK, f+A(| и — ff u — dQ — f (u»)/+A/u(< + Af, x)dQ^->0 при A/->0, Lt IJ dt J j 'Qi Й ' из (5.5.9), (5.5.10) и (5.5.11) получим dV [< и] dV [f, и] Г dt dt J Q 3 di dxi dxi I — J (cu — <f>)wda. Это и есть полная производная по t функционала V, со- ставленная в силу краевой задачи (5.5.1), (5.5.2). На- помним, что она получена в предположении, что функ- ция w, определяемая дифференциалом Фреше этого функционала, принадлежит 1F,1. Определим теперь функционал B[V, t, u,a,|3] = ^- dt f/y Oi.............................. dxidxt dXi dx« ' — J {cu — <p(i, x, a, P)} wda + 4 + 7а + /3> a где /* — функционалы, входящие в определение крите- рия оптимальности I.
334 ПРИМЕНЕНИЕ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ [ГЛ/ V Следуя Н. Н. Красовскому [16], через u[t, х] будем обозначать решение краевой задачи (5.5.1) —(5.5.3), ко- торое соответствует управлениям а[?, х] и р [^, х]. Теорема 5.1. Пусть для краевой задачи (5.5.1)— (5.5.3) существует функционал Ляпунова V0 и допусти- мые управления сф, х] и р°££, х], удовлетворяющие сле- дующим условиям: 1) функционал Р положителен, т. е. Р^О, причем Р [/, ы]=0 лишь при ы=0; 2) ®[/, ы]=/ф, аф, х], рф, х]]+/г(/, аф, х], рф, хЩ- +Л К, а0К, х], р° [/, х]] и функционал со [/, и] в этом равенст- ве также является положительным, т. е. аф,и]:>0, и ра- венство имеет место лишь при и=0; 3) справедливо равенство В(Р, t, и, аф, х], p°[f, х]) =0; (5.5.12) 4) для любых аир справедливо неравенство В(Р, t, и, а, р)>0. Тогда управления аф, х] и рф, х] являются решением задачи оптимальной стабилизации и при этом имеет ме- сто равенство J 3 “°х]’ “°dt = /о 1=1 = min f V h u И, *]> a *]> ₽ И> *]] dt. (5.5.13) Z £ Доказательство. Сначала докажем, что при выполнении условий теоремы тривиальное решение и=0 асимптотически устойчиво. Согласно условиям 1)—4) за- ключаем, что функционал Р удовлетворяет условиям тео- ремы 13 из [18] об асимптотической устойчивости инвари- антного множества, которое в рассматриваемом нами случае состоит из тривиального решения и=0. В самом деле, Р^О и равенство Р=0 достигается лишь при и=0. Отсюда следует, что для достаточно ма- лой величины Cj>0 можно указать величину с2>0 та- кую, что Р[/, и]>с2 при ||ы|| ! Далее, согласно и<2(ьЛ)
§5.^1 ОПТИМАЛЬНАЯ СТАБИЛИЗАЦИЯ 335 определению функционала У,и условию 3), имеем ^^ = -2 Л(0<0 ил i~ 1 при а=а°(/, х] и 0=0° [t, х]. Это означает, что с возраста- нием времени функционал V0 убывает. Легко доказать также, что он стремится к нулю при t-+0, ибо величина Ц может обращаться в нуль лишь при и=0. Докажем теперь, что функции a’ [/, х] и 0° [t, х] миними- зируют функционал /[/0, и (10, х)]. Иначе говоря, нужно доказать справедливость равенства (5.5.13). Выбирая функцию <р(х) в условии (5.5.3) достаточно малой в нор- ме £2(Й), получим, что соответствующее ей решение u°[t, х] краевой задачи (5.5.1) — (5.5.3) будет достаточно малым в норме W\ (Q). Это следует из асимптотической устойчивости решения и=0. Следовательно, вдоль такого решения будет иметь место равенство (5.5.12), т. е. g = h(t), (5.5.14) * £ а значит, и limV°(t и) = 0. (5.5.15) Интегрируя (5.5.14) и учитывая (5.5.15), получим 00 з &.*)]== I‘(t)dt. to 1=1 Повторяя, далее, почти дословно рассуждения, при- веденные в [16] на стр. 487—488, легко установить спра- ведливость равенства (5.5.13). Дальнейшее исследование задачи оптимальной стаби- лизации для линейных краевых задач можно провести с помощью интегро-дифференциальной краевой задачи типа Риккати подобно тому, как это было сделано в пре- дыдущем параграфе при решении задач оптимизации на конечном интервале времени. Этого делать не будем, по- скольку формальная процедура решения задачи таким путем не представляет принципиальных трудностей.
Г Л А В A VI ЗАДАЧИ УПРАВЛЕНИЯ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ ОПТИМАЛЬНОСТИ В этой главе мы продолжим рассмотрение задач уп- равления с квадратичными критериями оптимальности для линейных объектов. Как показано в гл. V, с помо- щью динамического программирования подобные задачи сводятся к необходимости решать интегро-дифференци- альные краевые задачи типа Риккати. Здесь мы изложим другую процедуру, основанную на использовании необходимых условий оптимальности в форме принципа максимума. При этом сначала на примере простейшей задачи покажем возможность ис- пользования аппарата принципа максимума как для аналитического исследования точного решения задачи, так и для построения его приближений с получением оценок погрешностей. Затем аналогичные результаты по- лучим для общего случая, когда управляемый процесс описывается общим линейным уравнением параболиче- ского типа с классическим граничным условием (I, II или III рода). В заключение укажем на связь полученных резуль- татов с тем, что получено по решению задачи об управ- лении с минимальной энергией, а также дадим схему ре- шения задачи об оптимальном быстродействии при огра- ничении на энергию управления. Следует отметить, что не все изложенное в этой гла- ве имеет законченный вид. Многое еще требует коррект- ного математического обоснования. Не исключено также, что при детальном исследовании некоторые из положе- ний будут уточнены. Поэтому содержание этой главы, по крайней мере в некоторых ее местах, следует рассмат- ривать не как готовый рецепт решения отдельных задач, а как предмет для дальнейших математических исследо- ваний.
§ е-V ПРИНЦИП МАКСИМУМА 337 § 6.1. Условия оптимальности в форме принципа максимума. Распределенное управление Изложение материала, относящегося к условиям оп- тимальности в форме принципа максимума, начнем с анализа простейшей задачи, когда управляемый процесс описывается одномерным уравнением теплопроводности с однородными граничными условиями и с управляющей функцией, входящей лишь в само уравнение. В этом слу- чае условия оптимальности можно получить различными способами и трудно отдать предпочтение какому-либо из них. Однако из методических соображений здесь исполь- зуется метод, основанный на построении приращения ми- нимизируемого функционала, ибо он оказывается доста- точно эффективным и в других более сложных задачах, рассматриваемых в настоящей главе. 1. Постановка задачи. Условия оптимальности. Будем рассматривать управляемый процесс, который описыва- ется неоднородным уравнением теплопроводности (6.1.1) с начальным и граничными условиями и(0, х) = 0, (6.1.2) d±^Jl + au(t, 1) = О, a = const>0, (6.1.3) где f(t, х)—заданная функция из L2(Q), a p(t, х) — управляющая функция, Q={O^.t^.T, Osgjx^l}. Допус- тимыми управлениями будем брать функции p(t, х) из L2(Q), которые почти всюду в Q удовлетворяют условию |p(f, х)|С1. (А) В дальнейшем будем также накладывать другие огра- ничения на эти управления, характеризующие специ-
338 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (Rfl. VI альную форму зависимости р от пространственной коор- динаты х и времени t. Эти ограничения сводятся к сле- дующему. В одном случае функции p(t, х) должны быть представимы в виде p = q(x)r(t), где q(x)—заданная функция из Л (0, 1), a r(t) является управляющей функ- цией. В другом случае q и г меняются ролями, т. е. r(t) — заданная функция, a q(x) является управлением. Анализ задач с такого типа управляющими функциями представ- ляет определенный практический интерес. Отметим также, что при указанных условиях каждое допустимое управление однозначно определяет функцию u(t, х), которая почти всюду в Q удовлетворяет уравне- нию (6.1.1) и дополнительным условиям (6.1.2), (6.1.3) при всех /их. Рассматриваемая здесь задача оптимального управ- ления состоит в том, чтобы найти допустимое управле- ние p°(t, х) и соответствующее ему решение «“(/, х) за- дачи (6.1.1) — (6.1.3) такие, чтобы функционал 1 1 г /= [и(Т, х) — ср(x)]2dx + Р J J Р'x)dxdt, О 0 0 p=const>0, принимал наименьшее возможное значение при р=р", «=«’. Здесь Т — фиксированный момент времени, а <р(х) — заданная функция из L2(0, 1). Для получения условий оптимальности возьмем про- извольное допустимое управление p(t, х) и обозначим через u(t, х) соответствующее ему решение задачи (6.1.1) — (6.1.3). Управлению р дадим некоторое допусти- мое приращение Др ‘И обозначим через Ди соответст- вующее ему приращение функции u(t, х). Тогда оче- видно, что функция Ди(/, х) является решением краевой задачи ^. = ^ + Др(/,х), dt дх* ' Ди (О, х) = О, =0, ^4-аДи) =0. U-o \ дх (6.1.4)
§ 6.1]> ПРИНЦИП МАКСИМУМА 339 Непосредственными вычислениями находим, что при этом функционал I получает приращение Д/ = 2 J [и (Т, х) — <р (х)] Ди (Т, х) dx + О 4- 2₽ j J р (t, х) Др (t, х) dxdt-\- J [Ди (Т, х)]г dx + 0 0 о 1 т + Р j рДр(/,х)]2ах<Я. (6.1.5) о о Возьмем произвольную функцию ф(/, XjsIFa^Q). Тогда, очевидно, справедливо равецство Т 1 f f * & Й ~ ~ Р <*> ~ Х>1dx dt == °- J J Id/ dx2 J О о Обозначая левую часть равенства через Л[ф, р], бу- дем иметь ДЛ [ф, р] = А [ф, р + Др] — А [ф, р] = ; = (6.1.6) о 0 Интегрируя по частям, находим, что о о т *) J дх О х=1 т 1 dt_ Г Cd^d^udxdt^ J J дх дх ix=o о о = —а Уф(^, 1)Да(Л l)dt — ^^^dxdi. о 0 0 Здесь мы воспользовались тем, что Ди является решени- ем краевой задачи (6.1.4).
340 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГД. VI Таким образом, равенство (6.1.6) можно записать в виде Т 1 о о т + а|ф(/, 1)Ди(М)Л = 0. (6.1.6') о До сих пор X) была произвольной функцией из (Q). Определим ее теперь как обобщенное решение краевой задачи + = 0</<Т, 0<х<1, (6.1.7) dt дх* ' ф (Г, х) = — 2 lu(Т, х) — <р(х)], (6.1.8) = 0, + аф (t, 1) = 0, (6.1.9) где u(t, х)—решение краевой задачи (6.1.1) — (6.1.3), соответствующее управлению p(t, х), а ф(х) —функция, фигурирующая в определении функционала I. При этом под обобщенным решением задачи (6.1.7)—(6.1.9) пони- мается функция ф(^, х) из W^4(Q), удовлетворяющая ин- тегральному тождеству 2 J [и (Т, х) — ф (х)] Ф (Т, х) dx + о + + + 1)Ф(^ 1)^ = 0 0 0 о (6.1.10) для любой функции (DgIF^Q), обращающейся в нуль при t—Q. Из того, что ф(х)е£х(0, 1) и и(Т, x)eL4(0, 1), сле- дует, что этим тождеством функция ф (t, х) определяется однозначно.
5 6.11 ПРИНЦИП МАКСИМУМА 341 f I kptydxdt = 0. Из (6.1.6') и (6.1.10), полагая Ф=Ди, получаем 1 Т 1 2 J [и (Т, х) — ф (х)] Ди (Т, х) dx + О 0 0 Следовательно, величину Д/ из (6.1.5) можно предста- вить в виде Т 1 1 Д7 = — J J ДрПЯ’ dxdi 4- j [Ди (7, х)]2 dx 4- fo о о Т 1 + pJJ[Ap(/,x)]*dxctf. (6.1.11) О о До сих пор p(t, х) было произвольным допустимым уп- равлением, a и(1, х) —соответствующим ему решением краевой задачи (6.1.1)— (6.1.3). Если теперь в формуле (6.1.11) положить р=р°, u=u°, ф=ф°, то получим, что 0 — 20р°] dx di 4- j [Ди (Т, х)]2 dx 4- 0 0 о Т 1 4- р J J [Др(/, x)]adxdf>0 о о для любого допустимого приращения Др(<, х) и соответ- ствующего ему приращения Ди(/, х). Так как второе и третье слагаемые в левой части это- го неравенства неотрицательны, то справедливо утверж- дение: Для того чтобы управление p°(t, х) и соответствующее ему решение u°(t, х) краевой задачи (6.1.1) — (6.1.3) бы- ли оптимальными, достаточно, чтобы для соответствую- щей им функции ф°(/, х) и любого допустимого прира- щения &p(t, х) имело место неравенство T 1 J J Др [ф° — 2рр°] dxdt^ 0. о « (6.1.12)
342 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Если ввести функцию и°> Р°) =РЧ°—Р(Р°)2> то вместо (6.1.12) можно брать неравенство Т 1 J J [Н (ф°, ы°, р°) —Я(ф°, u®, p°)]dxdt^Q (6.1.13) О о для всех допустимых управлений. Неравенство (6.1.13) эквивалентно следующему равенству: Я(ф«, и°, р»)(=)тахЯ(ф°, и°, р), (6.1.14) р где символ ( = ) означает равенство, справедливое почти всюду в области Q, а максимум берется по всем р из об- ласти допустимых значений (см. (А)). Можно доказать, что сформулированное достаточное условие оптимальности является также и необходимым. Это можно сделать различными способами. Один из них для подобного типа задач и применяется в последующих параграфах и его можно применить и в рассматриваемом здесь случае. Рассуждения, приводимые в следующем пункте, пока- зывают, что если условие (А) снять, то достаточные ус- ловия оптимальности определяют единственное управ- ление. Поэтому, имея в виду, что необходимость сформули- рованных условий можно доказать тем или иным спосо- бом (который легко может осуществить читатель), окон- чательный вывод можно записать в виде следующей тео- ремы. Теорема (принцип максимума). Для того чтобы допу- стимое управление p°(f, х) и соответствующее ему реше- ние «’(/, х) краевой задачи (6.1.1) — (6.1.3) были опти- мальными, необходимо и достаточно, чтобы функция Н удовлетворяла условию (6.1.14), в котором ф*— решение краевой задачи (6.1.7) — (6.1.9) при и=и°. 2. Построение оптимального управления. Переходя к построению оптимального управления, предположим сначала, что на область значений допустимых управле- ний не накладывается никаких ограничений. Тогда из
§6.1] ПРИНЦИП МАКСИМУМА 343 условия (6.1.14) следует, что оптимальное управление р® должно удовлетворять условию р(/,х)=1ф(/,х). (6.1.15) Таким образом, задача сводится к определению р®, и0 и ф® из соотношений (6.1.1) — (6.1.3), (6.1.7) — (6.1.9) и (6.1.15). Пусть {Хп(х)}—полная ортонормированная система собственных функций краевой задачи Х"(х)+АЛГ(х)=0, 0<х<1; Х'(0) =Х'(1) +аХ(1) =0, а {%„} — соответствующая последовательность ее собст- венных значений. Положим u(t,x)= 2 un(t)Xn(x), р?(1,х) = 2 Pn(t)Xn(x), П—Q П=0 । f(t,x)^ 2 М0Ш 71=0 J (6.1.16) Для определения un(t) получаем уравнения un(t) + K2nun{t) = Pn(t) + fn(t), n = 0, 1, .... (6.1.17) с начальными условиями цп(0) =0, n=0, 1, ... Отсюда находим, что Un (/) = J [рп (т) + fn (*)] dr. (6.1.18) о Полагая ф (t, х) = 2 Фл (х)> <₽(*)= 3 <РпХп
344 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI находим, что q'n (0 - (0 - о, (Т) - - 2 [ип (Т) - фл] и, следовательно, Ч>„ (0 = - 2 [Un (Т) - <р„] №>. (6.1.19) Далее, из соотношения (6.1.15) следует, что Рп(0 = ^%(0. (6.1.20) 2₽ Из (6.1.20) с учетом (6.1.18) и (6.1.19) получаем ин- тегральное уравнение относительно pn(t) л /Л Г Ьп(Ах-ъТ) , . , Ьпв-Т) $Рп (0 + J е рп (x)dx = qne " , О где qn = Фп — j e'n(t~T)fn (t)di. О Это уравнение имеет вырожденное ядро и единствен- ное его решение можно получить в виде „ (А 2г?пЯп рп (/) =------------ . е 2₽Х’ + 1-е " Таким образом, оптимальное управление имеет вид Р°(/, х) = 2 5J ---------------- • е^~Т}Хп(х); (6.1.21) п=о +1— е^пТ при этом j j р' (t, x)dxdt = о о -9к2т ‘ Л=о + 1- е *пТ
§ 6.U ПРИНЦИП МАКСИМУМА 345 Подставляя найденные значения p(t, х) в (6.1.18), на- ходим, что ип(Т) = q"(1^e------2_ +^eni')fn(0di. (6.1.22) 2%Др4-(1 — е-аХ"Г) о Этот результат представляет интерес в связи с зада- чей об управлении с минимальной энергией, рассмотрен- ной в гл. III. Если в управлении (6.1.21) положить 0=0, то получим P°(t, ^)1р=о = 22 —^^ХДх), (6.1.23) я=о 1 — е п а соответствующие значения величин (6.1.22) принима- ют вид ып(Т) =<р„. Таким образом, управление (6.1.23) определяет ре- шение краевой задачи (6.1.1) — (6.1.3), которое в момент времени t=T удовлетворяет условию и(Т, х)=<р(х), (6.1.24) где ф(х) —функция, входящая в определение функцио- нала I, фигурирующего в качестве критерия оптималь- ности в этом параграфе. С другой стороны, сравнение с результатами, изло- женными в § 3.1, показывает, что управление (6.1.23) является управлением с минимальной энергией, когда требуется перевести управляемый объект из состояния (6.1.2) в состояние (6.1.24). Этот факт показывает, что в рассматриваемых задачах можно пользоваться мето- дом штрафных функций для решения задач управления с фазовым ограничением (6.1.24). Подводя итог всему изложенному, можно сделать сле- дующие выводы.
346 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (ГЛ. VI 1. Задача об оптимальном управлении с критерием оптимальности I и управляющей функцией р, входящей в правую часть уравнения (6.1.1) без ограничений на об- ласть допустимых значений, решается до конца, и опти- мальное управление имеет вид (6.1.21). 2. Это управление в пределе при р->0 дает решение задачи об управлении с минимальной энергией, когда на конечное состояние объекта при t — T накладывается ус- ловие (6.1.24). Поэтому функционал I можно рассмат- ривать как «оштрафованный» функционал в задаче управления с минимальной энергией и фазовым ограни- чением (6.1.24). 3. Решение задачи с управлением вида р =q (х) r(t). Рассмотрим теперь ту же задачу управления, но при не- которых дополнительных ограничениях на функции p(t, х). Сначала будем считать, что p(t, х) = q(x')r(f), где q(x)—заданная функция из L2(0, 1), r(t)—управле- ние, подчиненное условию r(t) е£2(0, Т). Очевидно, что принцип максимума остается верным и в этом случае, нужно лишь условие максимума брать в интегральной форме (6.1.13), поскольку соотношения (6.1.13) и (6.1.14) теперь не будут эквивалентными, а (6.1.13) получено без каких-либо оговорок относительно структуры допустимых управлений. Функция Н в этом случае имеет вид HW, и', P)=<7(*)W. ₽<?г(х)г2(0. Пусть r°(f)—оптимальное управление. Тогда усло- вие (6.1.13) можно записать в виде J [г — г°(0] j q (х) ф° (/, х) dx — р [г3 — (г° (0)»] j <73 (х) dx Ltf < 0. Иначе говоря, этот факт можно сформулировать сле- дующим образом: функция h (ф°, и°, г) = J [q (х) ф° (t, x)r-^$q2 (х) г2] dx
ПРИНЦИП МАКСИМУМА 347 должна достигать своего максимального значения при г=г°(0- Отсюда получаем, что оптимальное управление должно удовлетворять условию r = 7^p(x)Wx)dx, О q2(x)dx, (6.1.25) 9 где гр°(Л х)—решение краевой задачи (6.1.7) — (6.1.9), в которой «=«’, где и0 — решение задачи (6.1.1) — (6.1.3), соответствующее оптимальному управлению г°(0- Таким образом, задача об оптимальном управлении сводится к совместному решению краевых задач (6.1.1) — (6.1.3) при p=q(x)r°(t), (6.1.7) — (6.1.9) и уравнения (6.1.25). Процедура построения оптимального управле- ния в этом случае совпадает с той, которая изложена в предыдущем пункте. Разлагая в ряд Фурье функцию р°(/, х), получаем p(t, х) = pn(t}Xn(x), где pn(t) =r°(0 J q(x)Xn(x)dx= О = r6qn. В итоге формула (6.1.18) принимает вид ип (0 = Чп J г° (т) dx + J fn (Т) dx, О о а коэффициенты Фурье решения краевой задачи (6.1.7) — (6.1.9) определяются по прежней формуле (6.1.19). Из (6.1.25) находим, что '•-зЬЗМ’- (6L26) Подставляя в (6.1.19) значение ип из (6.1.18), а затем исключая фп из (6.1.26), получаем интегральное уравне- ние относительно г° (0: т Г (0 + — (t,rx) г (х) dx = S (0, (6.1.27) ря J о
348 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. V1 где *(*,<) = 3 ^*(<+т’2П п=о е//\ 1 U'V' № г п=о 5(0 = 4- 3 Гф*- р"(<‘ПМ0Л«е D0 ' J О Покажем, что это уравнение имеет единственное ре- шение в L2(0, Т): 7* Г дд 2 2 9 9 J V t, „ _ ”*П Т/'Ь 0 о М—о " * Аналогично доказывается, что S(/)gL2(0, Т). Поэто- му линейный оператор А, определяемый формулой т Ar = r(0 + A^K(t, x)r (x)dx, О отображает функцию r(f)e£1(0, Г) в функции того же пространства. Кроме того, он симметричен, ибо (р, Ar) = ^p(t)r(t)dt + О Т Т оо 2 Т + -^Jp(Oj 3 dnen{t^r{x)dxdt ^p(t)r<t)di + о о л=0 о + г 3 f (О е1"“’П д f ’»r wл - Ил г>- Далее, имеем (в силу положительности q) (р (0, Ар (0) = jр» (0 dt + 1 2 ( f qnp (t) dA > о л=° \о /
§ 6.1] ПРИНЦИП МАКСИМУМА 349 т. е. и, следовательно, оператор А является определенно по- ложительным и согласно теореме 2.3 из гл. III уравне- ние (6.1.27) имеет единственное решение в энергетиче- ском пространстве НА оператора А. Поскольку для поло- жительно определенного оператора А пространство НА вложено в H=L2(0, Т), то тем самым доказано существо- вание и единственность решения уравнения (6.1.27). Это решение, очевидно, является оптимальным управлением в рассматриваемой задаче. Поскольку ядро K(t, т) представляет собой бесконеч- ный ряд, то точное решение уравнения (6.1.27) в явной форме получить не удается и приходится ограничиваться его приближениями. Их можно построить, ограничиваясь конечными суммами в рядах, определяющих функции K{t, т) и S (/). Полагая Ы т) = 3 п—о |m - = — 4 V фп 6(7 r /1=0 L ~1 2 £ /Л\ Л 4 qne Т 2 о m-e приближение rm(t) решения r°(0 уравнения (6.1.27) будем искать из уравнения т Гт (0 + 4- f w dx = (0. (6.1.28) р<7 J о которое имеет вырожденное ядро. Оператор Ат, опреде- ляемый левой частью уравнения, определенно положите- лен. Следовательно, при любом т это уравнение одно- значно разрешимо. Как известно, его решение легко на- ходится алгебраическим методом (уравнение сводится к системе алгебраических уравнений). Меру уклонения rm(t) от r(t) можно оценить исполь- зуя результаты § 3.2 гл. III, а именно, для этой цели
350 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (ГЛ. VI можно воспользоваться формулой u-'ml |х(Л) (1М-Л4 ||S-SOTq kmll 114,-лц I или + JS| )’ где р(Д) = ||Д||||Д_1||. Сложность в использовании этой формулы заключается в необходимости вычислять (или оценивать) величину ||Д_‘||. Можно воспользоваться другим приемом, который изложим более подробно. Запишем уравнения (6.1.27) и (6.1.28) в операторной форме Г = S — — К.Г > Gn — Sm ’ ~ КщГт‘ ₽<7 Р<7 Имеем Г — Sm ~ КщГ 4“ Фт» Р<7 где Фт = S Sm “— (К ' Кт) Г • М Тогда г—гт=фт——Кт(г—гга). Поскольку оператор Кт положителен, то, умножая скалярно обе части получен- ного уравнения на г—гт, будем иметь || Г — Гт |Р — (г — Гт, Фт) Г" (г Гт> Кт (Г Гщ)) Р? < (Г — Г«, фт)< ||Г — Гт ||||фт ||, и,следовательно, 1к-Гт||СНфт||. (6.1.29) Оценим ||фт||. Имеем Sm|| + i||K-Kmlllrll. (6.1.30)
§6.1] ПРИНЦИП МАКСИМУМА 351 Для оценки величины ||г|| воспользуемся положитель- ностью оператора К. Тогда из того, что г = 5 — -Кг, ₽<7 будем иметь IH = (S. г) -^(r.Kr)<(S,r)<IS|||r|. т. е. IklKIISII. (6.1.31) Следовательно, из неравенств (6.1.29) — (6.1.30) выте- кает k - + —(6.1.32) Это неравенство позволяет достаточно хорошо оцени- вать скорость сходимости гт к г. В самом деле, из определения S и S„ имеем -(X2 +Х2)Г (1-е п k: 1 1^1Ы ч + ц ’ где vn = Чп I K2(t-T) Фп — J е fn (О dt Так как a2+b2^2ab для любых вещественных а и Ь, то l|s-smp< 4 00 4 00 2Д2/ 3 S °*' 4 &жт+1 Л=т+1
352 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Числа являются корнями трансцендентного урав- нения X tg%=a и удовлетворяют условию пя < Хл < (п + л; поэтому ОО ОО / СО \ у 1 <_L у 1 < 1 / 1 . Г _ /п+2 „“L я2 *2 л2 I (m+l)a J д/«1 л2(т+1)2* й-==л1+1 к faszm+i \ m+i ' Следовательно, 1. Аналогично находим, что 00.00 1SI’<S ^-2 =о лп л=о 00 Из определения о„ следует, что ряд °* сходится, ибо п=о <7(х)е£2(0, 1), <p(x)eLt,(O, 1), f(t, x)g£2(Q). Повторяя аналогичные преобразования, можно показать, что и-м2< з n,fe=m+i (”»+2)2 £ д» я* (т +1)« чп' х ' n=m+i Таким образом, из (6.1.32) получаем следующую оценку скорости сходимости гт к г: Ur—rn\\<N(m), (6.1.33)
$ 6.1] ПРИНЦИП МАКСИМУМА 353 где N(m) — у ^ул + да2(т+1)%Д, ) , 1 ( (т+2)2 Pg I л4 (m 4-1)4 ОО 00 о° \ '/« 3 4-2»: • П=/П+1 k=o п=о / Не представляет большого труда вычислить оценку при- ближения и в пространстве функционала, если в качестве приближения оптимального решения задачи (6.1.1) — (6.1.3) брать т-ю частичную сумму ряда Фурье ее реше- ния при p=q(x)rm(t). 4. Решение задачи с управлением вида р — q(t)r(x) Итак, будем считать, что управляющая функция в уп- равлении (6.1.1) имеет вид p = q(t)r(x), где q(t)—за- данная функция из L2(0, Г), а г(х) —управление. Допу- стимыми управлениями считаются функции г=г(х), удо- влетворяющие условию 1 j r2(x)dx< оо, О т. е. г(х)е£2(0, 1). Очевидно, что принцип максимума справедлив и в этом случае, с той лишь поправкой, что условие макси- мума функции Н нужно брать в интегральной форме (6.1.13). Полагая h (ф°, и°, г) = J [q (0 ф° (t, х) г —т₽<72 (0 г2] dt, О находим, что условие (6.1.13) будет выполняться при т т Г _L f q (0 (/, Х) dt, где q = f q* (0 dt. (6.1.34) 2p? J F J о t o Таким образом, оптимальное управление должно оп- ределяться путем совместного решения краевых задач (6.1.1) — (6.1.3) и (6.1.7) — (6.1.9) при условии, что P = q(t)r(x), а г удовлетворяет соотношениям (6.1.34). 12 А. И. Егоров
354 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Полагая оо = Ъ Рп®Хп(х), п=о находим, что 1 Pn=q (t) гп, где rn = J r (x)Xn (x)dx. 0 Полагая, далее, ОО оо и (t, х) = 2 «п (0Хп (х), ф (I, х) = 5} ф„ (0 Хп (х), п=о п~о определяем un(t) и ф„(/) так же, как в п. 2. В результате они будут иметь вид (6.1.18) и (6.1.19). Учитывая специ- фику коэффициентов pn(t) в рассматриваемом случае, формулу (6.1.18) запишем в виде < -X2 (/-т) -Xs (/-г) = " q(x)dx±\e п fn(x)dx. (6.1.35) о о Из формулы (6.1.34) находим, что т rn = — [q(t)qn(f)dt, п =0, 1, ... (6.1.36) 2₽<? J О Решая совместно уравнения (6.1.19), (6.1.35) и (6.1.36), получаем гп ----- №+Яп где £ х2 (/-Г) Г f -W-п qn - J е п q(t)dt, ln<p„ - р n fn (t)dt 0 L о
S 6.11 ПРИНЦИП МАКСИМУМА 355 Таким образом, оптимальное управление в рассматривае- мом случае имеет вид 00 q I Р° (t х) - q (/) У —Хп (х). (6.1.37) Jo + Соответствующее ему решение u°(f, х) в момент времени t=T можно представить в виде и°(Т,х) = 2 Tf X2 V-T) . Ге" fn(t)dt fr + <ln J Отсюда следует, что в пределе при £->0 имеем и°(Т, х) |р==0=<р(х), а управление (6.1.37) принимает вид 00 I 7-хл(х). л=о Яп Х„(х). (6.1.38) (6.1.39) Сравнение с результатами решения задачи об управ- лении с минимальной энергией (см. § 3.3) показывает, что управление (6.1.39) имеет минимальную энергию в задаче перевода объекта (6.1.1)—(6.1.3) из состояния (6.1.2) в состояние (6.1.38). Во всех рассмотренных случаях мы игнорировали ог- раничение (А), накладываемое часто на допустимые уп- равления. Обычно в задачах управления объектами, опи- сываемыми обыкновенными дифференциальными урав- нениями, используется следующий прием. Сначала решается задача без учета такого ограниче- ния. В результате находится управление р, минимизирую- щее функционал в более широком классе допустимых уп- равлений. Затем делается «срезка» этого управления, т. е. строится новое управление [1, если 1, „1 если~р -1, 12*
356 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI которое считается оптимальным в задаче с ограничени- ем (А). Как показано Н. Н. Красовским и А. М. Лето- вым [1], этот прием не всегда приводит к цели. Для си- стемы с распределенными параметрами вывод работы [1] также справедлив. Однако пока нет результатов, из ко- торых можно было бы заключить, применим ли этот прием в рассмотренной здесь задаче. В настоящем параграфе рассмотрены лишь те зада- чи управления, когда управляющие функции p(t, х) при- надлежат L2. Ясно, что этим не исчерпываются все задачи управ- ления процессами, описываемыми краевыми задачами типа (6.1.1)— (6.1.3). В частности, представляет интерес случай, когда p(t, х) =6(х—xn)p(t), где 6 —функция Дирака. Некоторые из подобных задач могут быть ис- следованы изложенным выше методом, в чем читатель может убедиться непосредственной проверкой. Другие требуют специальных методов. § 6.2. Управление по границе Начиная с этого параграфа, будем рассматривать ряд задач управления, когда управляющий параметр входит в граничное условие, а процесс описывается общим урав- нением параболического типа. Критериями оптимально- сти служат интегральные квадратичные функционалы. Подобные задачи рассматривались многими авторами. При этом, как правило, основное внимание уделялось получению необходимых условий оптимальности и иссле- дованию вопросов существования и единственности оп- тимального управления (см., например, [2—9]). Для отдельных задач предлагались способы построения при- ближенных решений без получения оценок допускаемых погрешностей, причем обоснование сходимости таких приближений дано лишь в некоторых работах [3, 6]. Здесь мы уделим особое внимание построению и ис- следованию точного решения рассматриваемых задач, дадим способ аналитического построения оптимального управления, который позволил свести каждую из рас- сматриваемых задач к бесконечной системе алгебраиче- ских уравнений. Такой путь позволяет указать достаточ- но просто реализуемую процедуру отыскания приближен-
S 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 357 ного решения с априорно заданной погрешностью или с обоснованием сходимости приближений к точному решению. .Сначала рассматривается наиболее простая задача, когда на состояние управляемого объекта в конечный момент времени не накладывается никаких ограничений. Эта задача подобна задачам терминального управления, рассматриваемым в теории оптимизации конечномерных систем. Ее решение сводится к решению счетной системы линейных алгебраических уравнений, однозначно разре- шимой в пространстве последовательностей /2. Предла- гаемый способ приближенного решения достаточно прост и здесь удается доказать сходимость приближений к точ- ному решению задачи, получить оценку погрешности на каждом шаге аппроксимации как в пространстве управ- лений, так и в пространстве функционалов и доказать устойчивость метода относительно погрешностей в про- межуточных вычислениях. Приводится пример, показы- вающий, что приближения достаточно быстро сходятся к точному решению задачи. 1. Постановка задачи. Условия оптимальности. Пусть управляемый процесс описывается уравнением — Lu = F(t, х), х’= {хи , хп} е= t0 < t < 4, (6.2.1) dt где и оператор L является эллиптическим, т. е. всюду в зам- кнутой области #+S (S — граница области 8} выполне- но условие alf =ац, а*, у = const > О, i,i=i 1=1 для любых вещественных чисел at...ап.
358 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI (х) cos (N, х{) + а (х) и, ох. Пусть, далее, вместе с уравнением (6.2.1) заданы до- полнительные (начальные и граничные) условия и х) = ф(х), х^З, (6.2.2) Pu=a(x)g(t, х), xeS, (6.2.3) где п ₽“= 3 1.1=1 N — внешняя нормаль к S в точке xeS. Относительно области # и функций, определяющих краевую задачу (6.2.1) — (6.2.3), будем предполагать вы- полненными следующие условия. S’ — ограниченная об- ласть евклидова пространства Еп, ее граница S является кусочно-гладкой, с(х) и а(х) —заданные ограниченные измеримые функции, удовлетворяющие условиям а(х)^0, с(х)^0, причем хотя бы одна из них не равна тождественно нулю, g(t, x)<=L2 (t^t^it, S), F(t, х)е «=La(Q), ^(х)е£2(^), ф(х)е=£а(£), Q=$X[*o, Л]. Поскольку ф(х)е£2, то условие (6.2.2) следует пони- мать в том смысле, что j" [и(t, х) — ф (х)] ф (x)’dx 0 при t -> t0 +0. (6.2.4) Определение [6]. Функция u(t, x)^L2(Q), имею- л &U . 1 щая в цилиндре Q производные —, r=l, ..., п, принад- dxt лежащие L2(Q), называется обобщенным решением краевой задачи (6.2.1) — (6.2.3), если она удовлетворяет интегральному тождеству и (т2, х) Ф (t2, х) dx — . С у ai/——-4:u<b]dQ+ fa(u-'g)Od<J = qU Л &1 дХ‘дХ! J 4 = f «(Г1,х)Ф(г1,х)Лх+ \F(t,xyb(t,x)dQ (6.2.5)
§ G.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 359 для любой функции и условию (6.2.4). Здесь Qt=^X{x1, т2]— цилиндр с боковой поверхностью от, а Т1 и т2 — произвольные моменты времени, удовлетворяю- щие условию /0^Т1СТ2^^. Как показано в [6] (об этом уже говорилось в преды- дущей главе), при указанных выше условиях задача (6.2.1) — (6.2.3) имеет единственное обобщенное решение. Его можно построить следующим образом. Пусть {zn(x)}—полная в L2(IF) ортонормированная система обобщенных собственных функций краевой за- дачи L(z)=—Xz(x), х&!3, Pz(x)=0, x(=S, а {А,„} — соответствующая последовательность собствен- ных значений, при п->-оо. Согласно опре- делению функции zn(x) она удовлетворяет интегрально- му тождеству f У а(1 V* +С2пФ + .) Zj дх,. дх,- > J + j* а (х) г„Ф dx = \п j' глФ d(S (6.2.6) s для любой функции Ф е= IF2'1 ($) и принадлежит (g). Разлагая решение u(t, х) задачи (6.2.1) —(6.2.3) в ряд Фурье по системе {z„(x)}, получим u(t,x) = V un(t)zn(x), un(t) — \ u\t, x)zn(x)dx. (6.2.7) n'=l j? Полагая в тождестве (6.2.6) Ф = и(/, х) при фиксирован- ном t и интегрируя полученный результат по t, будем иметь f D (zn, и) dr -- j Zn (х) и (i, х) d2 - ( ип (т) dx. (6.2.8) T1 т,
360 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. V! С другой стороны, полагая в (6.2.5) Ф=г„(х) и учитывая равенство (6.2.8), получим т т‘ «п (Ь) + (0 dt = j agzn (х) do + ^Fn (t) dt J-un (rj (6.2.9) T1 T1 при любых т, и т2, удовлетворяющих условию to Т1 ^1* Здесь Pn(t)^ Г F(t, x)zn(x)dx. Полагая в (6.2.9) Ti=/0, a xt=t, и учитывая, что функция (6.2.8) удовлетворяет условию (6.2.4), получим -т2- + Кпип = Fn(t) + \a (x)g (t, x) z„ (x) dS, un (t9) = <pn, at J S (6.2.10) где <pn = j <p (x) zn (x) dx. Следовательно, zj\ . (* un(t) = ^n +je (x) g (r, x) zn(x) dx + Fn (t) dx. s (6.2.11) Подставляя найденные un(t) в (6.2.7), получаем фор- мальное решение задачи (6.2.1)—(6.2.3). Повторяя рас- суждения, изложенные в [6], можно показать, что оно дей- ствительно удовлетворяет приведенному выше определе- нию обобщенного решения. Предположим теперь, что функция g(t, х) в условии (6.2.3) имеет вид g(t, x}=q(x)p(t), где q(x)—заданная функция из a p{t) любая функция из Lt(to, tt), выбором которой можно управлять процессом, описываемым краевой задачей (6.2.1) — (6.2.3), т. е. p(t) будем рассматривать как управляющую
5 6,2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 361 функцию. Множество всевозможных допустимых управ- лений может быть подчинено некоторым дополнительным условиям, например, каждое допустимое управление должно удовлетворять неравенству |р| почти всюду на отрезке [fe, /J, или должно выполняться условие А» На выбранном классе допустимых управлений опре- делим функционал I [р] — J [и (tu х) — и0 (х)]2 dx 4- р j р1 (t) dt, р=const > О, (6.2.12) в котором и0(х)—произвольная заданная функция из L2, a u(t, х) — решение задачи (6.2.1) —(6.2.3) при Р=Р(О- Рассматриваемая здесь задача оптимального управ- ления состоит в следующем. Найти допустимое управление p=p0(t, р) и соответ- ствующее ему решение u°(t, х) задачи (6.2.1)—(6.2.3), на которых функционал (6.2.12) принимает наименьшее возможное значение. Управление p<,(t, р) и решение u°(t, х) в дальнейшем будем называть оптимальными. Так как функционал (6.2.12) является строго выпук- лым, то легко показать, что сформулированная задача управления не может иметь более одного решения. Су- ществование хотя бы одного оптимального управления следует из работы [7]. Поэтому, следуя общему стилю, принятому в этой мо- нографии, ограничимся нахождением оптимального уп- равления, соответствующего ему решения краевой зада- чи (6.2.1) — (6.2.3) и вычислением минимума функцио- нала (6.2.12). Для решения этой задачи сначала выведем необходи- мые и достаточные условия оптимальности, используя метод, изложенный в предыдущем параграфе.
362 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Каждому допустимому управлению p(t) и соответст- вующему ему решению u(t, х) задачи (6.2.1) — (6.2.3) будем сопоставлять функцию v(t, х), определяемую сле- дующими соотношениями: 01 (6.2.13) v (tL, х) = —2 [и (tL, х) — и0 (х)], х е (6.2.14) Pv(t, х) =0, ХЕ$, t0^ /<7Ъ (6.2.15) где u0(x) —функция, входящая в функционал (6.2.12), а операторы L и Р — те же, что и в краевой задаче (6.2.1) — (6.2.3). Если в этих соотношениях вместо време- ни t взять новую независимую переменную т, положив т=Л—t, то получим краевую задачу того же типа, что и (6.2.1) — (6.2.3), но с однородным граничным условием. Эта задача имеет единственное обобщенное решение v(t, х)е^2Л(<2), которое можно однозначно определить условием (6.2.14) и интегральным тождеством [10], dtp дх! суф dQ — ^а(х)цф4ст = О, (6.2.16) где ф(£, х) —произвольная функция из ^“'‘(Q), a Q, и от — те же множества, что и в (6.2.4). Тем самым каждое допустимое управление однозначно определяет функцию о(£, х). Теорема 2.1. Для того чтобы допустимое управление p0(t, р) в краевой задаче (6.2.1) — (6.2.3) было оптималь- ным, т. е. минимизировало функционал (6.2.12), необхо- димо и достаточно, чтобы функция h=pr(t)— рр2, (6.2.17) где г(0 — ^q(x)v(t, x)a(x)dx s
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 363 (v(t, х)—решение задачи (6.2.13) — (6.2.15), соответст- вующее управлению pa(t, 0)), удовлетворяла бы условию h (v (t, х) р0 (t, 0)) (=) sup h (о (f, х), р). р&р Здесь символ ( = ) означает равенство, справедливое почти всюду на отрезке [0, Л], а верхняя грань берется по всем значениям р, допустимым условиями рассматривае- мой задачи. Доказательство. Возьмем произвольное допу- стимое управление p(t) и подсчитаем приращение, кото- рое получает функционал (6.2.12), когда p(t) полу- чает некоторое (допустимое условиями задачи) прира- щение Др. Пусть u(t, х) и v(t, х)—решения задач (6.2.1)— (6.2.3) и (6.2.13) — (6.2.15) соответственно, когда р=р(0. Приращение Ды(0 х), соответствующее приращению Др, обозначим через Ди. Тогда Ди будет удовлетворять инте- гральному тождеству J Дм (0, х) Ф(11г x)dx — S? Ли^- — 4 ан dt д &и дф_______ дх> dxf- скиф dxdt — tl [ J [Ди — q (x) Др (0] a (x) Ф dS dt. (6.2.18) t,s Полагая в (6.2.16) ф = Ди, rl = t», Xi=ti и учитывая тож- дество (6.2.18), в котором возьмем Ф=о(0 х), будем иметь tt С Ди (0, х) v (tlt х) dx = J г (0 Др (0 dt, & t. где г (0 = j* а (х) q (х) у (0 х) dS. s
364 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Поскольку v(/, х) удовлетворяет условию (6.2.14), то от- сюда находим, что 2^ С [и (4, х) — Х(х)1 (*1, x)dx+ [r(t) кр (t) dt =0. № г & з г* С другой стороны, приращение минимизируемого функционала (6.2.12) можно представить в виде Д/ = J {2 [и(4, х) — и9 (х)] Ди (tL,'x) + t, + [Ди (<i, х)]2} dx 4- р J [2р + Др] kpdt. t. Из двух последних равенств получаем формулу прира- щения функционала (6.2.12) *1 Д/ = — J [h (v (t, х), р + Др) — (t, х), р (/))] dt + ^0 + f [Ди&.х)]2^, (6.2.19) где h — функция, фигурирующая в условиях теоремы 2.1, a v(t, х) —решение задачи (6.2.13)—(6.2.15), соответст- вующее управлению р(0- Теперь предположим, что h как функция переменной р достигает своего наибольшего значения при p=p»{t, ₽)• Тогда х), р0(/, р)+Др)— h(ya(t, х), р0(/, ₽))<0 (6.2.20) для любого допустимого Др. Здесь, очевидно, о°(/, х) — решение задачи (6.2.13) — (6.2.15), соответствующее уп- равлению pt(t, р). Из формул (6.2.19) и (6.2.20) следует, что Д/ЬШ Р)]=/[ро(/, р)+Др]-I[p,(t, Р)]>0, т. в. функционал (6.2.12) достигает своего наименьшего
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 365 значения при управлении p=p0(t, р), удовлетворяющем условию (6.2.20). Тем самым достаточность условий тео- ремы доказана. Для доказательства необходимости допустим, что на оптимальном управлении p<>(t, р) условие (6.2.7) не вы- полняется. Тогда существует допустимое управление Ptft) такое, что h(v9(t, х), p^-h^it, х), pQ(t, Р))>0 на множестве Д из отрезка [/0, М таком, что mesA=a, где а — некоторое положительное число. В этом нера- венстве v°(t, х) —решение задачи (6.2.13) — (6.2.15), со- ответствующее управлению p0(t, Р). Отсюда следует существование положительного чис- ла д и последовательности множеств {Дп} из {/0, Л} та- ких, что a) mes Д„=<%„-*() при п->-оо, б) х), p^y—h^^t, х), pt(t, р))>д>0 при ^<=An. Тогда по формуле I [Pi (011 lPo (!, ₽)] = ~ f {h (о» (t, х), pt (0) - - h (t>° (t, x), p0 (t, P))J dt + J [A*u (4, x)]« dx < < f [Д;«(4,х)]24г, (6.2.21) & где (pi(0 при/еА„, lpo (t, P) при t ё= Д„, а Д„ и — приращение решения краевой задачи (6.2.1) — (6.2.3), которое получает u(t, х) при переходе от управ- ления р0(/, р) к р? (/). Следовательно, Дп« является
366 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI решением краевой задачи — Lu =0, dt u(to,x)—O, x^'S, Pu-=q (х) [pt (t) — р0 (t, Р)], х 6= S, и согласно формулам (6.2.7) и (6.2.11) получаем пред- ставление функции А*ав виде ряда Дп« (t, х) = § gmzm (х) f [?• (t) - p0 (x, (6.2.22) m=i t0 где gm — o (S) q (S) Zm (S) dS, s сходящегося в метрике Lt(Q). Поскольку функции z„(x) ортонормированы в то согласно формуле (6.2.22) находим, что J [Д„и (4, х)]2 dx = & = % I'MlP? И - Р. (г, Р)1 лУ < 171=1 \ Дп J < 5J г- Ip? (t) - Ро (*, ₽)]’ dx 5? т=1 (6.2.23) где (ajt bj) — интервалы, образующие множество Д„. При этом 4^01<Ь1<а2<^2< •.. ^4- Непосредственными вычислениями находим, что e 1 —e ’ ^2kne (bl—al)^.c(bi^ai)(G.2.24) для любого интервала (ait b}) и любого n. Здесь с — оп- ределенная положительная постоянная.
§ 6.2J УПРАВЛЕНИЕ ПО ГРАНИЦЕ 367 Из (6.2.23) и (6.2.24) получаем [fa^xtfdx^Md 5^, m~i п где М = с Vrai sup | pl (г) — p0 (т, p) |2. TEP..G] Поэтому согласно формуле (6.2.21) будем иметь Ряд, стоящий в правой части полученного неравенства, сходится (это будет доказано в следующем пункте на- стоящего параграфа). Следовательно, при достаточно малом а» выражение, стоящее в квадратных скобках по- лученного неравенства, будет положительным и поэтому будет выполняться неравенство /1Р?(О] - IM. ₽)] <0, что противоречит предположению об оптимальности pa(t, р). Тем самым теорема полностью доказана. 2. Построение оптимального управления. Будем те- перь предполагать, что в сформулированной задаче опти- мального управления множество допустимых управлений состоит из всевозможных функций p(f)t=L2[to, ^], т. е., что ^p2(0df<oo. Докажем, что при этих условиях справедлива следую- щая Теорема 2.2. Оптимальное управление po(t, р) являет- ся решением интегрального уравнения рр (0 = f (/) - J К (t, г) р (г) dr, (6.2.25)
368 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI где f (0 = i gn^\ K(t, t) = 2 Л=1 п—1 П = Un — <рпе — I Fn (т) е dx, К gn - f a (x)q(x)zn(x)dx, и„ = f и0 (х) zn (х) dx, s & фп = f ф (х)zn (X)dx, Fn (t) = С F (t, x) zn (x) dx. (6.2.26) Это уравнение однозначно разрешимо в L2(^o, Л). Доказательство. Так как функция ft, фигури- рующая в условиях теоремы 2.1, достигает своего мак- симального значения при p=pB^t, р), то непосредственно из определения ft получаем Ро (И) = U(х)q(х)(t, х) dS, (6.2.27) где и°(/, х) —решение задачи (6.2.13) — (6.2.15), соответ- ствующее управлению pB(t, р). Это решение можно пред- ставить в виде °0 (t *) = 2 Vn Zn v" <0 = J ° (*. x) Zn (x) dx. n=i Коэффициенты Фурье vn(t) из условий задачи (6.2.13) — (6.2.15) получаются в следующем виде: vn (0 = — 2en{t'ti} j‘ [и (^, х) — и0(х)] zn (х) dx. & Отсюда, учитывая формулы (6.2.7) и (6.2.11), будем иметь tP(/,x) = ^22 [фпеМ,-/,>-^ + rt=l + f \gnP9 + Fn] en(x-^ dr] Zn (x) en(,~tlY К c II
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 369 Подставляя найденное выражение функции о* (t, х) в со- отношение (6.2.27), получаем, что р0(^, Р) удовлетворяет уравнению (6.2.25). Покажем теперь, что это уравнение имеет единствен- ное в L2(fo, ti) решение. В [10] на стр. 190—192 показано, что если однород- ная задача Lz=—%z(x), хе?; Pz(x)=0, xeS, имеет лишь тривиальное решение при %=0, то неоднород- ная краевая задача Lz=0, Pz=a(x)q(x) (6.2.28) однозначно разрешима в ТГ2Д(#) при a(x)q(x)e£r(S), r>2(n—1)п-1. Поскольку по условию задачи (6.2.1) — (6.2.3) функция a(x)q(x) ограничена и измерима, то за- дача (6.2.28) имеет единственное решение z(x) &WI'1 (&). Воспользуемся этим фактом, чтобы доказать неравен- ства ОО , ]/*(0(«<оо. h t* to Пусть Km — m-я частичная сумма ряда К (см. (6.2.26)). Тогда г ^0 т+р гг2 ГТ2 ч А I т*р £Г2 \ 2 V g”gP_______— 1 V — ] , (6.2.29) (\i+Ms 2 I Jha a,fc=m+i ' а \а=т+1 а / ибо Ха + %ц^2У%вА.₽ ДЛЯ любых %а>:0 И Выражение, стоящее в правой части неравенства (6.2.29), стремится к нулю при т->оо. В самом деле, обобщенное решение г(х) задачи (6.2.28) удовлетворяет интегральному тождеству D(z, т|) = fa(x)9(x)T](x)dS (6.2.30)
370 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI для любой функции т) (x)elFj (^j, где через D обозна- чено то же выражение, что и в формуле (6.2.6). Полагая в (6.2.30) t)=z*(x), будем иметь D(z,zk)=gh, (6.2.31) где gK — та же постоянная, которая входит в определение ядра K(t, т). С другой стороны, согласно определению z*(x), из (6.2.6) имеем D (Zk (х), Ф) - А.*Фй, Ф* = j Ф (х) zk (х) dx (6.2.32) для любой функции Фе IF* (^). Полагая в (6.2.32) Ф=г(х) и учитывая (6.2.31), будем иметь gk^k’-k, = Jz(x)z*(x)Jx. (6.2.33) Теперь воспользуемся неравенством ОО у, Х*Ф:<Р(Ф,Ф), k=l (6.2.34) которое справедливо для любой функции ФеТС^ (^). Оно легко получается из соотношений D(ZA(X), Zn(x)) = N N ~ D Ф — У Фт?т (x), Ф ' У Фщ^т (x) 0, m=i справедливых для любых натуральных k, п и N. Здесь 6ft„ — символ Кронекера. Полагая в (6.2.34) Ф=г(х) и учитывая (6.2.33), бу- дем иметь оо g2 У J2. < D (г, г) < оо. (6.2.35) т—1 w Отсюда следует, что выражение, стоящее в правой части неравенства (6.2.29), стремится к нулю при т->оо,
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 371 следовательно, t^K2(t,x)drdt<oo. Аналогично можно доказать, что функция f, входящая в уравнение (6.2.25), также принадлежит L2. Непосредственно из определения ядра К следует, что для любой функции p(t) ^L2(t0, tt) Mi /(i 00 i’k) V Jx)p(t)p(x)dx'dt = Mp(Z)^ gle " /ф \/o zi==l J т. e. ядро К. положительно. Поскольку по условию зада- чи параметр 0 больше нуля, то отсюда следует единст- венность решения уравнения (6.2.25). Теорема 2.2 полностью доказана. Чтобы построить оптимальное управление pa(t, 0), запишем уравнение (6.2.25) в виде ₽р(0 = К0 gnCnen(t4,) П=1 0 /—л в. Cn=gn\>p(y)e dx, ^0 (6.2.36) XT z? W-^l) Умножая обе части полученного равенства на gme , т=1, 2, и интегрируя полученный результат, полу- чим систему линейных неоднородных алгебраических уравнений относительно постоянных ст, m=l, 2, ... 1 00 Ст Н—о" 5 КтпСп ~ hi “ 1, 2, ..., (6.2.37) Р Л=-1 Лтп — ~---г— ~ (I — С ), Ьт—~Т V ЛтлОл, А„ ~г р (6.2.38) On — tin ~~^(pne • I Fn (t) в at.
372 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Поскольку 2 Ь*п<оо, П=1 У К*тп<°<> и, кроме того, КтпУтУп О т,п=1 для любой последовательности {уя}, удовлетворяющей условию 00 S Уп<оо9 Я=»1 то система (6.2.37) имеет единственное решение с(р) = = {МР)} такое, что сп (Р) 00 • П=1 Это решение определяет (согласно соотношениям (6.2.36)) оптимальное управление в следующей форме: Ро Р) = т 2 S-n - ст (₽)] Л ('Л (6.2.39) Соответствующее этому управлению решение u°(t, х) за- дачи (6.2.1)—(6.2.3) определяется по формулам (6.2.7) и (6.2.11), где в качестве g(t, х) нужно брать функцию <7(х)Ро(*, ₽). Поэтому согласно формуле (6.2.39) будем иметь “° (4. х) = 2 km (Р) 4- Vm] zm (х), (6.2.40) т—1 где vm=(pme dt9 *0
§6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 373 и, следовательно, минимальное значение функционала (6.2.12) можно представить в виде / [ро ₽)] = 3[dm -Ст <₽>J • <6-2-4 о m=i Этой формуле можно придать другой вид. Для этого введем функцию 6 (х) = 2 йщ^/п (х). т=1 Тогда из (6.2.41) получим /1Ро (t, 0)] = J й (х) [«о (*) — ч° (4> х)] dx, ибо *Vm. Так как ЙО ^1) I* у-, • » tn — Um ф/п^ — J h то отсюда следует, что I [Po(*> 0)1 = j — [и0(х) — и°(^, x)] dx, (6.2.4Г) S’ где v(t, x) —решение задачи (6.2.1)—(6.2.3) при p—0. 3. Приближенное решение задачи. В предыдущем пункте было показано, что задача построения оптималь- ного управления и соответствующего ему значения функ- ционала I[pa(t, 0)] в конечном счете сводится к решению бесконечной системы линейных алгебраических уравне- ний (6.2.37) и вычислению p0(t, 0) и /[р0(/, 0)] по форму- лам (6.2.39) и (6.2.41). Поскольку эту систему точно ре- шить практически невозможно, то здесь рассмотрим один из способов приближенного решения задачи. Вместо уравнения (6.2.25), определяющего оптималь- ное управление, будем решать вспомогательное урав- нение 0Р (0 = frn (0 - J Кт (t, Т) р (г) dx, (6.2.42) 4
374 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI в котором fm (0 = 2 Кт (Л Г) = 2 gle4 л=1 k= 1 Его единственным решением является функция Ят (t, Р) = У Sk [6л - Сл (P)J (6.2.43) р s=i где постоянные с* (0) однозначно определяются из систе- мы уравнений рсл + 2 = Я, ЬТ =2 ^д», k = 1............т. Л=1 Л'-=1 (6.2.44) Функцию (6.2.43) будем считать m-м приближением оптимального управления. Для вычисления m-го прибли- жения значения функционала (6.2.12) на управлении (6.2.43) ограничимся конечным числом слагаемых в ря- дах, определяющих функции u°(f, х) и v(t, х). Тогда вместо (6.2.40) будем иметь ит х) = 2 [с™ (р) + v„] гп (х), (6.2.45) П=1 а fm(4, х) = 2 v^„(x). n=i В качестве т-го приближения минимального значения функционала (6.2.12) будем брать выражение 1т \Дт} = J [Um (tb X) - Uq (X)]2 dx + 0 J 0) dt. & h
УПРАВЛЕНИЕ ПО ГРАНИЦЕ 375 § 6.2] Тогда, в соответствии с формулами (6.2.43) и (6.2.45), получим /т 1Чт] = [вл (вл ’ £л ) (Un)2] + В Цд,» или, что то же самое, 1т [Чт] = [ [Uo (х) ~Vm &, *)] [Uo (х) -и” (tu X)] dx. '(6.2.46) Для получения оценок допускаемых погрешностей как в пространстве управлений, так и в пространстве функ- ционала, уравнения (6.2.25) и (6.2.42) запишем в опера- торной форме РРо--f KpQ> КтЧгП' Отсюда имеем ₽p0=fm —KmPo+tm, где — — — (К — Km) po и, следовательно, ₽ (Po—Чт) =^m—Km (р0~Чт) • (6.2.47) Поскольку оператор Кт положителен, то отсюда нахо- дим, что Р II Ро Чт ||д2 ~ ('ф/л, Ро ’ Чт) ' (Кт [р0 • Чт] > Ро Чт) II IIII Ро ’ Чт IV Следовательно, 1|Ро-фп||£,< у!Ш1- (6.2.48) Оценим теперь ||*фт||. Очевидно,,что -МН-И-^Ц||Ро1|. (6.2.49) Величину Upoll можно оценить тем же способом, что и ПРо—<7т||, ибо оператор К положителен. В итоге будем иметь ШКу ш. (6.2.50)
376 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI а из неравенств (6.2.48) — (6.2.50) получим |Ро -м< I(if-AnI + {и II л) • (6.2.51) Отсюда следует, что ||р0 — ?т||-»-0 при т-*-оо. Более того, из формулы (6.2.51) можно получить оценку скорости сходимости qm к р0. В самом деле, тем же способом, как и при получении неравенства (6.2.29), находим, что (6-2.52) Аналогично можно показать, что 2 2 яЦ 2 < J^=m+1 n,ft=m+i \n=m+i / „ 00 а* S_ sn 5» 2 & Ъ, n=m+i n /„0\2 I \Цп) + фг^ е i T-(K-^r + h-<p»IP + ^H-W(6.2.53) 2 _ '-±.. К Здесь и» (*) — функция, входящая в определение функ- ционала (6.2.12), ф(х) взята из условия (6.2.2), а и*т (*)» Fro(Z, х) и фт(х) т-е частичные суммы в разложени- ях иа(х}, F и ф в ряды Фурье по собственным функ- циям zn(x). Из (6.2.53), в частности, следует, что 0° -2 «fill's ^(1«о11а + |ф1Г + сИП2. п=1
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 377 и в силу (6.2.35) будем иметь f (IM + 11ф112 + c\Ff?D(z, z), (6.2.54) 2j где z — решение краевой задачи (6.2.28). Таким образом, из (6.2.51), (6.2.53) и (6.2.54) получаем || •< г/з" / 00 г* Х7* 3 Ж {1|«-4.1ЖФ-TmlMF-WH № Um+1 Ч + -^[|«оГ + »ф||2 + Ц Л2]2 Щг, г)}. (6.2.55) ₽/2 Эта формула дает асимптотическую оценку величины Про—<М при достаточно больших т. Далее, из формул (6.2.41') и (6.2.24) находим, что |/[Ро]-Л<7т]| = {[«О W]— ит х)] [У (4, х) — — Пт (4> *)] — 1° х) — и0 (*)] l«° ttl, х) — Um(tu x)]}dx | < < (tlt х)Н Vmjt^x) || + II И° (4. X) - Um (tL, х) ||). Отсюда согласно определению функций и° и ит, v и vm, окончательно получаем I <[Ро1 —1 fam] I < с {|| q>i— <Pm II 4-] + ЕЛ W - Л Х)|| + coi||Po ~qm ||}. Здесь с и с0 — положительные постоянные. Эта формула дает асимптотическую оценку величины /[р0]—/[<?,»] при достаточно больших т. При решении конкретных задач предлагаемым методом требуется вычислить максималь- но точные оценки величин ||р0—<7»»11 и /[р0]—/[<7т] при малых т (т=1, 2, 3, 4). Для этих целей полученные формулы непригодны, так как при таких т они дают слишком грубые оценки. На приводимом ниже примере показан способ уточнения необходимых оценок при ма- лых т и устанавливается, что приближения qm доста- точно быстро сходятся к точному решению задачи.
378 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. V1 В заключение отметим два важных, на наш взгляд, обстоятельства. 1. В работе [6] предложен метод конечномерной ап- проксимации подобного типа задач, позволяющий сво- дить задачу оптимального управления для уравнения теплопроводности к аналогичной задаче для бесконечной системы обыкновенных уравнений, а затем путем «усе- чения» этой системы искать приближения оптимального управления и устанавливать сходимость этих приближе- ний к точному решению задачи. Изложенная здесь мето- дика построения приближений дает те же приближения оптимального управления. Это показано в [5]. Вместе с тем она дает более простую процедуру построения при- ближений на каждом шаге аппроксимации и, что особен- но важно, позволяет оценивать допускаемые погрешности. 2. Приближенное решение уравнения (6.2.25), опреде- ляющего оптимальное управление р0(/, ₽), мы находим с помощью уравнения (6.2.42). С позиций вариационных методов замена уравнения (6.2.25) уравнением (6.2.42) может рассматриваться как применение метода Ритца для отыскания приближений pa(t, р). Это легко показать, если вместо уравнения (6.2.25) выписать соответствующий ему функционал энергии или, что то же самое, вместо системы (6.2.37) выписать ее функционал энергии F(c) = (рс-|-/<с, с)— 2(с, Ь) в пространстве последовательностей /2- Приближенное решение этой системы с помощью си- стемы (6.2.44) с точки зрения метода Ритца означает, что m-е приближение точки минимума функционала F(c) ищется в виде гп ' ' -1-' Ст = 2 П—1 где еп= {0, ..., 0, 1,0,...} — координатная система, а вектор b заменяется вектором Ьт. Оператор р£+/< яв- ляется положительно определенным, ибо р>0, а опера- тор К — положительный. Легко также проверяется, что координатная система {еп} является сильно минимальной в энергетическом пространстве и, следовательно, предло-
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 379 женный процесс аппроксимации является устойчивым относительно погрешностей в промежуточных вычисле- ниях (см. [11] стр. 58). Таким образом, анализ способа аппроксимации с по- зиций вариационных методов позволяет установить по- лезный с точки зрения численного счета факт об устойчи- вости метода аппроксимации. 4. Пример [5]. Применим теперь полученные резуль- таты к конкретному примеру, чтобы посмотреть на чис- ловом примере скорость сходимости приближений и по- лучить возможно более точные оценки погрешности. Будем рассматривать управляемый процесс, описы- ваемый функцией u(t, х), которая внутри области (2={0<^<10, Os^x^l} удовлетворяет уравнению а на границе Q — условиям «(О, х)=0, (6.2.57) dK(^0) - =0, =0,5 IP (О — «(t !)]• (6.2.58) Допустимыми управлениями считаем функции р (t), удов- летворяющие условию 10 У^(0Л<’оо. о Задача оптимального управления состоит в том, чтобы найти функцию p=p„(t, р) и соответствующее ей реше- ние u°(t, х) краевой задачи (6.2.56) — (6.2.58), на которых функционал I = j [м(10, х) -l]2dx+ pW о о принимает наименьшее возможное значение. Таким образом, если эту задачу формулировать в тер- минах задачи (6.2.1) — (6.2.3), то следует положить <?={0^х^1, 0<^10}; 3 состоит из двух точек х=0, \р: (0 dt (6.2.59)
380 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI х=1; F(t, х)в.О, ф(х)аиО, и0(х) = 1, а(х)=0,5, , . (1 при X =1, g<X) = А А (0 при х =0. Соответствующая задаче (6.2.56) — (6.2.58) однород- ная краевая задача Х"(х) 4-1’Х'[(х)=0, 0<х< 1,Х' (0) =0, X' (1)4-0,5Х(1)=0 (6.2.60) имеет собственные значения n=0, 1, 2, ..., опреде- ляемые как положительные корни уравнения Itg 1=0,5. Отметим, что в этом примере берется параметр № вместо 1 в общем случае (сравните (6.2.6) и (6.2.60)). В итоге вместо собственных значений в общем случае теперь будут фигурировать In- Кроме того, здесь удобнее нуме- ровать собственные значения начиная с нулевого, ибо имеют место неравенства пл<Кп<.(п+Ч2)п. Ортонормированная система собственных функций зада- чи (6.2.60) имеет вид Хп(х) = , п-0, 1, ..., й)л где со* = f cos* lnx dx = J 2(l»+o,25) Так как в рассматриваемом примере и0(х) = 1, то, по- лагая оо оо cos X X Uq (^0 = 1 == 2 Un cos ип ~ л=о п=о п
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 381 находим, что ЬЖ+О-?5) Поэтому, в соответствии с формулами (6.2.26), находим, что дд = Wn®n- Далее, из конкретного вида функций а(х) и g(x) в рас- сматриваемом случае находим, что (см. (6.2.26)) 00 X2 (/-10) f(0 = а2 “’cos^ •е п . 00 cos2 ** (/+т-20) K(f,T) = a22 ~~z~ е п—о ап Записывая теперь уравнение (6.2.25) (для рассматривае- мого случая) в виде (6.2.36), приходим к бесконечной си- стеме уравнений (см. (6.2.37)) 2 °° Ст Н—~ 2 КтпСп ~ Ьт, т =0, 1, 2, . . . , Р £о где „ zzs, cos Аот *хтп — ------------------------------ -(М +%*)-ю (1— е п т : Ът = Оптимальное управление po(t, 0), в соответствии с фор- мулой (6.2.39), определится по формуле « r<xfl сое А, х2(/-ю) Ро М) = -г 2 — - ст (0)] е т . (6.2.61)
382 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (ГЛ. VI Соответствующее ему значение решения задачи (6.2.56) — (6.2.58) при /=10 определяем, в соответствии с форму- лой (6.2.40), и»(10, х)> J ст (0) -С<” V , (6.2.62) т=о т а минимальное значение функционала I определяем по формуле (см. 6.2.41)) 1 М= 3 3 = т—о т—о — KWУ“о(х)ы°(1°» x)dx = 1—j«°(10, x)dx. о о В качестве m-го приближения pe(t, р) будем брать функцию т cosln ft т „ (/-ю) —-£(₽)]*” ап Г П=0 где постоянные с” (₽) определяются из системы урав- нений „2 т £ + = & «=0, 1, ₽ "о в которой 2 т р k=t> т-е приближение функции (6.2.62) определим по фор- муле 4(Ю, х) = 2 MP)cos— .
§ 6.2] УПРАВЛЕНИЕ ПО ГРАНИЦЕ 383 В качестве m-го приближения минимума функционала / берем Im [fyn] — 1 J Мщ (10, х) dx. о Непосредственные вычисления по этим формулам, вы- полненные в работе [5], дали следующие результаты: ?„(/, Р) =0,3505 ехр [Х?(/ -10)], ?1 (t, р) = 0,3501 exp [А,,(/ —10)] 4-0,0280exp [X?(t —10)], 7-Д/, Р) —0,35 ехр [^(Г-Ю)] +0,0279 ехр 10)] + + 0,0077 ехр [М(*~ Ю)], q3(t, р) = 0,3501 ехр10)]+0,02795ехр 10)] h + 0,0077 ехр [Х2(/ -Ю)] +0,0035 ехр [Х^ (/ -10)], /0 [701 =0,8254, Л (711 =0,8232, !М =0,8231, /317з1 =0,8231. Таким образом, как по управлению, так и по функ- ционалу третье приближение практически не отличается от второго. В той же работе указан уточненный способ оценки приближений, в соответствии с которым получе- но, что |/ [Ро] —/о Ю I < 0,0113, |/ [Ро] — /117111< 0,0035, |Ира] -/2[72ц< 0,00195, 11 IPol -/317з1 К 0,00135. Этот результат показывает, что для рассмотренного примера способ аппроксимации является достаточно эф- фективным, а оценки погрешности являются довольно точными.
384 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI § 6.3. Обобщение задачи. Связь с задачей об управлении с минимальной энергией В этом параграфе мы продолжим рассмотрение задач оптимального управления процессом, который описывает- ся краевой задачей (6.2.1) — (6.2.3) в предположении, что g(t, x)=q(x)p(t). Сначала будет рассмотрена задача с критерием опти- мальности, несколько более общим, чем в предыдущем параграфе. Для такой задачи построение оптимального управления сводится к решению интегрального уравне- ния типа Фредгольма второго рода с регулярным ядром. Показывается, что это уравнение однозначно разрешимо, и искомое решение может быть найдено алгебраическими методами: путем решения бесконечной системы алгебраи- ческих уравнений. Вторая задача, рассмотренная в настоящем парагра- фе, состоит в отыскании управления с минимальной энер- гией, т. е. управления p(t), переводящего систему из од- ного заданного состояния в другое, для которого функ- ционал ]р2(0<Я принимает наименьшее возможное значение. Показано, что в том случае, когда эта задача разрешима, ее прибли- женные решения могут быть найдены на основе решения задачи, рассмотренной в предыдущем параграфе. Важ- ная особенность этой задачи состоит в том, что исполь- зуемые обычно способы ее приближенного решения с помощью конечномерной L-проблемы моментов оказыва- ются неэффективными. Объясняется это тем, что такая процедура неустойчива относительно погрешностей в про- межуточных вычислениях, на что указывалось в гл. III. С помощью метода, основанного на использовании реше- ния задачи из предыдущего параграфа, получается про- цедура, лишенная этого недостатка. Детальное исследование этой задачи для одномерного случая проведено в [13]. Здесь мы ограничимся изложе- нием наиболее важных результатов, когда процесс опи-
5 6.3] ОБОБЩЕНИЕ ЗАДАЧИ 385 сывается краевой задачей для общего уравнения парабо- лического типа. 1. Постановка задачи. Интегральное уравнение отно- сительно оптимального управления. Будем рассматри- вать управляемый процесс, который описывается краевой задачей - — Lu — F(t, х), . cl и (t0,x) = y(x), Ри — а (х) q (х) р (0, хеЭ, хе хеа, 4<*<4, (6.3.1) 4 < * 4» при выполнении тех же условий, которые накладывались на заданные функции и допустимые управления в зада- че, рассмотренной в предыдущем параграфе. Задача оптимального управления состоит в том, что- бы найти допустимое управление pt(t, 0) и соответствую- щую ему функцию и°(1, х), подчиненную соотношениям (6.3.1), на которых функционал / [/>]’= f (4. х) — и0 (х)]а dx 4- 9 1 f 1 + 0 j | u2(0x)dxd/ + 0 Jp2(0d/ f. 9 принимает наименьшее значение. Здесь u0(*) —заданная функция из L2($?). Точно так же, как доказывалась теорема 2.1, можно доказать следующую теорему. Теорема 3.1. Для того чтобы управление ро(Л ₽) в краевой задаче (6.3.1) минимизировало функционал /, необходимо и достаточно, чтобы функция . h = рг (0 -|- 0Р2, где г (0 = С а (х) q (х)'у (t, х) da, удовлетворяла условию максимума: h (и0 (0 х), р0 (0 ₽)) (=) sup h (о0 (t, х), р). р 13 А. И. Егоров
1 386 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. V1 Здесь о°(£, х) —решение краевой задачи ^ + Lv=2№(t,x); ' . । о (4, х) = —2 [и® (4, х) —[и0 (*)]1 (0-3-2) Pv (t, х) =0, хе о, t0 tt, а ы“(Л, х)—решение краевой задачи (6.3.1), соответ- । ствующее оптимальному управлению р=р0(/, р). Если предполагать, что на область значений допусти- мых управлений не накладывается никаких ограничений, 1 то можно доказать следующее утверждение. Теорема 3.2. Оптимальное управление p0(t, Р) явля- ется единственным в L2(A>, Q решением интегрального уравнения рр (0 = ф (0 — М (t, г) р (т) dx, (6.3.3) где 1 ♦ (0 = f (0 + ₽ 3 (у- sh Ъп (t 4) - п=*1 п ( th I К (t, х) — р V — еп{Х ^shX,,^ — 4) при т< t, г М = "J1 " ' к (I, Г) - Р 2 sh Кп (г - 4) при т > t, f(t) и K(t, х)—функции, определяющие интегральное уравнение (6.2.25) и определяемые по формулам (6.2.26). ' Доказательство. Согласно теореме 3.1 оптималь- ное управление в рассматриваемом случае удовлетворяет соотношению Ро(!) = —f а (х) q (х) о® (/, х) dx. (6.3.4) J а Решение о°(/, х) краевой задачи (6.3.2) представим в j
§ 6.3] ОБОБЩЕНИЕ ЗАДАЧИ 387 виде v’ (t, х) = 2 v« (0 гп (к), vn= J v (t, х) zn (х) dx. (6.3.5) П-1 3? Тогда будем иметь ... оп (0 = —J [и0 (0, х) — и0 (х)] zn (х) dx — -гр^фЛ^т, ^0 где ип (0 — коэффициенты Фурье функции u°(t, х), опре- деляемые по формуле (см. (6.2.11)) и°п (0 = <pe/n(Z°’0 + у Ка (х) g (т,'х) zn (х) dx + Fn (t)ldr, t, U J в которой g(t, x)=q(x)p(t). Поэтому из (6.3.4) и (6.3.5) тем же способом, который применялся в предыду- щем параграфе при выводе уравнения (6.2.25), получаем /1 tt т Рр(0 = ф(0— x)p{x)dx— pt у <p(t,x,s)p(s)dsdx, to t to (6.3.6) n \ 2 (^4"S"~2T) где введено обозначение <p(r, t,s) = gn^ • Двой- n—i ной интеграл в (6.3.6) можно преобразовать следующим образом: h t У У<р(0 х, s)p(s)dsdr = i ~ У г» s)p(s)d.xds — у j <p(f, т, s)p(s)dxds = t ti ti ti = у p(s) у ф(/, x, s)dxd$ у p(s) у <p(t, x, s)dxds. t> t is 13*
388 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (ГЛ. VI Вычисляя внутренние интегралы в правой части получен- ного равенства, находим, что уравнение (6.3.6) можно привести к виду (6.3.3). При этом непосредственными вычислениями можно показать, что JV(Odf<;oo, *0 а следовательно, управление р0(/, р) (если оно суще- ствует) принадлежит L2(£>, М при любом положитель- ном р. Докажем теперь, что уравнение (6.3.3) имеет единст- венное решение. Для этого, как известно, достаточно по- казать, что ядро М положительно, т. е. ? М (t, т) р (t)'p(x) dxdt>0 tot. для любой функции p(f)eL2(f0, Л) - В предыдущем пара- графе была доказана положительность ядра К. Значит, достаточно доказать, что ядро M(t, т)—K(t, т) также яв- ляется положительным. Согласно определению ядра М будем иметь N J ] [М (t, г) - Л (t, т)] р (/) р (t) dx dt = t р (x)eKn(x~tl}dxdt + + J р (0 р (т) sh кп (X — 4) 4 — i J 00 2 = “2PS ^~[p(t)shKn(t-t1)\p(x)eKn^dxdt. n=1 n f, i.
ОБОБЩЕНИЕ ЗАДАЧИ 389 § 6.3] Вводя обозначение z(0 = j/n<T’,‘>p(T)dt, находим, что = (>2 g^eAn(/^(t)dt>0 П=1 /ц для любой функции р (t) eL2. Отсюда следует, что ядро М положительно и, следо- вательно, уравнение (6.3.3) имеет единственное в Ьг (t9, tf) решение. Теорема полностью доказана. Приближенное решение уравнения (6.3.3) будем ис- кать тем же методом, который применялся в предыдущем параграфе при решении уравнения (6.2.25). С этой целью рассмотрим уравнение t ₽Р(0=Фт(0— j Mm(t, x)p(i)dx, (6.3.7) ^0 в котором фт и Мт — т-е частичные суммы рядов, опреде- ляющих функции ф(/) и M(t, т). Очевидно, что это урав- нение при каждом натуральном т имеет единственное решение qm(t, 0). При этом тем же способом, как и в пре- дыдущем параграфе, можно показать, что Пр»(Л ₽)— qm(t, 0)IUS-*O при т-^оо. Функции qm(t, 0) можно построить следующим-образом. Положим = 3 Упеп , . (6.3.8)
890 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ (ГЛ. Vi где уп и гп—неопределенные постоянные. Подставляя эту функцию в уравнение (6.3.7) и приравнивая коэффи- циенты при одинаковых экспонентах, получим следую- щую систему уравнений: 5] —---------==1, п = ± 1, ±2, ...» ± т, (6.3.9) т n=-m лу=о р 1 ~l т (А>*А) . о ~---------I Yn = gktyifi + Ч J т & 3 Ул 4+^ = ф*. k =1, 2....т, (6.3.10) где величины 6„ определяются по формуле So Р г, ... ,, п^и„—(рпе — \Fn(t)e dt, a u9n и <p„ являются коэффициентами Фурье функции u0(x) и ф(х) соответственно. Уравнения (6.3.9) при каж- дом п однозначно определяют г™ и при этом г.п =—гп- Таким образом, задача сводится к решению, системы уравнений (6.3.10). Подробного анализа дальнейшего решения этой задачи приводить не буде^. Отметим лишь, что ее частный случай детально рассмотрен в рабо- те [14]. 2. Управление с минимальной энергией. Формальное решение. В этом пункте мы рассмотрим задачу перевода управляемого объекта, описываемого соотношениями (6.3.1), из состояния м(4,х)=<р(х) (6.3.11) в состояние «(4, х) =и0(х), (6.3.12)
ОБОБЩЕНИЕ ЗАДАЧИ 391 $ 6.3] причем так, чтобы функционал S[p]=Jp2(0^ ^0 принимал наименьшее возможное значение. Здесь <р(х) и и0(х) —заданные функции из Lt(8), a t0 и 0— фикси- рованные моменты времени. Эта задача рассматривалась нами в гл. III, и приведенный там анализ был основан на использовании аппарата вариационных методов иссле- дования операторных уравнений первого рода. Здесь бу- дем исходить из других предпосылок, а именно, исполь- зовать аппарат штрафных функций, который часто при- меняется при решении различных задач оптимизации с ограничениями. Переходя к решению задачи, отметим, что функцио- нал S,[p] является выпуклым и поэтому задача не может иметь более одного решения. Кроме того, ограничение (6.3.12) определяет функцию штрафа вида ф (р) = 4 С [и (4, х) — и0 (х)р dx, Р const > О, Р О. и, следовательно, приближенное решение сформулиро- ванной задачи можно искать путем решения следующей вспомогательной задачи. Найти управление р0(/, р) из Lt(tt, 0) такое, чтобы оно вместе с соответствующим ему решением u°(t, х, р) задачи (6.3.1) минимизировало функционал t, s₽ IP] = Т [“ &> х)— “о W1® dx + С р* (0 dt. Р •’ j & t. При этом, если задача управления с минимальной энер- гией имеет решение ро(0, то lim||po(0 P)-p(0||£i =0. А—а Поскольку функционалы 5ц[р] и (6.2.12) связаны ра- венством Р«₽[р] = /[р],
392 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. -VI то эта вспомогательная задача имеет то же решение, что и задача, рассмотренная в предыдущем параграфе. Это решение определяется формулой (6.2.39), где по- стоянные ст определяются из системы уравнений (6.2.37). Произведя замену у„=б„—сп, получим, что оптимальное управление будет определяться формулой = 8^пеп(Ы1}, (6.3.13) Г П=1 где постоянные уп однозначно определяются из системы уравнений Y„ + ^nkyk = f>n, n=l,2, .... (6.3.14) в которой v ___ SnSk z j _ "*~4+V dn = Un — qne —I Pn(y)e dx. При этом для значения соответствующего решения и°(/, х, р) при t=ti получим выражение и° х, Р) = 2 [и°п - Y„] z„ (х), (6.3.15) Л=1 а минимальное значение функционала 5ц[р] вычислится по формуле $₽[р0(*.Р)] = 42 д^л. (6.3.16) р "i Таким образом, для определения всех искомых вели- чин во вспомогательной задаче мы имеем необходимые формулы и остается выяснить, в какой мере они оказы- ваются полезными для решения исходной задачи об управлении с минимальной энергией. Здесь прежде всего
ОБОБЩЕНИЕ ЗАДАЧИ 393 § 6.31 следует отметить, что аппарат штрафных функций не дает возможности делать выводы о существовании реше- ния исходной задачи на основании существования реше- ния «оштрафованной» задачи при каждом 0. В рассмат- риваемой нами ситуации этот факт означает следующее. Из того, что вспомогательная задача однозначно разре- шима при каждом р>0, еще не следует разрешимость задачи об управлении с минимальной энергией. Более того, в предыдущем параграфе было показано, что вспо- могательная задача однозначно разрешима при любых функциях <р(х) и м0(х) из L2(JF). В то же время из резуль- татов гл. III следует, что при этих условиях задача об управлении с минимальной энергией не всегда разреши- ма (см. теорему 3.2). Имея в виду этот факт, в дальнейшем будем предпо- лагать, что управление р0(О с минимальной энергией существует. Тогда pe'(0]=limpeO). (6.3.17) 3-ю Поэтому здесь ограничимся формальным построением функции Пусть {уп(Р)}— решение системы (6.3.14) и сущест- вуют пределы limу„(Р) = Yn(0), п = 1, 2, ... Р-*о Тогда из системы (6.3.14) получаем в пределе при р->0 2Kn*Y>(0) = 0. (6.3.18) Л=0 Оператор К, определяемый бесконечной матрицей, очевидно, симметричен. Докажем, что он положителен на элементах пространства Z2, т. е. на последовательностях х= {gt, ..., |n, ... }, удовлетворяющих условию 00 2Й<оо. £=1
394 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI В самом деле, из того, что следует 00 'Пл = ^1 Kndbk) k^l и поэтому оо оо оо 3 3 т. е. оператор К отображает элементы пространства 4 в элементы этого же пространства. Обозначая через (х, у) скалярное произведение элементов хе/2 и находим, что (X, /Сх) — 2 Knk&fck — n,k^i ст ^n^nSk^k /1 Jfe=1 n 1 * __ f (CT n Л/ \ n — j I 3 I dt 0. t0 \n=i / Отсюда, в частности, следует, что равенство (х, Кх)=0 может быть лишь в том случае, когда х=0, т. е. £<=(), i= 1,2,... Поэтому из (6.3.18) получаем, что уя=0, 6=1, 2,..., а функцию (6.3.13) можно записать в виде Ро(ь р) = 3 Sn--------------е . (6.3.19) Р
§ 6.3] ОБОБЩЕНИЕ ЗАДАЧИ 395 Отсюда и из (6.3.17) получаем Ро(0 = 7 = , (6.3.20) ® ₽=о а из (6.3.15) имеем lira и° (tu х, 0) = V Unzn (х) = и0 (х), (6.3.21) Si ибо, по определению, иап являются коэффициентами Фурье функции и0(х), входящей в условие (6.3.12). Здесь следует отметить, что соотношения (6.3.20) и (6.3.21) получены формальным переходом к пределу при 0->О, ибо не доказывалось существование производных функций у„(0) в точке 0=0. Кроме того, даже если такие производные существуют, нет никаких оснований утвер- ждать, что управление (6.3.20) принадлежит £2(/0, tt). Если же ро(О не принадлежит L2, то это управление не будет управлением с минимальной энергией, ибо в этом случае для него функционал S [р] теряет смысл. Дальнейший анализ показывает, что такой случай при решении задачи вполне возможен. Но вернемся снова к управлению (6.3.20). Коэффи- циенты фп в нем определены через уп(0). Если же исхо- дить из системы (6.3.14), то можно указать (опять же формально!) другой способ определения <в„. С этой целью подставим в систему (6.3.14) ее решение ?,»=?»>(₽), п=1, 2, ... Получим тождества относительно парамет- ра 0. Умножая каждое из них на 0, будем иметь ₽Yn(0) + 2 /СйУИР) = n = 1, 2, ... Ь=1 Дифференцируя каждое из них по 0, получим v _Ц R dNn (₽) _1_ £ ИГ dY*(P) А „10 Уп (0) + р —---1- У Ап* —— = On, п = 1, 2, ... 40 40
396 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Полагая здесь 0=0 и учитывая, что уп(0)=0, а dyn (0) ---— = ©„, находим, что ©„ удовлетворяют системе 2 = 6„, n = 1, 2, ... (6.3.22) А=1 Таким образом, можно говорить, что управление (6.3.20) определяется с помощью коэффициентов ©я, ко- торые находятся из системы (6.3.22). Непосредственны- ми вычислениями легко показать, что к тому же самому результату можно прийти, если решать задачу с помощью проблемы моментов (см. гл. III). Это дает, видимо, до- статочные основания для утверждения о законности диф- ференцирования функций уп=у„(0). Проанализируем теперь функцию р0 (0, определяемую из (6.3.20). Она будет решением задачи об управлении с минимальной энергией, если принадлежит Lt(t0, tt), т. е. если *7* А* •+• At, n,fe=l п » п,/г=1 Записывая систему (6.3.22) в виде Ка=6, (6.3.23) находим, что po(t)Ц) тогда и только тогда, когда решение системы (6.3.22) принадлежит энергетическому пространству оператора К. Таким образом, для существо- вания управления с минимальной энергией необходимой достаточно, чтобы уравнение (6.3.23) было разрешимо в энергетическом пространстве Нк оператора К. В свою очередь уравнение (6.3.23) разрешимо в Нк тогда и толь- ко тогда, когда существует постоянная N такая, что (см. § 3. 2) |(6, ©)|^У[©] . . (6.3.24) для всех ©е/2. Здесь [и] — норма © в метрике Нк.
ОБОБЩЕНИЕ ЗАДАЧИ 397 S в.з] Как показывает анализ простейших примеров, приве- денный в § 3.2 и 3. 3, это условие не всегда выполняется и, следовательно, не всегда задача об управлении с ми- нимальной энергией имеет решение. 3. Приближенное решение задачи об управлении с минимальной энергией. Бесконечную систему уравнений (6.3.22) точно решить невозможно. Поэтому приходится решать ее приближенно. Обычно ее «усекают», т. е. ищет- ся решение ©Г,...,©™ системы 2 KntPk = в„, п = 1.......т, (6.3.25) £=1 и с его помощью строится m-е приближение управления с минимальной энергией (6.3.26) Zl»l Такой способ таит в себе две опасности. Во-первых, он приводит к иллюзии, что управление с минимальной энергией всегда существует, ибо система (6.3.25) разрешима при любом т и притом однозначно. Во-вторых, такой способ неустойчив относительно по- грешностей в промежуточных вычислениях, ибо он, по существу, является методом Ритца приближенного реше- ния операторного уравнения с положительным операто- ром, а выбранная координатная система не является сильно минимальной (см. [11], стр. 19—20). Чтобы избавиться от этих опасностей, прежде всего нужно проверить выполнимость условия (6.3.24) для ре- шаемого конкретного примера. К сожалению, конкрет- ных рекомендаций по такой проверке у нас нет. Если же каким-либо способом установлено существо- вание управления с минимальной энергией, то использо- вание метода штрафных функций позволяет решать за- дачу методом, устойчивым относительно погрешностей в промежуточных вычислениях. Чтобы в этом убедиться, рассмотрим оба метода более подробно. Задача отыскания решения уравнения (6.3.23) в энергетическом пространстве Нк эквивалентна задаче
398 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI отыскания элемента ©°, на котором функционал F(ф) = [©]2—2 (б, ®) (6.3.27) достигает своего минимального значения. Если в каче- стве координатной системы в Нк взять элементы еп = {0, ..., 0, 1, 0, ...} П-1 и искать ©° приближенно методом Ритца, то в качестве m-го приближения будет браться элемент = J <лТе[ = {©?}, (6.3.28) i—i на котором функционал (6.3.27) принимает наименьшее значение в пространстве Н™, порожденном т координат- ными элементами ..., ет, т. е. элемент (6.3.28) опре- делится как решение системы уравнений dF{ef,) =0, i = 1, 2........tn. (6.3.29) дй>” Имея в виду, что т tn [<»m]2 = 2 Ы№, i,k=i находим, что система (6.3.29) совпадает с системой (6.3.25), т. е. метод «усечения» в приближенном решении уравнения (6.3.25) (или, что то же самое, системы (6.3.22)), по существу, является методом Ритца. Так как оператор К является положительным, то приближения Ритца ф”1 сходятся к точному решению уравнения (6.3.23) в метрике энергетического пространства Нк, т. е. [ф°—©"*]->-0 при т->-оо, где ©° — решение уравнения (6.3.23). Это означает, что 11Ро(О— ‘МОИ-’-О при т-^оо, где ро(О—управление с минимальной энергией, опреде- ляемое формулой (6.3.20), a qm(t) находится из (6.3.26).
§ 6.3] ОБОБЩЕНИЕ ЗАДАЧИ 399 При этом, очевидно, приближенное значение функцио- нала S[p0] вычисляется по формуле i,*=i Рассмотрим теперь вопрос об устойчивости прибли- жений относительно погрешностей в промежуточных вы- числениях. Как известно (см. [11], стр. 58), для того чтобы про- цесс Ритца был устойчив относительно погрешностей в промежуточных вычислениях, необходимо и достаточно, чтобы выбранный базис был сильно минимальным в соот- ветствующем энергетическом пространстве, т. е. lim Р?>0, т-*ео где рГ _ min -. т 3 КН ft=l Здесь минимум берется по всевозможным векторам {©?, отличным от нулевого. В рассматриваемом нами случае т [<от]2= 3 КаМ i.k=l и в соответствии с принципом Рэлея, рГ является наи- меньшим собственным значением /n-мерной матрицы {Ки^. В соответствии с теоремой Виета, сумма всех собствен- ных значений р”,..., р“ может быть вычислена по фор- муле т т S р" = 3 *" 1=1 (=1
400 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Из определения чисел Кпт (см. (6.3.14)) легко получим, что Выражение, стоящее справа в этом неравенстве, равно- мерно по т ограничено (см. 6.2.35)). Поэтому сумма собственных значений 2 р7 (б.з.зо) i=i также ограничена при m-М). Но так как матрица {Kn)k} положительна, то все ее собственные значения положи- тельны и выражение (6.3.30) представляет собой сумму положительных величин. Отсюда следует, что наимень- шее из чисел р<* стремится к нулю при т->оо. Это при- водит к тому, что в рассматриваемой задаче процесс Ритца нахождения приближений управления с мини- мальной энергией является неустойчивым относительно погрешностей в промежуточных вычислениях. Практически это означает, что приближения </„,(£), построенные с малыми погрешностями в промежуточных вычислениях, могут не сходиться к управлению с мини- мальной энергией и даже образовывать расходящуюся в L2 последовательность {qm(t)}. Ясно, что такие прибли- жения не представляют никакой ценности при решении задачи. Рассмотрим теперь второй способ приближенного решения, основанный на использовании штрафных функций. Как было показано выше, в качестве приближений управления с минимальной энергией берутся управления (6.3.13) или, что то же самое, Ро(*. Р) = Вп[^-сп]е^'\ (6.3.31) Р
СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 401 5 6.4] где постоянные с„ определяются из системы уравнений 1 00 сп + 4- V = bn, л = 1, 2, , (6.3.32) Ьп = 2 fc=»l С позиций вариационных методов задача отыскания решения системы (6.3.32) эквивалентна задаче отыска- ния элемента c={clt с2,...} из /2, на котором функционал Ф(с) = (с, Лрс)—2(6, с) принимает наименьшее возможное значение. Здесь Kf~E + ^-K, р где Е — оператор тождественного преобразования. Опе- ратор /<р определенно положителен в Z2, ибо (с, Я₽с) = (с, с) + 4" (<?. №) > (с- с) = I <||*. р Поэтому процедура построения приближений Ритца для системы (6.3.32) устойчива относительно погрешнос- тей в промежуточных вычислениях. Значит, не опасаясь неустойчивости, можно заменять систему (6.3.32) конеч- ной системой уравнений 4 т + 4" S П= 1,2, ...,/и, и таким образом аппроксимировать управление (6.3.31) при любом малом положительном р. Уменьшая затем р, можно все более точно вычислять управление с мини- мальной энергией. Расчеты конкретных примеров по этой методике показали достаточную ее эффективность. § 6.4. Синтез управления с минимальной энергией В этом параграфе мы продолжим изучение задачи об управлении с минимальной энергией на основе аппарата, изложенного в предыдущем параграфе. Основная цель будет состоять в том, чтобы выяснить структуру опти-
402 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI мального управления в зависимости от фазового состоя- ния управляемого объекта и проанализировать способы построения такого управления. В заключение рассмотрим задачу об оптимальном быстродействии при ограничении на энергию управления. 1. Управление с минимальной энергией. Как и в пре- дыдущем параграфе, будем рассматривать управляемый процесс, описываемый краевой задачей = £uj+ F(t, х), ut u(t0, х) =ф(х), Ри (t, х) = а (х) q (х) р (t), х^9, xeS, (6.4.1) при прежних предположениях относительно области 9 и всех функций, определяющих эту краевую задачу. Требуется определить управление ро(О из £»((«, <t) такое, чтобы соответствующее ему решение задачи (6.4.1) в момент времени t=tt удовлетворяло условию u(tt, x)=u0(x), (6.4.2) и при этом функционал S[P1 =]p4i)dt t» принимал наименьшее возможное значение, и0(х)—за- данная функция из L2 (9). При этом управление р0 требуется построить в зави- симости от соответствующего ему решения задачи (6.4.1). Как показано в предыдущем параграфе, эта задача не всегда имеет решение. Поэтому во всех дальней- ших рассуждениях будем исходить из предположения о том, что ее решение существует. Тогда управление с минимальной энергией определяется по формуле (см. (6.3.20)) (6.4.3) п=1
§ 6.4) СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 403 где gn = §q(s)zn(s)ds, а постоянные находятся из бесконечной системы урав- нений 2 = «=1,2,..., (6.4.4) где __ SfiSk /1 ол —• Un —• фи# • j Fn ('tf) 0 dx9 Un = Juo w Zn w dx> 'Pn = J ф Zn dx’ Frt(/)= $ F(t, x)zn(x)dx. Его m-e приближение, определяемое непосредствен- ным применением метода Ритца к системе (6.4.4), имеет вид <М0 = 2 (6.4.5) где <£>п находятся из системы уравнений 2 n = 1, ..., т. (6.4.6) k^l Обозначая определитель но записать этой системы через Dm, мож- 0 6х 6t ... 6т Чт (0 = — ит Кц /С12 ... К1т gmM-td Кт1 ктг...
404 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ 1ГЛ. VI Подставляя в эту формулу явное выражение коэффи- циентов 8т, будем иметь Ят (0 = С Г «о to ЗГ V, h, х) - <р (х) GT (t, t0, tu x) - ti — x)GT(f, x,tlt x)dr ^0 dx, (6.4.7) где GT(t^x) = ~ um 0 21 (x) ... Zm(x) Ku ... Klm = 1 XI A tn I \ = -z- 2 m n,k=l (6.4.8) GT(t,t0,tux)^± V m n,k=l Здесь AT* — алгебраическое дополнение соответствую- щего элемента определителя Dm. Соответствующее этому управлению значение функ- ционала S можно вычислить по формуле 5 [М = - 77 ит о «1 ... 8т 61 Кп ... К1т Кто • • • т '/ni '/шп 4 т = 7Г 2 <6’4-9) Из формулы (6.4.8) следует, что GJ1 можно предста- вить в виде G?(^^x) = S&<WeM'G\ П=1 где функции а>п (х) определяются из системы 2 #лт®л (х) = 2п(х), п = 1, . . . , т. П=1
§ 6.4] СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 405 Аналогично GT(M0,4.x) = 2 n=i где о» (х) находятся из системы 2 (х) = гп (х) eKn(i‘~il\ n = 1, ...» т. fe==l Выражение <7т(0 = J G? (/, 4. х) и0 (х) dx при каждом фиксированном т можно рассматривать как отображение некоторого множества М изАх(0) в£»(/0>^) с помощью линейного ограниченного оператора. Здесь множество М состоит из тех функций и0 (х), для которых задача об управлении с минимальной энергией имеет ре- шение при ф(х) =F(t, х) sO. Очевидно, что <Д(О||-*о при т-*0, где pj (0—управление с минимальной энергией, когда ф(х) ssF(Z, х)==0. Это означает, что существует функция <?! (t, tu х) такая, что lim f GJ* (f, 4. *) “о (х) dx = f Gx (t, tu x) u0 (x) dx m-m J g для всех Uo (x) eAf. При этом, очевидно, ОО 1 (4 л \ G1 {t, 4. X) = 2 (х) е n< h\ (6.4.10) П=1 где функции о„(х) определяются из системы уравнений 2 ^лт®т(х) = ZB(x), л=1, 2, ... (6.4.11) т=1
406 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Аналогичными рассуждениями определяем функцию G2 (t, t9, 4. X) = 5 gnvn (х) (6.4.12) n==l в которой vn(x) находятся из системы уравнений 2 tfnA (х)- гп (х)ел^\ п = 1, 2, ... (6.4.13) /п—1 Поэтому управление с минимальной энергией можно за- писать в виде (0 = С 00 0> ’ Ф 00 @2 (f* ^о» *0 * — J F (т, х) 02 (/, т, 4, х) dx t9 dx. (6.4.14) Отсюда легко можно получить решение задачи синтеза оптимального управления, т. е. построить управление с минимальной энергией в зависимости от текущего состоя- ния управляемого объекта. Необходимые для этой цели построения выполним, следуя методике, изложенной в [15]. Выпишем управление (6.4.14) в виде РоО> ^о» х)) — Wq 00 Gi (/, /1, х) Поскольку в задаче синтеза предполагается, что функ- ции и0(х) и F(t, х) и момент времени заданы, то это управление запишем в виде Ро0> ^0» w0o> ~ = — J G2(f, f0, x)u(/0, x)dx + Ф0, tQi tit x), (6.4.15)
S 6.4] СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 407 где dx. Формально синтезированное управление получаем, пере- ходя в (6.4.15) к пределу при Осуществляя эту операцию и переобозначая t0 на t, будем иметь Ро t, 4» “ x)) = — J G2 (t, t, tlt x) и (t, x) dx 4- ф (t, x). & (6.4.16) Для того чтобы доказать, что это управление действи- тельно является управлением с минимальной энергией, необходимо установить, что р0еА2(/0) Л), где u(t, х) удов- летворяет краевой задаче ^=Lu+F(t,x), xf=&, ^</<4, Рц (t, х) = а (х) q (х) ф (t, 4) — [ G2 (t, t, 4» x) и (t, x) dx , L £ XE S. В заключение отметим, что изложенная процедура решения задачи синтеза управления с минимальной энер- гией с практической точки зрения не представляет осо- бого интереса, ибо связана с решением систем (6.4.11) и (6.4.13), неустойчивых относительно погрешностей в про- межуточных вычислениях. Поэтому для достаточно надежного способа построе- ния приближений управления (6.4.16) нужно изложенным выше способом построить синтез оптимального управле- ния во вспомогательной задаче, т. е. в задаче минимиза- ции функционала, / [р] = j [и (ti, х) — и0 (х)]2 dx + р j р2 (0 dt. & <»
408 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI 2. Оптимальное быстродействие с ограничением на энергию управления. Результаты решения задачи об управлении с минимальной энергией, изложенные в гл. III и дополненные в настоящем параграфе, позволяют дать некоторый анализ следующей задачи об оптималь- ном быстродействии. Среди всех управлений р(/)е£2(^, 4), удовлетворяю- щих условию t, S[p] = v = const>0, (6.4.17) ^0 требуется найти управление p9(t) такое, чтобы соответ- ствующее ему решение u°(t, х) задачи (6.4.1) удовлетво- ряло условию u(tlt х)=и0(х) (6.4.18) при наименьшем (/1>/0), где u^fx) — заданная функ- ция из L2(&). Прежде всего отметим, что эта задача разрешима не для всякой функции и0(х) из L2(S), что непосредственно следует из результатов исследования задачи об управле- нии с минимальной энергией. При дальнейшем анализе будем предполагать, что за- дача имеет решение, и основная цель будет заключаться в том, чтобы проанализировать способы ее приближен- ного решения. Выше было показано, что если при некотором ^>^0 задача об управлении с минимальной энергией разреши- ма, то оптимальное управление однозначно определяется по формуле (см. (6.4.3)) I со I X. tt f \ Ро’(М1)> 3 п . (6.4.19) где величины (о„(^) должны быть определены из системы уравнений (см. (6.4.4)) 2 (tj = МО» n = 1, 2, ... (6.4.20)
§ 6.41 СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 409 При этом необходимое и достаточное условие раз- решимости системы (6.4.18) состоит в том, что (см. (6.3.24)) n=l \rt,fe=l / для любой последовательности {а„} из 12, т. е. ОО 2 а*< °°- Л=1 Соответствующее управлению (6.4.19) значение функ- ционала S (р] вычисляется по формуле S (Ро (t. ^1)1 = 2 tt>” /1»й==1 Из этой формулы следует, что в конечном счете S(p0(f, Л)] является функцией переменной и, следова- тельно, можно рассматривать функцию £(Q=S[p0(f, /,)]. (6.4.21) Предположим, что она определена при всех т. е. задача об управлении с минимальной энергией име- ет решение при любом tlt превосходящем /0- При таком предположении о функции E(tt) справед- лива следующая Теорема 4.1. Функция £(Q непрерывна при всех tOto* Доказательство. Пусть Л зафиксировано; дадим ему некоторое малое приращение Д/. Вместе с задачей об управлении с минимальной энергией рассмотрим задачу минимизации функционала Sp[p]=4-Z[p], р где h I[P]= — u0(x)]2dx + p fp2(Odt & to
410 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Как было показано выше, она разрешима при любом р>0. При этом оптимальное управление p0(t, 4, р) мож- но определить по формуле (см. (6.3.13)) pm h, ?)=4з г /1=1 где определяются из системы уравнений Уп + 4-S КпкУь = М4), n = 1, .. . (6.4.22) Решая систему (6.4.22), можно вычислить величины <М4. 0) = 4 Р) Р и определить функцию Я(*1.₽)ЧА>(М1,Р)||а= f М4.₽И»*ММ)- При этом (см. (6.3.17)) lira |£(4,р)-£ (4)| = 0 (6.4.23) ₽-»0 равномерно по 4 из любого конечного отрезка [4°, 4‘]. Так как матрица в системе (6.4.22) определенно положи- тельна, то ее решение {уп(4, Р)} устойчиво относительно малых изменений правых частей. Это значит, что по лю- бому 0>О можно указать т] (Р) >0 такое, что из нера- венства Цб (4+ДО -6 (4) 11<2<П (Р) (6.4.24) будет следовать II?(4+Д4 Р) -У (4, р) ||«,<е. (6.4.25) Полагая zj (4) = (4, Р), г’ (4) = (4 + Д4 0).
§ 6.4] СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 411 находим, что Е(0+Д0 Р)-Е(4, ₽) = = ({z'-z1}, Kzl) + (z1, K{z‘-z*}) - = (z‘-za, K{z‘—z2}). Здесь мы воспользовались симметричностью матрицы К. Поэтому |Е (4 + ДО Р)-Е (4, Р) | < к -г’МЖ*1 + z2)||z, = =iiw+[Yn(4+А/> ₽)-?«&’Р)гУ< < у К (И1 + г2) III у (4 + Д 4 р) - у (4, Р) |G. Полагая М(4, ДО Р)= уИ^ + г2)!!, находим, что |Е(4+Д4Р)-£(4, Р)|< <М(4, ДО Р) Ж4+Д4 ₽)-у(0, р) IU (6.4.26) (число М может неограниченно возрастать при Р->0). Теперь с помощью неравенств (6.4.24) —(6.4.26) мож- но доказать непрерывность функции Е. В самом деле, пусть е — произвольно малое положи- тельное фиксированное число. Покажем, что существует Д/‘>0 такое, что |Е(4+Д0— Е(Ъ) I <е при |Д/| <Д/‘, Очевидно, что согласно (6.4.26) справедливо неравенство |Е (4 + ДО-Е (4) I < IЕ (4 + ДО -£ (4 + ДО Р)| + 4-1Е (4 + ДО ₽) -Е (4, Р) I +1Е (4, р) -Е (4) 1 < < IЕ (4 + ДО -Е (4 + ДО ₽) | + |Е (4, Р) -Е (4)| + + М (4, ДО Р) ||У (0 + ДО 0) - у (4, Р) V (6.4.27)
412 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI Выберем теперь р настолько малым, чтобы | Е & + At р) -Е (4 + АО | < v (6.4.28) и для всех А/ из некоторого отрезка —Af ^Af^Af’ и обо- значим это значение р через р°. Теперь выберем Af на- столько малым, чтобы |т(/1 + д/,П-уй,Н1,.<5^Ьй (6'4'2Э) а/И р ) для всех Af, удовлетворяющих условию |Af|^AP. Здесь М(4,р°)= max Mft.Atp0). Поэтому из неравенства (6.4.27) — (6.4.29) получаем |Е(Л+А/)-5(М|<8 при | Д/| что и доказывает непрерывность функции Е(М. Отметим, что доказанная теорема не противоречит установленному ранее факту о неустойчивости решения задачи об управлении с минимальной энергией. Дело в том, что неустойчивость учитывает все возможные малые отклонения в вычислении правых частей системы (6.4.20) и элементов ее матрицы К.- При анализе непрерывности функции E(tt) учитывались лишь специально выбранные изменения этих величин. Установив этот факт непрерывности функции Е(^), можно использовать процедуру, предложенную Н. Н. Кра- совским в [15] (см. стр. 234 и далее в [15]),"чтобы иссле- довать задачу об оптимальном быстродействии. Суть ее можно изложить следующим образом. В плоскости пе- ременных Е и tt строим график функции Е=Е(Л). Зна- чение этой функции в каждый конкретный момент времени Л>70 представляет собой энергию оптимального управления pe(t, ti), т. е. величину S [р0 Ц» 4)] ~ I Ро (^» ^1) Ut«o.G)* На эту же плоскость наносим линию E=v, где v—посто-
§ 6.4) СИНТЕЗ УПРАВЛЕНИЯ С МИНИМАЛЬНОЙ ЭНЕРГИЕЙ 413 янная, фигурирующая в условии (6.2.17). Точки пересече- ния этих кривых занумеруем в порядке возрастания Л: <<!<••• (рис. 27). Тогда ti будет временем оп- тимального быстродействия в рассматриваемой задаче, а p0(f, ti) — оптимальное управление. При этом из способа построения p0(t, t*) следует, что S[Po(<. <)] = v. Таким образом, с практической точки зрения решение задачи, по существу, сводится к выбору разумной вычис- лительной процедуры нахождения величины Л0 и ис- пользованию изложенных выше методов решения за- дачи об управлении с ми- нимальной энергией при В соответствии с полу- ченными здесь результа- тами можно рассмотреть два возможных пути при- ближенного решения за- дачи. 1. Считаем парамет- ром и строим управление (см. (6.3.26)) Л—1 в котором co п определяются из системы уравнений 2 = Ьп, п = 1, 2, ..., т. (6.4.30) Л—1 Энергия этого управления определится по формуле т k Em (У = 3 K^k (О (4) = 2 МГ (4). п,Л=1 которую можно рассматривать как ш-е приближение функции Е(it), ti>tt. Затем на плоскости переменных
414 УПРАВЛЕНИЕ С КВАДРАТИЧНЫМИ КРИТЕРИЯМИ [ГЛ. VI наноеим линии £=£m(f1) aE=v. Самая левая точка пере- сечения этих линий определит абсциссу tm—10, которую и можно брать в качестве т-го приближения времени оп- тимального быстродействия t\m—10. Очевидно, что при точных вычислениях £т(Л) будет справедливо соотно- шение £т(^)->£(/1), когда т-^оо, поскольку при этом £т(<1)->-^(\) в любой момент времени Л. Однако поскольку процесс приближенного решения системы ~ л=1,2, • •., k—i с помощью системы (6-4.30) неустойчив относительно по- грешностей в промежуточных вычислениях, то погреш- ности эти могут существенно повлиять на величину фак- тически вычисленных значений £„,(/<). Это в свою оче- редь может дать ощутимые вычислительные погрешно- сти в tim> Следовательно, с практической точки зрения такой способ приближенного решения задачи является ненадежным, ибо он чувствителен к малым погрешностям в промежуточных вычислениях. 2. Можно предложить способ приближенного реше- ния задачи, основанный на использовании штрафных функций. Сначала вычисляем однопараметрическое семейство функций Bm(M) = llAn(Ui, ₽)112. Затем, последовательно увеличивая т и уменьшая р, строим приближения функции £(ft). Этот способ аппрок- симации £(Q несколько более громоздкий по сравне- нию с предыдущим, но он устойчив относительно погреш- ностей в промежуточных вычислениях и в этом его глав- ное преимущество. После того, как построены приближе- ния £(^i), легко можно построить приближенные значе- ния времени оптимального быстродействия tlm (0) — to-
ГЛАВА VII РАЗНЫЕ ЗАДАЧИ В этой главе анализируются некоторые конкретные задачи управления тепловыми и диффузионными процес- сами на основе математических методов, изложенных в предыдущих главах. Сначала рассматривается вопрос об управлении индукционным нагревом, формулируются не- которые, по нашему мнению интересные, задачи опти- мального управления процессом и анализируются воз- можности аналитических методов их исследования. Индукционный нагрев является довольно сложным процессом для использования математических методов. Тем не менее уже сейчас результаты его исследования позволяют достаточно четко сформулировать различные математические задачи оптимального управления нагре- вом и указать пути их исследования. Здесь мы подробно анализируем одну из них [1]. Точное ее решение, к сожа- лению, получить не удается. Поэтому приходится поль- зоваться окольными путями поиска управления, которое было бы по крайней мере лучше того, что рекомендуется другими авторами и используется в производстве. Под- робный обзор различных задач управления индукцион- ным нагревом можно найти в [2]. Затем рассматривается одна задача управления про- цессом в ядерном реакторе. Для ее решения применяется динамическое программирование в той форме, которая изложена в гл. V. Следует также отметить, что даже бег- лое знакомство с описанием кинетики и регулирования реакторов (см., например, [17,18]), а также их применение в ракетных двигателях [19] позволяет сделать вывод о до- статочно широком круге задач оптимального управления, при исследовании которых непременно нужно учитывать распределенность параметров управляемого объекта. В заключение формулируются и исследуются некото- рые задачи инвариантности для теплообменных аппара- тов [20, 21]. В предыдущих главах нигде не рассматрива-
416 РАЗНЫЕ ЗАДАЧИ [ГЛ. VII лись задачи управления для процессов, протекающих в таких объектах. Вместе с тем легко убедиться в том, что все изложенные выше методы применимы и в этом слу- чае. В частности, можно воспользоваться динамическим программированием или получить условия оптимальности в форме принципа максимума. Однако более или менее подробное изложение этого материала потребовало бы существенного увеличения объема монографии. С другой стороны, для рассмотренных выше объектов можно было бы подробно исследовать задачи инвариантности, подоб- ные тем, которые рассматриваются в этой главе. Именно это обстоятельство послужило решающим мотивом вклю- чения в настоящую монографию вопросов инвариантно- сти для теплообменных аппаратов. § 7.1. Управление индукционным нагревом Прежде чем переходить к математическому описанию индукционного нагрева и задачам, связанным с его уп- равлением, кратко опишем протекающие при таком на- греве процессы. Устройство для индукционного нагрева металлов схематически представляет собой электрическую обмотку, питаемую переменным током. В переменном магнитном поле, создаваемом этой обмоткой, помеща- ется нагреваемое металлическое изделие. Переменный магнитный поток возбуждает в этом изделиц переменную э. д. с. и вихревые токи, которые и нагревают изделие, создавая в нем внутренние тепловые источники. Частота переменного тока определяет глубину расположения те- пловых источников внутри металла, а его напряжение определяет их интенсивность. Таким образом, изменяя ток (его частоту и напряжение) по выбранному закону, можно управлять процессом с целью повышения качества термической обработки изделий и экономии энергетиче- ских затрат. Индукционный нагрев представляет собой довольно сложный процесс взаимодействия электромагнитных и тепловых явлений, трудно поддающийся точному мате- матическому описанию (см., например, [4]). Поэтому при аналитических расчетах обычно используют различные упрощенные математические модели, основанные на раз- личных гипотезах. Кроме того, на практике температура
§ 7.1] УПРАВЛЕНИЕ ИНДУКЦИОННЫМ НАГРЕВОМ 417 нагреваемого изделия изменяется в довольно широких пределах (от 50°С до 1250°С—1300°С), в результате чего его теплофизические характеристики претерпевают су- щественные изменения. Поэтому для описания процесса теплопроводности, строго говоря, нужно учитывать за- висимость коэффициента теплопроводности от темпера- туры, что неизбежно ведет к нелинейному уравнению. Учет всех этих фактов приводит к довольно сложной ма- тематической модели, из которой практически невозмож- но извлечь полезную информацию. Чтобы упростить модель, тепловой процесс в изде- лии обычно разделяют на три этапа: «холодный», проме- жуточный и «горячий». Считается, что на каждом этапе существуют свои свойства внутреннего тепловыделения, свои характеристики теплофизических свойств материала изделия. При этом физические свойства стальных изде- лий на каждом этапе принимаются постоянными [4]. Та- кие предположения позволяют использовать на каждом этапе линейное уравнение теплопроводности с постоян- ными коэффициентами. В частности, если нагреваемое изделие имеет форму сплошного цилиндра с высотой, значительно превосходящей его диаметр, то с достаточ- ной для практики точностью процесс теплопроводности на i-м этапе можно описать уравнением дТ д*Г <4 дТ at ---— dl---------*------== — dt дг2 г дг 0<г<₽, (7.1.1) где at, К{ — температуропроводность и теплопроводность изделия на i-м этапе, u(t, г) —плотность внутренних теп- ловых источников. При этом граничные условия берутся в виде = ht [TR - Т (i, Я)], (7.1.2) or <®^ = 0, (7.1.3) где hi — коэффициент теплообмена, а Тп— температура внешней среды. Как уже отмечалось выше, внутренние источники теп- ла создаются электромагнитным полем индуктора. По- этому, обозначая черезЕиН характеристики поля (элек- 14 А. И. Егоров
418 РАЗНЫЕ ЗАДАЧИ [ГЛ. VII трическую и магнитную напряженность), будем иметь u=u(E, Н). В свою очередь Е и Н зависят от параметров тока, проходящего через катушку индуктора, и определяются с помощью уравнений Максвелла. Таким образом, если параметрами управления брать силу тока и его частоту в индукторе, то управляемый про- цесс будет описываться совокупностью уравнений тепло- проводности и Максвелла, и исследование задач опти- мального управления даже в этом случае остается до- вольно сложным. Однако, используя некоторые факты, ситуацию можно упростить. Дело в том, что во многих случаях распределение плотности внутренних источни- ков можно представить в виде [5] u=p(t)v(r). (7.1.4) Физически p(i) представляет собой величину потока активной энергии, которая может быть выделена в виде тепла, а функция о (г) показывает распределение плот- ности источников по пространственной координате. При этом 239.R.12.(r-R + x^ R , . -------7S------------- ПР“ A— O(r) = . 4/?—jrx О при (7.1.5) Здесь Xt — расстояние от поверхности цилиндра до того слоя металла, где плотность тока равна нулю, и х{— 1,46 Де, Де — глубина проникновения электромагнитного поля в металл, определяемая по формуле [4] Де = 5030 , (7.1.6) где р, — удельное сопротивление металла, ц, — его маг- нитная проницаемость, f — частота тока. Таким образом, соотношение (7.1.5) и (7.1.6) указы- вают явную зависимость распределения плотности источ-
$ 7.1] УПРАВЛЕНИЕ ИНДУКЦИОННЫМ НАГРЕВОМ 410 ников от частоты тока в индукторе, что позволяет исполь- зовать выбранную математическую модель для исследо- вания зависимости тепловых процессов в изделии от частоты тока f. Здесь для нас эта зависимость представ- ляет интерес с точки зрения задач управления, когда в качестве управляющего параметра берется f. Поскольку величина потока p(t) активной энергии не зависит от f, то ее можно рассматривать как другой управляющий параметр. В итоге получаем пару управляющих парамет- ров f и р, с помощью которых можно по желанию изме- нять тепловой процесс в обрабатываемом изделии. 1. Общая характеристика некоторых задач управле- ния. Анализируя различные задачи управления процес- сом нагрева изделия, прежде всего отметим, что, исхо- дя из технических возможностей индуктора, следует предполагать, что f может изменяться в некоторых фик- сированных пределах ^/тах» (7.1.7)* где fmin и fmaI — заданные постоянные. При этом величи- на f не зависит от времени и является числовым пара- метром. По тем же соображениям величина /? должна подчиняться условиям (7.1.8) где Ртах — фиксированная постоянная. Однако величину р можно изменять в процессе нагрева, т. е. р может быть функцией времени: P=P(t)- Это может быть достигнуто путем изменения силы тока в индукторе. Поскольку силу тока в индукторе можно пе- реключать практически мгновенно с одного уровня на другой, то естественно считать, что допустимыми управ- лениями могут быть кусочно-непрерывные функции р= удовлетворяющие условию (7.1.8). Иногда вместо таких допустимых управлений можно брать функции Р=Р(0. подчиненные требованиям « р(0>0 и jp(O<#< v, о 14*
420 РАЗНЫЕ ЗАДАЧИ [ГЛ. VII где т — продолжительность времени нагрева, a v — за- данная постоянная. Первое из этих требований очевидно из физического смысла функции р(0, второе — указыва- ет на то, что полный поток энергии за время т не может превосходить заданной величины, хотя на малых отрез- ках времени он может быть весьма значительным. • Определив таким способом допустимые f и p(t), мож- но сформулировать различные задачи оптимального уп- равления индукционным нагревом. Прежде всего отметим, что при всяком индукцион- ном нагреве конечной целью управления является дости- жение заданного распределения температуры в изделии. 'Следовательно, если речь идет о нагреве цилиндрической заготовки, температура которой в процессе нагрева опи- сывается соотношениями (7.1.1)— (7.1.3), а процесс -оканчивается в момент времени t=x, то должно выпол- няться условие Г(т, г) = Тк(г), где Т„(г) —заданная функ- ция. Начальную температуру заготовки естественно счи- тать заданной и постоянной Т(0, г) =Т0(г) =const. При этом следует иметь в виду, что процесс нагрева из- делия от температуры Го до Тк(г) проходит три этапа — «холодный», промежуточный и «горячий». Границы раз- делов между ними обычно определяются температурой поверхностного слоя изделия. Переход от «холодного» к промежуточному нагреву происходит в тот момент вре- мени Ti, когда температура изделия T(t, г) удовлетворяет условию -*« Т(т„/?)=?., (7.1.9) где Л — заданная постоянная. : Таким образом, в течение времени от 0 до процесс нагрева описывается краевой задачей dt ‘ дг> г дг %! ' ’ 1 ^^=М7>-Т(^)], ^ = 0, <7ЛЛ0) dr dr I Т(О,г) = То. J
$ 7-U УПРАВЛЕНИЕ ИНДУКЦИОННЫМ НАГРЕВОМ 421 В момент времени t=Xi в изделии устанавливается тем- пература Т(т1,г)=Г1(г), Г, (/?)=?,. Затем происходит промежуточный нагрев до некоторого момента т2, когда температура поверхности изделия до- стигает заданной величины Т2, т. е. ; Т(т2, R)=T2. (7.1.11) В течение этого отрезка времени от Tt до т2 процесс опи- сывается краевой задачей дТ д*Т а2 дТ а2 _ -__ “-in—^T=V“,r’’ ЭТ(<’ 8) Т(/,Я)1, аГ('’0) = 0, дг дг (7.1.12) Т{хи r) = Tt(r). При некотором выбранном законе управления в конеч- ный момент времени в изделии устанавливается темпе- ратура Т’(т2,г)=Т2(г), Т2(Я)=Т2. С этого момента /=т2 начинается «горячий» нагрев, ко- торый должен осуществляться таким образом, чтобы в конечный момент времени t=x достигалось желаемое распределение температуры Т(т, г)=Гв(г). (7.1.13) В течение этого отрезка времени процесс описывается краевой задачей ЭТ &Т а3дТ «з .. . 8) - л. -т(«,«)]. 2^2 = 0, дг дг (7.1.14) Т(Ч, г) = Т,(г). Ясно, что на каждом этапе можно осуществить нагрев множеством различных способов. При этом . следует иметь в виду, что моменты времени Tt и т2 не фиксиро-
РАЗНЫЕ ЗАДАЧИ [ГЛ. VII ваны. Они подчиняются соотношениям (7.1.9) и (7.1.11). Кроме того, функции 7\(г) и Т»(г) также не заданы. От них требуется лишь выполнение условий Г1(₽)=7’1, Тг(Я)=Т2, (7.1.15) где Г, и Л — заданные постоянные. Кроме того, из усло- вий обеспечения необходимого качества нагрева на эти функции обычно накладывается довольно расплывчатое требование, чтобы они не слишком уклонялись от линей- ных функций переменной г. При недопустимости резких перепадов температур внутри нагреваемого тела на всех этапах нагрева обычно вводится ограничение на гради- ент температурного поля внутри этого тела 0<f<t. (7.1.16) dr I Тем не менее, остается практически неограниченное чис- ло различных способов, которыми можно добиться же- лаемого распределения температуры в момент окончания процесса нагрева. В связи с этим возникает вопрос о вы- боре оптимального режима по тому или иному крите- рию качества. 2. Формулировка задач оптимального управления. Существенным для большинства процессов индукцион- ного нагрева является требование его интенсификации. Это означает, что нужно нагревать заготовку от началь- ной температуры То до желаемой Тк(г) за кратчайшее время. Тем самым мы имеем первую задачу оптимально- го управления, которая формулируется следующим об- разом. Задан класс допустимых управлений f и р, подчинен- ных условиям (7.1.7) и (7.1.8), причем f — числовой па- раметр управления, а р — функциональный, т. е. р зави- сит, вообще говоря, от времени (p=p((f)), и допустимые функции могут быть кусочно-непрерывными с конечным или счетным числом точек разрыва. Управляемый про- цесс описывается совокупностью краевых задач (7.1.10), (7.1.12), (7.1.14), в которых на функции 7\(г) и Т2(г) на- ложены условия (7.1.15), где Л и Т2— заданные посто- янные. Требуется найти такие f и p(t), чтобы соответствую- щая им функция T(t, г), определяемая краевыми задача-
«7.П УПРАВЛЕНИЕ ИНДУКЦИОННЫМ НАГРЕВОМ 423 ми (7.1.10), (7.1.12), (7.1.14), удовлетворяла условию (7.1.13) при минимальном положительном т. Задача может быть усложнена дополнительными ог- раничениями. Например, можно потребовать, чтобы в процессе нагрева выполнялось условие (7.1.16). Может также требоваться, чтобы функции 7\(г) и Тг(г) удов- летворяли условиям |Т1(г)-ф1(г) |<81, |72(г)-ф2(г)|^82,0^г</?, (7.1.17) где q>t и ф2 — заданные функции, а 81 и 8» — заданные постоянные. Естественным также может быть требование о том, что одновременно должны быть выполнены усло- вия (7.1.16) и (7.1.17). Иногда может оказаться целесо- образным вместо (7.1.17) брать неравенства J IЛ (г) - Фх (г) Iе dr < 81, JIТа (г) - ф2 (г) |“ dr < в2, о о а> 1. (7.1.18) С практической точки зрения точное выполнение усло- вия (7.1.13) далеко не всегда необходимо. Поэтому при формулировке этой задачи оптимального управления условие (7.1.13) можно ослабить, заменив его требова- нием, чтобы в момент окончания процесса выполнялось неравенство R рТ(т, г)-Тк(г)]Мг<8, (7.1.13') где в — заданная постоянная, характеризующая меру ук- лонения Т(т, г) от желаемого распределения температуры Тк(г). Вместо (7.1.13х) может фигурировать условие шах | Т(т, г) — Тк (г) | < е. Все это говорит о том, что общая техническая пробле- ма интенсификации процесса индукционного нагрева в терминах теории оптимального управления приводит к
424 РАЗНЫЕ ЗАДАЧИ (ГЛ. VII различным математическим задачам оптимизации, каж- дая из которых имеет свое решение. Другой тип задач оптимального, управления возни- кает, когда время нагрева изделия фиксировано, т. е. т является заданной постоянной. Такая ситуация склады- вается при непрерывном производстве различных изде- лий, когда нагревательное отделение является составной частью обрабатывающего оборудования и время нагрева определяется темпом работы всего оборудования. В этом случае речь может идти о выборе такого управления на- гревом, при котором за заданное время достигается за- данное распределение температуры в изделии при наи- меньших затратах электрической энергии. Одна из математических формулировок задачи опти- мального управления, примыкающей к этому кругу во- просов, состоит в следующем. Задана частота тока в ин- дукторе, удовлетворяющая условию (7.1.7). Задан так- же класс допустимых управлений p=p(t), каждое из которых в соответствии с определением представляет ве- личину потока активной энергии, которая может быть вы- делена в виде тепла. Этот класс, в частности, может со- стоять из кусочно-непрерывных ограниченных функций или кусочно-непрерывных функций, подчиненных усло- вию (7.1.8). Управляемый процесс описывается совокупностью краевых задач (7.1.10), (7.1.12) и (7.1.14), в которых Т4(г) и Тг{г) не заданы, а подчинены условиям (7.1.15), где Ti и Т2— определенные постоянные. Требуется найти управление р(0 такое, чтобы соот- ветствующая ему функция T(t, г), определяемая соотно- шениями (7.1.10), (7.1.12) и (7.1.14), удовлетворяла ус- ловию (7.1.13), и при этом функционал Q=jp(/)df (7.1.19) О принимал наименьшее возможное значение. При этом из физического смысла p(t) следует, что любое допустимое управление является неотрицательным. Сформулированная задача является одной из наибо- лее простых задач оптимизации, связанных с управлени- ем индукционным нагревом при фиксированной длитель-
$ 7.1] УПРАВЛЕНИЕ ИНДУКЦИОННЫМ НАГРЕВОМ 425 ности процесса. Так же как и в предыдущем случае, ее можно видоизменить потребовав, например, выполнение не точного равенства (7.1.13), а лишь выполнение усло- вия (7.1.13'). Можно также наложить ограничения (7.1.17) или (7.1.18). Все это легко можно обосновать, исходя из фи- зического смысла рассматриваемой задачи. Следует отметить, что оба типа задач оптимального управления нагревом (с фиксированной и нефиксиро- ванной продолжительностью процесса) теоретически могут быть исследованы методом, предложенным В. И. Плотниковым [12]. Таким способом можно получить необходимые условия оптимальности в форме принципа максимума. Однако при этом задача сведется к другой, не менее сложной задаче, точное или приближенное реше- ние которой, как нам кажется, найти будет чрезвычайно трудно. Поэтому представляется естественным искать окольные пути построения управлений, в каком-то смыс- ле близких к оптимальным. Необходимость такого рода поисков, между прочим, диктуется еще и тем, что в на- стоящее время используется, как правило, кусочно-посто- янные управления, независимо от выбора критерия опти- мальности (см. [13—15]); поиск наилучшего управления осуществляется лишь варьированием точек переключе- ния, которых обычно берется всего две (см., например, [15]). Здесь мы используем другой подход к решению одной из сформулированных выше задач [1]. Его суть за- ключается в замене одного минимизируемого функциона- ла другим. В результате получается новая задача опти- мального управления, которую легко решать приближен- но с помощью методов, изложенных в предыдущих главах. Ясно, что, вообще говоря, этот метод не является законным, ибо при его использовании одна задача под- меняется другой, никак не связанной с исходной. Однако в рассмотренном нами случае он оказался полезным. По- лученное управление оказалось по многим параметрам лучше тех, которые предлагались до сих пор. В следую- щем пункте этот метод изложен подробно со всеми необ- ходимыми пояснениями. 3. Управление индукционным нагревом при фиксиро- ванной длительности процесса. Будем рассматривать управляемый процесс, описываемый совокупностью
426 РАЗНЫЕ ЗАДАЧИ (ГЛ. VII краевых задач (7.1.10), (7.1.12) и (7.1.14), в которых функция u(t, г) представима в виде (7.1.4). При этом о (г) имеет вид (7.15), частота тока f является заданной и, следовательно, о (г) —заданная функция. Поток ак- тивной энергии p(t) находится в нашем распоряжении, соответствующим выбором которого будем управлять процессом. Задача состоит в отыскании управления p(t), p(t) ^0, такого, чтобы соответствующее ему решение Т(/, г) кра- евых задач (7.1.10), (7.1.12) и (7.1.14) в фиксированный момент времени т удовлетворяло условию (7.1.13), где Тк(г) —заданная функция, и при этом функционал Q = jp(t)di (7.1.20) в принимал наименьш