/
Автор: Васильев Ф.П.
Теги: вычислительная математика численный анализ математика дифференциальные уравнения оптимизация прикладная математика
ISBN: 5-88688-056-9
Год: 2002
Текст
Ф. П. ВАСИЛЬЕВ
МЕТОДЫ ОПТИМИЗАЦИИ
Москва
Факториал Пресс
2002
УДК 519.6 (075.8)
ББК 22.19
В 19
Васильев Ф. П.
В 19 Методы оптимизации. — М.: Издательство «Факториал Пресс»,
2002. — 824 с.
ISBN 5-88688-056-9.
Книга содержит численные методы решения задач оптимизации. Приводятся
теоретическое обоснование и краткие характеристики этих методов. Рассматриваются задачи
минимизации функций в конечномерных и бесконечномерных пространствах, а также
задачи оптимального управления процессами, описываемыми системами обыкновенных
дифференциальных уравнений и уравнений в частных производных.
Для студентов вузов по специальности «Прикладная математика», и специалистов,
связанных с решением задач оптимизации.
Научное издание
Васильев Фёдор Павлович
МЕТОДЫ ОПТИМИЗАЦИИ
Формат 70х 100/16. Усл. печ. л. 67. Бумага офсетная № 1. Гарнитура литературная. Подписано
к печати 25.12.2001. Тираж 500 экз. Заказ № 5182.
Издательство «Факториал Пресс», 117449, Москва, а/я 331; ЛР ИД № 00316 от 22.10.1999.
e/mail: factorial@mail.compnet.ru; http:/'www.compnet.ru/factorial.
Отпечатано с готовых диапозитивов издательства «Факториал Пресс» в ППП типографии
«Наука» Академиздатцентра «Наука» РАН. 121099, Москва Г-99, Шубинский пер., 6.
Оригинал-макет подготовлен с использованием издательской системы АР-ТеХ.
ISBN 5-88688-056-9
© Факториал Пресс, 2002.
ОГЛАВЛЕНИЕ
Предисловие 6
Часть I. КОНЕЧНОМЕРНЫЕ ЗАДАЧИ МИНИМИЗАЦИИ. ПРИНЦИП
МАКСИМУМА. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 9
Глава 1. Методы минимизации функций одной переменной 9
§ 1. Постановка задачи 9
§ 2. Классический метод 14
§ 3. Метод деления отрезка пополам 16
§ 4. Метод золотого сечения. Симметричные методы 17
§ 5. Об оптимальных методах 20
§ 6. Метод ломаных 24
§ 7. Методы покрытий 28
§ 8. Выпуклые функции одной переменной 32
§ 9. Метод касательных 38
Глава 2. Классическая теория экстремума функций многих
переменных 43
§ 1. Постановка задачи. Теорема Вейерштрасса 43
§ 2. Классический метод решения задач на безусловный экстремум 53
§ 3. Задачи на условный экстремум; Необходимые условия первого порядка . 58
§ 4. Необходимые условия экстремума второго порядка 67
§ 5. Достаточные условия экстремума 83
§ 6. Вспомогательные предложения 86
Глава 3. Элементы линейного программирования 94
§ 1. Постановка задачи 94
§ 2. Геометрическая интерпретация. Угловые точки 100
§ 3. Симплекс-метод. Антициклин 105
§ 4. Поиск начальной угловой точки , 132
§ 5. Условие разрешимости задач линейного программирования. Теоремы
двойственности 137
Глава 4. Элементы выпуклого анализа 148
§ 1. Выпуклые множества 148
§ 2. Выпуклые функции 159
§ 3. Сильно выпуклые функции . , i : . . . 176
§ 4. Проекция точки на множество 182
§ 5. Отделимость выпуклых множеств 188
§ 6. Субградиент. Субдифференциал 197
§ 7. Равномерно выпуклые функции ■„ • i . 206
§ 8. Обоснование правила множителей Лагранжа 211
§ 9. Теорема Куна — Таккера. Двойственная задача 217
Глава 5. Методы минимизации функций многих переменных 234
§ 1. Градиентный метод ... .1 234
§ 2. Метод проекции градиента . 249
§ 3. Метод проекции субградиента 258
§ 4. Метод условного градиента 263
§ 5. Метод возможных направлений . ... 269
4 ОГЛАВЛЕНИЕ
§ 6. Проксимальный метод 278
§ 7. Метод линеаризации 284
§ 8. Квадратичное программирование 288
§ 9. Метод сопряженных направлений 292
§ 10. Метод Ньютона 300
§11. Непрерывные методы с переменной метрикой 308
§ 12. Метод покоординатного спуска 310
§ 13. Метод покрытия в многомерных задачах 315
§ 14. Метод модифицированных функций Лагранжа 317
§ 15. Метод штрафных функций 323
§ 16. Доказательство необходимых условий экстремума первого и второго
порядков с помощью штрафных функций 339
§ 17. Метод барьерных функций 348
§ 18. Метод нагруженных функций 356
§ 19. О методе случайного поиска 368
§ 20. Общие замечания 371
Глава 6. Принцип максимума Понтрягина 376
§ 1. Постановка задачи оптимального управления 376
§ 2. Формулировка принципа максимума. Примеры 387
§ 3. Доказательство принципа максимума 406
§ 4. Принцип максимума для задач оптимального управления с фазовыми
ограничениями 430
§ 5. Связь между принципом максимума и классическим вариационным
исчислением 459
Глава 7. Динамическое программирование 462
§ 1. Схема Беллмана. Проблема синтеза для дискретных систем 462
§ 2. Схема Моисеева • 474
§ 3. Проблема синтеза для систем с непрерывным временем 479
§ 4. Достаточные условия оптимальности 486
Часть II. МИНИМИЗАЦИЯ В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ.
РЕГУЛЯРИЗАЦИЯ. АППРОКСИМАЦИЯ 493
Глава 8. Методы минимизации в функциональных пространствах 493
§ 1. Предварительные сведения. Обозначения . > 494
§ 2. Теорема Вейерштрасса в функциональных пространствах , . 500
§ 3. Дифференцирование. Условия оптимальности 519
§ 4. Методы минимизации 539
§ 5. Градиент в задаче оптимального управления со свободным правым
концом 554
§ 6. Градиент в задаче оптимального управления с дискретным временем . . . 565
§ 7. Оптимальное управление процессом нагрева стержня 571
§ 8. Оптимальное управление колебательными процессами 582
§ 9. Оптимальное управление процессами, описываемыми уравнением Гурса —
Дарбу • • • 591
§ 10. Взаимодвойственные задачи управления и наблюдения 595
§11. Метод моментов 605
Глава 9. Методы решения неустойчивых задач оптимизации 617
§ 1. Постановка задачи. Устойчивые и неустойчивые задачи минимизации . . . 617
§ 2. Методы регуляризации для решения неустойчивых задач первого типа . . 625
§ 3. Стабилизатор. Леммы о регуляризации 632
§ 4. Метод стабилизации :. 639
§ 5. Метод невязки 655
§ 6. Метод квазирешений 658
ОГЛАВЛЕНИЕ 5
§ 7. Методы регуляризации с расширением множества 662
§ 8. Регуляризованный метод проекции градиента 669
§ 9. Регуляризованный метод условного градиента 678
§ 10. Регуляризованный проксимальный метод 685
§11. Регуляризованный метод Ньютона 690
§ 12. Регуляризованный непрерывный метод проекции градиента 697
§ 13. Метод динамической регуляризации 703
Глава 10. Аппроксимация экстремальных задач 710
§ 1. Разностная аппроксимация квадратичной задачи оптимального
управления 710
§ 2. Общие условия аппроксимации 719
§ 3. Разностная аппроксимация для квадратичной задачи с фазовыми
ограничениями 726
§ 4. Регуляризация аппроксимаций экстремальных задач 733
§ 5. Разностная аппроксимация квадратичной задачи с переменной областью i
управления 742
§ 6. Аппроксимация задачи быстродействия 750
§ 7. Разностная аппроксимация задачи об оптимальном нагреве стержня . . . 757
§ 8. Об аппроксимации максиминных задач 775
Список литературы 788
Предметный указатель 816
Список обозначений ' 820
ПРЕДИСЛОВИЕ
Первые задачи геометрического содержания, связанные с отысканием
наименьших и наибольших величин, появились еще в древние времена.
Развитие промышленности в XVII — XVIII веках привело к необходимости
исследования более сложных задач на экстремум и к появлению
вариационного исчисления. Однако лишь в XX веке при огромном размахе
производства и осознании ограниченности ресурсов Земли во весь рост встала
задача оптимального использования энергии, материалов, рабочего
времени, большую актуальность приобрели вопросы наилучшего в том или ином
смысле управления различными процессами физики, техники, экономики и
др. Сюда относятся, например, задача организации производства с целью
получения максимальной прибыли при заданных затратах ресурсов,
задача управления системой гидростанций и водохранилищ с целью получения
максимального количества электроэнергии, задача о космическом перелете
из одной точки пространства в другую наибыстрейшим образом или с
наименьшей затратой энергии, задача о быстрейшем нагреве или остывании
металла до заданного температурного режима, задача о наилучшем
гашении вибраций и многие другие задачи.
Потребности развития самой вычислительной математики также привели
к необходимости исследования таких задач на максимум и минимум, как,
например, задачи наилучшего приближения функций, оптимального выбора
параметров итерационного процесса или узлов интерполирования,
минимизации невязки уравнений и т. д.
На математическом языке такие задачи могут быть сформулированы как
задачи отыскания экстремума (максимума или минимума) некоторой
функции или функционала J(u), выражающего собой качество (цену)
управления и из заданного множества U некоторого пространства. Требование
принадлежности управления и некоторому множеству U выражает собой
ограничения, обычно вытекающие из законов сохранения, ограниченности
наличных ресурсов, возможностей технической реализации управления,
нежелательности каких-либо запрещенных (аварийных) состояний и т. п. Задачи
отыскания экстремума функции J(u) на множестве U принято называть
экстремальными задачами. Заметим, что задача максимизации
функционала J (и) на множестве U эквивалентна задаче минимизации функционала
— J(u) на том же множестве U, поэтому можно ограничиться
рассмотрением задач минимизации.
В настоящее время теория экстремальных задач обогатилась
фундаментальными результатами, появились ее новые разделы, такие как линейное,
выпуклое, стохастическое программирование, оптимальное управление и
др. Потребности практики способствовали бурному развитию методов
приближенного решения экстремальных задач. Появление быстродействующих
электронных вычислительных машин (ЭВМ) сделало возможным
эффективное решение многих важных прикладных экстремальных^задач, которые
ранее из-за своей сложности представлялись недоступными.
В настоящей книге излагаются элементы теории экстремальных задач,
а также основы наиболее часто используемых на практике методов
приближенного решения экстремальных задач, теоретическое обоснование и
краткая характеристика этих методов. Книга написана как учебное пособие
ПРЕДИСЛОВИЕ
7
для студентов факультетов, и отделений прикладной математики
университетов, технических вузов. В основу книги положен курс лекций по
численным методам решения экстремальных задач, который автор в течение
ряда лет читает на факультете вычислительной математик» и кибернетики,
Московского университета.
Заманчиво было бы изложить теорию и методы минимизации сразу в
общем виде на языке функционального анализа, охватив при этом как частный
случай многие методы минимизации функций конечного числа'переменных.
Однако такой способ, изложения, несмотря на свою привлекательность и
удобства для читателя-математика, видимо, все же труден для* первого; зна.-
комства с предметом, не говоря уже о том, что он не может отразить всю
специфику конечномерных задач.
Поэтому автор, стремясь сделать книгу доступной широкому кругу
читателей, впервые знакомящихся с теорией и методами решения
экстремальных задач, разделил ее на две части.
В части 1 излагаются методы минимизации функций конечного числа
переменных (главы 1-5), а также рассматриваются задачи оптимального
управления процессами, описываемыми системами обыкновенных
дифференциальных уравнений (главы 6, 7). Этот материал для своего понимания
требует лишь знания основ математического анализа, линейной алгебры,
теории обыкновенных дифференциальных уравнений в объеме стандартных
курсов технических вузов.
В части II книги рассматриваются задачи оптимизации на множествах
из бесконечномерных функциональных пространств,, и посвящена задачам
оптимального управления процессами, описываемыми как обыкновенными
дифференциальными уравнениями, так и уравнениями с частными
производными (глава 8), методам решения неустойчивых задач оптимизации
(глава 9), проблемами аппроксимации бесконечномерных задач оптимизации
(глава 10). Для понимания содержания части II желательно знание
элементов функционального анализа в объеме программ, обычно изучаемых в
университетах и технических вузах с повышенной математической
подготовкой. Однако следует оговориться, что отсутствие знаний по
функциональному анализу не будет мешать пониманию и усвоению излагаемых в
книге основ методов и приложений к конкретным классам экстремальных
задач, если читатель будет готов принять некоторые приводимые в книге
утверждения не в самой общей их форме.
Настоящую книгу можно считать очередным изданием сразу двух
предыдущих книг автора «Численные методы решения экстремальных.задач» (М.:
Наука, 1980 г.— 1-е издание, 1988 г.— 2-е издание) и «Методы, решения
экстремальных задач» (М.: Наука, 1981 г.), причем часть I ранее излагалась
в первой из названных книг, часть II — во второй книге. В предлагаемом
переиздании указанных книг сохранена прежняя их структура, но
содержание существенно переработано и дополнено. Заново написаны главы 2, 9,
добавлены новые параграфы: §§ 6, 11, 16 в главе 5, § 4 в главе 6, §§ 10,
11 в главе 8, §§ 2, 7, 13 в главе 9, § 7 в главе 10, существенно обновлено
содержание § 5 главы 3, § 13 главы 5, §§ 2, 3 главы 8, улучшено изложение
материала во многих других параграфах, исправлены замеченные ошибки,
неточности, опечатки.
В § 2 главы 2 впервые в учебной литературе изложены новые
необходимые условия экстремума второго порядка, принадлежащие А. В. Арутюнову.
В главе 3 дано простое обоснование антициклина (§ 3), теория
двойственности в линейном программировании изложена, опираясь лишь на симплекс-
метод (§ 5). Приведено элементарное доказательство принципа максимума
8 ПРЕДИСЛОВИЕ
Понтрягина для весьма общей задачи оптимального управления, включая
задачи с фазовыми ограничениями (§ § 3, 4 главы 6^. Часть текста, которая
содержит материал, дополняющий и расширяющий основное содержание
книги, напечатана петитом и при первом чтении может быть опущена.
По рассматриваемым в книге проблемам оптимизации имеется обширная
библиография, насчитывающая много тысяч названий. Список литературы,
приведенный в конце книги, содержит лишь некоторые работы, в основном,
российских математиков, а также переведенные на русский язык книги и
монографии зарубежных авторов, которые были или непосредственно
использованы в книге или близко примыкают к ней, дополняя и расширяя ее
содержание.
Нумерация формул, теорем, лемм, определений, упражнений в каждом
параграфе самостоятельная; ссылки на материалы, расположенные в
пределах данного параграфа, нумеруются одним числом, вне данного параграфа,
но в пределах данной главы — двумя числами, вне данной главы —
тремя числами. Так, например, теорема 3 из § 2 главы 4 в пределах этого
параграфа именуется просто теоремой 3, в других параграфах 4-й главы —
теоремой.2.3, в других главах — теоремой 4.2.3. Аналогично параграфы при
ссылках на них в пределах данной главы нумеруются одним числом, а вне
этой главы — двумя числами: первое число означает номер главы, второе —
номер параграфа.
Работа по подготовке настоящей книги к изданию не могла бы быть
выполнена без помощи многих моих коллег и читателей. Автор глубоко
признателен А. С. Антипину, А. В. Арутюнову, Е. Г. Белоусову, Н. А. Бобылеву,
Н. Л. Григоренко, М. И. Зеликину, Л. Ф. Зеликиной |, А. Ф. Измайлову
А. С. Ильинскому, X. Д. Икрамову, А. 3. Ишмухаметову, М. Йовановичу,
А. С. Леонову, А. Недич, М. С. Никольскому, О. Обрадовичу, Н. М.
Попову, М. М. Потапову, А. В. Разгулину, В. А. Срочко, А. А. Станевичюсу,
М. Ф. Сухинину, А. В. Тимохову, В. В. Федорову, А. А. Шананину, В. Янко-
вичу, В. Ячимовичу, М. Ячимовичу, которые своими советами,
предложениями, замечаниями способствовали улучшению содержания книги. Особенно
благодарен А. В. Арутюнову, без помощи которого автор не смог бы
написать §§ 2.4, б Л 6, 6.4 в их настоящем виде, А. 3. Ишмухаметову за помощь
при написании § 10.7.
В столь бурно развивающейся области, как теория и методы решения
экстремальных задач, очень трудно создать учебное пособие, которое
обладало бы определенной завершенностью и было бы свободным от недостатков,
и поэтому автор будет признателен читателям за критические замечания
по содержанию книги.
Ф. П. Васильев
Часть I
КОНЕЧНОМЕРНЫЕ ЗАДАЧИ
МИНИМИЗАЦИИ. ПРИНЦИП МАКСИМУМА.
ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
ГЛАВА 1
Методы минимизации функций одной переменной
С задачами минимизации функций одной переменной мы впервые сталкиваемся при
изучении начальных глав математического анализа и решаем их методами дифференциального
исчисления. Может показаться, что эти задачи относятся к достаточно простым и методы их
решения хорошо разработаны и изучены. Однако это не совсем так. Методы
дифференциального исчисления находят ограниченное применение и далеко не всегда удобны для реализации
на современных ЭВМ. Хотя в последние десятилетия появились другие методы, более удобные
для использования на ЭВМ, требующие меньшего объема вычислительного труда, но тем не
менее эту область экстремальных задач нельзя считать завершенной. Работы, посвященные
новым методам минимизации функций одной переменной, продолжают появляться на страницах
математических книг и журналов. Мы здесь остановимся на некоторых наиболее известных
методах, достаточно хорошо проявивших себя на практике. Другие методы минимизации
функций одной переменной читатель найдет, например, в [76; 148; 193; 214; 257; 590; 662; 671;
681; 684; 709; 738; 755].
§ 1. Постановка задачи
Пусть Е = {х: — оо < х < оо} — числовая ось, X — некоторое множество
из Е, f(x) — функция, определенная на множестве X и принимающая во
всех точках х е X конечные значения; Примерами множеств из К
являются: отрезок [а, Ь] = {х е Е: а< х ^ &}, интервал (а, Ь) = {х е Е: а< х < Ь},
полуинтервалы [а, Ь) = {х G R: а^х < 6}, (а, b] = {х G К: а < х ^ 6}, где
а, Ь — заданные числа. Будем рассматривать задачу минимизации функции
f(x) на множестве X. Начнем с того, что уточним постановку этой
задачи. Для этого сначала напомним некоторые определения из классического
математического анализа.
Определение 1. Точку xt е X называют точкой минимума
функции f(x) на множестве X, если /(¾) </(ж) для всех хеХ; величину /(¾)
называют наименьшим или минимальным значением f(x) на X и
обозначают min/(a;) = /(¾). Множество всех точек минимума f(x) на X будем
хеХ
обозначать через Xt.
В зависимости от свойств множества X и функции f(x) множество X,
может содержать одну, несколько или даже бесконечно много точек, а
также возможны случаи, когда Xt пусто.
Пример 1. Пусть /(a;) = sin2(7r/a;) при х^О и /(0) = 0. На множестве
X = {х: 1 ^ х ^ 2} минимальное значение f(x) равно нулю, множество
X, состоит из единственной точки xt = 1. Если X = {х: 1/3 ^ х < 1}, то
Xt содержит три точки: 1/3, 1/2, 1; если X = {х: 0 < х < 1}, то Xt = {х:
х = 1 /п, п = 1, 2,...} — счетное множество. В случае X = {х: 2 ^ х < об},
10 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
функция /(¾) не имеет наименьшего значения на X. В самом деле,
какую бы точку х € X ни взять, найдется точка v е X (например, v = к при
достаточно большом к) такая, что /(¾) > f'(v). Это значит, что Xt пусто.
Пример 2. Функция /(¾) = \х\ + \х — 1| — 1 на X = {х: \х\ < 1}
принимает свое наименьшее значение, равное нулю, во всех точках отрезка
Х„ = {х: 0 ^ х < 1}. Если X = {х; 1 < х ^ 2}, то Xt содержит одну точку
xt = 1; если X = {х: 1 < х < 2}, то Xt = 0.
Пример 3. Пусть f(x) = x при х ф0 и /(0) = 1. На множествах
Х = {ж:0<а;<1} или X = {х:0<х^.Ц эта функция не имеет наименьшего
значения, т. е. Xt = 0,
Пример 4. Пусть /(¾) = In х, X = {х: 0 < х ^ 1}. Здесь Xt = 0, так
как во всех точках из X функция принимает конечные значения, а для
последовательности хк — \1к (к = 1, 2...) имеем Urn /(¾) = —оо.
к —юо w
Определение . 2. Функция /(ж) называется ограниченной снизу
на множестве X, если существует такое число М, что /(¾) > М для всех
же1. Функция /(ж) ме ограничена снизу на X, если существует
последовательность {хк} G X, для которой lim f(xk) = —oo.
к - > оо
В примерах 1 -3 функции ограничены снизу на рассматриваемых
множествах, а в примере 4 функция не ограничена.
В тех случаях, когда Xt = 0, естественным обобщением понятия
наименьшего значения функции является понятие нижней грани функции.
Определение 3. Пусть функция /(¾) ограничена снизу на
множестве X. Тогда число ft называют ниэюней гранью /(¾) на X, если: 1)
/* < f(x) ПРИ всех х е х> 2) для любого сколь угодно малого числа е > 0
найдется точка xt £ X, для которой /(¾) < /* + е. Если функция /(¾) не
ограничена снизу на X, то в качестве нижней грани /(¾) на X принимается
/. =— оо. Нижнюю грань /(z) на X обозначают через inf f(x) = ft.
х £ X
В примерах 1-3 /, = 0, а в примере 4 /, = —оо.
Если Xt ф 0, то, очевидно, нижняя грань /(¾) на X совпадает с
наименьшим значением этой функции на X, т. е. inf f(x) — minf(x). В этом
хе X хе X
случае говорят, что функция /(¾) на X достигает своей нижней грани.
Подчеркнем, что inf f(x) = ft всегда существует, a min/(z), как мы видели из
хеХ xeJf
примеров 1-4, не всегда имеет смысл. Введем еще два определения.
Определение 4. Последовательность {/(¾)} G X называется
минимизирующей для функции f(x) на множестве X, если
lim /(¾) = ini[f(x) = l.
к —>оо хел
Из определения и существования нижней грани следует, что
минимизирующая последовательность всегда существует.
Определение 5. Скажем, что последовательность (¾} сходится
к непустому множеству X, если lim р(хк, Х) = 0, где р(~хк, Х) = jrrf 1¾ -
- х\ — расстояние от точки хк до множества X.
Заметим, что если X, ф 0, то всегда существует минимизирующая
последовательность, сходящаяся к Xt; например, можно взять стационарную
последовательность хк = xt (к = 1, 2,...), где xt — какая-либо точка из Xt.
Однако не следует думать, что при Х^ф0 любая минимизирующая
последовательность будет сходиться к Xt.
§ 1. ПОСТАНОВКА ЗАДАЧИ
11
Пример 5. Пусть /(%) = ■ х 4, X = R. Очевидно, здесь /t = 0 и
множество Xt состоит из единственной точки xt = 0. Последовательность
хк = к (к = 1, 2,...) является минимизирующей, так как lim /(¾) = О, но
р(хк, Xt) = к не стремится к нулю. к~"х>
Теперь перейдем к формулировке задачи минимизации функции /(¾) на
множестве X. Здесь возможны различные подходы. Обычно принято
различать задачи двух типов. К первому типу относят задачи, в которых
требуется определить величину ft= inf f(x). Сразу же подчеркнем, что в задачах
первого типа неважно, будет ли множество Xt точек минимума f(x) на X
непустым или оно пусто. Ко второму типу задач относят те задачи, у
которых множество Xt непусто и требуется наряду с ft найти какую-либо точку
xt g Xt. Здесь возможно дальнейшее уточнение постановки задачи. Можно
искать точку xt е Х±, обладающую каким-либо дополнительным свойством
(например, ближайшую к началу координат). Бывают ситуации, когда
важно найти все множество Xt или какую-либо ее часть, представляющую,
скажем пересечение Xt с некоторым заданным множеством.
Заметим, что получить точное решение задачи первого или второго типа
удается лишь в редких случаях. Поэтому на практике при решении задач
первого типа обычно строят какую-либо минимизирующую
последовательность {хк} для функции f(x) на X и затем в качестве приближения для /„
берут величину /(¾) при достаточно большом к. Аналогично для
приближенного решения задач второго типа достаточно построить
минимизирующую последовательность {хк}, которая сходится ко множеству Xt в смысле
определения 5, и в качестве приближения для ft и точки \ е Х„ взять
соответственно величину /(¾) и точку хк при достаточно большом к.
Как показывает пример 5, в отличие от задач первого типа не всякая
минимизирующая последовательность может быть использована для
получения приближенного решения задач второго типа. Построение
минимизирующих последовательностей, сходящихся ко множеству Х„,в общем
случае требует привлечения специальных методов. В настоящей главе будем
рассматривать лишь такие задачи второго типа, у которых любая
минимизирующая последовательность сходится к Xt. Один такой класс задач дается
следующей теоремой, называемой теоремой Вейерштрасса [327; 350; 352;
534].
Теорема 1. Пусть X — замкнутое ограниченное множество из
Ж, функция /(¾) непрерывна на X. Тогда f(x) ограничена снизу на X,
множество X, точек минимума f(x) на X непусто, замкнуто и любая
минимизирующая последовательность (¾} сходится к Xt.
Несколько более общий факт будет установлен в § 2.1, из которого также
будет следовать теорема 1. Предлагаем читателю вернуться к примерам 1-
5 и выяснить, в каких случаях и какое из условий теоремы 1 нарушено и к
чему это приводит.
Возможна и более широкая постановка задач минимизации второго
типа— когда ищутся не только точки минимума в смысле определения 1, но
и точки так называемого локального минимума.
Определение б. Точка vt G X называется точкой локального
минимума функции f(x) на множестве X со значением с =/(«♦). если
существует такое число а>0, что/(^) ^/(ж) для всех хеХ(Л\х: \x-vt\ <а\~
= О (v ). Если при некотором а > 0 равенство f(vt) = /(¾) для х е Oa{vJ
возможно только при х = vt, то vt называют точкой строгого локального
минимума.
12 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Для функции, график которой изображен на рис 1.1, точки x0,x2,xi
являются точками строгого локального минимума, а в точках,
удовлетворяющих неравенствам ж5 <
< х ^ х6 и ж8 ^ х ^ 0¾.
реализуется нестрогий
локальный минимум. Функция из
примера 1 в точках хк =
= 1/jfe (к = ±1,±2)
имеет строгий локальный
минимум на X = 1R, а в точке
ж+ = О — нестрогий
локальный минимум.
Точки локального
минимума, в которых минимум
достигается в смысле
определения 1, часто называют
точками глобального или
x0 = axl 3¾
Рис. 1.1
абсолютного минимума функции /(ж) на множестве X.
Выделим класс функций, у которых все точки локального минимума
являются точками глобального минимума.
Определение 7. Функцию /(ж) назовем унимодальной на отрезке
X = [а, Ь], если она непрерывна на [а, Ь] и существуют числа а,/3 (а^
^ а ^ /3 ^ 6) такие, что: 1) /(ж) строго монотонно убывает при а^х ^ а
(если а< а); 2) /(ж) строго монотонно возрастает при /3 ^ х ^ b (если
/3 < Ь); 3) /(ж) = ft= inf /(ж) при a ^ x ^ /3, так что Xt = [a, /3]. Случаи,
когда один или два из отрезков [а, а], [а, /3], [/3, Ь] вырождаются в точку,
здесь не исключаются. В частности, если a =/3, то /(ж) назовем строго
унимодальной на отрезке [a, Ь].
Функция из примера 2 унимодальна на любом отрезке [а, 6]; функция из
примера 1 строго унимодальна на [2/3, 2], но не будет унимодальной на
отрезке [1/2, 2].
Нетрудно видеть, что если функция /(ж) унимодальна на [а, 6], то она
остается унимодальной и на любом отрезке [с, d] С [a, Ь].
В заключение кратко остановимся на задаче максимизации функции.
Определение 8. Функция /(ж) называется ограниченной
сверху на множестве X, если существует такое число В, что f(x)^B при
всех хе X. Функция f(x) не ограничена сверху на X, если существует
последовательность {хЛ е X, для которой lim /(¾) = +оо. Функцию /(ж)
к —> оо
называют ограниченной на X, если она ограничена на X сверху и снизу.
Определение 9. Если функция /(ж) ограничена сверху на X, то
число /* называется верхней гранью /(ж) на! в том случае, когда: 1)
/(ж) ^ /* для всех хе.Х; 2) для любого числа е > О найдется такая точка
xs е X, что /(же) > f* — е. Если /(ж) не ограничена сверху на X, то по
определению принимается /* = оо. Последовательность {жДе X называется
максимизирующей для /(ж) на X, если lim f(xk) — f*. Если существует
А: —> оо
такая точка ж* е X, что /(ж*) = /*, то ж* называется точкой максимума
/(ж) на X, а величина /(ж*) — наибольшим или максимальным значением
/(ж) на X. Множество точек максимума /(ж) на X будем обозначать через
X*, верхнюю грань — через /* = sup /(ж).
хеХ
§ 1. ПОСТАНОВКА ЗАДАЧИ
13
Заметим, что верхняя грань и максимизирующая последовательность
всегда существуют, а максимальное значение может не существовать. Если
выполнены условия теоремы 1, то /* < оо, X* ^0и любая максимизирующая
последовательность {хк} сходится к X*.
В задачах максимизации также можно различать задачи двух типов: в
задачах первого типа ищется величина /*, а в задачах второго типа ищется
/* и какая-либо точка х* е X*. Нетрудно видеть, что
sup/(а:) = - inf(-/(z)),
причем любая точка максимума и любая максимизирующая
последовательность для /(ж) на X является точкой минимума и соответственно
минимизирующей последовательностью для функции —/(ж) на X. Это значит,
что любая задача максимизации функции /(ж) на X равносильна задаче
минимизации функции -/(ж) на том же множестве X. Поэтому мы можем
ограничиться изучением лишь задач минимизации.
Наконец, немного о точках локального максимума.
Определение 10. Точка v* е X называется точкой локального
максимума функции /(ж) на множестве X, если существует такое число
а >0, что f(v*) ^ /(ж) для всех хеХп{х: |ж-«*| <a} = Oa(v*). Если при
некотором а >0 равенство f(v*) = f(x) для хе Oa(v*) возможно только
при x — v*, то v* называют точкой строгого локального максимума.
Для функции, график которой изображен на рис. 1.1, точки-ж,, а%, Ху, ж10
являются точками строгого локального максимума, а в точках,
удовлетворяющих неравенствам ж5 ^ ж < 3¾ и ж8 < ж < 0¾. реализуется нестрогий
локальный максимум; х3 — точка глобального максимума.
Множество всех точек локального минимума и максимума функции на
множестве X принято называть точками локального экстремума
функции на этом множестве или, проще, точками экстремума.
Для обозначения задач минимизации (или максимизации) функции /(ж)
на множестве X часто пользуются следующей краткой символической
записью:
/(ж)-мп;Е, хеХ (/(ж)-» sup, хеХ),
при необходимости дополнительно уточняя постановку задачи; при этом
минимизируемую (максимизируемую) функцию /(ж) называют целевой
функцией, множество X — допустимым множеством.
Упражнения
1. Построить минимизирующую и максимизирующую последовательности ^ для функции
f(x) = arctga; на X = Е. Достигает ли функция своих нижней и верхней граней на R?
2. Пусть f(x) = \х2 - 1| при хф 1 и /(1) = 1. Найти множество Xt точек минимума f(x)
на X = Е. Можно ли утверждать, что любая минимизирующая последовательность для этой
функции будет сходиться к!,?
3. Найти все точки локального экстремума функции f(x) = |||ж2 - 1| — 1| - 1| на отрезке
[а, Ь] при различных а, Ь. При каких a, b эта функция будет унимодальной на [а, Ь]?
4. Выяснить, на каких отрезках будут унимодальными функции f(x) = ex, f(x)-x2, f(x) =
— -ж2, f(x) = \Дх~\, f(x) — COS X.
5. Если функция G(v) унимодальна на отрезке [с, d], то функция f(x)-G((d -с)(х-
— а)/(Ь - а) + с) унимодальна на отрезке [а, 6]. Доказать.
14 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
6. Доказать, что линейная функция f(x)~Ax+B, где А, В —постоянные, А ^0, достигает
своего минимума и максимума на отрезке [а, Ь] только при х — а или х — Ь.
7. Найти минимум функции f(x) — max \t2 - xt\ на множествах X —Ш. и X ~{х: 1 < х <
<оо}. 0<t<i
§ 2. Классический метод
Под классическим методом будем подразумевать тот подход к поиску
точек экстремума функции, который основан на дифференциальном
исчислении и подробно описан в учебниках по математическому анализу [327; 350;
352; 534]. Мы здесь лишь вкратце остановимся на этом методе.
Пусть функция f(x) кусочно непрерывна и кусочно гладка на отрезке
[а, Ь]. Это значит, что на [а, Ь] может существовать лишь конечное число
точек, в которых f(x) либо терпит разрыв первого рода, либо непрерывна,
но не имеет производной. Тогда, как известно, точками экстремума функции
f(x) на [а, Ь] могут быть лишь те точки, в которых выполняется одно из
следующих условий: 1) либо f(x) терпит разрыв; 2) либо f(x) непрерывна,
но производная f'(x) не существует; 3) либо производная f'(x) существует
и равна нулю; 4) либо х = а или х = Ь. Такие точки принято называть
точками, подозрительными на экстремум.
Поиск точек экстремума функции начинают с нахождения всех точек,
подозрительных на экстремум. После того как такие точки найдены, проводят
дополнительное исследование и отбирают среди них те, которые являются
точками локального минимума или максимума. Для этого обычно исследуют
знак первой производной f'(x) в окрестности (или соответствующей
полуокрестности точек разрыва и граничных точек х = а, х = Ь) подозрительной
точки. Для того чтобы подозрительная точка v£[a, b] была точкой
локального минимума, достаточно, чтобы lim f(x) >/(«), lim f(x) ^ f(v) и при
x - > г» — 0 х - > v -Ь 0
некотором а >0 на множествах [a, b]n(v, v + a) = 0+(v), [а, b](l(v — а, v) =
= 0~(v) существовала производная /'(ж), причем f'(x)>0 при хе 0+(w)
и /'(а;)<0 при хе 0~(v). Если же lim f(x)^.f(v), lim f(x)^.f(v)n
i-tii-0 x-t v + 0
f'(x) < 0 при x e 0+(v), f'(x) > 0 при x £ 0~(v), то v —точка локального
максимума.
В тех случаях, когда удается вычислить в подозрительной точке
производные второго и более высокого порядков, то их также можно
использовать для исследования поведения функции в окрестности этой точки. А
именно, пусть известны производные f'(v), . . .,f(n\v), причем /(<)(г;) = 0
(г = 1, . . ., п - 1), a f(n)(v) т^О (п > 1). Если п — четное число, то в
случае /(п)(«) > 0 в точке v реализуется локальный минимум, а в случае
f(n)(v) <0 — локальный максимум. Если п нечетно, то при а< v < b в точке
v не может быть локального минимума или максимума; при v = a (v = b)
в случае f(n)(v) >0 в точке v имеем локальный минимум (максимум), а в
случае /(п)(г;) <0 — локальный максимум (минимум).
Чтобы найти глобальный минимум (максимум) функции f(x) на [а, Ь],
нужно перебрать все точки локального минимума (максимума) на [а, Ь] и
среди них выбрать точку с наименьшим (наибольшим) значением функции,
если таковое существует. Если вместо отрезка [а, Ь] имеем дело со
множеством X — {х: а^. х < оо}, или X = {х: -оо<х^.Ь}, или X = R, то наряду
с вышеописанными исследованиями нужно также изучить поведение
функции при х —> оо или х —> —оо.
§ 2. КЛАССИЧЕСКИЙ МЕТОД
15
Классический метод исследования функции на экстремум следует
использовать во всех тех случаях, когда достаточно просто удается выявить все
подозрительные на экстремум точки и реализовать описанную выше
схему отбора экстремальных точек. К великому сожалению, классический
метод имеет весьма ограниченное применение. Дело в том, что вычисление
производной f'(x) в практических задачах зачастую является непростым
делом. Например, может оказаться, что значения функции f(x)
определяются из наблюдений или каких-либо физических экспериментов, и получить
информацию о ее производной крайне трудно. Но даже в тех случаях, когда
производную все же удается вычислить, решение уравнения f'(x) = 0 и
выявление других точек, подозрительных на экстремум, может быть связано
с серьезными трудностями. Поэтому важно иметь также и другие методы
поиска экстремума, не требующие вычисления производных, более удобные
для реализации на современных ЭВМ.
Упражнения
1. Найти точки экстремума функции f(x) = sin3 х + cos3 х на отрезках [0, 37г/4], [0, 2тг].
2. Пусть f(x) = (1 + е1/*)-1 при хфО и /(0) = 0. Найти точки экстремума этой функции
на отрезках [0, 1], [-1,0], [-1, 1], [1,2] и на R.
3. Пусть непрерывная на отрезке [а, Ь] функция f(x) в точке v (a<v < Ь) имеет строгий
локальный минимум. Можно ли утверждать, что существует число а > 0 такое, что f(x)
монотонно убывает при »-а<1;<ии монотонно возрастает при v<x<v + al Рассмотреть
функцию f(x)-2x2 + x2sm(l/x) (хфО), /(0) = 0 на [-1,1]. Исследовать случай, когда f(x)
имеет на [а, Ь] конечное число точек локального экстремума.
4. Пусть функция f(x) определена на [а, Ь] и дважды дифференцируема в точке v. е [а, 6].
Доказать, что если a<v < b и в точке v реализуется локальный минимум f(x), то необходимо,
чтобы /'' (х) ^ 0. Будет ли верным это утверждение, если v = а или v = Ь? Будет ли оно верным,
если г> = а или v = b и, кроме того f'(v) = 0? Рассмотреть функции f(x) = —х , f(x) = cos х
На [—7Г, 7Г].
5. Пусть функция f(x) определена на [а, Ь] и в точке v£[a, Ь] имеет п производных (п^2),
причем известно, что /(*'(и) = 0 при г = 1,..., п - 1 и /(п'(и) Ф 0. Доказать, что если v —
точка локального минимума и а < и < Ь, топ — четное число и pn'{v) > 0. Что изменится,
если v = а или v = Ь?
6. Пусть функция f(x) аналитична на [а, 6], т. е. ряд Тейлора этой функции сходится к
f(x) во всех точках [а, 6]. Может ли эта функция иметь на [а, Ь] бесконечное число точек
локального экстремума?
7. Пусть функция f(x) определена на [а, Ь] и в точке v имеет производные всех порядков.
Можно ли утверждать, что если v — точка локального минимума, то pn'{v)^0 при каком-
либо njtl? Рассмотреть функцию f(x) = e~llx* (х ^0), /(0) = 0 в точке v = 0. Что изменится,
если функция f(x) аналитична на [а, Ь]?
8. Пусть функция f(x) дифференцируема на [а, Ь] и в точке v е [а, Ь] достигает своей
нижней грани на [а, 6]. Доказать, что тогда необходимо, чтобы f'(v)(x — v) ^ 0 при всех х е
е [а, 6]. Будет ли выполнение этого условия достаточно для того, чтобы в точке v достигалась
нижняя грань f(x) на [а, Ь]?
§ 3. Метод деления отрезка пополам
Простейшим методом минимизации функции одной переменной, не
требующим вычисления производной, является метод деления отрезка пополам.
Опишем его, предполагая, что минимизируемая функция f(x) унимодальна
на отрезке [а, о]. Поиск минимума f(x) на [а, Ь] начинается с выбора двух
16 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
точек хх =(а+ b — 8)/2 и а^ = (а+ b + (5)/2, где <5—постоянная, являющаяся
параметром метода, 0 < <5 < Ь — а. Величина <5 выбирается вычислителем и
может определяться целесообразным количеством верных десятичных
знаков при задании аргумента х. В частности, ясно, что <5 не может быть
меньше машинного нуля ЭВМ, используемой при решении
рассматриваемой задачи. Точки ж,,:% расположены симметрично на отрезке [щ Щ
относительно его середины и при малых 6 делят его почти пополам — этим < и
объясняется название метода.
После выбора точек 35,,¾ вычисляются значения /(0:,),/(¾) и
сравниваются между собой. Если /(ж,) ^ /(¾). то полагают а, = а, о, = х^\ если
же /(ж,) > /(¾). то полагают а, = х,, 6, = Ь. Поскольку f(x) унимодальна
на [а, о], то ясно, что отрезок [а,, 6,J имеет общую точку с множеством X,
точек минимума f(x) на [а, Ь] и его длина равна
6,-а, =(Ь-а-<5)/2 + <5.
Пусть отрезок [аА._,,6А._1], имеющий непустое пересечение с Х„, уже
известен, и пусть bfc_,- %_, = (6-а- 8)/2к-х + 8 > 8 (к ^2). Тогда берем
точки ^_i = (ai._,+6i_1-<5)/2, х2к = (ак_х+Ък_х + 8)/2, расположенные на
отрезке [%_,, ЬА._,], симметрично относительно его середины, и вычисляем
значения f(x2k_x),f(x2k). Если /(^.,)^/(¾). то полагаем ак = ак_х,
Ьк = х2к; еслижеДх2к_1)>/(х2к), то полагаем ак = х^к_,, Ь4 = Ь„_,. Длина
получившегося отрезка [%, &J равна 6^ — ак = (Ь—а—8)/2к + 8 > 8 и [%, 6Jn
Если количество вычислений значений минимизируемой функции ничем
не ограничено, то описанный процесс деления отрезка пополам можно
продолжать до тех пор, пока не получится отрезок [ак, Ьк] длины Ьк — ак< е, где
е — заданная точность, е> 8. Отсюда имеем, что к > log2((6 — а— 8)/(е -
— 8)). Поскольку каждое деление пополам требует двух вычислений
значений функции, то для достижения точности Ьк — ак < е требуется всего
п = 2к > 2 log2((6 - а - 8)/(е - 8)) таких вычислений.
После определения отрезка [ак, Ьк] в качестве приближения ко
множеству Xt можно взять точку хп = х?к_х при f(x2k_i)^f(x2k) и хп = хгк
при f(x2k_x)>f(x2k), а значит f(xn) может служить приближением для
/ = inf f(x). При таком выборе приближения для Xt будет допущена
xe[atb\
погрешность р(хп, Xt)^ max{bk-хп; xn-ak}—\b-a- 8)/2к. Если не
требовать того, чтобы значение функции, принимаемое за приближение к /,,
было вычислено непременно в той же точке, которая служит приближением
к Xt, то вместо х можно взять точку vn = (ak + bk)/2 с меньшей
погрешностью р(хп, X,) ^ (Ьк - %)/2 = (6 -а- <5)/2£+| + 8/2 (здесь к = п/2 и 8
достаточно мало).
Конечно, и в этом случае можно бы провести еще одно дополнительное
вычисление значения функции в точке vn и принять /(«„)«/*.■ Однако
заметим, что на практике нередко встречаются функции, нахождение значения
которых в каждой точке связано с большим объемом вычислений или
дорогостоящими экспериментами, наблюдениями, — понятно, что здесь
приходится дорожить каждым вычислением значения минимизируемой функции.
В таких ситуациях возможно даже, что число п, определяющее количество
вычислений значений функции, заранее жестко задано и превышение его
недопустимо.
Из предыдущего следует, что методом деления отрезка пополам с
помощью п = 2к вычислений значений функции можно определить точку ми-
§ 3. МЕТОД ДЕЛЕНИЯ ОТРЕЗКА ПОПОЛАМ
17
нимума унимодальной функции на отрезке [а, 6] в лучшем случае с
точностью «(6 — ¢1)2-1-^2. Возникает вопрос, не существует ли методов,
позволяющих с помощью того же числа вычислений значений функции решить
задачу минимизации унимодальной функции поточнее? Оказывается, такие
методы есть. Один из них будет описан в § 4.
В заключение отметим, что метод деления отрезка пополам без изменений
можно применять для минимизации функций, не являющихся
унимодальными. Однако в этом случае нельзя гарантировать, что найденное решение
будет достаточно хорошим приближением к глобальному минимуму.
§ 4. Метод золотого сечения. Симметричные методы
Перейдем к описанию метода минимизации унимодальной функции на
отрезке, столь же простого, как метод деления отрезка пополам, но
позволяющего решить задачу с требуемой точностью при меньшем количестве
вычислений значений функции. Речь пойдет о методе золотого сечения.
1. Как известно, золотым сечением отрезка называется деление отрезка
на две неравные части так, чтобы отношение длины всего отрезка к длине
большей части равнялось отношению длины большей части к длине
меньшей части отрезка.
Нетрудно проверить, что золотое сечение отрезка [а, 6]
производится двумя точками ж, = а + (3- \/5)(6 - а)/2 = а+ (6 - а) 0,381966011...
и 3¾ = а + (VE - 1)(6 - а)/2 = а + (6 - а) 0,618033989.. „
расположенными симметрично относительно середины отрезка, причем а < ж, < х^ < 6,
(b-a)/(b-xl) = (b-xl)/(xl-a) = (b-a)/(x2-a) = (x2-a)/(b-x2) = (V5 +
+ 1)/2=1,618033989...
Замечательно здесь то, что точка хх в свою очередь производит золотое
сечение отрезка [а,:%], так как £2-0:,03,-(1=6-¾ и (¾ — а)/(ж, — а) =
= (ж, -а)/(х2- ж,). Аналогично точка ¾ производит золотое сечение отрезка
[ж,, о]. Опираясь на это свойство золотого сечения, можно предложить
следующий метод минимизации унимодальной функции /(ж) на отрезке [а, 6].
Положим ах = а, 6, = 6. На отрезке [а,, 6,] возьмем точки ж,, х^,
производящие золотое сечение, и вычислим значения /(ж,),/(¾). Далее, если
/(ж,) ^ /(¾). то примем U2 = а, Ы = Щ, ж2 = ж,; если же /(ж,) > /(¾). то
примем щ = ж,, 62 = 6,, ^2 = ¾. Поскольку функция /(ж) унимодальна на
[а, 6], то отрезок [%, 62] имеет хотя бы одну общую точку с множеством
Xt точек минимума /(ж) на [а, 6]. Кроме того, 62 - % =^v5 - 1)(6 — а)/2
и весьма важно то, что внутри [а^, 62] содержится точка ж2 с вычисленным
значением /(ж2) = тт{/(ж,);/^)}, которая производит золотое сечение
отрезка [а2, 62].
Пусть уже определены точки ж,,..., ж ,, вычислены значения /(ж,),...
...,/(жп_,), найден отрезок K_,,6n_,J такой, что [ап_,, Ь„_,] П Xt ф 0,
Ь _ апХ = ((\/5 - 1)/2)п~2(6 - а), и известна точка жп_,, производящая
золотое "сечение отрезка [о„_,,&„_,] и такая, что /(жп_,)= min f(x{)
(п^2). Тогда в качестве следующей точки возьмем точку жп = ап_, + 6п_,--
— жп_,, также производящую золотое сечение отрезка [ап_,, 6П_,],
вычислим значение /(жп).
18 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Пусть для определенности ап_, < хп < хп_1 < 6П_, (случай xn_i < хп
рассматривается аналогично). Если f(x)^f(xn_l), то полагаем an = an_v
К = Xn-v яп = хп; если же f(xn) > f(xn_l), то полагаем ап = хп, Ъп = bn_v
xn = xn-i- Новый отрезок [ап,Ъп] таков, что [ап, bn] nXt^0, bn-an =
= ((V5 - l)/2)n~'(6 - а), точка xn производит золотое сечение [an, bn] и
f(xn) = min{/(zn); /(£„_,)} = mm /(¾).
Если число вычислений значений f(x) заранее не ограничено, то
описанный процесс можно продолжать, например, до тех пор, пока не
выполнится неравенство Ь — ап < е, где е —заданная точность. Если же число
вычислений значении функции f(x) заранее жестко задано и равно п, то
процесс на этом заканчивается и в качестве решения задачи второго типа
(см. § 1) можно принять пару f(xn), хп, где f(xn) является приближением
для ft — inf f(x), а точка хп служит приближением для множества Xt с
хе[а, ь\
погрешностью
р(хп, X.) < тгх{Ъп-хп; хп-ап} = \{Vb-\)(bn-an) = (^Щ\ъ-а) = Ап.
Вспомним, что с помощью метода деления отрезка пополам за п = 2к
вычислений значений функции f(x) в аналогичном случае мы получили
точку хп с погрешностью
р(хп1 Xt) < 2-/2(Ь -а-6)< 2-/2(Ь -а) = Вп.
Отсюда имеем Ап/Вп = (2>/2/(>/5 + 1))п ~ (0, 87...)" — видно, что уже при
небольших п преимущество метода золотого сечения перед методом
деления отрезка пополам становится ощутимым.
2. Обсудим возможности численной реализации метода золотого
сечения на ЭВМ. Заметим, что число VE на ЭВМ неизбежно будет задаваться
приближенно, поэтому первая точка ж, = а+ (3 — Vo)(6 — a)/2 будет
найдена с некоторой погрешностью. Посмотрим, как повлияет эта погрешность
на результаты последующих шагов метода золотого сечения. Обозначим
An = 6n-an = ((v/5-l)/2)n-'(6-a) (n = l,2,...). Нетрудно проверить, что
Ап является решением конечно-разностного уравнения Ап_2 = Ап_, + Ап,
или
Д^Д^-Д,.,, п = 3,4,..., (1)
с начальными условиями A, = b — а, Д2 = b — xl.
Как известно, линейно независимые частные решения этого уравнения
имеют вид т,п и т2п (п = 1,2,...), где т, = (VE - 1)/2, т2 = -(VE+ 1)/2—
корни характеристического уравнения т2 + т— 1 =0, а любое решение
уравнения (1) представимо в виде
Ап = Ат» + Вт2\ n = 1,2,---, (2)
где постоянные А и В однозначно определяются начальными условиями из
линейной системы
Аг1+Бг2 = Д1, Ат? + Вт? = А2. (3)
При А, = Ъ - а, Д2 = Ь - хх из (3) имеем А = 2(6 - a)/(VE - 1), В = 0,
и понятно что формула (2) в этом случае дает уже известное нам
решение Дп = т,п~'(Ь — а). Однако точка ж, задана с погрешностью, поэтому
§ 4. МЕТОД ЗОЛОТОГО СЕЧЕНИЯ. СИММЕТРИЧНЫЕ МЕТОДЫ 19
в системе (3) вместо точного значения А2 придется взять приближенное
Д2 = Д2 + <5. Тогда постоянные А, В из (3) определятся с
соответствующими погрешностями: А = А + 6Х, В = В + 62, и вместо (2) с точными А, В
будем иметь Ап = Атхп + Вт? (п = 1, 2,...). Поскольку 0 < т, = 0,6... < 1,
|т2| = 1,6.,. > 1, то погрешность |АП - AJ = |<5,т,п + <52т2п| с возрастанием
п будет расти очень быстро. Это значит, что уже при не очень больших
п отрезок [ап, Ьп] и точки хп, хп + х = ап + Ьп — хп будут сильно отличаться
от тех, которые получились бы при работе с точными данными. Численные
эксперименты на ЭВМ также подтверждают, что метод золотого сечения в
описанном выше виде практически неприменим уже при небольших п.
Как же быть? К счастью, имеется достаточно простая модификация
метода золотого сечения, позволяющая избежать слишком быстрого
возрастания погрешностей при определении точек хп (п ^ 2). А именно на
каждом отрезке [ап, Ьп], содержащем точку хп с предыдущего шага, при
выборе следующей точки хп+х нужно остерегаться пользоваться
формулой хп + х = ап + Ьп — хп, и вместо этого лучше непосредственно
произвести золотое сечение отрезка [ап, Ьп] и в качестве хп + х взять ту из точек
ап + (3-\/5)(Ьп-ап)/2, ап + (\/5- 1)(6п-ап)/2, которая наиболее удалена
от хп (здесь под Vo подразумевается какое-либо подходящее приближение
этого числа). Конечно, после такой модификации метод золотого сечения,
вообще говоря, теряет свойство симметричности и, быть может, уже не так
красив, но зато вполне годится для приложений. Нетрудно видеть, что этот
метод может применяться и без априорного знания о том, что
минимизируемая функция унимодальна, но в этом случае полученное решение может
оказаться далеким от глобального минимума.
3. Метод золотого сечения относится к классу так называемых симметричных методов.
Дадим краткое описание произвольного симметричного метода минимизации функции f(x) на
отрезке [а, 6].
Первый шаг: на [а, Ь] задается точка хх (а < хх <Ъ), полагается ах = а, Ьх = Ь, х~х = хх и
вычисляется f(xx). Пусть уже сделано п — 1 шагов (n ^2) и найдены отрезок [ап_ ,, Ьп_х]
и точка хп_х (ап_, <я„„х <Ьп_х) с вычисленным значением f(x~n_x), причем хп_хф
Ф (ап - 1 + К _ ] )/2. Тогда на следующем n-м шаге берется точка хп = ап_ х + Ьп_ ,' — хп _ ,,
расположенная внутри [ап_ ,, Ьп_ ,], симметрично точке хп_ х относительно середины этого
отрезка — отсюда происходит название методов. Затем вычисляется значение f(xn) и
сравнивается с f(xn_ ]). Пусть для определенности х~п_ , < хп (случай хп < х~п_ х рассматривается
аналогично). Тогда при f(xn_ ,) < f(xn) полагается ап = ani_ ,, bn = хп, хп = х~п_ ,; если же
/(£„_])>/К), то ап = хп_х, Ъп = Ъп_х, хп = хп. Еслижп^(ап + Ьп)/2, то процесс может
быть продолжен дальше. Может оказаться, что хп = (ап + Ьп)/2, — в этом случае процесс
заканчивается; при необходимости на [an, Ьп] можно продолжать поиск минимума аналогичным
методом, начиная с выбора новой начальной точки х~п -£ (ап + Ьп)/2.
Из описания симметричного метода видно, что всякий симметричный метод полностью
определяется заданием отрезка [а, Ь] и первой точки хх (а < хх < Ь). Отсюда следует, что в
качестве другой характеристики симметричного метода можно взять длины Дп отрезков [an, b ]
(п=1,2, ...), где Д, =Ь-а, Д2 = тах{Ь -ж,; ж, -а}. Очевидно, Дп + 1 ^А„/2 при всех п^1.
Как видим, симметричные методы весьма просты и, пожалуй, даже изящны. Однако все эти
методы страдают тем же недостатком, что и метод золотого сечения: погрешность, допущенная
в задании первой точки хх, приводит к быстрому накапливанию погрешностей на дальнейших
шагах, и уже при не очень больших п результаты будут сильно отличаться от тех, которые
могли бы получиться при точной реализации симметричного метода с точными исходными
данными.
Если симметричный метод таков, что для Дп = Ьп - ап выполнено условие
ДП/2<ДП+1<2ДП/3, n=\,...,N,
(4)
20 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
при некотором ЛГ> 1, то Дп будут удовлетворять конечно-разностному уравнению (1) при
п = 2,..., N, и исследование поведения погрешностей в этом случае может быть проведено
так же, как это было сделано выше для метода золотого сечения. Чтобы избежать слишком
быстрого роста погрешностей в симметричных методах со свойством (4), на каждом отрезке
[ап, Ьп] (п = 2,..., N), содержащем точку х~п с предыдущего шага, следующую точку хп + х
нужно определять не по формуле хп +1 = ап + Ьп — х~п, а лучше принять за хп+ х ту из точек
ап + Т(К ~ ап)' ап + (1 - т)(ьп ~ %) (г= (Д2 + s)/^\)' которая наиболее удалена от хп.
Упражнения
1. Найти наименьшее п, начиная с которого точность метода золотого сечения больше
точности метода деления отрезка пополам в 2 раза; в 10 раз.
2. Написать конечно-разностные уравнения для длин Дп отрезков [ап, Ьп], получаемых
симметричным методом, для случая, когда на каких-то шагах метода нарушается условие (4).
§ 5. Об оптимальных методах
1. В тех случаях, когда вычисление значений функции связано со
значительными затратами, большую ценность приобретают экономичные или,
как их еще называют, оптимальные методы, позволяющие решить задачу
минимизации с требуемой точностью на основе вычислений значений
минимизируемой функции как можно в меньшем числе точек, а также тесно
связанные с ними методы, гарантирующие наилучшую точность при
жестко заданном количестве вычислений значений минимизируемой функции.
В связи с этим возникают вопросы, что такое оптимальные методы,
существуют ли такие методы, как их строить? Абсолютно наилучший метод,
пригодный для минимизации всех функций, вряд ли существует, и на
поставленные вопросы можно попытаться ответить лишь при определенных
ограничениях на рассматриваемые методы, функции и постановки задач
минимизации.
Предположим, что нам задан некоторый класс функций Q,
зафиксирована какая-либо постановка задачи минимизации функций из этого класса
(например, задача первого или второго типа из § 1) и указано множество
методов Р, позволяющих решить поставленную задачу минимизации. Пусть
Л(/> р) — погрешность решения рассматриваемой задачи минимизации для
функции / = f(x) е Q с помощью метода р£ Р. Ясно, что, минимизируя
одним и тем же методом р различные функции из Q, мы будем получать,
вообще говоря, различные погрешности: для некоторых «хороших» функций
из Q эта погрешность может оказаться равной нулю, а для других
«плохих» функций из Q погрешность может быть значительной. Имеет смысл
считать метод р, е Р лучше метода р2е Р, если погрешность метода р1
даже для самых «плохих» (для pl) функций из Q будет меньше погрешности
метода р2 для «плохих» (для ^) функций из Q. В связи с этим
представляется разумным ввести величину 6(р) = sup А(/, р), выражающую собой
погрешность метода р при минимизации самой «плохой» (для р) функции
из Q.
Определение 1, Величину 6(р) = supЛ(/,р) назовем гаранти-
рованной точностью метода ре Р на классе функций Q, Скажем, что
§ 5. ОБ ОПТИМАЛЬНЫХ МЕТОДАХ
21
метод р{е Р лучше метода р2€Р на классе Q, если 6(р{) < 6(р2).
Метод ptEP назовем оптимальным методом на классе Q, если S(pt) —
= inf 8(р) — 8{рЛ, а величину 6(pt) — наилучшей гарантированной точ-
реР
ностью методов Р на классе Q. Если для некоторого метода р£ е Р
выполняется неравенство S(pe) ^ S(pt) + е, то метод р£ назовем е-оптимальным
на классе Q.
Вопросы существования оптимальных и е-оптимальных методов,
возможности их построения для различных множеств методов Р, классов функций
Q и постановок задач минимизации, а также другие возможные подходы
к проблеме выбора оптимальных методов изучались, например, в [74; 140;
148; 193; 214; 218; 374; 523; 671; 681; 684; 704; 709; 755].
2. Здесь мы кратко остановимся на оптимальных методах решения задачи минимизации
функций из класса Q, состоящего из всех унимодальных функций на отрезке [а, 6].
Ограничимся рассмотрением множества Р методов минимизации, использующих лишь значения
функции, считая при этом, что число п вычислений значений минимизируемой функции
заранее задано. Будем предполагать, что в описание каждого метода рп из Р входит задание
правила выбора точек х,,..., х из отрезка [а, Ь], вычисление значений /(Х]) f(xn)
минимизируемой функции f(x) е Q, выделение из точек х,,..., хп такой точки хп, для которой
/(х ) = min /(х{), и определение отрезка [ап, Ьп], где в качестве an, Ьп берутся ближай-
I ^ г ^ п
шие слева или справа к х~п точки среди хр ..., хп, а, Ь (возможности х( = а или х( = Ь не
исключаются).
Таким образом, применяя конкретный метод р е Р к конкретной функции f(x) е Q, в
результате получаем отрезок [ап, Ьп] и точку х e[an, Ьп] с вычисленным значением /(хп) =
= min f(x{). Из определения унимодальной функции и построения отрезка [ап, Ьп] следует
1 ^ «^ п
неравенство /(х) ^'/(хп) при всех х е [а, Ь]\[ап, Ьп], так что
Д= inf /(х)= jnf /(х), Х,П[ап,Ьп]?0. (1)
В качестве приближения для Д обычно берут величину /(х ), а в качестве приближения к
множеству Xt можно взять любую точку хп из отрезка [ап, Ьп] — на практике часто
принимают хП( = хп или xn> = (on + Ь„)/2.
Отрезок [ап, Ьп] принято называть отрезком локализации минимума функции /(х) на
отрезке [а, 6]. Из (1) следует что расстояние от любой точки хп е [ап, Ьп] до множества Xt
не превышает длины отрезка локализации Ьп — ап:
Р(*п,Х.)= И К -*1 <*„-«»„■ (2)
Величину Д(/, рп) — Ьп - ап можно принять за погрешность решения задачи минимизации
функции /(х)е Q методом рп еР. Согласно (2), чем меньше погрешность Д(/, рп), тем точнее
будет определено приближение хп к Xt и, следовательно, тем лучше метод рп. Для точного
определения наилучшего или близкого к нему метода нам остается еще уточнить правило
выбора точек х,,..., хп, в которых вычисляются значения минимизируемой функции. Здесь
принято различать два типа методов: пассивные методы и последовательные методы.
Если все точки Х|,..., х метода рп выбираются одновременно до начала вычислений и в
дальнейшем уже не меняются, то такой метод называют пассивным. Если в методе рп точки
X] хп выбираются последовательно отдельными порциями, причем при выборе каждой
очередной порции учитываются результаты предыдущих вычислений и проводится уточнение
отрезка локализации минимума, то такой метод называется последовательным.
Примером пассивного метода является метод равномерного перебора. В этом методе точки
Х|, ..., хп выбираются по правилу: xi = X] + ih (г = 1,..., п), где h > 0 — шаг метода, х, —
заданная точка из [а, 6], X] — а < h (например, Х| = а или X] = a + h/2), и, кроме того, пп <
< 6-х, <(n+ 1)¾.
Примерами последовательного метода служат методы деления отрезка пополам, золотого
сечения.
Пассивный метод является частным случаем последовательного метода, когда все п
точек выбираются сразу в первой же порции. Поэтому нетрудно понять, что последовательные
методы, вообще говоря, обладают большей гибкостью и гораздо точнее пассивных методов.
Однако отсюда не следует, что пассивные методы вовсе не находят применения. Такие методы
22 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
весьма полезны, когда можно вести параллельные вычисления, используя, например,
многопроцессорные ЭВМ. В тех случаях, когда значения минимизируемой функции определяются
из физического эксперимента, условия проведения таких экспериментов также могут сделать
необходимым применение пассивных методов.
Таким образом, n-точечные (т. е. использующие вычисление значений функции в п
точках) последовательные и пассивные методы описаны. Если в определении 1 принять, что
Q — класс унимодальных функций на отрезке [а, 6], Р — Рп — множество всех п-точечных
последовательных (или пассивных) методов, Д(/, рп) = Ьп - ап — длина отрезка локализации
минимума, полученного минимумом рп для функции / = /(ж) е Q, то придем к определениям
гарантированной точности, оптимального и е-оптимального последовательного (пассивного)
метода для унимодальных функций. Кратко рассмотрим вопросы существования и построения
оптимальных методов для таких функций.
3, Сначала остановимся на пассивных методах. Пусть рп = {ж,,..., хп\— какой-либо
пассивный метод, а = Xq ^. ж, <...<жп^Ь = жп+). Применяя его к какой-либо функции
/(ж) е Q, получаем отрезок [ж{_|,ж; + ]] локализации минимума этой функции, так что
погрешность метода рп здесь будет равна Д(/, рп) = х{ +, -х{ _,. Поэтому S(pn)= sup Д(/, рп) <
< max (ж; , , - xi_ ,). Пусть max (xi + l - х. _ ,) = хк , -хк_х. Возьмем функцию Д =
= /, (х) = \х-хк\. Это строго унимодальная функция достигает своей нижней грани на отрезке
[а, Ь] в точке xt = хк е [ж^. _ ,, хк +, ], причем Д(Д, рп) = хк , , — хк _ ,. Следовательно,
гарантированная погрешность метода рп на классе Q равна 6(рп)= max (ж{ + ] -х{_х). Для
получения оптимального пассивного метода остается выяснить, достигается ли нижняя грань
inf 6(р„) = &., где Р„ — множество всех пассивных методов, и если достигается, то на каком
КеР„
методе рп £ Р . Оказывается, здесь нужно различать случаи четного и нечетного п.
Теорема 1. При всех нечетных п = 2т +1 (т ^ 0) существует бесконечно много
оптимальных пассивных методов на классе Q; наилучшая гарантированная точность
пассивных методов Pzm + \ на этом классе равна (Ь - а)/(т +1).
Доказательство. Возьмем пассивный метод рп = {uj,..., vn}, где v2i = а+ i(b -
— a)/(rn+l) (г — 1 т), а точки v2i + x (г =0, 1,..., m) расположены на отрезке [а, Ь]
произвольно, лишь бы %_, <v2i <v2i + \, v2i + l—v2i_l ^(b-a)/(m+l). Очевидно, 6(pn ) =
= (b - a)/(m + 1). С другой стороны, для любого пассивного метода рп — {хх,..., хп} (xq =
= а^Ж]<..,<жп^Ь = жп + ], п- 2т + 1) имеем S(pn) = max (ж{ + ] — ж<_ ]) ^ тах{Ь -
~х2т' х2т~х2т-2< • • -1¾-¾) ¾-а}^(Ь —а)/(т+1). Следовательно, методы рп оптимальны
и6^ = (Ь-Ь)/(т+1).а
Теорема 2. При всех четных п = 2т (т ^ 1) оптимального пассивного метода на
классе Q не существует; наилучшая гарантированная точность пассивных методов Р2п
на этом классе равна (Ь — а)/(т+ 1). В качестве е-оптимального метода можно взять
Pne — ivl' ■■ ->vn}> edev2t_l=a+i(b-a)/(m+\)-e, v2i=a+i(b-a)/(m+\)+e (г = 1 m,
0<e<(b-a)/(2(m+l))).
Доказательство. Сначала убедимся в том, что 6(рп) > (Ь — а)/(т + 1) для любого
пассивного метода рп = {Я|,..., жп} (xq = о^Ж| < ... < я:п ^ 6 = хп + |, п = 2т). Обозначим
х = а+ (Ь - а)/(т + 1). Имеются две возможности: либо 3¾ > ж, либо ж^ < ж. Если ж^ > ж, то
8(рп) = max (ж; + | — ж^_|)>Ж2 — о> ж — а= (Ь — а)/(т +1). Если же ж^ ^ ж, то 6(рп) =
I SC г ^ п
= max (ж.,,-ж. ,)>ж, — а. В самом деле, если бы max (ж.,,—ж. ,) < ж, — а, то ж,,- , i —
1<«<п +' 1<«^п г + ' »-"~ * ■" + '
— ж2«- 1 ^ 3¾ — a (i = 1,..., т) и, кроме того, Ж|• — а< ж^ - а. Сложив эти неравенства, придем
к противоречивому неравенству Ъ — а < (гп + 1)(ж2 - а) < (т + 1)(ж - a) = b - а.
Таким образом, при ж^ < ж" имеем <5(рп)= max (ж< + ] - х-_,) = <5(р^_ ]), где p'n_i —
пассивный метод на отрезке [Ж|, Ь ], составленный из точек ж^,..., хп метода рп. Но п— 1 = 2гп—
— I — нечетное число, поэтому, применяя теорему 1 к отрезку [ж], 6], имеем 6(р'и_ х) ^ (Ь —
— Ж])/гп. Тогда (5(рп) = <5(р^_ ])^(Ь-Ж])/т>(Ь—ж)/гп = (Ь-а)/(гп+1), Тем самым доказано,
что 8(рп)>(Ъ-а)/(т+1) при всех рп €Р2т. С другой стороны, S(pne) = (b - а)/(т+ 1)+е
для всех е (0 < е < (Ь - а)/(2(т + 1))). Следовательно, St = (b — а)/(т + 1). D
Из теорем 1, 2 вытекает, что предпочтительнее пользоваться пассивными методами с четным
числом п = 2т точек, поскольку в случае п — 2т+ 1 наилучшая гарантированная точность
остается такой же, как и при п = 2т.
§ 5. ОБ ОПТИМАЛЬНЫХ МЕТОДАХ
23
4. Перейдем к рассмотрению последовательных методов минимизации унимодальных
функций на [а, 6]. Здесь нам понадобятся знаменитые числа Фибоначчи, которые, как известно
[193], определяются соотношениями
^ + 2 = ^ + 1 + ^- n=l,2,..., Fx=F2 = l.
С помощью индукции легко показать, что n-е число Фибоначчи представимо в виде
,..((1^5)-.(1^)-]^ „_,,*... (3)
Используя числа Fn, построим n-точечный последовательный метод, который принято
называть методом Фибоначчи. Этот метод относится к классу симметричных методов, описанных
в § 4, и определяется заданием на отрезке [а, Ь] точки ж, = о+ (6 - a)Fn_ \/Fn + x или
симметричной ей точки x2 = a+b-xl — a+(b — a)Fn/Fn + x. С помощью индукции нетрудно показать,
что такой симметричный метод обладает свойством (4.4) и на fc-м шаге (к < п), когда
проведены вычисления значений функции в точках хх хк, приводит к отрезку локализации
минимума [ак, Ьк] длиной
Ak = h-4=(b-a)Fn-k+2/Fn+\'
причем точка хк (ак < хк < Ьк) с вычисленным значением f(xk) = min f(x-) совпадает с
одной из точек
4=4 + ^-4)^- = 4 + ^-^^,
гп - к + 2 гп + 1
** =¾+(¾ "°*)|^^ = в* + (Ь-°)%^^ =^+^-^.
гп-к+2 гп+1
(4)
расположенных на отрезке [а^., Ьк ] симметрично относительно его середины.
Как видно из (4), при к = п — 1 точки х'п_ х, х"_ х совпадают. Это означает, что при к = п— 1
первая часть процесса заканчивается вычислением значения функции в точке хп _ х и
определением отрезка локализации минимума [ап _], Ьп_ ,] длины bn_x — an_ \ = (b — a)F3/Fn+l =2(6-
- a)/Fn + l, причем точка ж^_, =х"_1 =хп_х совпадает с серединой отрезка [ап_,, Ьп_х].
В заключение, несколько нарушая симметричность процесса, последнее n-е вычисление
значения минимизируемой функции f(x) проводится в точке хп = хп _ , + е (или хп = х~п _ х - е),
где 0 < е < (Ь - a)/Fn+x, и отрезок [an, Ьп] локализации минимума определяется по
формулам o„ = on_,, Ьп = хп_1 + е при /(х„_,)</(х„_, +е) и оп = хп_,, Ьп=Ьп_, при
/(жп_1)>/(жп_] + е), так что в худшем случае 6n-on = (6-o)/i?n + Ii+e. Описанный метод
обозначим через Фп.
Теорема 3. При всех п > 1 оптимального последовательного метода на классе
унимодальных функций не существует; наилучшая гарантированная точность
последовательных методов на этом классе равна (b - a)/Fn + x. В качестве е-оптимального
метода можно взять метод Фибоначчи Фп.
Доказательство этой теоремы можно найти в [148; 374; 684].
Заметим, что число Fn_x/Fn+l, вообще говоря, является бесконечной периодической
десятичной дробью, поэтому первая точка ж, метода Фп будет задаваться на ЭВМ приближенно.
Во избежание быстрого роста погрешности из-за неточности задания первой точки на
практике нужно пользоваться модификацией метода Фп, описанной в § 4 для симметричных методов
в общем случае.
Следует подчеркнуть, что метод Фп для своей реализации требует, чтобы число п
вычислений значений минимизируемой функции было задано заранее — выбор первой точки в этом
методе невозможен без знания п. В тех случаях, когда число п по каким-либо причинам не
может быть задано заранее, можно применять метод золотого сечения, не требующий для
своей реализации априорного знания п.
Для сравнения вспомним, что методом золотого сечения за п вычислений значений функции
мы получали отрезок [ап, Ьп] локализации минимума длины bJl — an = ((л/5 - l)/2)n~ (Ь —
-а) = (2/(\/5+ 1))п-1(Ь-а). Сучетом формулы Fn + l и((\/5 + l)/2)n + ^/VS, вытекающей
из (3) при больших п, для метода Фп получаем отрезок локализации минимума, длина которого
близка к (b-a)/Fn + 1s«(2/(\/5+l))n + 1(b-a)/\/5. Отсюда следует, что метод золотого сечения
хуже метода Ф при больших п всего в ((\/5+ 1)/2)2/\/5= 1, 1708... раз, т. е. на классе
унимодальных функций метод золотого сечения близок к оптимальным методам. Интересно
24 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
также заметить, что
Ит К-1_3-У5 u Fn _у/Ь-1
т. е. при достаточно больших п начальные точки х^, :¾ методов Фибоначчи и золотого сечения
практически совпадают.
Упражнения
1. Найти гарантированную на классе унимодальных функций точность последовательного
(или пассивного) n-точечного метода рп, если в качестве погрешности метода рп при
минимизации функции / = f(x) принята величина Д(/, рп) = |/„ — /(яп)| [755].
2. Сравнить оптимальные и е-оптимальные пассивные методы на классе унимодальных
функций с методом деления отрезка пополам.
3. Указать все точки метода Фп на отрезке [0, 1] при п = 2, 3, 4, 5.
4. Применить метод Ф5 к функциям f(x) = х, f(x) = \х - 1| на отрезке [0, 2].
5. Найти наименьшее п, для которого точность метода золотого сечения хуже точности
метода Фибоначчи в 2 раза.
6. Доказать, что число Фибоначчи Fn является ближайшим целым числом к ((1 +
+ y/b)/2)n/Vb.
7. Доказать, что решение уравнения (4.1) представимо в виде Дп = (-l)nFn_, Д2 +
+ (— 1)п~ 'i? 2Д, (п = 3,4,...). Отсюда вывести закон изменения погрешности величины
Дп, если Д], Д2 заданы неточно.
8. Доказать, что последовательность {F2m/F2m + l} сходится к г, = (V5- 1)/2, монотонно
возрастая, a {F2m_ \/F2m} сходится к ц монотонно убывая.
9. Используя утверждения упражнений 7, 8, доказать, что метод золотого сечения является
единственным симметричным методом, удовлетворяющим условию (4.4) при всех п — 1, 2...
10. Пусть дан симметричный метод с начальными отрезками Д], Д2, пусть N ^ 2 — заданное
натуральное число. Используя утверждения упражнений 7, 8, указать промежуток изменения
отношения Д2/Д], чтобы метод удовлетворял условию (4.4) при всех п = 1,.,., N.
И. Пусть дан некоторый симметричный метод, удовлетворяющий условию (4.4) при п ~
= 1. Используя утверждения упражнений 7, 8, указать максимальное число N, при котором
условие (4.4) выполняется для всех п = 2,..•., N.
§ 6. Метод ломаных
Описанные выше методы часто приходится применять без априорного
знания о том, что минимизируемая функция является унимодальной.
Однако в этом случае погрешности в определении минимального значения и
точек минимума функции могут быть значительными. Например, применение
этих методов к минимизации непрерывных на отрезке функций приведет,
вообще говоря, лишь в окрестность точки локального минимума, в
которой значение функции может сильно отличаться от искомого минимального
значения на отрезке. Поэтому представляется важной разработка методов
поиска глобального минимума, позволяющих строить минимизирующие
последовательности и получить приближенное решение задач минимизации
первого и второго типов (см. § 1) для функций, не обязательно
унимодальных.
Здесь мы рассмотрим один из таких методов для класса функций,
удовлетворяющих условию Липшица.
§ 6. МЕТОД ЛОМАНЫХ
25
Определение 1. Говорят, что функция f(x) удовлетворяет условию
Липшица на отрезке [а, Ь], если существует постоянная L > О такая, что
\f(x)-f(y)\^L\x-y\ Wx,ye[a,b]. (1)
Постоянную L называют постоянной Липшица функции f(x) на [а, Ь].
Условие (1) имеет простой геометрический смысл: оно означает, что
угловой коэффициент (тангенс угла наклона) \f(x) — f(y)\ • \х — у\~х хорды,
соединяющей точки (ж, f(x)) и (у, f(y)) графика функции, не превышает
постоянной L для всех точек х, у е [а, Ь]. Из (1) следует, что функция f(x)
непрерывна на отрезке [а, Ь], так что по теореме 1.1 множество Xt точек
минимума f(x) на [а, Ь] непусто.
Теорема 1. Пусть функция f(x) непрерывна на отрезке [а, Ь] и
на каждом отрезке [ai} di + 1] (г = 1,..., т), где а, = а, ат + 1 = Ь,
удовлетворяет условию (1) с постоянной L-. Тогда f(x) удовлетворяет
условию (1) на всем отрезке с постоянной L = max Lt.
Доказательство. Возьмем две произвольные точки х,уе[а,Ь].
Пусть ар_ , :¾ х ^ ар, а„ ^ у ^ as +, при некоторых р, s. Тогда
\f(x)-f(y)\ = \f(x)-f(ap)+E(f(ctt)-f(at + l))+f(as)-
-f(y)\^Lp_l\x-ap\+ 'f:L{(al + l-a{) + L,\a.-y\^ L\x - у\. □
«=p
Теорема 2. Пусть функция f(x) дифференцируема на отрезке
[а, Ь] и ее производная f'(x) ограничена на этом отрезке. Тогда f(x)
удовлетворяет условию (1) с постоянной = sup |/'(ж)|.
Доказательство. По формуле конечных приращений для любых
х,у£ [а, Ь] имеем f(x) - f(y) = f'(y + в(х - у))(х - у) (О < в < 1). Отсюда
и из ограниченности f'(x) следует утверждение теоремы. □
Пусть функция f(x) удовлетворяет условию (1) на отрезке [а, Ь].
Зафиксируем какую-либо точку у £ [а, Ь] и определим функцию д(х, у) = f(y) -
-L\x-y\ переменной х (а^х^Ь). Очевидно^функция д(х, у) кусочно
линейна на [а, 6], и график ее представляет собой ломаную линию,
составленную из отрезков двух прямых, имеющих угловые коэффициенты L и — L
и пересекающихся в точке (y,f(y)). Кроме того, в силу условия (1)
f(x)-g(x,y)>(L-\f(x)-f(y)\\x-y\-l)\x-y\ZO, хфу,
Т'е' 9(x,y) = f(y)-L\x-y\^f(x) Ухе[а,Ь], (2)
причем д(у, y) — f(y). Это значит, что график функции f(x) лежит выше
ломаной д{х, у) при всех х е [а, Ь] и имеет с ней общую точку (у, f(y)):
Свойство (2) ломаной д(х, у} можно использовать для построения
следующего метода [257], который назовем методом ломаных. Этот метод
начинается с выбора произвольной точки Xq е [о, Ь] и составления функции
g(x, х0) = /(¾) - L \х - Xq\ = Ро(х). Следующая точка ж, определяется из
условий pJx^ = min р0(х) (ж, е [а, 6]); очевидно, ж, = а или ж, = Ь. Далее
26 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
берется новая функция рх(х) = тах{д(х,х1);р0(х)}, и очередная точка 2¼
находится из условий ^,(¾) = min рх(х) (¾ е [а, о]) и т. д. (рис. 1.2).
х e\a, Ь\
Пусть точки Xq, ж,, ..., хп (п ^ 1) уже известны. Тогда составляется
функция
Рп(х) = тах{д(х, хп), рп_ х(х)} = max д(х, х.),
и следующая точка хп + х определяется условиями
Pn(xn + i)= m}nh.Pn(x)> ^-цбК Ь].
(3)
Если минимум рп(х) на [а, Ь] достигается в нескольких точках, то в качестве
хп , , можно взять любую из них.
Метод ломаных описан. Очевидно, рп(х) является кусочно линейной
функцией и график ее представляет собой непрерывную ломаную линию,
состоящую из отрезков прямых с угловыми наклонами L или — L. Из
теоремы 1 следует, что рч(х) удовлетворяет условию (1) с той же постоянной
L, что и функция f(x). Ясно также, что
Pn-i(x) = n max ,9(& xi)^nm.ax д(х, х() = рп(х), , ж е [а, 6]. (4)
Кроме того, согласно (2) функция д(х, xt) ^ f(x) (х е [а, Ь]) для всех i =
= 0, 1,..., п, поэтому
Р„(ЖК Дж). же [а, Ь],
п = 0,1,... (5)
Таким образом, на каждом
шаге метода ломаных
задача минимизации функ-
* ции f(x) заменяется
более простой задачей
минимизации кусочно
линейной функции рп(х),
которая приближает f(x)
снизу, причем согласно (4)
{рп(х)} монотонно
возрастает. Докажем теперь,
Рис. 1.2. ABC — график д,(ж) = г(ж, :¾). Л, В, —график что при неограниченном
Ро(х) == а(х, х\)< ЛВС,в,— график р,(ж), А2в2с2 — гра- увеличении п метод лома-
фик д(х, 3¾). ABD2B2E2BX — график р2(х) ных СХОДИТСЯ.
Теорема 3. Пусть f(x) — произвольная функция,
удовлетворяющая на отрезке [а, Ь] условию (Г). Тогда последовательность {хп},
полученная с помощью описанного метода ломаных, такова, что:
1) \im f(xn)= \im pn(xn+l)=ft= inf f(x), причем справедлива оценка
, n —too n —too 2:6^,61
0 ^ /K+l) -/* ^ /K+l) - Pn(Zn+l)>
= 0,1,
(6)
2) {xn} сходится к множеству Xt точек минимума f(x) на [a, b], т. е.
lim p(xn,Xt) = 0.
§ 6. МЕТОД ЛОМАНЫХ
27
Доказательство. Возьмем произвольную точку ж, е Xt. С
учетом условий (3) и неравенств (4), (5) имеем рп„\(хп) = min pn_i(x)^.
^Pn-i(xn + l)^pn(xn + l) = min. pn(x)^pn(xt)^f(xt) = ft, т. е. последова-
тельность {рп(хп + 1)} монотонно возрастает и ограничена сверху. Отсюда
сразу следует оценка (6) и существование предела lim pn(xn + l) = pt%[ft.
Покажем, что pt = ft, п^°°
Последовательность {х } ограничена и по теореме Больцано — Вейер-
штрасса обладает хотя бы одной предельной точкой. Пусть % — какая-
либо предельная точка последовательности {хп}. Тогда существует
подпоследовательность {хп }, сходящаяся к %, причем можем считать, что
n,<...<nn_, < пк <./. Заметим, что f(xi) = g(xi,xi)^pn(xi)^.f(xi), т. е.
/(Х) = рп(ж;)привсехг'=0, 1,..., п. Тогда(Крп(^)- m}n.Pn(x) = f(xi)-
- Рп(хп + \) = Pn(xi) - Рп(хп + \) ^ L\xi - xn + i\ при любом п и г=0, 1,...,тг.
Принимая здесь п = пк — 1, г = пк_х ^ пк — 1, получаем 0 ^ f(x ) -
-Рпк-\(хпк) < L\xnk , _ хпк\ (к ■£ 2)- Отсюда при к -> оо имеем /t ^ /(%) =
= lim /(¾ ,)= limp ,*(avj = ft</., т. е. lim /(ж ) = lim ^_,(z ) =
= pt = /t. Пользуясь тем, что рассуждения проведены для произвольной
предельной точки % последовательности {хп}, убеждаемся в
справедливости первого утверждения теоремы. Второе утверждение следует из
теоремы 1.1. □
Таким образом, с помощью метода ломаных можно получить решение
задач минимизации первого и второго типов для функций,
удовлетворяющих условию (1). Проста и удобна для практического использования
формула (6), дающая оценку неизвестной погрешности f(xn + l) — ft через
известные величины, вычисляемые в процессе реализации метода ломаных.
Этот метод не требует унимодальности минимизируемой функции, и,
более того, функция может иметь сколь угодно точек локального экстремума
на рассматриваемом отрезке. На каждом шаге метода ломаных нужно
минимизировать кусочно линейную функцию ph(x), что может быть сделано
простым перебором известных вершин ломаной рп(х), причем здесь
перебор существенно упрощается благодаря тому, что ломаная рп(х) отличается
от ломаной pn_i(x) не более чем двумя новыми вершинами. К достоинству
метода относится и то, что он сходится при любом выборе начальной точки
Хо-
К недостаткам метода ломаных следует отнести то, что с увеличением
числа шагов п растет требуемый объем памяти ЭВМ для хранения координат
вершин ломаной рп(х). В § 7 будет рассмотрен другой метод, по своей идее
близкий к методу ломаных, но предъявляющий менее жесткие требования
к объему памяти и более удобный для реализации на ЭВМ.
Следует также отметить, что метод ломаных невозможно реализовать без
знания постоянной L из условия (1). На практике оценку для L
получают, вычисляя угловые коэффициенты некоторого числа хорд, соединяющих
точки графика минимизируемой функции. Здесь полезно иметь в виду, что
если и <v < w, то :■{'
\f(w)-f(u)\/(w-u) < тах{|/(го)-/(«)|/(го-«); |/(«)-/(u)|/(«-t*}},,(7)
т. е. при добавлении новой точки на отрезке [и, w] появляется новая хорда
с неменьшим угловым коэффициентом.
28 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Для доказательства (7) нужно рассмотреть два случая, когда неравенство
f(v)>(f(W)-f(u))(v-u)/(w-u) + f(u) (8)
выполняется и когда оно не выполняется. Если /(ги) > /(■") и (8)
выполняется, то (/(г>)-/(и))/(г>-и)^(/(ги)-/(и))/(ги-и)^0; если /(ги)^/(и)
и'(8) не выполняется, то (/(ги) — f(v))/(w — v) ^ (/(гу) —/(и))/(ги — u) >0.
Аналогично доказывается (7) в случае /(ги) </(и).
Пусть а= v0 < vi<...<vm = b; обозначим Lm= max |/(ч)-/(ч_,)|-К-
1 ^ г ^ m
— vi_x\~i. Ясно, что Lm ^ L. Пусть при каждом т > 1 величина Lm + l
вычисляется по точкам а = w0 < ги, < ... < гит+1 = Ь, полученным
добавлением к точкам г>0, w,,..., wm одной новой точки. Тогда согласно (7) имеем
Lm^Lm + i ¢. L (m^l). Это значит, что с возрастанием т величины Lm
все лучше и лучше приближают L снизу. Если max \v{ - w._,| —> 0 при
m —» оо, то lim Lm = L. Приведенные соображения могут помочь в полу-
т~4 оо
чении оценки для L. При определении L могут быть полезны теоремы 1,2.
Следует заметить, что использование завышенной оценки для L
ухудшает скорость сходимости метода ломаных, приводит к излишне большому
количеству вычислений значений минимизируемой функции. Если же
пользоваться заниженной оценкой для L, то метод может привести к
неправильному определению приближения минимального значения.
Упражнения
1. Привести пример функции, которая удовлетворяет условию (1), но не является
унимодальной.
2. Можно ли утверждать, что всякая унимодальная на отрезке [о, 6] функция удовлетворяет
условию (1) на [а, 6]? Рассмотреть пример функции f(x) = л/х на [0,1].
3. Рассмотреть первые шесть шагов метода ломаных для функций /(as) — ||ж2 ^- 1| — 1| на
отрезке [—2, 2] при различном выборе начальной точки 3¾.
4. Выяснить, как ведет себя метод ломаных при минимизации функции f(x)= 1 на отрезке
[0,1].
5. Пусть f(x) = dnxn+.. .-t-'ajX'+Oo — многочлен n-й степени на отрезке [а, 6], где0<а<6.
Обозначим
А+ = {г: 0 < г < п, а{ > 0}, А' = {г: 0 < г ^ п, а{ < 0},
/+(*)= E.V, /_(*)= Е. 1»41*'-
'" ' " ' ieA+ ieA" ' ,! ' !
Доказать, что f(x) — f+(x) — f_(x), а в качестве постоянной L из условия (1) для функции
f(x) на [а, 6] можно взять величину thax{f+(b) — f!_(a); \f[(a) - fL(b)\} [214].
§ 7. Методы покрытий
1. Обозначим через Q(L) класс функций, удовлетворяющих условию
Липшица (6.1) на отрезке [а, 6] с одной и той же для всех функций
этого класса постоянной L > 0. Для функций / = f(x) е Q(L) будем
рассматривать задачу минимизации первого типа, когда ищется величина
/„ = inf f(x). Для решения этой задачи будем пользоваться методами рп,
х 6 [а, Ь] ] ,
которые заключаются в выборе точек ж,,..., хп (а< ж, < .,. < хп ^ 6), вычи-
§ 7. МЕТОДЫ ПОКРЫТИЙ
29
слении значений функции /(ж,),..., /(¾) и определении величины f(xk) =
= min /(¾). принимаемой за приближение к /„.
Возникает вопрос: как выбрать метод рп = {ж,,..., хп}, чтобы
min /foK/. + e Wf(x)€Q(L), (1)
1 $1 ^ 71
где е > О — заданная точность? Ниже будет изложено несколько методов
решения поставленной задачи (1). В каждом из этих методов
определенным образом строится некоторая система отрезков, покрывающих исходный
отрезок [а, Ь], и вычисляются значения функции в подходящим образом
выбранных точках этих отрезков. Поэтому излагаемые ниже методы принято
называть методами покрытий.
2. Простейшим методом рп для решения задачи (1) может служить метод
равномерного перебора, когда точки х1,...,хп выбираются по правилу
xl=a+h/2, x2 = xl + h, ..., xi + l=x{ + h = xt + ih,...,
xn_1 = x1+(n-2)h, xn = mm{xi+(n-l)h;b},
где h = 2e/L — шаг метода, а число n определяется условием жп_, < b —
-/i/2<Zi+(n-l)/i.
Теорема 1. Метод равномерного перебора (2) решает задачу (1)
на классе Q(L). Если h > 2e/L, то существует функция /(ж) е Q(L),
для которой метод (2) не решает задачу (1).
Доказательство. Пусть / = /(ж)— произвольная функция из
Q(L). С учетом неравенства (6.2) для любого х е [х{ — h/2, х{ + h/2] имеем
f(x)^f(x{) — L\x — xi\^f(xi) — Lh/2'Z min /(ж,)- е при всех г = 1,. .., п.
Поскольку система отрезков [х. — h/2, х{ + h/2] (г = 1,..., п)
покрывает весь отрезок [а, Ь], т. е. всякая точка х из [а, Ь] принадлежит
одному из отрезков этой системы, то из предыдущего неравенства следует,
что /(ж) ^ min /(¾) — е для всех х G [а, Ь]. Поэтому /„■>-. min /(¾) — е
для любой функции / = /(¾) е Q(L), что равносильно неравенству (1).
Если h>2e/L, то, например, для функции f(x) = Lx метод (2) дает
min (Lж,) - La = Lh/2 > е. □
1 < i < п ''
3. Метод равномерного перебора (2) относится к пассивным методам,
когда точки ж,,..., хп задаются все одновременно до начала вычислений
значений функции. На классе Q(L) можно предложить такой же простой, но
более эффективный последовательный метод перебора, когда выбор точки
ж; при каждом г > 2 производится с учетом вычислений значения функции в
предыдущих точках ж,,..., xi_i, и задачу (1) удается решить, вообще
говоря, за меньшее количество вычислений значений функции, чем методом (2).
А именно, следуя [286], положим
xl = a+h/2, xi + l = x. + h + (f(x.)-Fi)/L, г = 1,...,п-2,
жп = тт{жп_1 + /1+(/(жп_1)-^-1)А^}. U
где h = 2e/L, F( = min /(жу), а число n определяется условием жп_ Х<Ъ —
-h/2^xn_l + h + (/(£„_,) -^_,)/Ь.
30 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
система отрезков
весь отрезок "
при всех х е
Теорема 2. Метод последовательного перебора (3) решает
задачу (1) на классе Q(L).
Доказательство. Пусть / = f(x) — произвольная функция из
Q(L). С учетом неравенства (6.2) для всех х е[ж;, xi + h/2 + (f(xi)-Fi)/L]
имеем f(x)^f(xi)-L(h/2+(f(xi)-Fi)/L) = Ft-Lh/2.>Fn-e. Аналогично
для всех х е [ж,. - h/2, хЛ получим fix) ^ /(¾) - L h/2 > Fn - е. Поскольку
'x^h/2, ^ + /г/2+(/(а5;)-^)/Ь] (г = 1,..., п) покрывает
, то из предыдущих неравенств следует, что /(¾) ^ Fn - е
. Тогда /„ ^ Fn - е при всех / = /(¾) е Q(L), что
равносильно неравенству (1). □
В худшем случае, когда, например, функция /(¾) постоянна или
монотонно убывает на [а, Ь] и, следовательно, F{ = min /(¾) = /(¾). метод (3)
превращается в метод (2), и для решения задачи (1) тогда потребуется
jV, и (6 - a)L/(2e) вычислений значений функции. В самом лучшем
случае, когда /(ж) = A + L(ж - В), где А, В — постоянные и, следовательно,
F. = /(¾). х, = ¾ +(2*-' - \)h (г = 1,..., п-2), для решения задачи (1)
понадобится всего iV2« l+log2(6-a)L/(2e) вычислений значений функции.
И вообще, если /(¾) > PJ при каком-либо i,to xi + l-x{>h, и поэтому
число п вычислений значений функции, необходимое для решения задачи (1),
будет, вообще говоря, меньше Nx и больше N2.
Заметим также, что метод (3) идейно примыкает к методу ломаных из
§ 6, но метод (3) выгодно отличается простотой реализации и не требует
большой машинной памяти. Недостатком метода (3), как и метода ломаных,
является необходимость априорного знания постоянной L из условия (6.1).
4. Следуя [590], изложим еще один вариант метода покрытий для
решения задачи (1). Пусть зафиксирована сетка точек (2) с шагом h =
= 2e/L. Выберем две произвольные точки ?;,, v2 этой сетки, вычислим
значения /(^),/(¾) МИНИМИЗИруеМОЙ фуНКЦИИ И ПОЛОЖИМ F, =/(^))-^2 =
= min{Fl; /(u2)} = min{/(v,), /(¾)}. Имеются две возможности: либо F2 =
= /(¾) < Fu либо F2 = F, ^ /(¾). Если F2 < F{, то из дальнейших
рассмотрений исключаем точку «, вместе с теми точками xj сетки (2), для
Тр Тр
которых |аз3- — «,| ^ -l L 2, не вычисляя значений /(¾). Если F2 = Fv то
исключаем точку v2 вместе с точками xj сетки (2), для которых 1¾ - %| ^
< 2т~ '. Начальный шаг метода описан. Опишем общий шаг. Пусть в
точках «,, «2,.. <., wfc сетки (2) уже вычислены значения /(«,), /(¾)). ■., /(¾).
найдена величина Fk = min{Fk_l; f(vk)} = min f(v{), и пусть ?^ та из
точек «,, «2,..., wfc, в которой Fk =f{Vj) = m.in /(¾). Далее возьмем любую
точку vk + i сетки (2), которая на предыдущих шагах не исключалась и в
которой еще не вычислялось значение функции f(x). Вычислим f(vk + l) и
величину Fk + i = min{Fk; f(vk + l)} = min /(¾). Имеются две
возможности: либо Fk + i = /К + 1) < i5!, либо Д + , = Fk ^ f(vk + i). В первом случае,
когда Fk +, < Fk, из дальнейших рассмотрений исключим точку ^ и вместе
с нею те точки xj сетки (2), для которых
\хз vjk\^ L • W
Заметим, что некоторые из этих точек могли оказаться исключенными уже
на предыдущих шагах. Для нас здесь важно лишь то; что среди исклю-
§ 7. МЕТОДЫ ПОКРЫТИЙ
31
ченных точек заведомо нет таких, в которых значение функции /(ж) было
бы меньше, чем Fk + l. В самом деле, прежде всего f(\) = Fk > Fk + i. Для
остальных исключенных точек xj имеем: /(жу) — Fk + l= /(¾) ~ /(1¾) + -^ ~
_ Fk +1 ^ —Ь\х}- - Vj\ + Fk — Fk + l ^ 0 в силу (6.2) и (4). Таким образом,
без дополнительных вычислений значений функции /(ж) мы сумели
выяснить, что исключенные точки не являются перспективными с точки зрения
получения в них значений функции, меньших Fk + i.
Рассмотрим вторую возможность, когда Fk + l = Fk^f(vk + l). Тогда из
дальнейшего перебора исключаем точку vk + l вместе с точками ж,, сетки (2), для
которых
1^-^,1^^- (5)
Нетрудно убедиться, что и в этом случае в исключенных точках значения
функции не могут быть меньше Fk + l. В самом деле, здесь /(¾.) - Fk + i =
= f(x])-Fk=f(x.)-f(vk + i)+f(vk + i)-Fk>-L\x.-vk + l\+f(vk + l)-Fk>0
в силу (6.1) и (5). Общий шаг метода описан.
Так как на каждом шаге метода берется новая точка сетки (2), которая
еще не исключена из перебора и в которой значение функции /(ж) еще
не вычислялось, то ясно, что на каком-то шаге такие точки будут
исчерпаны и описанный процесс закончится за N шагов, N < п, перебором точек
«,, «2,..., vN сетки (2) и вычислением FN— min f(v{)= min /(¾).
Теорема 3. Пусть сетка точек {ж,,..., жп} определены
согласно (2), пусть /(ж) — произвольная функция из класса Q(L).
Тогда найденная методом последовательного перебора (4), (5) величина
FN= min F(x4) решает задачу (1).
1 ^ г ^ п
Доказательство. Поскольку система отрезков [х{ — h/2, х{ + /г/2],
а, Ь], то для любой точки ж е [а, Ь]
х - ж,| < /г/2- Тогда /(ж) = /(ж)
г = 1,..., п, образует покрытие отрезка
найдется точка х- сетки (2) такая, что
-f(xj)+f(x:j)^-L\x-xj\+FN^-Lh/2+FN=FN-e цдялюбот же [о, Ь].
Следовательно, /„ > FN — е, т. е. выполняется неравенство (1). Теорема 3
доказана. □
Метод (4), (5), как и метод (3), в худшем случае может превратиться в
метод простого перебора точек сетки (2). В то же время ясно, что для
многих функций /(ж) е Q{L) этот метод гораздо эффективнее метода простого
перебора, так как если величины Fk — Fk+X, /(¾+ 1) - Fk в (4), (5)
достаточно большие, то многие точки сетки (2) могут оказаться исключенными
из перебора без вычисления в них значений функции.
К методу покрытий мы еще вернемся в § 5.13.
Упражнения
1. Пусть одним из вышеописанных методов покрытий найден min f(x.) = /(¾). Можно
1 ^ г ^ п
ли принять хк за приближение к множеству Xtl Оценить погрешность p(xk,Xt) для
метода (2) на классе Q(L); рассмотреть функцию f(x) = L(x- а) - е/2 при а^.х^.а-\- e/L,
f(x)= e(b-x)/(2(b-a~e/L)) при а+е/< ж < 6, где е> 0 —малое число. Оценить р(хк, Xt)
для методов (3) и (4), (5) на классе Q(L).
2. Найти оптимальный пассивный и оптимальный последовательный методы на классе
функций Q(L) [218; 671; 755].
32 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
§ 8. Выпуклые функции одной переменной
Рассмотрим класс функций, для которых существует более эффективный
вариант метода ломаных, когда ломаные составляются из отрезков
касательных и лучше аппроксимируют минимизируемую функцию. Речь идет о
выпуклых функциях, играющих важную роль в теории экстремальных задач.
Определение 1. Функция f(x), определенная на отрезке [а, Ь],
называется выпуклой на этом отрезке, если
f(au+(l-a)v)^af(u) + (l-a)f(v) (1)
при всех и, v £ [a, b], a £ [0, 1].
Когда а пробегает отрезок [0, 1], точки (cm+(l — a)v, af(u)+(l — a)f(v))
на плоскости переменных
(ж, /) пробегают хорду АВ,
соединяющую точки А =
= (н,/(н)) и В =(«,/(«))
на графике функции / =
— f(x). Поэтому
неравенство (1) имеет простой
геометрический смысл: график
выпуклой функции на
любом отрезке [и, v] С [а, Ь]
находится не выше хор-
х ды, соединяющей точки гра-
— : —_____ ■ > фика (u,f(u)) и (v,f(v))
v и w (рис. 1.3). Примерами функ-
р , 3 ций, выпуклых на любом
отрезке, могут служить
функции f(x) = х2, f(x) = \х\, f(x) = х. Наряду с выпуклыми функциями в
литературе рассматривают вогнутые функции.
Определение 2. Функция f(x) называется вогнутой на отрезке
[а, Ь], если
f(au+(l-a)v)^af(u) + (l - a)f(v)
при всех и, v £ [а, Ь], а £ [0, 1].
Между выпуклыми и вогнутыми функциями существует простая связь:
если f(x) вогнута на [а, Ь], то —f(x) выпукла на этом же отрезке. Учитывая
эту связь, достаточно ограничиться изучением свойств выпуклых функций.
Теорема 1. Для выпуклости функции f(x) на отрезке [а, Ь]
необходимо и достаточно, чтобы
(/(«)-/(«))/(«-«) ^ (f(w)-f(v))/(w-v) ^ (f(w)-f(u))/(w-u) (2)
при всех u,v,w, a^.v<u<w^.b.
Доказательство. Необходимость. Пусть функция f(x)
выпукла на [а, Ь]. Нетрудно проверить, что и = av + (1 — a)w, где a ={w —
— u)/(w — v) (0< а < 1). Отсюда с учетом выпуклости функции f(x) имеем
/(и) < (ги — u)f(v)/(w — v) + (1 — (ги — u)/(w — v))f(w), или
(ги - v)f(u) ^ (ги - и)/(г>) + (и - v)f(w).
§ 8. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ
33
Последнее неравенство можно переписать в двоякой форме:
(w - v)(f(u) - /(«)) ^ (и - «)(/(«,) - /(«)),
ИЛИ
(w-u)(/(w)
откуда будет следовать (2).
Достаточность. Пусть f(x) удовлетворяет одному из
неравенств (2). Отправляясь от этого неравенства и проделав предыдущие
преобразования в обратном порядке, убеждаемся в том, что f(x) выпукла на
отрезке [а, Ь]. О
Нетрудно понять геометрический смысл неравенств (2) (см. рис. 1.3),
если вспомнить, что (f(u) — f(v))/(u — v) представляет собой угловой
коэффициент хорды АВ, соединяющей точки А =(и, f(u)) иВ=(«, f(v)) на
графике функции / = /(ж).
Теорема 2. Выпуклая на отрезке [а,Ь] функция f(x) в
каждой внутренней точке и отрезка [а, Ь] непрерывна и имеет конечную
правую производную lim (f(u + h)-f(u))/h=f'(u+0), конечную левую
А-.+0
производную lim (/(u)-/(u-t))/t = /'(u-0), причем /'(и-0)</'(и+0)
!{п))/т (3)
.+0
при всех и е (а, Ь).
Доказательство. Из теоремы 1 следует, что
(/(«) ~ /(« - т))/т ^ (/(н) - /(н - h))/h ^
^(f(u+h)-f(u))/h^(f(u+T)
при всех т, h, лишь бы 0 < h < т и точки и, и ± /i, и ± т G (а, 6) (рис. 1.4).
Неравенства (3) означают, что величина (/(u + /i) — f(u))/h
монотонно убывает при убывании h
и ограничена снизу,
например, величиной (f(u)—f(u +
+ т))/т, не зависящей от
h. Отсюда следует
существование правой производной
f'(u + 0). Аналогично
доказывается существование
левой производной /'(и — 0).
Из (3) при h-> + 0
получаем неравенство /'(и — 0) ^
^ /'(и + 0)- Из
существования левой и правой
производных следует
непрерывность функции f(x) при всех
значениях х G (а, 6). □
Заметим, что на концах отрезка [а, Ь] выпуклая функция может не иметь
соответствующей односторонней производной и, более того, здесь она
может терпеть разрыв.
Пример 1. Пусть f(x) = х при 0 < х < 1, /(0) = /(1) = 2. Очевидно,
эта функция выпукла на [О, 1], но на концах отрезка терпит разрывы.
Пример 2. Функция f(x) = —\/\ — х2 выпукла и непрерывна на
отрезке [—1, 1], но на концах отрезка не имеет конечных производных /'(1 —
-0),/(-1+0).
Рис. 1.4
34 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Теорема 3. Пусть функция f(x) выпукла на отрезке [а, 6] и имеет
конечные производные /'(а + 0), /'(6 — 0). Тогда
/'(а + 0)(н - v) < /(h) - /(«) < /'(6 - 0)(н - v) (4)
при всех u,v (а< v ^ и ^ 6), так что f(x) на [а, 6] удовлетворяет
условию Липшица (6.1) с постоянной L =max{|/'(a + 0)|; \f'(b-0)\}.
Доказательство. Из теоремы 1 имеем
(/(«+ h) - f(a))/h ^ (f(v) - f(a))/(v - а) £
< (/(«) - /(«))/(« - «К (/(Ь) - /(«))/(& - «) < (Я*) ~ f(b ~ h))/h
для всех h>0, а+ h <v <и < 6 — h. Отсюда при h —> +0 получаем
/'(« + 0) < (/(«) - /(«))/(« -«) < /'(Ь - 0).
что равносильно (4) при любых и, v (а< v < и < 6). Неравенства (4)
остаются верными также и при v = а или и = Ь, так как при выполнении условий
теоремы функция f(x) непрерывна во всех точках отрезка [а, 6] и в (4)
можно совершить предельный переход при v —> а + 0 или и —> 6 — 0. □
Пример 2 показывает, что конечность величин /'(а + 0), /'(6-0)
существенна для выполнения условия Липшица (6.1).
Теорема 4. Пусть функция f(x) выпукла на отрезке [a, b], a l(v) —
любая функция, удовлетворяющая неравенствам f'(v-0) < /(«) ^ /'(«+
+ 0) /г/ж а< г; < 6. Тогда l(v) не убывает при v е (а, 6) и справедливо
неравенство
/(«)£/(«)+ *(«)(«-«), ие[а,Ь]. (5)
Бела, кроме того, f(x) дифференцируема во всех точках отрезка [а, 6],
то
/(«)£/(«) + /'(«)(«-«). «е [а, 6], (6)
при любож г; е [а, 6]. Бела неравенство (5) (ала (6)) обращается в
равенство при некотором и = с € [а, 6] (c^v), то f(u) = f(v) + l(v)(u — v)
при всех и из отрезка [с, г;].
Доказательство. Перепишем неравенство (1) в виде f(v + а(и —
-v))-f(v)^ a(f(u)-f(v)) (0< а < 1). Разделив обе части этого
неравенства на а и перейдя к пределу при а —> +0, получим /(и) - /(и) > /'(«"+
+0)(и-г;)^г(?;)('и-7;) при и>« и f(u)-f(v)^ f'(v-0)(u-v)^l(v)(u-b)
при u < w. Неравенство (5) доказано. Заметим, что при а<и < 6
переменные и, г; в (5) входят равноправно, поэтому, меняя их ролями, получаем
f(v) ^ /(u) + Z(u)(w - и) при всех v G [а, 6]. Сложим последнее
неравенство с (5) почленно. Будем иметь (l(u)-l(v))(u-v)^0 при всех и, ve(a, 6),
что равносильно монотонному возрастанию l(v).
Пусть теперь f(x) дифференцируема во всех точках х £ ['о, 6]. Тогда
/'(и + 0) = /'(и - 0) = /'(и) при всех и е [а, 6]. Полагая в (5) l(v) = /'(«),
убеждаемся в справедливости неравенства (6) при всех и б (о, 6). Из
существования конечных функций /'(а+0), /'(6-0) и из (4) следует, что (6)
верно и при v = a, v — Ь.
Наконец, пусть /(с) = f(v) — l(v)(c - v) при некотором с е [а, 6] (с ^ ь).
Возьмем произвольную точку и = ас + (1 — а)« из отрезка [с, «].- Из
выпуклости f(x) тогда следует, что /(и)^ а/(с) + (1-0!)/(г;) = а(д«)-Н(«)(с-
-г;))+(1-о!)/(г;)=:/(г;)+г(г;)(и-г;) (и£[с, v]). Сравнивая это неравенство
с (5), заключаем, что f(u)=f(v)+l(v)(u-v) при всех и е [с, г;]. □
§ 8. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ
35
График линейной функции f(v) + f'(v)(u — v) переменной и е [а, 6]
представляет собой касательную к графику / = f(x) в точке v. Поэтому
неравенство (6) означает, что график любой выпуклой дифференцируемой
функции лежит не ниже любой касательной к нему. Обобщая понятие
касательной на случай выпуклых недифференцируемых функций,. прямую
д(и, v) = f(v) + l(v)(u - v), где f'(v - 0) < l(v) ^. f'(v + 0), также будем
называть касательной к графику / = f(x) в точке v.
Следствие 1. Пусть функция f(x) выпукла на [а, 6]. Тогда
производные f'(u + 0), f'(u — 0) монотонно возрастают при и е (а, 6) (если
существуют конечные /'(а + 0), /'(6 — 0), то утверждение справедливо
на всем отрезке [а, 6]).
Доказательство этого утверждения непосредственно следует из
теоремы 4, если в ней принять l(v) = f'(v +0) или l(v) = f'(v — 0).
Теорема 5. Пусть функция f(x) выпукла на отрезке [а, Ь] и
lim f(x) = f(a), lim f(x) = /(6). Тогда множество Xt точек ее гло-
aj—ta + O я: —* b — 0
бального минимума на [а, 6] непусто и все точки локального минимума
f(x) принадлежат Xt. Для того чтобы xt е Xt, необходимо и
достаточно, чтобы
f'(xt+0)>0, /4¾-0К0. (7)
(если xt = a или xt = b, то (7) заменяется одним неравенством /'(а+0) ^0
или /'(6 - 0) :¾ 0 соответственно).
Доказательство. Из условий на функцию f(x) и теоремы 2 следует
непрерывность f(x) на [а, 6]. Согласно теореме 1.1 тогда множество Xt
непусто. Пусть xt — какая-либо точка локального минимума f(x). Тогда
f(xt+h)—/(ж4)>0при всех достаточно малых \h\, для которых xt+he[a, 6].
Разделив это неравенство на/г>0и/г<0и устремив h к нулю, получим
условие (7). Заметим, что существование и конечность f'(xt±0) при а<
<xt<b следует из теоремы 2. Если xt = а, то существование и конечность
/'(а + 0) следует из того, что (f(a+h) — f(a))/h монотонно убывает при
/1-»+0и ограничена снизу нулем. Аналогично доказывается существование
и конечность /'(6—0) при xt — 6. Таким образом, показано, что всякая точка
локального минимума необходимо удовлетворяет условиям (7).
Пусть теперь некоторая точка xt е (а, 6) удовлетворяет условию (7).
Положим в неравенстве (5) v = xt, l(v) = 0 и получим, что f(u) ^ f(xt) при
всех и е [а, 6]. Это значит, что xt е Xt. Аналогично с использованием
неравенств (4) рассматриваются случаи xt = а или xt = 6 и показывается, что
xtE Xt. Отсюда следует, что всякая точка локального минимума выпуклой
и непрерывной на [а, 6] функции является точкой ее глобального минимума
на [а, 6]. □
Теорема 6. Пусть функция f(x) выпукла на отрезке [а, 6] и
lim f(u) = f(a), lim f (и) = f(b); пусть Xtr—множество точек ми-
u-ia + 0 u-t 6-0
нимума f(x) на [а, 6] и v — некоторая точка (а < v < 6). Тогда для
того чтобы Xt П [a, v] = 0 (Xt П [v, b] = 0), необходимо и достаточно
выполнения неравенства f'(v + 0) < 0 (f'(v - 0) > 0). Для того
чтобы Xt П [a, v] ф 0 (Xt П [v, 6] ф 0), необходимо и достаточно, чтобы
/'(« + 0)^0 (/'(«-0)^0).
Доказательство. Достаточность. Пусть f'(v + 0) < 0. Тогда
согласно следствию 1 f'(u + 0) < 0 при всех и G [a, v]. Из теоремы 5 тогда
имеем Xtn[a, v] = 0. Если f'(v-0)>0, то аналогично получаем /'(и-0)>0
при всех и £ [v, b], так что Xt П [v, 6] = 0.
36 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
Необходимость. Пусть Xt П [a, v] = 0. Допустим, что f'(v + 0) > 0.
Тогда возможно, что f'(v — 0) < 0 или f'(v — 0) > 0. Если f'(v — 0) ^ 0, то
из (7) следует, что v е Xt. Если же f'(v — 0) > 0, то по доказанному выше
Xt П [v, b] = 0 и, следовательно, Х„ П [a, v] ф0. В обоих случаях приходим
к противоречию с тем, что Xt П [a, v] = 0. Это значит, что при Xt П [a, v] =
= 0 необходимо, чтобы f'(v + 0) < 0. Аналогично доказывается, что если
Xt П [v, b] = 0, то необходимо, чтобы f'(v — 0) > 0.
В справедливости последнего утверждения теоремы 6 легко убедиться
рассуждением от противного со ссылкой на уже доказанное первое
утверждение. □
Теорема 7. Если функция f(x) выпукла на отрезке [а, Ь] и
lim /(u) = /(a), lim /(^) = /(6), то она унимодальна на [а,6].
u—t a + 0 u—> Ь -0
Доказательство. Обозначим ut = infXt, vt = supXt. Из
непрерывности f(x) на [a, b] и определения верхней и нижней грани множества Xt
следует, что ut,vteXt. Если ut = vt, то Xt состоит из одной точки ut. Если
u4 < vt, то с учетом выпуклости f(x) имеем ft — inf f(u) ^ /(от, + (1 —
ке[а, Ь[
- a)vt) < af(ut) + (1- a)/(«,) = ft. Это значит, что f(a% + (1- a)wj = /,
при всех a G [0, 1], т. е. Xt — [ut, vt].
Далее, так как Х^ П [a, v] — 0 для любого v (a^ v < ut), то по теореме 6
имеем f'(v + 0) < 0 при a ^ v < ut. А тогда /'(г; + 0) ^ (/(г; + h) -f(v))/h < 0
при всех достаточно малых h, т. е. f(x) строго монотонно убывает при
a^.x^.ut. Аналогично показывается, что при vt ^ х <6 функция f(x) строго
монотонно возрастает. □
Как показывает пример 1, при нарушении условий теоремы 7 множество
Xt может быть пустым. Приведем еще несколько примеров.
Пример 3. Функция f(x) = х2 выпукла на отрезке [—1, 1] и множество
Xt состоит из единственной точки xt = 0.
Пример 4. Функция f(x) — \х\ + \х — 1| выпукла на отрезке [-1, 2] и
множество Х„ представляет собой отрезок Xt = [0, 1].
Пример 5. Пусть f(x) = 0 при 0 < х ^ 1, /(0) = 1. Функция f(x)
выпукла на [0, 1], но множество Xt = {х: 0 < х ^ 1} не является отрезком.
Здесь lim f(u) ф /(0) — нарушено одно из условий теоремы 7.
и —> +о
Критерий выпуклости функций, приведенный в теореме 1, не очень
удобен для практической проверки. Приведем другие, часто более удобные
критерии выпуклости функций.
Теорема 8. Для того чтобы дифференцируемая функция f(x)
на отрезке [а, Ь] была выпуклой, необходимо и достаточно, чтобы ее
производная f'(x) не убывала на [а, Ь].
Доказательство. Необходимость доказана в теореме 4, так как в
рассматриваемом случае l(v) — f'(v) (v е [a, b]).
Достаточность Пусть f'(x) не убывает на [a, Ь]. Пусть a^.v <и <
< w ^ Ь. Применяя формулу Лагранжа, имеем
(/(«)-/(«))/(«-«) = /'(£i). «<£i<«,-
(Я«0-/(«))/(«»-«) = /'(&). «<£2<™.
По условию /'(£i) ^ /'(£г)> поэтому из предыдущих равенств следует одно
из неравенств (2), что согласно теореме 1 равносильно выпуклости f(x) на
[а, 6]. □
§ 8. ВЫПУКЛЫЕ ФУНКЦИИ ОДНОЙ ПЕРЕМЕННОЙ
37
Теорема 9. Для того чтобы дважды дифференцируемая функция
f(x) на отрезке [а, Ь] была выпуклой, необходимо и достаточно, чтобы.
/"(ж» 0 на [а, Ъ].
Доказательство. Условие f"(x) ^ 0 является необходимым и
достаточным для неубывания f'(x) на [а, о]. Отсюда и из теоремы 8 следует
требуемое. □
Используя теоремы 8, 9, легко проверить, что функции f(x) = Ьх, f(x) ~
= — In х, f(x) = х In х выпуклы на любом отрезке из области своего
определения; функции f(x) = хТ при г ^ 1, г < 0 и f(x) = —хт при 0 < г < 1
выпуклы на любых отрезках [а, Ь] (О < а < Ь < оо). Функция f(x) = sin х
выпукла на отрезке [—7г, 0], но невыпукла на [—7г, 7г].
Упражнения
1. Доказать, что если функция /(ж) выпукла на отрезке [а, 6], то /'(ж + 0) = inf (f(x+ h) —
-f(a))/h, /'(ж-0) = sup(f(x)-f(x-h))/h при всех жб[а,Ь]. h>0
h>0
2. Пусть функция f(x) выпукла на отрезке [а, 6]. Доказать, что тогда /'(ж + 0) непрерывна
слева, a f'(x — 0) непрерывна справа при всех х (а < х < Ь). Указание: воспользоваться
непрерывностью f(x), следствием 1 и упражнением 1. s
3. Пусть/(ж) выпукла на [а, 6]. Доказать, что f'(v-0)^f'(v+0)^f'(u-0) </'(u + 0) при
всех и, v (a<v<u<b). Пользуясь этими неравенствами, показать, что/(ж) дифференцируема
в точке v (a<v<b) тогда и только тогда, когда одна из функций /'(ж + 0) или /'(ж —0)
непрерывна в точке v.
4. Пусть /(ж) выпукла на [а. 6]. Пользуясь упражнениями 2, 3, доказать, что множества
точек непрерывности функции / (ж+0) и / (ж-0) совпадают. Вывести отсюда, что множество
точек, в которых /(ж) недифференцируема, не более чем счетно.
5. Пусть функция /(ж) непрерывна на отрезке [а, 6], дифференцируема на отрезках
[a, a,], [3,,¾]. ...,[an_,,aj, [ап, Ь] (а < а, < ... < ап < Ь), причем на каждом таком
отрезке производная /'(ж) суммируема, не убывает и f'(ai -0) </'(а; +0) (г = 1,..., п). Доказать,
что тогда /(ж) выпукла на [а, 6].
6. Для выпуклости функции /(ж) на интервале (а, Ъ) необходимо и достаточно, чтобы
существовала функция l(v) (v е (а, Ь)) такая, что /(ж) ^ f(v) + l(v)(x - v) при всех ж е (а, Ь).
Необходимость доказана в теореме 4, докажите достаточность. Покажите, что l(v) = f'(v)
почти всюду на (а, Ь).
7. Пользуясь теоремой 3, доказать, что выпуклая на отрезке [а, Ь] функция /(ж) абсолютно
непрерывна на любом отрезке [а, /3] С (а, Ь).
8. Если функция g(t) возрастает на отрезке [а, Ь] и суммируема на этом отрезке, то функция
X
f(x)= J g(t)dt выпукла на [а, 6]. Доказать. Верно ли обратное утверждение?
а
9. Пусть /(ж) выпукла на [а, Ь] и имеет обратную функцию. Можно ли утверждать, что
обратная функция также будет выпуклой? Рассмотреть функции f(x) = ex, f(x) = e~x.
10. Пусть /(ж) выпукла на [а, Ь] и |im f(u) = f(a), lim nf(u) = /(6), a Xt. — множе-
u—»a+0 H~tb- 0
ство точек минимума /(ж) на [а, 6]. Доказать, что Xt П [а, /3] ф 0, (Xt С int [а, /3]) тогда и
только тогда, когда f'(a -0)<0, /'(/3+0)5*0, (/'(а-0)<0,/'(/3 + 0)>0); здесь а<а</3<Ь.
11. Доказать, что выпуклая ни отрезке [а, Ь] функция /(ж), отличная от постоянной, не
может достигать своей верхней грани внутри отрезка [а, 6].
12. Пусть функция f(u) выпукла и монотонно возрастает на отрезке [а, 6], а функция z(x)
выпукла на [с, d], причем z(x)e[a, b] при всех же [с, d]. Доказать, что тогда сложная функция
#(ж) = f(z(x)) выпукла на [с, d].
13. Назовем функцию /(ж) выпуклой на отрезке [а, 6], если f((u+v)/2) < (f(u)+f(v))/2 при
всех и,»е [а, 6]. Доказать, что для непрерывных функций это определение выпуклой функции
равносильно определению 1. Если не требовать непрерывности /(ж), то новое определение
выделяет более широкий класс функций — см. пример из [735, стр.119];
38 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
14. Пусть f(x)— выпуклая функция при х ^ О, /(0)^0. Доказать, что тогда функция
ip(x) = f(x)/x монотонно возрастает при х > 0. На примере функции f(x) = 1 + х2 убедиться,
что при /(0) > 0 это утверждение неверно. Указание: воспользоваться равенством f(u) =
= /(;rh<« + ft)+;rb-0)<ft>0>-
15. Пусть функция f(x) выпукла и дважды дифференцируема при х ^ 0, причем
lim (xf (х) — f(x)) ¢. 0. Доказать, что тогда <р(х) = f(x)/x монотонно убывает при х > 0.
X —> оо
Указание: вычислить производные функций tp(x) и xf'(x) — f(x).
16. Доказать, что (a + b)n ^. 2п ~ 1 (ап + Ьп) при всех п ^ 1, а ^ 0, Ь ^ 0. Указание:
воспользоваться выпуклостью функции /(ж) = ж" при х ^ 0, п > 1.
§ 9. Метод касательных
1. Пусть функция f(x) выпукла и дифференцируема на отрезке [а, Ь].
Согласно теоремам 8.3, 8.7 такая функция удовлетворяет условию Липшица и
унимодальна на [а, Ь]. Поэтому для минимизации f(x) на [а, 6] применимы
почти все описанные выше методы, в частности, метод ломаных из § 6.
Однако, если значения функции f(x) и ее производной f'(x) вычисляются
достаточно просто, то здесь можно предложить другой, вообще говоря, более
эффективный вариант метода ломаных, когда в качестве звеньев ломаных
берутся отрезки касательных к графику f(x) в соответствующих точках.
Зафиксируем какую-либо точку v G [а, Ь] и определим функцию д(х, v) =
= f(v) + f'(v)(x — v), a ^ x ^. b. Согласно теореме 8.4
g(x, v) < f(x) Vx<E[a,b] (1)
В качестве начального приближения возьмем любую точку Xq е [а, Ь]
(например, Xq = а), составим функцию Ро(х) — д(х, Xq) и определим точку u, G [а, Ь]
из условия р0(хх) = mm Ро(и) (ясно, что при f'(x0)^0 будет хх = а или
хх = Ъ). ие[а'61
Далее, берем новую функцию рх(х) = тах{р0(х); д(х, ж,)} и следующую
точку х~ G [а, Ь] найдем из условия ^,(¾) = min рх(и), и т. д. Если точ-
и е [а, 61
ки х0,хх,...,хп (п ^ 1) уже известны, то составляем функцию рп(х) =
= тах{рп_х(х); д\х, хп)\ = max д(х,х{) и следующую точку хп + х опреде-
0 ^ i ^ п
ляем из условий рп(хп ,,)= min рп(и) (хп,х е [а, &]). Если при каком-либо
п > 0 окажется, что f'(xn + 0) ^ 0, f'(xn — 0) ^ 0 (если a < хп < 6, то это
равносильно условию /'(а5п) = 0), то согласно теореме 8.5 хп е Xt— в этом
случае задача минимизации уже решена и итерации на этом заканчиваются.
Нетрудно видеть, что рп(х) — непрерывная кусочно линейная функция и
ее график представляет собой ломаную, состоящую из отрезков
касательных к графику функции f(x) в точках я^, хи..., хп (рис. 1.5). Поэтому
описанный метод естественно назвать методом касательных.
Теорема 1. Пусть функция f(x) на отрезке [о, Ь] выпукла и
дифференцируема, а последовательность {хп} получена описанным выше
методом касательных, причем xn^Xt (п = 0, 1,...). Тогда:
1) lim f(xn) = lim pn(x+l) = ft и справедлива оценка
п —юо тг —» оо
0 ^ f(x„ +1) - /. < f(x„+1) - Рп(хп +1)> n = 1, 2,...;
§ 9. МЕТОД КАСАТЕЛЬНЫХ
39
2) lim р(хп, Xt) = 0, или точнее, {хп} имеет не более двух предельных
П ~4 оо
точек, совпадающих с ut = inf Xt или vt — sup Xt.
Доказательство. Поскольку величины f'(a + 0), /'(b — 0) конечны
по условию, то в силу теоремы 8.3 функция /(ж) удовлетворяет условию
Липшица с постоянной L =тах{|/'(а)|, |/'(&)|}. Кроме того, согласно (1) и
определению функции рп(х) имеем
Рп-\(х) <Рп(хХЯх), х€[а,Ь], п = 1,2,
Тогда f(x{) = g(xit ж;) < pn(xt) ^ f(xt), т. е.
f(xi) = Pn(Xi), *=0, 1,..., n.
(2)
(3)
Наконец, угловые
причем |/'(ж()| ^ L.
летворяет условию
ца с постоянной L.
Отсюда с учетом (2), (3) с
помощью тех же
рассуждений, которые применялись
при доказательстве
теоремы 6.3, нетрудно
убедиться в справедливости всех
утверждений доказываемой
теоремы. Остается лишь
заметить, что из того, что
функция /(ж) унимодальна
и хп <£ Xt = [и„, vt] (га ^ 0),
равенство lim р(х ,Xt) = 0
n—too
возможно только в том
случае, если предельными для
{хп} будут лишь точки ut
или vt. О
2. Метод касательных
обладает всеми
достоинствами метода ломаных из § 6.
Недостаток этого метода:
он применим лишь в
случае, когда минимизируемая
функция выпукла и значе-
коэффициенты касательных g(x,xt) равны /'(ж;),
Из теоремы 6.1 тогда следует, что рп(х) удов-
Липши-
Рис. 1.5. АВ — график g(x, Xq), CD — график д(х, ж,),
AED — график рх(х), PQ — график д(х, :¾). AMND —
график Р2(х), FL — график д(х, Жд), AMRSD — график
Рз(х)
ния функции и ее производных вычисляются достаточно просто.
Можно предложить более удобную для использования на ЭВМ
вычислительную схему метода касательных, которая не требует хранения в
машинной памяти информации обо всей ломаной рп(х) при х е [а, Ь]. А именно,
возьмем а, = а, 6, = Ь, вычислим /'(ад) = /Ха + 0)< /'(М = f'(b — 0). Если
/'(а,) ^ 0 или/'(6,) < 0, то по теореме 8.5 ае
Поэтому, пусть /'(щ) < 0, /'(6]) > 0,
ет Х„ с (а, Ь). Пусть отрезок [ап_,, Ьп
/'(ап_,)<01/'(Ьп_,)>0, ^с(а„_„Ь,.
ресечения касательных д(х, ап_х) и д(х, 6,
Вычислим /'(ж ). Если /'(ж ) = 0, то хп е Х\ — задача решена, итерации на
или Ь е Xt — задача решена,
что согласно теореме 8.6 означа-
,] (n ^ 2) уже построен, причем
,'). Обозначим через хп точку пе-
,). Ясно, что ап_х <хп< Ьп_х.
40 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
этом заканчиваются. Если f'(xn)j^0, то положим
„ Г «п-1. /'Ю>о. ,=/¾. №.)>о, m
п I *„, /'К)<о, " I ь„_„ /'(*„)< о. w
По построению f'(an) < 0, /'(&„) > 0, и согласно теореме 8.6 Xt с (а, 6).
Индуктивное описание метода закончено.
Из геометрических построений нетрудно усмотреть (см. рис. 1.5), что
этот метод совпадает с описанным выше методом касательных, в котором
за начальную точку берется :¾ = а. В то же время приведенная схема
метода более проста и удобна для реализации на ЭВМ, на каждом шаге
метода здесь достаточно хранить в памяти ЭВМ величины ап, bn, f(an), f(bn),
f'(an), f'(bn). Нетрудно выписать явное выражение для точки жп + 1,
определяемой условием д(х, ап) = д(х, Ьп) пересечения касательных в точках ап,
Ьппри/'(ап)<0,/'(Ьп)>0:
т f("n)-f(bn) + bnf'(bn)-aj'(an)
Ж"+1_ f'(bn)-f'(an) ' П*1' W
3. Поскольку ломаная из отрезков касательных аппроксимирует
функцию /(ж), вообще говоря, лучше, чем ломаные из § 6, то следует ожидать,
что метод касательных для выпуклых функций сходится быстрее метода
ломаных из § 6. Исследуем скорость сходимости метода касательных, считая
минимизируемую функцию дважды дифференцируемой.
Теорема 2. Пусть функция /(ж) дважды непрерывно
дифференцируема на [a,b], inf /"(ж) > 0, ж,— точка минимума /(ж) на [ayb].
и G [а, 61
Пусть последовательность {хп} получена методом касательных при
х0 = а по схеме (4), (5), а, = а, 6, = Ь, причем xn^xt (п = 0, 1,...). Тогда,
для любого числа е > 0 существует номер N = N(e) такой, что
К-я.|< (0 +^)/2)-¾-М> пЖ (6)
Доказательство. Из теоремы 8.9 следует выпуклость функции /(ж)
на [а, Ь]. Кроме того, так как f'(x) строго возрастает, то множество Xt
состоит!из единственной точки xt. Тогда из теоремы 1 имеем lim xn = xt.
Поскольку [on+I, b„ + i]c[on, bn] (га = 1,2,...), то последовательность{ап}
монотонно возрастает, а {Ьп} — монотонно убывает, причем ап < xt < bn
(п = 1, 2,...). Покажем, что lim ап = lim bn = xt.
П —> ОО 71 —* ОО
В силу (4) либо {ап}, либо {&„} является подпоследовательностью
последовательности {х } и сходится к х„. Пусть для определенности lim ап = xt.
п —> ОО
Допустим, что {Ьп} не сходится к ж,. Тогда согласно (4)
последовательность {Ьп} не может быть подпоследовательностью для {хп}, т. е.
найдется номер щ ^ 1 такой, что bn = b при всех п ^ 7¾. При п —> оо из (5)
получим /(¾) = /(&„ ) + f'(b)(x^ - b^). В силу теоремы 8.4 это
возможно только тогда, когда /(ж) = /(6^) + }'(Ь^)(х - Ь^) (ж, ^ ж ^ 6^). Отсюда
/'(& ) = /'(ж„) = 0, что противоречит условию f'-(b„J > 0. Тем самым
доказано, что обе последовательности {ап}, {Ьп} сходятся к xt.
§ 9. МЕТОД КАСАТЕЛЬНЫХ
41
Из представления (5) для точки хп + х с помощью формулы Тейлора имеем
2/"(МпГп nh
1!Ы(Ъ -а)
2/"(мпЛ°" aJ)
где £n, vn, цп — некоторые точки из отрезка [ап, Ьп]. Отсюда
получаем, что Ъп + Х - ап + х ^ max{zn + 1 - ап; Ьп - хп + х} ^ qn(bn - о„)/2, где qn =
= max{/"(Cn)//"(Mn);/"K)//"(Mn)}- Поскольку последовательности {£п},
{vn}, {/хп} вместе с {ап}, {Ь } стремятся к xt, то в силу непрерывности
функции/"(ж) и условия inf f(u) > О имеем lim qn = l.
ue[a, 61 n—юо
Следовательно, для любого е>0 найдется номер N = N(e) такой, что
qn ^ 1 + е при всех п^ N. Тогда Ъп +, - an +, ^ g(6n - о„) (га ^ JV), где g =
= (1 + е)/2. Отсюда Ьп - an ^ qn~N(bN — aN). Следовательно,
K-^\^(K-an)^qn-N(bN-aN), n>N. П
4. Оценка (6) означает, что метод касательных сходится со скоростью,
не меньшей скорости сходимости геометрической прогрессии со
знаменателем q — (1 + е)/2 рз 1/2. Конечно, существуют выпуклые функции, для
которых этот метод будет сходиться гораздо быстрее (возможно, например,
что точка минимума найдется за конечное число шагов). Однако нетрудно
привести пример, показывающий, что на классе дважды непрерывно
дифференцируемых функций оценка (6) по порядку не может быть улучшена.
Пример 1. Пусть f(x) = х2 (—1^ х ^2). С помощью формулы (5) легко
проверить, что касательные к параболе в точках а, Ьп пересекаются в точке
а;п + ]=(ап+Ьп)/2. Возьмем х0 = ах = -1, хх = Ьх =2. Тогда ¾=l/2. С помощью
индукции нетрудно показать, что ап=-1/2п~\ Ьп=— 1/2п~2, хп+х=1/2п при
нечетных п и ап=-1/2п-2, 6п=1/2п-\ хп + х=-\/2п при четных п. Отсюда
получается точная оценка \хп—xt\=\xn\ = 1/2п"\ в то время как, используя
методику вывода оценки (6), имеем |жп—asj ^ К~~ап = 3/2n_1 (п> 1).
Таким образом, из примера 1 следует, что метод касательных на классе
гладких выпуклых функций не лучше метода деления отрезка пополам.
Более того, для этого класса функций нетрудно предложить вариант метода
деления отрезка пополам, требующий лишь вычисления значений
производных минимизируемой функции.
А именно, положим х0 = а1 = а, х, = Ьх = 6, вычислим значения /'(а,) =
= /'(о+0), f'(bx) = f'(b-0). Если/'(а,)$>0 или/'(6,)^0, то по теореме 8.5
имеем aeXt или beXt — задача решена. Поэтому пусть /'(а,)<0, f'(bx)>
> 0. Тогда Xt с (о,, Ьх). Пусть отрезок [оп_,, Ь„_,] (га ^ 2) уже построен,
причем /'(о„_,)< 0, /'(Ь„_|)> 0. так что Х,с(ап_ х,Ьп_х). Положим хп =
= (ап-1 + К-1)/2 и вычислим f'(xn). Если f'(xn) = 0, то хп е Xt — задача
решена. Если f'(xn)^0, то определим точки о„, 6П по формулам (4), приняв
в них хп = (ап_, + Ьп_х)/2. По построению /'(о„) < 0, /'(Ьп) > 0, и согласно
теореме 8.6 .Х, с (оп, Ьп). Кроме того, ясно, что
Ьп-ап = (Ьп_х-ап_х)/2 = (Ъх-ах)/2-\ п=1,2,...
Описанный метод деления отрезка пополам выгоднее применять при
минимизации тех гладких выпуклых функций, у которых значения производ-
=/К)-ли-/'(UK-и
f'(bn) - /'К)
_/(Ь»)-/К)-/'К)(Ьп-°п)
f'(bn)-f'(an)
42 Гл. 1. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ ОДНОЙ ПЕРЕМЕННОЙ
ных вычисляются проще, чем значения функции. Если же значения и
функции, и ее производных вычисляются достаточно просто, то метод
касательных может оказаться предпочтительнее — хотя, как мы выше убедились,
метод касательных на классе гладких выпуклых функций в целом не лучше
метода деления отрезка пополам, но в то же время нетрудно привести
примеры таких выпуклых функций, для которых метод касательных сходится
гораздо быстрее описанного метода деления отрезка пополам.
Заметим, что метод касательных можно описать и без требования
дифференцируемое™ выпуклой функции, используя лишь односторонние
производные во внутренних точках отрезка [а, Ь] [148].
Упражнения
1. Применить метод касательных для минимизации функций f(x) = х2, f(x) = |х|, f(x) =
= \x\ + (x-lf на отрезках [-1,1], [-1,2], [0,1], [1,2].
ГЛАВА 2
Классическая теория экстремума функций многих переменных
В этой главе собраны основные факты о задачах на безусловный и условный экстремум
функций конечного числа переменных, обычно излагаемые в учебниках по математическому
анализу [327; 350; 352; 534]. Кроме того, приводятся необходимые условия экстремума
первого порядка для задач с ограничениями типа неравенств (см., например, [14; 286; 358; 374; 605;
617; 670]). Впервые в учебной литературе излагаются новые необходимые условия экстремума
второго порядка, принадлежащие А. В. Арутюнову [44]. В последнем параграфе этой главы
приведены некоторые вспомогательные формулы и оценки, необходимые для дальнейшего
изложения.
§ 1. Постановка задачи. Теорема Вейерштрасса
1. Сначала введем обозначения и напомним некоторые определения из
линейной алгебры и математического анализа. Через ШР будем
обозначать n-мерное вещественное линейное пространство, состоящее из вектор-
столбцов
х =
У-
У1
У J
с действительными координатами х\у\ z\ ... (г = 1,..., п)\ сумма х + у
двух вектор-столбцов и произведение ах вектор-столбца х на
действительное число ав!" определяется обычным образом:
х + у =
вектор-столбец
хх + у1
хп + уп _
0 =
ах =
ах'
ах"
0
называется нулевым. Вектор-строку, полученную транспонированием
вектор-столбца х, обозначим через хт = (ж',..., хп). Там, где не могут
возникнуть недоразумения, вектор-столбец или вектор-строку из Шп для краткости
мы часто будем называть просто вектором или точкой, а знак
транспонирования «Т» будем опускать.
Если в Rn ввести скалярное произведение двух векторов (х, у) =
= ЁЖ*2Л х,уе\
то Шп превращается в n-мерное евклидово
пространство, которое будем обозначать через Еп. Длина вектора или норма вектора
44
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
1/2 / " ■ \ '
в Еп определяется так \х\ = (х, х) = I X) \x%\2) ■ Величину
/ п х 1/2
р(х,у) = \х-у\ = [J2 \хг -уг\2)
называют евклидовым расстоянием между точками х,уЕЕп. Для любых
точек x,y,zeEn справедливо неравенство
\х - у\ ^ \х - z\ + \z - у\,
называемое неравенством треугольника. Когда важно подчеркнуть, что
скалярное произведение, норма, расстояние взяты именно в Еп, мы будем
писать (х,у)Е„, \х\ЕП, \х — у\Е„. В Еп справедливо неравенство Коши —
Буняковского
\(х,у)\^\х\-\у\ Ух,уеЕп,
причем неравенство превращается в равенство тогда и только тогда, когда
векторы х, у колинеарны, т. е. х = ау при некотором а.
Иногда мы будем пользоваться и другими нормами векторов из Еп, та-
/ " \ i/p
кими, как Ы = ( X) FT ) • 1 ^ Р < °°' F L = max FT Как известно
\;_ J / 1 =5» «л
[192], в конечномерных пространствах все нормы эквивалентны. Это
значит, что если I • L, I • \ц —две нормы в Ш.п, то существуют числа т, > О,
4111 , 41U С^-i/lll Г, \Ц АОС nUpiVlDl 1Э 11¾ , 1U ^^mt^lDJlUl -lri^-JlCl 11 frj ^ W,
77¾ > 0, что m, | • fr ^ I • ]я ^ 77¾ | • |г Ух e En. Отсюда следует, что если
последовательность {xk} сходится к точке х в какой-либо норме | • |г, т. е.
1¾-ж|/—>0 при к—>оо, то |жА—ж|я—»0 в любой другой норме | • |я, в
частности, 1^—х\ = max \х{—х'\ —>0, что равносильно покоординатной сходи-
1 ^ г ^ тг
МОСТИ.
В дальнейшем мы будем часто пользоваться различными
геометрическими понятиями в Еп, такими, как прямая, луч, гиперплоскость,
подпространство, шар, сфера, конус и т. п., обобщающие на многомерный случай
соответствующие привычные понятия на плоскости Е2 и в пространстве Е3
[192; 213; 349; 351; 353]. Определения некоторых понятий будут даны ниже
по ходу изложения; определения некоторых, наиболее широко
используемых понятий напомним здесь.
Множество X — {хе Еп: х = x(t) = Xq + td, -оо < t < +00} называется
прямой, проходящей через точку Xq и имеющей направляющий вектор d G
еЕп, d ^ 0. Множество X ={хеЕп: х = x(t) = Xq + td, t ^ 0} — луч с
направляющим вектором deEn, d^=0, выходящий из точки х^; X = {хе Еп:
x = x(t) = x0+td, t>0} — открытый луч. Множество X = {хеЕп: (с, х) =
= 7}, где 7 — заданное число, сеЕп, с ^ 0 — заданный вектор, называется
гиперплоскостью. Множество X = {хеЕп: (а;, х) = 0, г = 1,..., s} = {xe
е Еп: Ах = 0} называется подпространством; здесь а,,..., а3 —заданные
векторы-строки, не все из которых равны нулю, А — матрица размера s хп
со строками о,,..., оя; число dim X = п — г, где г = rang А — ранг матрицы
А, называется размерностью подпространства X,ar — коразмерностью
этого подпространства. Ясно, что aim X ^ тах{п — s; 0}. Множество X =
= {хеЕп: x-XqI^R} — шар радиуса R с центром в точке х„; Х = {хеЕп:
\х — х0\ < R} — открытый шар; X = {хе Еп: \х\ ^1} — единичный шар
с центром в точке Xq = 0. Множество X = {х еЕп: \х — х0\ = R} — сфера
радиуса R с центром в точке х^; X = {хеЕп: \х\ = 1} — единичная сфера
с центром в точке Xq = 0.
§ 1. ПОСТАНОВКА ЗАДАЧИ. ТЕОРЕМА ВЕЙЕРШТРАССА
45
Конусом (с вершиной в нуле) называется множество, содержащее
вместе с любой своей точкой х и точку \х при всех Л >0. Примерами конуса
являются прямая, проходящая через начало координат, луч, выходящий из
начала координат, произвольное объединение прямых и лучей. Конусами
являются множества X = {х £ Еп: (а., х) ^ 0, г = 1,..., т, (а., х) = 0, г =
= т + 1,..., s}, где вектора a. G Еп, г = 1,..., s, заданы, X = {х е Еп:
J2 а{(х{)р^0},Х = {хеЕп: J2 ai(xi)p = 0}, где р, а., г = 1, ..., п — задан-
i=i i=\
ные числа. Конус называется острым, если не содержит никакой прямой,
и неострым, если содержит хотя бы одну прямую.
2. Перейдем к постановке задачи минимизации. Пусть X — некоторое
непустое множество из Еп, a /(ж)— функция, определенная на этом
множестве. Всюду ниже, если не оговорено противное, мы будем рассматривать
лишь функции, принимающие во всех точках х е X конечные
вещественные значения. Определения таких понятий, как точка минимума и
максимума, наименьшее и наибольшее значение, ограниченность снизу и сверху,
нижняя и верхняя грань функции /(ж) на множестве X, минимизирующая
и максимизирующая последовательность, точка глобального (абсолютного)
локального и строгого локального минимума и максимума функции,
сходимость последовательности к заданному множеству в пространстве Еп
получаются из определений 1.1.1-1.1.6, 1.1.8-1.1.10, нужно лишь под х
понимать точку х = (ж1,..., хп) из Еп, под |ж| — норму х в Еп. Поэтому
здесь мы не будем воспроизводить определения перечисленных понятий.
Примеры 1.1.1-1.1.5 могут служить иллюстрацией к этим понятиям и в
Еп, так как функция одной переменной является частным случаем
функции п переменных.
Нижнюю грань функции /(ж) на множестве X по-прежнему будем
обозначать через
lnf/(a) = /.,
а множество точек минимума /(ж) на X — через
Xt = {x:xeX,f(x) = ft}.
Для обозначения задачи минимизации функции /(ж) на множестве X часто
будем пользоваться следующей краткой символической записью:
/(ж) -> inf; ж е X.
В этом параграфе мы будем рассматривать лишь задачи поиска нижней
грани ft и точек, близких к Xt. Как и в § 1.1, будем различать задачи
минимизации двух типов. В задачах первого типа ищется точное или
приближенное значение величины /„, и здесь неважно, будет ли множество
Xt пустым или непустым. В задачах второго типа наряду с величиной /„
ищется точка ж е X, которая достаточно близка к множеству Xt или даже
принадлежит Xt, — здесь естественно требовать, чтобы ft > —оо, Xt ф0.
Для приближенного решения задач обоих типов на практике обычно
строят какую-либо минимизирующую последовательность {ж^.}:
хкеХ, Л = 1,2,..., Пт/(ж,) = Л
к —>оо
(при Xt^0 возможно, например, хк = xt G Xt, к = 1, 2, . ..). Тогда, как
нетрудно видеть, в качестве приближения для ft можно взять величину
46
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
f(xk) при достаточно большом к. В том случае, если {хк} сходится к
множеству Xt, т. е. р(хк, Xt)= inf \хк — х\—>0 при к—>оо, точку хк и соответст-
вующее значение функции f(xk) при достаточно большом к можно принять
за приближенное решение задачи второго типа. Однако, как мы видели в
примере 1.1.5, условие lim p(xk,Xt) = 0 имеет место не всегда. Поэтому
к —>оо
в задачах второго типа построение минимизирующих последовательностей,
сходящихся к!„в общем случае требует привлечения специальных
методов (см. ниже, главу 9).
В то же время имеются классы задач второго типа, у которых любая
минимизирующая последовательность {хк} сходится к Xt. Эти классы
задач хороши тем, что для их приближенного решения достаточно
построить произвольную минимизирующую последовательность {хк} и затем пару
(xk,f(xk)) при достаточно большом к принять за приближенное решение.
Один такой класс задач для функций одной переменной был сформулирован
в теореме Вейерштрасса (см. теорему 1.1.1). Эта теорема остается верной и
для функций многих переменных, нужно лишь уточнить ее формулировку,
заменив Енай" [327; 350; 352; 534].
3. Ниже, в теореме 1, которую также будем называть теоремой
Вейерштрасса, приводится несколько более общее утверждение, тоньше
учитывающее особенности задач минимизации. Для ее формулировки нам
понадобятся понятия компактного множества, полунепрерывности снизу функции
и некоторые другие понятия из математического анализа. Кратко напомним
их определения.
Пусть {хк} = (х1, аь,...) — некоторая последовательность, {хк}еЕп, т. е.
хк е Еп (к = 1, 2,...). Точка v называется предельной точкой
последовательности {хк}, если существует подпоследовательность {хк },
сходящаяся к v. Последовательность {хк} называется ограниченной, если
существует постоянная М > 0 такая, что \хЛ ^ М для всех к = 1, 2,...
Числовая последовательность {ак} = (аи а^,...) называется
ограниченной снизу [сверху], если существует число А такое, что ак > А [ак ^ А]
при всех к = 1, 2,... Если {%} не ограничена снизу [сверху], то существует
подпоследовательность {ак } такая, что lim ак = —оо [ lim ак = оо].
"* m -~»оо т m ~4 оо m
Множество X из Еп называется ограниченным, если существует
постоянная М ^ 0 такая, что [ж| ^ М для всех хе X. Множество 0(v, е) = {х:
хеЕп, \х — v\<e}, представляющее собой открытый шар с центром в точке
v и радиусом е > 0, называется е-окрестностью точки v. Точка v е Еп
называется предельной точкой множества X с Еп, если любая ее е-окрест-
ность содержит точки из X, отличные от v. Нетрудно видеть, что для любой
предельной точки v множества X существует последовательность {xk} е X
(хк ^v), сходящаяся к v, —для построения такой последовательности
достаточно при каждом к = 1, 2, ... взять точку хк G 0(v, l/k) (хк j^v). Верно
и обратное: если в X существует последовательность {хЛ (хк фу),
сходящаяся к точке v, то v —предельная точка множества X, Множество X из
Еп называется замкнутым, если оно содержит все свои предельные точки.
Определение 1. Множество X из Еп называется компактным,
если любая последовательность {хк} еХ имеет хотя бы одну предельную
точку v, причем v G X.
Согласно теореме Больцано — Вейерштрасса [327; 350; 352; 534] всякая
ограниченная последовательность имеет хотя бы одну предельную точку.
Пользуясь этой теоремой, нетрудно доказать, что в Еп компактными
являются все замкнутые ограниченные множества и только они.
§ 1. ПОСТАНОВКА ЗАДАЧИ. ТЕОРЕМА ВЕЙЕРШТРАССА
47
Определение 2, Число а называется нижним [верхним] пределом
ограниченной снизу [сверху] числовой последовательности {ак} и
обозначается через lim ак = а ит ак = а , если:
£-.оо U->oo J
1) существует хотя бы одна подпоследовательность {%} сходящаяся к а,
2) все предельные точки последовательности {ак} не меньше [не больше]
числа а, т. е. число а является наименьшей [наибольшей] предельной точкой
последовательности {%}.
Иначе говоря, а—нижний [верхний] предел {%}, если для любого е >0:
П существует номер N такой, что ак^ а— е [ак ^ а+ е] для всех к ^ N;
2) для любого номера т найдется номер кт> т такой, что ак ^ а + е
[ак ^ а— е]. В том случае, когда (¾} не ограничена снизу [сверху], то по
определению принимают lim ак = —оо
lim ак = оо
.к —>оо
если Ит ак = — оо, то
к —> оо
полагают lim ак = —оо; если lim ак = оо, то lim ah =оо.
k—*OQ k—>OQ к—* ОО
Например, если ак = (-1)* (к = 1, 2,...), то lim а,, = —1, lim ак = 1; если
k-ioo к ->оо
ak = (-l)kk (fc = l, 2,...), то _Нт_%=—оо, lim afc = oo; если ак = [1+(-1 )к]к
k-toa k-toa
(к = 1, 2,,..), то lim а^ =0, lim % = 00; если ак — А;"1 (к = 1,2,. ..), то
i-ioo fc->00
lim ак = lim % = 0.
/t_,oo A:-100
У любой числовой последовательности {ак} существуют конечный или
бесконечный нижний и верхний пределы. Для того чтобы
последовательность {ак} имела предел, необходимо и достаточно, чтобы lim ак = lim ак —
= а; тогда lim ак = а. к^°° к~~*оа
к —> оо
Определение 3. Пусть функция f(x) определена на множестве
X СВ", Говорят, что функция f(x) полунепрерывна снизу [сверху] в точке
х е X, если для любой последовательности {хЛ G X, сходящейся к точке
х, имеет место соотношение lim f(x^)^f(x) lim f(xk)^.f(x) . Функцию
к —t 00 LA ' 00 .
f(x) называют полунепрерывной снизу [сверху] на множестве X, если она
полунепрерывна снизу [сверху] в каждой точке этого множества.
Предлагаем читателю доказать, что функция f(x) полунепрерывна
снизу [сверху] в точке v е X тогда и только тогда, если для любого е > О
существует <5 > 0 такое, что для всех х £ {х: х £ X, \x — v\<6}
справедливо неравенство f(x) ^ f(v) — е [f(x) ^ f(v) + е]. Нетрудно убедиться, что
функция непрерывна в точке v тогда и только тогда, когда она в этой точке
полунепрерывна и снизу, и сверху.
Пример 1. Пусть X = {х: х е Еп, \х\4. 1} — n-мерный единичный
шар; пусть f(x) = \x\ при 0<|ж[^ 1 и /(0) = а. Тогда при а^.0 функция f(x)
будет полунепрерывна снизу на X; при а^О — полунепрерывна сверху на
X; при а —0 — непрерывна на X.
Пример 2. Пусть Х = {х: хеЕ\ -1 ^ж^ 1}; f(x) = х при 0< х^. 1;
f(x) = 1 — х (— 1 :¾ х < 0); /(0) = а. Нетрудно видеть, что при а ^ 0 эта
функция полунепрерывна снизу на X; при а^ 1 —полунепрерывна сверху
на X, а при 0 < а < 1 в точке х = 0 она не будет полунепрерывной ни снизу,
ни сверху.
48
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Пример 3. Пусть и — (х, у) е Е2; f(u) — х2 + у2 при х > О, у > 0;
/(и) = 0 при х^0, у^О; /(и)=1 при ж^О, г/<0; /(и) = -1 при х<0, у<0.
Нетрудно показать, что эта функция на множестве Хх — {(х, у): х > 0, у ^ 0}
непрерывна; на Х2 = {(ж, у): у ^ 0} полунепрерывна снизу; на Х, = {(ж, у):
х ^ 0} полунепрерывна сверху; на ХА = {(х, у); х ^ 0} в некоторых точках
полунепрерывна снизу, в некоторых — сверху.
Установим связь между свойством полунепрерывности снизу функции и
замкнутостью множеств
М(с) = {х: хе X, f(x) :¾ с}, с = const,
называемых множествами Лебега функция f(x) на множестве X.
Лемма 1. Пусть X —замкнутое множество из Ец. Тогда для
того, чтобы функция f(x) была полунепрерывна снизу на X,
необходимо и достаточно, чтобы множество Лебега М(с) было замкнутым при
всех с (пустое множество считается замкнутым по определению). В
частности, если f(x) полунепрерывна снизу на X, то множество Xt
точек минимума f(x) на X замкнуто.
Доказательство. Необходимость. Пусть f(x)
полунепрерывна снизу на X. Возьмем произвольное число с. Пусть М(с)ф<3. Возьмем
какую-либо предельную точку w множества М(с). Тогда существует
последовательность {xk} G М(с), сходящаяся к ги. В силу замкнутости X точка
ги G X. Из того, что f(xk) ^ с (к = 1, 2,...), с учетом полунепрерывности
снизу f(x) в точке ги имеем f(w)^.\imf(xk)^. с, т. е. ги G М(с). Замкнутость
М(с) доказана. В частности, множество Xt = {x: хеХ, f(x) ^/, = Inf f(x)}
замкнуто.
Достаточность. Пусть для некоторой функции f(x) множество
М(с) замкнуто при любом с. Возьмем произвольные е > 0, х G X и
последовательность {хк} е X, сходящуюся к точке х. Пусть lim /(¾) = а =
к —> оо
= lim f(xk ). Тогда f(xk ) ^. а+ е, т. е. хк £ М(а+ е) для всех достаточно
т —> оо т т т
больших номеров кт. Но М(а+е) замкнуто по условию, а точка х является
пределом для {хк }. Следовательно, х G М(а+ е), т. е. f(x) ^ а+ е. В силу
произвола е > 0 отсюда имеем f(x) ^ а= lim f(xk). □
к —> оо
Установим одно интересное свойство расстояния от точки до множества.
Лемма 2. Пусть X —произвольное непустое множество из Еп.
Тогда расстояние р(х, Х)= inf р(х, ги) от точки х до множества X как
функция переменной х непрерывна на Еп и, более того, удовлетворяет
условию
\р(х,Х)-р(у,Х)\^р(х,у) Ух,уеЕп.
Доказательство. Прежде всего из р(х, w) = \х — w\ ^0 и р(х, Х)^.
^ \х — w\ (ги е J) следует, что функция р(х, X) неотрицательна и конечна
во всех точках хеЕп. Возьмем произвольное число е > 0. По определению
нижней грани (см. определение 1.1.3) для любых х, у е Еп найдутся точки
хе, уе G X такие, что
р(х,Х)^р(х, х£)^р(х,Х) + е, р(у,Х)^р(у, ys) ^ р(у, X) + е.
Поскольку р(х, X) ^ р(х, уе), то с помощью неравенства треугольника
Р(Х, Уе) ^ Р(Х, У) + Р(У, Уе) ИМееМ Р(Х, Х) - Р(У, Х) ^ Р(Х> Уе) ~ РЬ, Уе) +
§ 1. ПОСТАНОВКА ЗАДАЧИ. ТЕОРЕМА ВЕЙЕРШТРАССА
49
+ е ^ р(х, у) + е. Аналогично получается неравенство р(х, X) — р(у, X) ^
^ р(х, хе) — е — р(у, хе) ^ — р(х, у) — е. Объединяя два последних
неравенства, имеем \р(х, X) — р(у, Х)\ ^ р(х, у) + е. Отсюда при е —> +0 получим
требуемое неравенство. П
4. Перейдем к формулировке теоремы Вейерштрасса.
Теорема 1. Пусть X — компактное множество, а функция f(x)
определена, конечна и полунепрерывна снизу на X. Тогда ft = inf f(x)>
>—оо, множество Xt = {х: хеХ, f(x) = ft} непусто, компактно и любая
минимизирующая последовательность сходится к Xt.
Доказательство. Возьмем произвольную минимизирующую
последовательность {хк}: хк G X (к = 1, 2,..., lim f(xk) = /J. Существование
к —* оо
хотя бы одной такой последовательности следует из определения 1.1.3
нижней грани функции. Так как X — компактное множество, то {хк} имеет
хотя бы одну предельную точку и все ее предельные точки принадлежат X.
Возьмем любую предельную точку xt этой последовательности. Тогда
существует подпоследовательность \хк }, сходящаяся к точке xt. Пользуясь
свойством нижней грани ft и полунепрерывностью снизу функции f(x) в
точке xt, имеем
Л^/(в.К_!Ш_/(в* )= lim /(¾) = Л,
т —юо т к -400
т. е. f(xt) = ft. Отсюда следует, что /, > —оо, Xt ф 0. Более того, показано,
что любая предельная точка любой минимизирующей последовательности
принадлежит Xt.
Покажем, что Xt компактно. Возьмем произвольную последовательность
(¾} G Xt. Так как (¾} G X — компактное множество, то существует
подпоследовательность (¾ }, сходящаяся к некоторой точке vt G X. Но {vk} —
минимизирующая последовательность, так как /(¾) = /, (к — 1,2,...). По
вышедоказанному тогда vte Xt. Компактность Xt установлена.
Покажем, что любая минимизирующая последовательность (¾}
сходится к Xt. Так как р(хк, Xt) = inf р(хк, х)^0 (А: = 1,2,...), то ясно, что
х е Xt
lim p(xh,Xt)^0. Пусть lim р(хк, Xt)= lim p(xk , Xt) = a^.oo. Всилу ком-
т—юо /:-400 m-юо m
пактности X из {хк } можно выбрать подпоследовательность, сходящуюся
к некоторой точке xt. Не умаляя общности, можем считать, что сама
последовательность {хк } сходится к xt. Согласно лемме 2 функция р(х, Xt)
непрерывна по переменной х, поэтому lim р(хк ,Xt)~p(xt,Xt) — a. Од-
771 —* 00 т
нако по доказанному ж, £ I,. Тогда а= p(xt,Xt) —0, Это значит, что
lim p(xkyXt)= lim p(xk,Xt) = 0. Следовательно, предел lim p(xk,Xt) cy-
m->oo £-too fc-too
ществует и равен нулю. Теорема 1 доказана. □
Предлагаем читателю рассмотреть функции, а также множества, из
примеров 1-3 (см. также примеры 1.1.1-1.1.5) и проверить, в каких случаях
условия теоремы 1 выполнены и, следовательно, нижняя грань
достигается, в каких случаях она не достигается и в каких случаях нижняя грань
достигается несмотря на то, что условия теоремы 1 нарушены.
б. Заметим, что в теореме 1 условие компактности множества X является
довольно жестким. Например, такие часто встречающиеся на практике
множества, как X = Еп — все пространство или X — {х: хх ^ 0, ..., хп ^ 0} —
50
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
неотрицательный ортант, не являются компактными. Приведем две
теоремы, в которых компактность множества X не предполагается, но зато
функция, кроме полунепрерывности снизу, удовлетворяет некоторым
дополнительным требованиям.
Теорема 2. Пусть X — непустое замкнутое множество из Еп,
функция /(¾) конечна, полунепрерывна снизу на X и для некоторой
фиксированной точки v е X множество Лебега
M(v) = {x: хеХ, f(x)^f(v)}
ограничено. Тогда ft > —со, множество Xt непусто, компактно и
любая минимизирующая последовательность {хк}, принадлежащая M(v),
сходится к Xt.
Доказательство. По определению множества M(v) имеем: /(аз) >
> f(v) при всех хеХ\M(v) и f(x) ^ f(v) при всех х GM(v). Это значит,
что на X \ M(v) функция f(x) не может достигать своей нижней грани на
X и для доказательства теоремы достаточно рассмотреть функцию f(x) на
множестве M(v).
Замкнутость множества M(v) вытекает из леммы 1. Из ограниченности и
замкнутости M(v) следует его компактность. Применяя теорему 1 к
функции f(x) на M(v), получим все утверждения теоремы 2. Попутно
установили, что Xt С M(v). □
Заметим, что в теореме 2 утверждается сходимость к Xt только тех
минимизирующих последовательностей хк, которые принадлежат M(v). Если
/(«) >/,, то условие {хк} G M{v) можно не оговаривать, так как в этом
случае для любой минимизирующей последовательности {хк} найдется
номер /¾ такой, что /(¾) < f(v) для всех к ^ /¾. т. е. хк G M{v) при к > /¾.
Если же f(v) = ft, то Xt = M(v) и, как видно из примера 1.1.5, в этом
случае могут существовать минимизирующие последовательности, которые не
принадлежат M(v) и не сходятся к Xt.
Теорема 3. Пусть X — непустое замкнутое множество из Еп,
функция f(x) конечна, полунепрерывна снизу на X и для любой
последовательности {хк} е X, lim 1^1 = 00 (если такие хк существуют)
к —> оо
имеет место соотношение
lim /(¾) = оо.
к —>оо
Тогда /, > —оо, множество Xt непусто, компактно и любая
минимизирующая последовательность (¾} сходится к Xt.
Доказательство. Если множество X ограничено, то все
утверждения теоремы следуют из теоремы 1. Поэтому пусть X не
ограничено, т. е. существует хотя бы одна последовательность (¾} е X такая,
что lim 1^1 = 00. Тогда согласно условию теоремы lim f(vk) = oo. Возь-
k —> оо к —>оо
мем какую-либо точку v е X такую, что f(v) > ft (например, можно
принять v = vk при достаточно большом А;), и рассмотрим множество
Лебега M(v) = {x: х е X, f(x) :¾ f(v)}. Покажем, что M(v) ограничено.
Допустим противное: пусть существует последовательность {wk} е M(v)
такая, что lim |wJ = oo. Тогда lim f(wk) = oo, что противоречит неравенству
A: —too A: —too
f(wk) ^f(v) < оо, вытекающему из включения wk &M(v) (к = 1, 2, ...).
Таким образом, множество M(v) ограничено. Отсюда и из теоремы 2 следуют
все утверждения теоремы 3. П
§ 1. ПОСТАНОВКА ЗАДАЧИ. ТЕОРЕМА ВЕЙЕРШТРАССА
51
Следствие 1. Пусть X — непустое замкнутое множество из Еп.
Тогда для любой точки хеЕп найдется точка v = v(x) е X такая, что
р(х,Х)= inf \x—w\=\x—v(x)\, т. е. v(x)—ближайшая к х точка из X.
Доказательство. Пусть х — произвольная точка из Еп.
Рассмотрим функцию g(w) — \w — х\ переменной w£.En. Ясно, что g(w)
непрерывна на Еп. Кроме того, g(w) ^ \w\ — \х\, так что lim g(w) = оо. Таким
\w\ —> оо
образом, g(w) удовлетворяет условиям теоремы 3 на любом непустом
замкнутом множестве X СЕп. Существование искомой точки v = v(x) теперь
следует непосредственно из теоремы 3. Заметим, что такая точка v(x),
вообще говоря, неединственна. □
6. В заключение кратко остановимся на задаче максимизации функции
f(x) на множестве X. Для обозначения этой задачи также будем
пользоваться символической записью
f(x)—>sup, х е X.
Так как sup f(x) = — inf (-f(x)) для любого множества G с X, то ясно,
что любая точка локального или глобального максимума, а также любая
максимизирующая последовательность для функции f(x) на множестве X
будет соответственно точкой локального или глобального минимума или
минимизирующей последовательностью для функции (—/(ж)) на X.
Это значит, что любая задача максимизации функции f(x) на X
равносильна задаче минимизации функции (-f(x)) на том же множестве X.
Поэтому можно ограничиться изучением лишь задач минимизации.
Предлагаем читателю, пользуясь указанной связью между задачами
минимизации и максимизации, по аналогии с п. 2 сформулировать задачи
максимизации первого и второго типов. Далее, учитывая, что
полунепрерывность сверху функции f(x) равносильна полунепрерывности снизу функции
—f(x), нетрудно сформулировать и доказать аналоги теорем 1-3 для задач
максимизации. Для примера приведем формулировку теоремы Вейерштрас-
са, являющуюся аналогом теоремы 1.
Теорема 4. Пусть X — компактное множество, а функция
f(x) определена, конечна и полунепрерывна сверху на X. Тогда f =
= sup f(x) < +оо, множество X* = {х: х е X, f(x) = /*} непусто, ком-
пактно и любая максимизирующая последовательность сходится к X*.
Упражнения
1. Выяснить, будет ли произвольная минимизирующая последовательность сходиться к
множеству точек минимума функции f(u) на множестве X, если:
а) X = {и = (х, у) еЕй, х > 0, у >0, х + 1у < 1}, f(u) =х+у;
6)X^En,f(x) = \x\(\+\x\2)-1;
в)Х = Еп,/(х) = \х\2.
2. Пусть X — замкнутое множество из Еп, функция f(x) полунепрерывна снизу на X,
/ = inf /(ж)>-оо, Ма = {хеХ: f(x) <ft + a]. Доказать, что если множество Ма ограничено
х е X
при некотором а > 0, то X, = {х е X: f(x) = ft} непусто, компактно и любая минимизирующая
последовательность сходится к X, (ср. с теоремой 2). Если множество Ма неограничено при
всех а > 0, то возможны случаи, когда Xt = 0 или Xt ф 0 и неограничено, или Xt ф 0
ограничено, но существует минимизирующая последовательность, которая не стремится к Х„.
52
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Рассмотреть функцию f(x) = х на множествах Хх = {х = (х , х ) &Е : х ~£е х }, Х2 = {ж =
= (ж1,ж2)е£;2: 0<ж2<1}, Х3 = Х,и{я; = (0,0)}.
3. Доказать следующие свойства верхнего и нижнего пределов числовых
последовательностей:
а) Нт са„ = с lim а„, lim ca = с lim a , lim (—ca ) = —с 11m a„, lim (—ca„) =
= -c frP% для лШбШ сГ= сЪ-Ш?> О; ^°° "-°° п-оо " п-оо
r»->6o п
б) если а <Ь (п = 1, 2,...), то Jim а ^ lim b , lim a :¾ lim 6 . Можно ли утверж-
n-ioo n-ioo n -> оо " n -> oo n
дать, что lim an ^ lim Ьп? Рассмотреть пример: an = (—1)", n= 1, 2 bn = 0 при n = 2fc,
71™t OO 71 —> OO
bn = -2 при n = 2fc- 1, fc= 1,2,...;
в) lim a„ + Hm b„ < lim (a„ + b„)^ lim a„ + lim Ь„. Рассмотреть пример a = (—1)",
7»->oo n n-too " n-too n n n-too " n-too " n
bn = (—1)" или bn = (— l)n+ ' и убедиться, что здесь возможны строгие неравенства;
г) I'm a + lim Ъ ^ lim (а„ + Ьп) < lim а + lim 6 . Привести примеры последова-
n—too n-too n—too n—too n —t оо
тельностей, когда здесь возможны строгие неравенства;
д) если существует lim а„,то lim (а„ + Ь„) = lim а„+ lim Ъ„, lim (а„ + Ь„) = lim а„ +
4- lim 6 • n-too n n-ioo " n n-ioo " n-ioo " n->oo n n-ioo "
e) если an JtO, bn JtO (n= 1,2,...), то lim an ■ lim 6„ < Jim_anbn $ Hm a„ ■ lim bn;
71™tOO П —IOO 7l—>00
lim a ■ hm Ь < lim а Ь < Hm a ■ hm Ь„. Привести примеры последовательностей, когда
n-tob nn-toonn-toonnn-toonn-ioon
здесь возможны строгие неравенства; _
ж) если а„ >0, Ь„ >0 (п = 1,2,...) и существует lim а„,то lim а„Ь„= lim а • lim Ь„,
lim (а Л )= lim а ■ lim Ь„. п~*°° п~*°° "-*°° ".»-»
п -юо п -> 00 n-ioo
4. Найти верхний и нижний пределы последовательности an = sin псе, где а —
фиксированное число.
5. Пусть f(x) = (1 — е""^')-1 (ж^О). Как надо доопределить эту функцию при х = О, чтобы
она стала полунепрерывной снизу или сверху на Е' = Е?
6. Пусть /((ж), /2(ж)— две функции, полунепрерывные снизу на множестве X. Будут ли
полунепрерывными снизу на X следующие функции:
a) f(x) = «j/^ffi) + a2f2(x) (рассмотреть случаи положительных и отрицательных а,, а^);
б)/(ж) = ттШж);/2(ж)};
в) /(х) = тах{/,(х);/2(х)};
г)/(ж) = |/,(*)1?
7. Пусть функция /(ж) определена на множестве X. Говорят, что число А является нижним
[верхним] пределом этой функции в точке v по множеству X и обозначают lim f(x) — А
Т "1 х —i V
lim fix) = А , если:
и -и j
а) для любой последовательности {хк}€Х, сходящейся к v, имеет место неравенство
Jm_f(xk)> А [ТПЙГДаъКл];
к -. оо Li -. оо J
б) существует последовательность (¾} е X, сходящаяся кии такая, что lim f(xk) = Л.
А: —t оо
Доказать, что функция f(x) полунепрерывна снизу [сверху] в точке v, если lim f(x) ^ f(v)
La: —t tj J
8. Пусть X = Еп, f(x) — sm(ir\x\~l) при ж^О и /(0)= а. При каких а эта функция будет
полунепрерывна снизу или сверху на XI Найти lim f(x), Hm f(x). Что изменится, если
Х = {х: \х\ = п-\ п=1,2,...}? *-0 ж_,°
9. Показать, что понятия верхнего и нижнего предела функции в точке обладают
свойствами, аналогичными свойствам верхнего и нижнего предела числовых последовательностей,
приведенных в упражнении 3.
10. Пусть X сЕп —произвольное множество, X — замыкание X (см. определение 4.1.6),
функция f(x) непрерывна на X. Доказать, что
inf /(х) = inf_/(x), sup /(ж) = sup f(x).
sex x$X xzX X£X
§ 1. ПОСТАНОВКА ЗАДАЧИ. ТЕОРЕМА ВЕЙЕРШТРАССА
53
11. Пусть X сЕп —произвольное множество из Еп, функции f(x), д(х) определены на
X. Доказать, что
а) inlm\n{f(x); д(х)} = min{ inl' f(x); inl' g(x)};
X £ X X £X l£A
б) inf тах{/(я;); 3(0;)} ^ max{ inf /(ж); inl' g(x)}.
гсел iea zex
12. Пусть X <zEn, Y cEm—произвольные множества, функция f(x,y) определена на
множестве X х У = {(х, у): х е X, у е У}. Доказать, что a) inf f(x, у) = inf{inf f(x, у)} =
= inf{inf/(ffi, у)}; б) sup Inf ^ Inf sup f(x, у). XxY x Y
У X х$ХУ^у У^ух£Х
13. Пусть X с En, Y cEm — произвольные множества, функция <p(x, у) определена на
множестве X х У, полунепрерывна снизу на X при каждом фиксированном у е У и ограничена
сверху на У при каждом фиксированном х е X. Доказать, что функция /(ж)= sup <р(х,у)
полунепрерывна снизу на X [54]. у&у
14. Пусть X —произвольное множество из Еп, У — компактное множество из Ет,
функция f(x,y) непрерывна [полунепрерывна снизу] на X х У. Доказать, что функция f(x) =
= Inf <р(х, у) непрерывна [полунепрерывна снизу] на X. Покажите, что условия на У и tp(x, у)
в этом утверждении существенны [54]. Рассмотрите примеры: 1) tp(x,y) = xy, X = Y =Е ;
2) V(x, у) = х2у2 + у, X = У = В'; 3) v{x, у) = '„ 2, X = У = Я1; 4) <р(х,у) = -j^U,
Х + х'-у'- x'-ArlT
х2 + у2^0; <р{0, 0) = 0, Х=У = [-1,1]; 5) ^(я, у) = тах{0; 1 - ад}, Х= У = [0,+оо).
15. Пусть X сЕп, Y сЕт — произвольные_множества, функция <р(х, у) непрерывна на
X х У, пусть У — плотное в У подмножество, X — ограниченное подмножество из X, такие,
что при каждом у е У функция tp(x, у) своего максимума на X достигает в точке х = х(у) е X.
Доказать, что функция f(y) = sup tp(x, у) непрерывна на У.
§ 2. Классический метод решения задач на безусловный экстремум
Рассмотрим задачу поиска локального или глобального экстремума
гладкой функции многих переменных на всем пространстве Еп. Такуть задачу
принято называть задачей на безусловный экстремум. В этом названии
отражен тот факт, что на переменные х — (х\ ..., хп) никакие
дополнительные ограничения в такой задаче не накладываются. Кратко изложим
классический метод поиска решения задач на безусловный экстремум,
подразумевая под этим тот подход к ним, который основан на дифференциальном
исчислении функций многих переменных и обычно излагается в учебниках
по математическому анализу [327; 350; 352; 534; 768].
Сначала напомним некоторые понятия и факты.
Определение 1. Пусть функция f(x) определена в некоторой е-ок-
рестности 0(х, e) = {veEn: \v-х\ < е} точки х. Говорят, что функция f(x)
дифференцируема в точке х, если существует вектор f'(x) е Еп, такой,
что приращение функции можно представить в виде:
Af(x) = f(x + h)-f(x) = (f'(x),h) + o(h,x), \h\<e, (1)
где o(h, х) — величина, бесконечно малая более высокого порядка, чем \h\,
т е lim °(Ь;Х) =0. Вектор f'(x) называется первой производной или гра-
|л|-о I"!
диентом функции / в точке х.
Условие (1) однозначно определяет градиент f'(x), причем
/4*0 = (/.-(*).•-../..(в)), (2)
где
54
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
есть частная производная функции / в точке х по переменной х\ е{ —
= (0,..., 1,..., 0) — единичный вектор, у которого г-я координата равна 1,
остальные координаты равны нулю, г = 1,..., п. Если функция
дифференцируема в каждой точке множества X, то ее часто называют гладкой на
X, Если производная f'(x) существует и непрерывна в каждой точке хеХ,
то функцию f(x) называют непрерывно дифференцируемой на множестве
X, Напомним, что функция, дифференцируемая в точке х, непрерывна в
этой точке.
Определение 2. Пусть функция f(x) определена и
дифференцируема во всех точках некоторой е-окрестности точки х. Говорят, что функция
f(x) дважды дифференцируема в точке х, если существует матрица f"(x)
размера п х п, такая, что
f'(x + h)~f(x) = f"(x)h + 0l(h,x), \h\<e, (3)
где lim ' | ', =0. Матрица f"(x) называется второй производной
функции / в точке х.
Условие (3) однозначно определяет вторую производную f"(x), причем
( f^Ax) f*>Ax) ... fx'Ax)\
faAx) /«•«•(a:) ••• UAX)
\UAX) f*-Ax) ■■■ UAX)J
№) =
= {/«<«*(b). *,j = l,...,n}, (4)
ная функции f(x) по переменным х\х3. Как видим, f"(x) —
симметричная матрица. Если функция f(x) дважды дифференцируема в некоторой
е-окрестности точки х, причем ее вторая производная непрерывна в точке
я, т. е. lim \\f"(x + h)~f"(x)\\=0, то
Af(x)=f(x+h)-f(x) = (f'(x), h)+\{f"{x)h, h)+o2(h, x), \h\ < e. (5)
где lim |o2(fe'ж)| =0 [327; 350; 352; 534; 768]. Квадратичную форму d2f(x) =
\h\~i0 \h\
— {f"(x)h, h) = ^ pJiJu^h3' переменной heEn называют вторым диф-
ференциалом функции / в точке х. Если функция дважды
дифференцируема в каждой точке множества X, то ее часто называют дважды гладкой
на X. Если вторая производная f"(x) существует и непрерывна в каждой
точке х е X, то функцию f(x) называют дважды непрерывно
дифференцируемой на множестве X.
Определение 3. Пусть А = {а~, г, j = 1,..., п} симметричная
п
матрица, {Ah, h)= Yl ai3-hlhj — соответствующая ей квадратичная форма.
Говорят, что матрица А положительно [неотрицательно] определена на
Еп и обозначают А > 0 [А > 0], если {Ah, h) > 0 Vh е Еп, h ф 0 [{Ah, h) >
^ 0 Wi G En]. Аналогично, матрица А отрицательно [неположительно]
§ 2. КЛАССИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧ
55
определена на Еп, т. е. А < О [А ^ 0], если (Ah, h) < О VheEn, h^O
[(Ah, h) < 0 Wi G £n] (cm. [192; 213; 349; 353]).
Перейдем к изложению необходимых и достаточных условий
оптимальности в задачах на безусловный экстремум.
Теорема 1 (Необходимое условие экстремума). Пусть xt — точка
локального экстремума (минимума или максимума) функции f(x) на
Еп, пусть f(x) дифференцируема в точке xt. Тогда
/4¾) = о. (6)
Если f(x) дважды дифференцируема в некоторой е-окрестности
0(xt, е) точки xt и f"(x) непрерывна в точке xt, то f"(xj >0 в точке
локального минимума и f"(xt) ^ 0 в точке локального максимума.
Доказательство. Пусть для определенности xt — точка локального
минимума f(x) на Еп. Это значит, что существует е-окрестность 0(xt, е)
точки xt такая, что f(x) > f(xt) Ух G 0(xt, е). Отсюда и из (1) при х = х„
h = —tf'(xt), 0 < t < t0, где число t0 столь мало, что t0\f'(xt)\ < е, имеем
0 ^ (f'(xj, -tf'(xt)} + o(t) = -t\f'(xt)\2 + o(t). Разделим это неравенство
на t > 0 и затем устремим t —> +0. Получим -t\f'(xt)\2 > 0, что возможно
только при выполнении равенства (6).
Далее, пусть f(x) дважды дифференцируема в окрестности 0(xt, е) и
f"(x) непрерывна в точке xt. Зафиксируем произвольное h е Еп и возьмем
t0 > 0 столь малым, что t0\h\ < е. Тогда xt + the 0(xt, е) и из (5) с учетом
уже доказанного равенства (6) имеем
0 < f(x, + th) - f(xt) = \(f"(x,)h, h)t2 + o(t2) Vi, 0 < t < i0.
Разделим это неравенство на t2 > 0 и устремим t —> +0. Получим 0 <
^ (f"(x*)hi h) Vh е Еп- Согласно определению 3 это значит, что /"(ж*) > 0.
Так как точка локального максимума функции f(x) является точкой
локального минимума функции (-f(xY), то, применяя уже доказанные
утверждения теоремы к функции (-f(x)), получим, что если xt — точка локального
максимума f(x) на Еп, то f'(xt) = 0, f"(xj^0. D
Определение 4. Точка v, удовлетворяющая уравнению f'(v)= 0,
называется стационарной точкой функции f(x).
Из теоремы 1 следует, что только стационарные точки могут быть
точками экстремума дифференцируемой на Еп функции. Однако стационарная
точка необязательно является точкой экстремума. Более того, если в
стационарной точке v еще выполняется условие f"(v) > 0 [/"(«) <0], то это
также не значит, что точка v непременно является точкой локального
минимума [максимума]. Можно уверенно сказать лишь одно: стационарные
точки являются подозрительными на экстремум.
Пример 1. Пусть f(u)=xi-y\ и=(х, у) G Е2. Очевидно, v=(0, 0) —
стационарная точка функции f(x) и в ней /"(и) = 0. Однако в любой
окрестности точки v = 0 существуют точки х, в которых f(x)>f(v) = 0 и f(x) <0,
т. е. v = 0 не является точкой экстремума.
Этот пример показывает, что условия экстремума, сформулированные в
теореме 1, являются лишь необходимыми, но в общем случае этих условий
56
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
недостаточно для экстремума. Тем не менее, оказывается, несколько усилив
условия теоремы 1, можно получить условия, достаточные для экстремума.
Теорема 2. Пусть функция f(x) дважды дифференцируема в
окрестности 0(v, е) стационарной точки v этой функции и f"(x)
непрерывна в точке v. Тогда если f"(v)> О, то v — точка строгого
локального минимума функции f(x), а если f"(v) < О, то v — точка
строгого локального максимума.
Доказательство. Пусть в точке v выполнены условия f'(v) = О,
f"(v) > О, но v не является точкой строгого локального минимума. Тогда
существует последовательность {хк}, такая, что хк ф v, {хк} —> v, f(xk) ^
^f(v). Точки хк можем представить в виде хк = v + tkdk, где dk = т-^ ,,
** = 1¾ ~ wl ""* О ПРИ ^ —*■ °°- Так как \dk\ = 1, то, выбирая при
необходимости подпоследовательность согласно теореме Больцано — Вейерштрасса
[327; 350; 352; 534], можем считать, что {dk} —> с^,, |с^| = 1. Тогда
полагая в (5) x = v, h = tkdk, имеем 0 > f(xk) - f(v) = 2**(/"(wK> <4) + °(**)>
к = 1, 2, Разделим это неравенство на tk > 0 и устремим к —> оо.
Получим (/"(г;)^, d,,) <0, где с^фО. Однако это противоречит условию f"(v)>0.
Следовательно, v — точка строгого локального минимума функции f(x).
Аналогично доказывается, что если f'(y)=0, f"(v)<0, то v — точка
строгого локального максимума. Теорема 2 доказана. □
Замечание 1. Для выяснения знакоопределенности квадратичных
п
форм < Ah, h >= Yl a^WW существуют различные алгебраические
критерии [192; 213; 349;" 353].
Определение 5. Главными минорами матрицы А называются
определители
А,- ,■ , = det
•i«i
, 1 ^ г, < % < ... < ik ^ п, к = 1,..., п.
Главными угловыми минорами называются определители А12 к, к =
= 1,..., п.
Критерий Сильвестра: для того, чтобы А > 0, необходимо и
достаточно, чтобы все главные миноры матрицы А были неотрицательны; для того,
чтобы А > 0, необходимо и достаточно, чтобы все главные угловые миноры
матрицы А были положительны.
Сформулируем критерии знакоопределенности матрицы А в терминах
собственных чисел этой матрицы. Напомним, что собственным числом
матрицы А называется решение А уравнения det \А — \1п\ = 0, где 1п —
единичная матрица размера пхп. Так как у нас А — симметричная
матрица, то у нее существует п действительных собственных чисел А,, А2,..., Ап
(с учетом их кратности). Для того, чтобы А > 0 [А > 0], необходимо и
достаточно, чтобы все собственные числа матрицы А были неотрицательны
[положительны]. Квадратичная форма (Ah, h) знакопеременна тогда и
только тогда, когда у матрицы А имеется хотя бы одно положительное и хотя
бы одно отрицательное собственное число.
§ 2. КЛАССИЧЕСКИЙ МЕТОД РЕШЕНИЯ ЗАДАЧ
57
В том случае, когда в стационарной точке v квадратичная форма
{f"(v)h, h) не меняет знака при всех h е Еп, но может равняться нулю
при некоторых кфО, то для выяснения поведения функции в окрестности
точки v можно привлечь старшие производные и связанные с ними формы
более высокого порядка:
^^)=^(^)Г/((1т,(^г ...(*т-,
где суммирование проводится по всём целым г,,..., гт таким, чтоО^ г{ ^т,
г = 1,..., п, r{ + r2+.. .+гп = т. Однако на практике исследование характера
стационарных точек с помощью форм dmf(v), т > 3, почти не применяется
из-за его громоздкости.
В тех случаях, когда описанным выше способом удается выявить все
точки локального минимума [максимума] функции f(x), то для определения
глобального минимума [максимума] этой функции на всем пространстве
Еп нужно перебрать все найденные точки и из них выбрать точку с
наименьшим [наибольшим] значением функции, если такая точка существует.
Пример 2. Пусть в пространстве Еп даны р точек xt = (xj,..., ж"),
г = 1,.. .,р, и требуется найти точку х G Еп, сумма квадратов расстояний
от которой до этих данных точек минимальна. Р
Эта задача равносильна задаче минимизации функции f(x) — J2\x — xt\2
на En. Функцию f(x) удобнее представить в виде: f(x) = p\x\2-2p(x, Xq) +
+ Л kl2> гДе Ч = ^ X) xi- Отсюда видно, что f'(x) = 2р(х -xQ)\iv = xQ —
стационарная точка. Матрица f"(v) = 2pln, где 1п — единичная матрица
размера пхп. Следовательно, (f"(v)h, h) = 2p\h\2 >0 при всех h еЕп, h ^0.
Согласно теореме 2 это значит, что v = Xq —точка строгого локального
минимума. Однако здесь можно сказать больше: v = х0 — точка глобального
минимума f(x) на Еп. В самом деле, рассматриваемая функция такова, что
lim f(x) = oo. Тогда по теореме 1.3 множество Xt точек глобального ми-
|а;| ~4 оо
нимума f(x) на Еп непусто, а по теореме 1 \/xt&Xt является стационарной
точкой. Поскольку здесь имеется единственная стационарнаярточка v = х0,
то v е Xt. Следовательно, Xt = {х0}, ft = /(¾) = -р|а\,|2 + £ Ы2. Заме-
тим, что при исследовании этой несложной задачи можно было обойтись и
без привлечения теоремы 1.3, поскольку здесь f(x) — /(¾) =р\х — ^2 ^ 0
Ух е Еп. Ясно также, что в этой задаче /* = sup f(x) = +оо, т. е. задача
ses"
максимизации f(x) на Еп не имеет решения.
Упражнения
1. Найти экстремумы функций:
а) /Ы = (я + «-1)е-<*2-^ + ^), и = (х,у)£Е2;
б) f(u) = xy2zS(\-x-2y-3z), u=(x,y,z)£E3;
в) f(u) = sin(a; + у) - sin х - sinу, u = (x,y)£E2.
2. Может ли функция двух переменных на плоскости иметь бесконечно много точек
локального минимума и ни одной точки локального максимума? Рассмотрите функцию f(u) =
= хех - (1 + ех) cos у, и = (х, у) е Е2.
58
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
В следующие упражнения 3-8 вошли задачи, которые автору сообщил
Н. А. Бобылев.
3. В точке «д = (0, 0) функция f(u) переменных и = (х, у) е Е2 имеет локальный минимум
вдоль каждой прямой, проходящей через точку «д. Можно ли утверждать, что в точке «д
реализуется локальный минимум функции /(ж)? Рассмотреть функции:
/,(«) = (х- у2)(2х - у2), }2(и) = х2- 2ху2 + у* - у5.
4. Построить пример гладкой функции f(u), и = (х, у)£Е2, для которой точка (0, 0)
является единственной стационарной точкой, причем (0, 0) — точка локального минимума функции
/, не являющаяся точкой ее глобального минимума. Рассмотреть функцию
f(u)=3x2-2xl-1 +(Зх2-2х3)е~У.
1 + У
5. Пусть xq = 0 является единственной стационарной точкой гладкой функции f(x) на Еп,
в которой реализуется локальный минимум этой функции. Пусть для некоторых е>0иЯ>0
выполнено неравенство |/'(ж)| ^ е Ух, |ж| > R. Докажите, что 2¾ = 0 — точка глобального
минимума функции / на Еп.
6. Постройте пример (нарисуйте графики линий уровня) дифференцируемой функции f(u),
и = (х, у) е Е2, у которой имеется ровно т стационарных точек и все они являются точками
локального минимума этой функции.
7. Пусть заданы произвольные целые числа т > 0, к > 0, / > 0, Покажите, что существует
гладкая функция f(x), и=(х,у)&Е2, у которой имеется ровно т+к + 1 стационарных
точек, причем т из них являются точками локального минимума, к — точками локального
максимума, I —седловыми точками (определение 4. 9. 1).
8. Пусть Sn~ ' —{х&Еп: |ж|2 = 1} — единичная сфера в Еп, пусть гладкая функция f(x),
x£Sn~l, имеет две точки локального максимума на Sn~ '. Покажите, что функция / имеет
стационарную точку, отличную от упомянутых двух и от точки глобального минимума этой
функции на Sn ~ '.
§ 3. Задачи на условный экстремум.
Необходимые условия первого порядка
В приложениях задачи на безусловный экстремум встречаются редко.
Дело в том, что в практических задачах переменные, как правило, не могут
быть совершенно произвольными и должны удовлетворять некоторым
дополнительным условиям, выражающим, например, условия
неотрицательности тех или иных переменных, условия ограниченности используемых
ресурсов, ограничения на параметры конструкции системы, условия
нормировки и т. п. Иначе говоря, переменные х = (ж1,..., хп) должны
принадлежать некоторому заданному множеству X из Еп. Тогда, чтобы подчеркнуть,
что экстремум функции ищется при условии х G X ф Еп, часто говорят о
задаче на условный экстремум.
В таких задачах мы также будем различать точки локального минимума и
максимума. Напомним, что точка v G X называется точкой локального
минимума [максимума] функции f(x) на X, если существует такая е-окрест-
ность 0(v, е) = {х G Еп: \x-v\< е} точки v, что f(x) > f(v) [f(x)% f(v)]
для Ух G X П 0(v, е). Если функция f(x) дважды гладкая на X и точка v ее
локального минимума [максимума] является внутренней точкой множества
X, то необходимо f'(v) = 0, f"(v)^0 [f"(v) ^0]. Эти условия доказываются
точно также, как в теореме 2.1. Однако, если v — граничная точка
множества X, то такие условия, вообще говоря, не имеют места. Так, например,
§ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
59
функция f(x) = —х2 на отрезке X = {хе Еи. 1^ж<2} имеет глобальный
минимум в точке v = 2, но /'(2) = —4, /"(2) = —2. Следовательно, условия
экстремума в задачах на условный экстремум должны иметь другую форму,
чем в теореме 2.1. В этом параграфе будут сформулированы необходимые
условия экстремума, основанные на правиле множителей Лагранжа.
1. Начнем с классической задачи на условный экстремум, традиционно
рассматриваемой в математическом анализе [327; 350; 352; 534; 768]: найти
экстремумы функции f(x) при условии, что
хеХ = {хеЕп: gi(x) = 0,...,g3(x)=0}. (1)
Здесь предполагается, что функции f(x), д{(х) определены на всем
пространстве Еп. Ограничения д{(х) = 0, г = 1,..., s, принято называть
ограничениями типа равенств.
В тех случаях, когда систему уравнений (1) удается преобразовать к
эквивалентному виду
s1 = ^,(^ + 1...., в»),..., хр = %(хр + \...,х"), (2)
выразив из (1) какие-то р переменных через остальные, рассматриваемую
задачу на условный экстремум можно свести к задаче на безусловный
экстремум функции д(хр+л,..., хп) = f(!pl(xp + l,.. ., хп), . .., ipp(xp + l,...
..., хп), хр +',..., хп) переменных (хр + х,..., хп)е Еп~р, которую можно
исследовать по описанной в § 2 схеме. Однако этот подход имеет
ограниченное применение из-за того, что явное выражение вида (2) одной группы
переменных через остальные удается получить лишь в редких случаях.
Более общий подход к исследованию задачи поиска экстремума функции
f(x) на множестве (1) дает правило множителей Лагранжа. Это правило
заключается в следующем. Вводится функция
£(x,\) = \0f(x)+±\.9j(x) (3)
з = \
переменных х = (ж1,..., хп) е Еп, А = (А0, A,,..., As) G Es + \ называемая
функцией Лагранжа. Имеет место
Теорема 1 (правило множителей Лагранжа). Пусть ж+ — точка
локального минимума функции f(x) на множестве (1), пусть функции
f(x), gt(x), i = 1,..., s, непрерывно дифференцируемы в окрестности
точки xt. Тогда существуют числа Ад,..., А*, называемые
множителями Лагранжа, такие, что
Г = (а0*,...,а:)^о, а0*>о,
Таким образом, в теореме 1 утверждается, что всякая точка локального
минимума xt является стационарной точкой функции Лагранжа £(х, А) при
некотором, подходящим образрм выбранном, нетривиальном наборе
множителей А.
Доказательство. Условие (4) означает, что градиенты f(xt), #/(¾).
..., g3'(xt) линейно зависимы. Допустим противное: пусть это не так, пусть
60
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
эти векторы линейно независимы. Тогда s + 1 < п. В случае s + 1 < п
возьмем какие-либо векторы ев +,,..., еп_, так, чтобы система /'(я*)> 9\{х*), ■ ■ ■
■ ■ • > 9S'(X*), es + n • • м e„_i образовала базис в Еп. Введем вектор-функцию
Р(Ъ *) = (/ote *). Мъ *). • • •./„- ifo *))■ гДе № *) = /(а:) - /(¾) +.*■
Л (ж, *) = &(ж), г = 1,..., s, /г(ж, t) = (e.,x-xt),i = s+l,...,n-l, (x,t)e
е En+l. Рассмотрим систему п уравнений
f(M) = (/o(M),/i(M) /»., (М)) = 0 (5)
относительно га неизвестных ж = (ж1,..., ж"). Для ее исследования
применим теорему о неявных функциях [327; 350; 352; 534; 768]. Заметим,
что ^(ж„, 0) = 0. Далее, функции /г(ж, t) непрерывно дифференцируемы в
окрестности точки (¾. 0)G#n + 1, причем f0x(xt, 0) = f'(xj, f.x(xt, 0) = 0/(¾).
г = 1,..., s, /и(ж„,0) = е;, г = s + l,. .., га —1. Это значит, что в точке (ж+,0)
якобиан системы функций F(x, t) = (fi(x, £), i =0,..., га — 1),
представляющий собой определитель квадратной матрицы со строками f'(xt), ^'(ж,,),...,
gj{xt), es + 1,.. ., en_,, образующими базис в Еп, отличен от нуля. Тогда по
теореме о неявных функциях система (5) имеет решение при каждом t,
\t\^.t0, где t0 —достаточно малое положительное число, или, точнее,
существует непрерывно-дифференцируемая вектор-функция ж = ж(£) = (ж1(£), ...
..., xn(t)), такая, что при всех t, \t\ < t0
х(0) = х„ f(x(t)) = f(xt)-t, &(ж(*)) = 0, г = l,...,s,
(е{, ж(*)-ж+)=0, г =s + 1,..., га- 1.
Это значит, что x(t)eX, 0<t<t0. Однако f(x(t)) = f(xj- t <f(xt) Vi G
G (0, t0), что противоречит тому, что xt — точка локального минимума. Тем
самым доказано, что векторы f'(xt), д^хЛ,..., gj(xt) линейно зависимы,
т. е. существует набор А ^0, что Cx(xt, Л ) = 0. Тогда для набора (—А )Ф
ф0 также Cx(xt, —А ) = 0. Поэтому можем считать, что Ад > 0. Теорема 1
доказана. □
Условие (4), в котором используются лишь первые производные функций
/(ж), д{(х), i = 1,..., s, принято называть необходимым условием первого
порядка. Разумеется, в (4) неравенство Ад >0 вполне можно было бы
заменить на Aq < 0 — это принципиального значения не имеет. Однако, следуя
традициям, восходящим к Вейерштрассу, в литературе по экстремальным
задачам для определенности обычно берут Aq>0, относя это неравенство
к характеристике точки локального минимума.
Из теоремы 1 следует, что подозрительными на локальный минимум,могут
быть лишь те точки х&Еп, для которых существуют множители Лагранжа
А = (А0,..., As) такие, что пара (ж, А) является решением системы
А0/'(я)+£ А.д/(ж) = 0, &(ж) = 0, i = l,...,s, А>0, А0>0. (6)
3=1
Пусть v — какая-либо фиксированная точка локального минимума функции
/(ж) на множестве (1). Множество всех А, для которых пара (ж = г>, А)
является решением системы (6), будем называть множителями Лагранжа,
соответствующими точке v, и обозначать через Л=_Л(г;). Нетрудно
видеть, что если (г;, А) — решение системы (6), то (г;, а\) при любом а. > 0
§ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
61
также является решением этой системы. Отсюда следует, что множество
A(v) является конусом, будем его называть конусом Лагранжа точки v.
Замечание 1. Поскольку всякая точка х* £ X локального
максимума функции f(x) является точкой локального минимума функции (—/(ж)),
то, применяя теорему 1 к функции (-f(x)), получим, что для точки х*
необходимо существуют множители Лагранжа А = (Aq, ..., А*) такие, что
Сх(х*, А ) = 0, А т^О, Ag ^0. Отсюда следует, что подозрительными на
локальный максимум функции f(x) на множестве (1)_могут быть лишь те
точки х € Ens для которых существуют множители A = (Aq, ..., А*) такие,
что пара (х, А) является решением системы
АоЛаО + Е V/(b) = 0, Я(в) = 0, г = 1,...,5, А^О, А0 ^ 0. (7)
3=1
Множество всех А, для которых пара (х = «, А) является решением
системы (7), также является конусом, который мы будем обозначать через Ar(v)
и называть конусом Лагранжа точки v локального максимума. Отличие
этого конуса от конуса, соответствующего точке локального минимума в
том, что здесь у всех точек АеЛ"(г;) координата А0 ^ 0. Такое соглашение о
знаке А0, несмотря на всю свою условность, ниже позволит нам
единообразно формулировать необходимые и достаточные условия экстремума второго
порядка, как-то упорядочит процедуру исследования точек экстремума.
Из теоремы 1 и замечания 1 следует, что в точке v экстремума функции
f(x) на множестве (1) конус Лагранжа не может быть пустым — если этот
конус пуст, то такая точка v заведомо не может быть точкой экстремума.
Из того, что множество множителей Лагранжа является конусом, условие
А^О в (6), (7) можно заменить каким-либо условием нормировки, взяв,
з
например, |А |2 = J2 А? = 1. Вместо отдельного исследования систем (6), (7)
>=о
можно рассмотреть одну систему
Сх(х,\) = \0Г(х)+±\,д/(х) = 0, ft(z) = 0, i = l,...,s,
(А0)А1)...,А.)96 0,
з
последовательно полагая в ней А0 = 1, А0 = — 1 и А0 = 0, £) А? = 1.
Система (8) с учетом условий нормировки представляет собой систему
n + s + l уравнений с п + s + l неизвестными (х, \) = (х1,..., хп, А0, А,,...
..., А„). Решив ее, мы найдем точки x = v множества (1), подозрительные на
экстремум, и соответствующие им множители Лагранжа A = \(v). Для
выяснения того, будет ли в этих точках в действительности реализовываться
локальный минимум или максимум, нужно провести дополнительное
изучение свойств функции f(x) в окрестности точки v с учетом ограничений (1).
Здесь могут быть привлечены геометрические, физические и т. п.
соображения. При выполнении, условий теорем Вейерштрасса из § 1 можно^быть
уверенным, что хотя бы одна из найденных точек v окажется точкой
глобального минимума или максимума. Для выяснения характера экстремума
точек v могут быть привлечены вторые производные функции Лагранжа по
переменной х — об этом речь пойдет в § 5.
62
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Изложенная схема поиска экстремума функции на множестве (1)
составляет суть правила (метода) множителей Лагранжа. Для иллюстрации этого
правила рассмотрим несколько примеров.
Пример 1. Пусть требуется на n-мерной единичной сфере Х =
= {х £ Еп: \xf = (х, х) = 1} найти точку, сумма квадратов расстояний от
которой до р данных точек ж,,..., х была бы минимальной. Иначе говоря,
р
нужно минимизировать функцию f(x)= J2 \х - х.\2 при условии д(х) =
> = i
= (х, ж) — 1 =0. Как и в примере 2.2, здесь удобнее пользоваться следующим
представлением функции f(x) = p\x\2 — 2p(x, х0) + '%2 \х.\2, где х0 = -'%2 х{.
_ i = 1 р i = 1
Составим функцию Лагранжа этой задачи: С(х, A) = \0f(x) + А ((х, х) — 1).
Система (8) имеет вид
Сх(х,Х) = 2р\0(х-х0) + 2\х = 0, {х,х) = 1, (\0,\)ф0. (9)
При А0 = 0 эта система, очевидно, не имеет решения. Поэтому здесь можем
принять А0 = 1 или А0 = -1. При х0 ф 0 из системы (9) получаем две точки:
vx = А- и v2 = — А, подозрительные на экстремум. Соответствующие этим
точкам множители Лагранжа нетрудно выписать явно. Однако они нам
ниже явно не понадобятся, важен лишь факт их существования. Поскольку
X компактное множество, функция f(x) непрерывна на X, то согласно
теоремам 1.1, 1.4 эта функция достигает на X своего глобального минимума
и максимума. Но точки глобального экстремума, конечно же,
удовлетворяют системе (9). Но система (9) при Xq ф 0 имеет всего два решения vx и
v2. Следовательно, одна из этих точек является точкой глобального
минимума, другая — точкой глобального максимума. Вычислив и сравнив
значения /(^,),/(¾). нетрудно убедиться, что «, = Дг—точка глобального
минимума со значением f(vi) = ftf =р — 2 J2 xi +J2 xh v2 = ~ \\—точка
Р Р
глобального максимума со значением /(¾) = /* —р + 2 J2 х{ +Y1 ХЬ По-
i=i t=i
скольку при Xq ф 0 у функции f(x) других точек экстремума на X нет, то
f(v\) <f(x) Va; е X, хф «,, и f(x) <f(v2) УхеХ, хф v2, т. е. экстремумы
строгие.
Рассмотрим случай Xq = 0. Тогда системе (9) удовлетворяют все точки v,
для которых \v\ = 1. Это значит, что из необходимых условий экстремума (9)
при Xq = 0 нам не удалось извлечь никакой полезной информации — все
точки единичной сферы как были, так и остались подозрительными на эк-
р
стремум. Однако нетрудно убедиться, что при Xq = 0 f(x)=p+ J2 ж? = const
i = \
Ух e X, и рассматриваемая задача стала тривиальной: можно сказать, что
все точки х е X являются точкой абсолютного минимума (или максимума).
Пример 2. Определим точки экстремума функции f(u) = х на
множестве X =_{и = (х, у) G Е2: д(х) = х3 - у2 = 0}. Функция Лагранжа здесь
равна £(и, А) = А0ж + Х(х3 - у2). Система (8) запишется в виде:
А0 + ЗАж2 = 0, -2\у = 0, х3-у2 = 0, (\0,\)ф0.
§ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
63
Из этой системы находим единственную точку v = (0, 0), подозрительную
на экстремум. Ей соответствует конус Лагранжа A(v) = {Л = (Л0 = 0, Л):
VA ф 0}. Нетрудно видеть, что точка v = 0 в этой задаче является точкой
глобального минимума. В самом деле, из равенства х3 — у2 = 0 следует, что
/(и) = х = (у2)1'3 £ 0 = /(0) = /, Vu е X. Здесь /* = +оо.
2. Изложим правило множителей Лагранжа для задачи поиска точек
экстремума функции f(x) на множестве, имеющем более общий вид:
X = {х е Еп: 9l(x) < 0, ..., дт(х) < 0, дт + 1(х) = 0, ..., gs(x) = 0}, (10)
где предполагается, что функции f(x), д^х),..., gs(x) определены на всем
пространстве Еп. Ограничения gi(х) = 0, г = т+ 1, . .., s, как и в (1),
будем называть ограничениями типа равенств, а ограничения gt(x) ^ 0,
г = 1,..., т — ограничениями типа неравенств. В (10) не исключаются
возможности, когда отсутствуют ограничения типа равенств (s = т) или
типа равенств (т = 0); при s = т = 0 множество X = Еп получаем задачу
на безусловный экстремум из § 2. Для исследования задачи поиска
экстремума функции f(x) на множестве (10) введем функцию Лагранжа
C(x,X) = X0f(x)+±Xi9i(x)
3 = 1
переменных х е Еп, А е Es + l, внешне ничем не отличающуюся от
функции (3), но здесь, оказывается, достаточно ограничиться рассмотрением
лишь неотрицательных множителей А,,..., Ат, соответствующих
ограничениям типа неравенств.
Теорема 2. Пусть xt — точка локального минимума функции
f(x) на множестве (10), функции f(x),gi(x),...,gm(x)
дифференцируемы в точке xt, функции gm+i(x),..., gs(x) непрерывно
дифференцируемы в некоторой окрестности точки xt. Тогда существуют множители
Лагранжа A = (Aq, ..., А*) такие, что
Гфо, а^о, а*^о, ..., а;^о, £х(х„Г)=о, а;Л(^)=о, ;=i,...,m.
Отметим, что теорему 2 в литературе иногда называют теоремой Ка-
руша — Джона [234; 586]. Доказательство этой теоремы требует развития
некоторого математического аппарата, и оно будет ниже проведено
двумя способами для несколько более общих множеств, чем (10) (см. § 4.8,
§ 5.16). Из теоремы 2 следует, что точками локального минимума функции
f(x) на множестве (10) могут быть лишь те точки хеЕп, для которых
существуют множители Лагранжа А = (А0,..., А„), такие, что пара (х, А)
является решением системы
А„/'(я) + £ VA*) = °> A*ft(z) = 0, 9{(х)^0, i = l,...,m,
3 = 1
д{(х) = 0, i = m+l,...,s, \ф0, A0^0, A,>0, ..., Am^0. (11)
Пусть v — какая-либо фиксированная точка локального минимума
функции f(x) на множестве (10). Множество всех точек А, для которых пара
64
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
(x = v, А) является решением системы (11), будем называть множителями
Лагранжа, соответствующими точке v, и будем обозначать через Л = Л(г;).
Нетрудно видеть, что если (г;, А) — решение системы (11), то (г;, аХ) при
всех а > О также является решением этой системы, так что Л(^) —
конус. Этот конус, как и в случае множества (1), будем называть конусом
Лагранжа точки г;.
Равенства \igi(x) = 0, г = 1,.. ., т, из (11) принято называть условиями
дополняющей нежесткости. Если g{(v) < 0 при некотором г, 1 ^ г < т,
то из условия дополняющей нежесткости следует, что координата А; =0 у
всех А еЛ(и); с другой стороны, если у некоторого набора А бЛ(г;)
оказалось, что Аг > 0 при некотором г, 1 ^ г ^ т, то соответствующее g{(v) = 0.
Ограничение gt(x) ^ 0 называется активным в точке v, если д((ь) = 0, и
пассивным (неактивным) в точке v, если g{(v)<0. Ограничения д{(х) = 0,
г = т + 1,.. ., s, в любой точке v е X, конечно, являются активными.
Замечание 2. Как и выше (см. замечание 1), нетрудно
убедиться, что точки v локального максимума функции f(x) на множестве (10) и
соответствующие им множители Лагранжа А являются решением системы
A0/'(z) + Е Ау5/(а:) = 0, A,9i{x) = 0, 9i(x) ^ 0,
3~l i = l,...,m, д((х) = 0, i=m+l,...,s,
A=(A0,A1,...,As)^0, А0^0, А,^0, ..., Ат^0. (12)
Множество всех А, для которых пара (x = v, А) является решением
системы (12), будем обозначать через Л~(г/). Множество Ar(v) и здесь будет
конусом, и его также будем называть конусом Лагранжа. Отличие этого
конуса от конуса, соответствующего точке локального минимума в том, что
здесь у всех точек А е Ar(v) координата А0 ^ 0. Такие соглашения о знаке
А0, как уже отмечалось в замечании 1, несмотря на всю свою условность,
позволят нам несколько унифицировать дальнейшее изложение.
Так как A(v), Л"(г;) конусы, то в системах (11), (12) условие А ^0 можно
s
заменить каким-либо условием нормировки, взяв, например, |А|2= Е Af=l.
i = 0
Вместо отдельного исследования систем (11), (12) можно рассмотреть одну
систему
Сх(х,\) = \0Г(х)+±\^(х) = 0, \i9i(x) = 0, 9i(x)^0,
3 = 1
i = 1,..., т, &(ж) = 0, i = m+l,...,s,
A=(A0,A1,...,As)^0, A, ^0, ..., Am ^0, (13)
з
полагая в ней последовательно А0 = 1, А0 = — 1 и А0 = 0, 2^ = 1. Нетруд-
> = i
но видеть, что в системе (13) с учетом условий нормировки содержится
подсистема из n + s + 1 уравнений с n + s + 1 неизвестными (х, Л) = (яс1,...
..., хп, А0,..., А„). Определив решения этой подсистемы и отобрав из них
те, которые удовлетворяют остальным условиям (13), получим множество
точек v, подозрительных на экстремум и соответствующие им множители
Лагранжа A = \(v). Для дальнейшего выяснения того, будет ли в
найденных точках v в самом деле реализовываться экстремум, как и в задачах
§ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
65
с ограничениями (1), нужно провести дополнительное исследование
поведения функции f(x) в окрестности точки v с учетом ограничений (10) или
попытаться использовать достаточные условия экстремума из § 5.
Правило множителей Лагранжа для поиска точек экстремума функций
на множествах вида (10) изложено. Проиллюстрируем его на примерах.
Пример 3. Пусть требуется найти точки экстремума функции f(x) =
р
= J2 \х — xi\2 из примера 1 на шаре X = {х е Еп: \х\2 = (х, х) ^ 1}.
Функция Лагранжа этой задачи
К(х, A) = \0f'(x) + Xl((x, о;)-1), хеЕ\ А, ^ 0.
— 1 р
Ее производная равна £х(х, А) = 2Х0р(х — х0) + 2А,ж, где а\, = -]С xi-
Система (13) имеет вид: , = 1
(А0р+A,)^0^, A^l^l2—1)=0, \x\2^l, A=(Ao,A,)^0, А,^0. (14)
Нетрудно убедиться, что при А0 = 0 эта система не имеет решения.
Анализируя систему (14) при А0 = 1 и А0 = -1, получим следующие точки,
подозрительные на экстремум: vl = x0 при \xq\ ^ 1 с соответствующими
множителями Лагранжа А, ,=(1,0) и Aj 2 = (—1,0); ^2 = 7-^ при \xq\ > 1 с
А2 = (А0 = 1)А1=р(|яЬ|-1)>0)^ = |^приО<|яЬ|<1сАз = (А0 = -1,А1 =
= р(1-|яь|)>0);«4 = -|^ при |аЬ|>0сА4 = (А0 = -1, А, =р(1+ К|)>0);
наконец, при :¾ = 0 подозрительными на экстремум будут все точки v5 на
единичной сфере | х \ = 1 с множителем А 5 = (А0 = — 1, А, = р> 0).
Выясним теперь, будет ли в отобранных точках действительно реализо-
вываться экстремум, анализируя поведение функции f(x) в окрестности
этих точек с учетом ограничения \х\ ^ 1. В данной конкретной задаче такой
анализ удается провести до конца. Так как /(^)-/(¾) = р\х — Xq\2 Ух е Еп
и, тем более, Ух е X, то ясно, что ^, = ¾ является точкой глобального
минимума f(x) на X (ср. с примером 2.2). В точке v2 согласно теореме
2 можно ожидать, что будет локальный минимум. Это ожидание
оправдывается и, более того, v2 — точка глобального минимума. В самом деле, с
учетом неравенства \xq\ > 1 имеем: f(x) — f(v2) = p(\x — Xq\ + \xq\ — l)(\x —
— яь| — 1¾] + 1) ^ p\x -^|(1- \x\) > 0 Ух e X.
В точке v3, судя по знаку А0, может быть локальный максимум.
Однако установленное в примере 1 неравенство f(x) > f(v3), справедливое при
всех х, \х\ = 1, говорит о том, что это не так. Следовательно, точка чх при
0< \xq\ < 1 не может быть точкой экстремума функции f(x) на X. Далее,
для точки и4 = -рт> Ы > ° имеем f(x) - /(у4) = р(\х - х0\ + \xq\ + 1)(\х -
-ж0|-|^|-1)^р([ж-ай| + |^| + 1)(|а;|-1)^0 УхеХ. Это значит, что «4—
точка глобального максимума. Наконец, пусть :¾ = 0, пусть v5 —
произвольная точка такая, что \v5\ = 1. Тогда f(x) - /(%) = р(\х\2 — 1) < 0 Ух G X.
Следовательно, при :¾ = 0 все точки единичной сферы являются точками
глобального максимума (ср. с примером 1).
Пример 4. Найти точки экстремума функции f(u) = х на множестве
X = {и = (х, у) е Е2: 9l(u) = -х^0, д2(и) = х2-у^0, д3(и) = у-2х2 <: 0}.
66
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Здесь Ди, Х) = Х0х + Х1(-х) + Х2(х2-у) + Х3(у-2х2), (х, у)еЕ2, Л, ^0,
Л2 ^ 0, А3 ^ 0. Система (13) имеет вид
А0 — А, + 2ж(А2-2А3) = 0, -Л2 + Л3 = 0, А,(-ж) = 0,
Х2(х2-у) = 0, Х3(у-2х2) = 0, -х^О, х2-у^0, у-2х2^0,
А,^0, А2^0, А3^0,А = (А0,...,А3)^0. (15)
Допустим, что решением (15) является пара (v, А), где v = (х, у), х>0.
Тогда 0 < х2 ^ у ^ 2х2, причем хотя бы одно из неравенств ^ строгое. Отсюда
и из (15) следует, что А, =0, А2 = А3 = 0, А0 = 0, что противоречит условию
А Ф 0. Остается одна возможность, что v = (х = 0, у). Но тогда из
предыдущих неравенств имеем у = 0. Таким образом, в рассматриваемой задаче
подозрительной на экстремум _является лишь точка v = (0,0). Ей
соответствуют множители Лагранжа А, =(1, 1, А2 ^0, А3 = А2 ^0), А2 = (0, 0, А2 ^
^ 0, А3 = А2 ^ 0) (с учетом нормировки А0 = 1 или А0 = 0). Поскольку у
всех точек и — (х, у) е X координата х ^ 0, то f(u) = х^0 = /(0) УиеХ.
Следовательно, v = 0 — точка глобального минимума.
Пример 5. Найти точки экстремума функции f(u) = х + cos у на
множестве Х = {и = (х, у) Е Е2: д(и) = х ^ 0}.
Здесь С(и, A) = A0(a;+cos у) + Х1х, (х, у)еЕ2, А, ^ 0. Система (13) имеет
вид:
А0+А,=0, А0 sin 2/=0, Л,¢=0, х < 0, А,^0, А=(А0) А,)^0.
Из этой системы определяется бесконечно много подозрительных на
экстремум точек vk = (x = 0, у = тгк), к=0, ±1, ±2,...; всем им соответствует один
и тот же набор множителей Лагранжа А =(—1, 1) (с учетом нормировки).
Отсюда видно, что в этой задаче точек локального минимума нет. В точках
v2 = (0, 2тгпг), m = 0, ±1,..., реализуется глобальный максимум, так как
}(и) = х + со&у^ 1 =/(%J УхеХ. Далее, f(v2m + l) = -l, причем в
любой сколь угодно малой е-окрестности точки v2m+i нетрудно указать точки
иеХ, в которых /(и) < —1 (например, и = (х, у = т:(2т+ 1), -е < ж <0) и
/(и)>-1 (например, и = (х = 0, у), 0< |у-7г(2т + 1)| < е). Следовательно,
в точках v2m + i, т = 0, ±1,... экстремума нет.
Упражнения
1. Пользуясь правилом множителей Лагранжа, найти точки экстремума функции f(u) на
множестве X, если:
а) f(u) = x2 + y2 + z2, Х = {и = (х, у, z)eE3: х + y + z = 1}, или X = {и еЕ3: х^0,у^
5>0,.О0, x + y + z=l}, шиХ ={иеЕ3: x-2y + Sz = 1}, или X = {ut=E3: x + y + 2z = 2,
x-2y+z=—2}\ рассмотреть множества, полученные из X заменой ограничений типа равенств
на ограничения типа < или >;
б) f(u) = x, Х = {и = (х,у)еЕ2: х2 + У2 ^1, х2 ^у, х + у ^0}, шиХ={и = (х,у)еЕ2:
ж2 + у2 < 1, ж3 + у3= 1}, или Х = {и = (х,у)еЕ2: х2 + у2<1, (-х)3 < у < х3};
в) f(u) = sin(a + у) - sin х - sin у, X ={и = (х,у)еЕ2: х < 0, у ^ о, х + у < 2тт}.
2. Среди всех вписанных в данный круг радиуса R треугольников найти тот, площадь
которого наибольшая [периметр которого наибольший].
3. Среди всех параллелепипедов, имеющих ребра данной длины, найти параллелепипед
наибольшего объема.
§ 3. ЗАДАЧИ НА УСЛОВНЫЙ ЭКСТРЕМУМ
67
4. Среди треугольных пирамид с данным основанием и высотой найти ту, которая имеет
наименьшую боковую поверхность.
5. Пусть Д = Д(ж, жп)—определитель матрицы (xt хп), столбцами которой
являются вектор-столбцы ж,- с координатами ж J ж™, г = 1 п. Найти наибольшее и
наименьшее значение величины определителя А при условии, что |жг-| = аг, где а; —заданные
положительные числа, г = 1 п. Доказать неравенство Адамара |Д| < |Ж] \ ■ |ж,| •... • |жп|.
Дать геометрическую интерпретацию задачи при п = 2, 3 (ср. с упражнением 3) [352, ч. I,
с. 554-557].
6. Найти наименьшее и наибольшее значение квадратичной формы /(ж) = (Ах, х) при
условии х е X = {х е Еп: (х, х) = 1}, где А ■— симметрическая матрица. Показать, что величины
Д = т1п/(ж) и /* = тах/(ж) представляют собой соответственно наименьшее и наибольшее
собственное число матрицы А ([353, с. 209]).
7. Найти точки экстремума функций f(u)=x+y, f(u)=\x\+\у —' 1|, f(u)—x2+2y2 на
множествах X, где Х={и=(х, у) <=Е2: 0<x<l,0<j^l} или Х={и=(х, у) <=Е2; х-у2 >0,
х2+у2 < 1}, илиХ={и=(ж, у)еЕ2: ж>0, 2/^0, ах+Ьу= 1}, числа а^О, Ь ^0. Указание:
нарисовать пересечения графиков линий уровня f(x) = const со множеством X.
8. Пусть Х = {хеЕп: (с, х) = 1} или Х = {а:еВ": (с, х) < 1}, где сей", с^О. Найти
точку ж е X, сумма квадратов расстояний от которой до р данных точек ж,, а^ же Еп
была бы минимальной [максимальной] (ср. с примерами 1,3).
9. Задачи из примеров 1, 3 и упражнения 8 исследовать геометрически (при п = 2,3),
v
используя тот факт, что поверхности уровня /(ж) = const, где /(ж)= X) |ж —жг.|2, являются
1 v i=\
сферами |ж-а^|=Я с центром я^=„ 2_, xi- ' '
« = 1
10. Пусть f(u) = ж, Х={и = (х, у) еЕ2: д,(и) = х2 - у = 0, д2(и) = х2 + у = 0, д3(х) = х = 0}.
Дайте описание конуса Лагранжа точки v = (0, 0), выясните характер экстремума в этой точке.
11. Приведите пример функции /(ж) и множества X, таких, что /(ж) не имеет ни одной
точки экстремума на X, а система (13) имеет бесконечно много решений. Начните с функции
f(u) = ж + у на множестве X = {и = (ж, у) еЕ2: д(и) = х2 - у2 =■ 0}.
§ 4. Необходимые условия экстремума второго порядка
Для более тонкого анализа точек экстремума используются
необходимые условия второго порядка. Так называются условия, в формулировке
которых используются вторые производные функций, входящих в
постановку задачи. С помощью этих условий проводят дополнительный отбор и
суживают множество точек, подозрительных на экстремум, выделенных с
помощью необходимых условий первого порядка. Для задач на безусловный
экстремум необходимые условия второго порядка мы уже формулировали
выше (теорема 2.1). Перейдем к формулировке таких условий для задач на
условный экстремум.
1. Как в предыдущем параграфе, изложение начнем с классической задачи
поиска экстремума на множестве
X = {xeEn:gi(x) = 0,...,gs(x)=0}, (1)
задаваемом ограничения типа равенств. Известные в^литературе
необходимые условия второго порядка в задачах на условный экстремум обычно
формулируются при дополнительном требовании нормальности точки,
подозрительной на экстремум (см., например, [14; 670; 721]).
Определение 1. Точка v называется нормальной точкой
множества (1), если v е X и векторы £/,'(«),..., gs'(v) линейно независимы.
68
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Требование нормальности точки в литературе часто называют условием
Люстерника. Посмотрим, как устроен конус Лагранжа A(v) в нормальной
точке локального минимума. Перепишем уравнение Cx(v, А) = 0 из
системы (3.6) в виде:
X1g1'(v) + ... + X.g.'(v) = -X0f'(v). .(2)
По определению точка А = (А0,..., А„) принадлежит конусу_Л(г;) тогда и
только тогда, когда А является решением уравнения (2) и А Ф О, А0 ^ 0.
При каждом фиксированном А0 (2) представляет собой систему линейных
алгебраических уравнений относительно неизвестных А =(А,,..., А„) с
матрицей {g/iv),..., gs'(v)}, ранг которой в нормальной точке v равен s,
причем s^n. Отсюда следует [192; 353], что при каждом А0 система (2) имеет
единственное решение А, и оно представимо в виде А = А0/х, где р, —
решение этой системы при А0 = 1. Это значит, что конус Лагранжа в нормальной
точке v есть открытый луч Л(г;) = {А е Es + U. А = А0(1,/х), А0>0} с
направляющим вектором (1,/х).
Теорема 1. Пусть функции f(x), д{(х),..., gs(x) дважды
непрерывно дифференцируемы в некоторой окрестности точки v локального
минимума функции f(x) на множестве (1), пусть v —нормальная
точка этого множества, A(v) — конус Лагранжа точки v. Тогда для любой
точки A eA(v)
(£xx(v,X)h,h)>0 VheK(v)={heEn:(gi'(v),h)=0,i=l,...,s}. (3)
Конус K(v), введенный в (3), называют конусом критических
направлений множества (1) в точке v. Этот конус непуст, так как он всегда
содержит точку h = 0. В нормальной точке v при s = п конус K(v) состоит
из единственной точки h — 0, а при 0 < s < п он является подпространством
размерности п - s. Так как функция £(х, А) однородна по переменной А,
т. е. С(х, а\)=а£(х, A) Va, аЛ(г;) — луч с направляющим вектором (1, р),
то условие (3) достаточно проверить при А = (1, /х). Для нормальной точки
локального максимума теорема 1 сохраняется, нужно лишь в ее
формулировке конус Л(«) заменить на конус Л~(г;) = {А eEs + u. А = А0(1, /х), А0<0}.
Для иллюстрации теоремы 1 приведем пример.
Пример 1. Пусть f(x) = (xl)2-(x2f, X = {х = (х\ х2) е Е2:
д(х) = х1 = 0}. Тогда функция Лагранжа С(х, А) = А0((ж1)2 — (х2)2) + Xlxi,
ее производные £х(х, А) = (2А0ж1+ А,, -2А0ж2), Схх{х, X) = ( Q° _2д );
квадратичная форма (Схх{х, X)h, h) = 2A0((/i')2 - (h2)2). Нетрудно видеть,
что точка v = (0, 0) нормальна и подозрительна на локальный минимум, ее
конус Лагранжа Л(0) = {А = А0(1, 0), А0 > 0}. Применим к ней теорему 1.
Здесь конус критических направлений К(0) = {h = (hl, h2): hx = 0}. Тогда
(Cxx(0, X)h, h) = -2X0(h2)2 <0 Vhe K(0), НфО. Условие (3) не
выполняется. Следовательно, точка v = 0 не может быть точкой локального
минимума функции /(ж) на множестве X. Нетрудно убедиться, что точка г; = 0
с конусом Л~(0) = {А = А0(1, 0), А0 < 0} также удовлетворяет условию (3)
и претендует на локальный максимум. В этом простом примере ясно, что
v = 0—-точка глобального максимума f(x) на X.
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
69
Теперь откажемся от априорного требования нормальности точки,
подозрительной на экстремум.
Определение 2. Точка v называется анормальной точкой
множества (1), если v е X и векторы gi'(v),..., g/(v) линейно зависимы, т. е.
существуют числа А,,..., Ая такие, что
• Alfll'(«) + .-. + A.a'(«) = 0, A=(A„...,As)^0. (4)
Сразу отметим следующее интересное свойство анормальных точек.
Условие (4) можно переписать в равносильном виде: 0 • f'(v) + A,<7,'(w) + ...
.. . + \„gs'(v) = 0, А =(А0 = 0, Х)фО, для любой дифференцируемой функции
f(x). Это значит, что набор А = (О, А) е A(v), т. е. конус A(v) ф0.
Следовательно, всякая анормальная точка v множества (1), по сути выражающая
лишь некоторое специфическое свойство (4) этого множества,
автоматически удовлетворяет необходимым условиям экстремума первого порядка и
оказывается подозрительной на экстремум для любой дифференцируемой
функции f(x).
Посмотрим, как устроен конус Лагранжа в анормальной точке локального
минимума. Оказывается, в такой точке v конус A(v) U {0} содержит
прямую. В самом деле, если набор А = (А,,..., А„) удовлетворяет условию (4),
то набор (—А) также удовлетворяет ему. Тогда точки А0 = (А0 = 0, А) ф0
и (—А0) = (А0 = 0, — \\ф 0 являются решением системы (2) при А0 = 0_и,
следовательно, А0, (—X0)eA(v). Так как A(v) конус, то прямая А(£)= *А0,
—оо < t < +оо, с направляющим вектором А0 ф 0, принадлежит Л(^) U {0}.
Верно и обратное: если конус A(v) U {0} содержит некоторую прямую
Л(£) = £Д, -оо < t < +оо, Д = (/х0, .. .±/j,s) ф0, to_v — анормальная точка
множества (1). Действительно, тогда А(1) = Д и А(— 1) = — Д принадлежат
A(v). Поскольку у всех точек А конуса A(v) координата А0 ^ 0, то
необходимо jUq ^ 0, — jUq ^ 0, так что /½ = 0, А = (/х,,..., /х„) Ф 0. Это значит, что
условия £x(v, Д) = 0, ЦфО из системы (3.6) превращаются в условие (4).
Следовательно, v — анормальная точка множества (1).
Из приведенных рассуждений следует, что точка v локального минимума
анормальна тогда и только тогда, когда конус Л(г;)и{0} неострый.
Аналогично доказывается, что точка v локального максимума будет анормальной
тогда и только тогда, когда конус Ar(v)U {0} неострый.
Заметим, что наличие анормальных точек у множества (1) довольно
частое явление. Если s > п, то всякая точка множества (1) анормальна и,
следовательно, подозрительна на экстремум для любой дифференцируемой
функции f(x).
Типичным примером задачи, приводящей к необходимости исследования
на экстремум анормальных точек, является следующая: при каких условиях
на симметричные матрицы Q0,..., Qs квадратичная форма {Q0x, х) ^ 0 Уже
еК = {х ей": < Qtx, х >=0[^ 0], г'=1,..., s} (см. ниже упражнения 4,
5). Эта задача имеет различные приложения и показывает, что^проблема
изучения анормальных точек экстремума не является надуманной.
Для дальнейшего анализа на экстремум анормальных точек нужны
необходимые условия второго порядка. Однако теоремой 1 мы здесь
пользоваться не можем, так как она доказана в предположении, что v
—нормальная точка. Более того, нетрудно привести примеры, показывающие, что для
анормальных точек теорема 1 просто неверна.
70
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Пример 2. Рассмотрим задачу: f(x) = —(х1)2 — (х2)2 + (ж3)2 —> inf,
хеХ = {х = (х\ х2, х3) е Е3: gt(x) = х[х*= 0, д2(х) = (х()2 - (х2)2 = 0}.
Нетрудно видеть, что множество X состоит из точек х = (0, 0, х3) с Vas .
Отсюда ясно, что v = (0, 0, 0) = 0 — точка глобального минимума функции
f(x) на X. Так как #/(0) = 0, д2'(0) = 0, то условия (4) выполняются при всех
A =(A,,A2)^0. Следовательно, v = 0 — анормальная точка_множества X.
Кроме того, /'(0)=_0, и, очевидно, конус Лагранжа Л(0) = {А =(А0, А,, А2):
А0 ^ 0, VA,, VAj, А ф 0}. Убедимся, что условие (3) не выполняется ни для
одного набора А е Д(0). В самом деле, здесь
0
1
0
1
0
0
0
0
0
£ra(z,A) = 2A0 0 -1 0 +А, 1 0 0 +А2 0 -2 0 УхеЕ3
2
0
0
0 0
-2 0
0 0
конус К(0) = {h = (ft1, h2, h3) e E3: (¢//(0), ft) = 0, (g2'(0), ft) = 0} = E3.Tlo
этому условие (3) означает, что £ет(0, A )^0 (см. определение 2.2).
Воспользуемся критерием неотрицательности матрицы, приведенном в
замечании 2.2. Если А = (А0 > 0, А, = 0, А2 = 0), то неравенство
£ет(0,А) = 2А0
невозможно ни при каком А0 > 0. Если же А=(А0=0, VA,, VA2), то
неравенство
£ет(0,лн( Л; ^2А2 oho
также невозможно, так как det <2 _п\ =— 4Л| — А2 < 0 V(A,, А2)^0.
Аналогично исследуется случай А0 > 0, (А,, А2) ф 0.
Таким образом, теорема 1 в анормальных точках перестает быть
справедливой. Следовательно, необходимые условия экстремума второго порядка
для анормальных точек должны формулироваться как-то иначе, чем в
теореме 1. А как? Ниже приводится необходимое условие второго порядка,
справедливое в общем случае, независимо от того, является ли точка v
нормальной или анормальной. Этот интересный и изящный результат
принадлежит А. В. Арутюнову [44] и в учебной литературе излагается впервые.
Определение 3. Пусть v — точка локального минимума функции
f(x) на множестве (1) и A(v)— соответствующий ей конус Лагранжа.
Конусом Арутюнова Аа = Aa(v) будем называть конус, состоящий из таких
наборов А = (А0,..., As) е A(v) для каждого из которых существует
подпространство П = П(А) пространства Еп, обладающее следующими тремя
свойствами:
ШтП(А) ^тах{п-я;0},где dim П(А)— размерность П(А); (5)
П(А) С ker G'(v)={heEn; (g/(v), ft)=0, *=1,...,*}, G=( 9]. ) ; (6)
<A>,A)ft, ft) ^0 Vften(A).
(7)
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
71
Подпространство П(А) со свойствами (5)-(7) будем называть
сопровождающим подпространством точки А eAa(v).
Убедимся, что множество Ла(г;) в самом деле является конусом. Возьмем
произвольные точку A G Aa(v) и число а > 0. Для точки аА в качестве
сопровождающего подпространства можно взять то же подпространство П(А),
которое является сопровождающим для точки А. Свойства (5), (6) не
требуют доказательств, а свойство_(7) вытекает из того, что (£xx(v, a\)h, h) =
= a(£xx(v, X)h, h)^0 V/i G ЩА), Va >_0. Это значит, что Aa(v) — конус.
Заметим, что при s^n каждая точка А eA(v) обладает сопровождающим
подпространством П(А) = {0}. Следовательно, Aa(v) = A(v) при я > п.
Теорема 2 (Арутюнов [44]). Пусть v —точка локального
минимума функции f(x) на множестве (1), пусть функции f(x), g^x),..., gs(x)
дважды, непрерывно дифференцируемы в некоторой окрестности точки
v. Тогда
л» ^0; (8)
max (C„(v,\)h,h)>0 (9)
АеЛ», |Л| = 1
VheK(v)={h е Еп: (а'(«), Л)=0, г = 1,..., s}.
Доказательство этой теоремы будет дано ниже в § 5.16. Сейчас мы
прокомментируем ее и проиллюстрируем примерами. Сразу же заметим,
что в условиях (7) и (9) участвует одна и та же квадратичная форма
(£xx(v, \)h, h), и у читателя может сложиться впечатление, что оба этих
условия как-то связаны с неотрицательной определенностью указанной
формы. Условие (7) в самом деле означает неотрицательность этой формы
на сопровождающем подпространстве П(А). А условие (9) гарантирует
лишь то, что для каждого фиксированного h е K(v) найдется своя
точка A = X(h) eAa(v), \X(h)\ = 1, для которой значение квадратичной формы
(Аи(щ> ^)^> ^) ^ 0> что вовсе не исключает того, что в какой-либо другой
точке h е К(v) значение той же формы будет <0. Как увидим ниже на
примерах, бывают, конечно, случаи, когда максимум в (9) достигается в одной
и той же точке А* при всех h е K(v), и для такого А квадратичная форма
(Ara(w) ^*)^i h) в самом деле будет неотрицательной на K(v). На примерах
мы также увидим, что такого универсального А , не зависящего от h,
может и не существовать. Заметим также, что условие (8) непустоты конуса
Aa(v) вовсе не вытекает из условия A(v) ^0и весьма содержательно.
Посмотрим, во что превращается теорема 2, когда v — нормальная точка
множества (1). Тогда, как было выяснено выше, конус Лагранжа A(v) =
= {А = А0(1, /х), А0>0} — открытый луч с направляющим вектором (1,/х)
где р, — решение системы (2) при А0 = 1. Согласно теореме 2 конус АЛу)ф
ф0. Отсюда и из включения AAv)<zA(v) следует, что Aa(v) =A(v). Далее,
в нормальной точке v конус ker G'(v) является подпространством в Еп
размерности_п—s^O. С другой стороны, сопровождающее подпространство
П(А) точки X eAa(v) в силу (5), (6)_имеет размерность dimn(A)^ п — s, и
ЩА) С ker G'(v). Следовательно, П(А) = кег G'(u) \/XeAa(v), т. е. все точки
A G Ла(г;) обладают одним и тем же сопровождающим подпространством,
совпадающим с ker G'(v), Кроме того, в рассматриваемой задаче ker G'(v) =
= К {у), и условие (7) означает, что (£Хх(у, \)h, h)^0 Vh е П(А) = K(v)
72
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
и VA G Aa(v) = A(v). Отсюда следует, что условие (9) в нормальной точке
v совпадает с условием (7), так как множество {Л еЛа(г;), |Л| = 1} состоит
из единственной точки и знак максимума в (9) можно опустить. Таким
образом, если точка локального минимума v функции f(x) на множестве (1)
является нормальной точкой этого множества, то теорема 2 превращается
в теорему 1.
Теперь рассмотрим другую крайность, когда v — точка локального
минимума, является анормальной точкой множества (1), и, более того, пусть
gl'(v) = .. . = gs'(v) = 0. Тогда конус ker G'(v) = En, и условие (6) тривиально
выполняется для всех Л eAa(v). Для истолкования условий (5), (7) здесь
удобно воспользоваться понятием индекса квадратичной формы. Как
известно из линейной алгебры [192; 213; 349; 351; 353], всякая квадратичная
форма (Ах, х) с помощью невырожденного линейного преобразования
может быть приведена к каноническому (диагональному) виду, причем число
положительных, число отрицательных и число нулевых членов в
канонической форме не зависит от способа приведения (закон инерции квадратичных
форм). Поэтому имеет смысл
Определение 4. Число положительных членов в каноническом
виде квадратичной формы {Ах, х) называется положительным индексом
этой формы, число отрицательных членов — отрицательным индексом.
Если при приведении квадратичной формы (Ах, х) к каноническому виду
используются лишь ортогональные преобразования, то коэффициенты
канонического вида квадратичной формы совпадают с собственными числами
матрицы А, причем положительный индекс этой формы равен числу
положительных собственных чисел матрицы А, отрицательный индекс — числу
отрицательных собственных чисел этой матрицы (с учетом их кратности).
Ниже нас будет интересовать лишь отрицательный индекс, и мы его для
краткости будем называть просто индексом квадратичной формы. Можно
доказать, что индекс квадратичной формы совпадает с размерностью
максимального подпространства L_ пространства Еп, на котором форма (Ах, х)
отрицательна, т. е. (Ах, х) < О Ух е L_, хфО, или еще иначе, индекс
формы равен коразмерности максимального подпространства L+, на котором
форма неотрицательно определена. Напомним, что коразмерность
подпространства L+, по определению, есть число (n-dim L+) [192; 213; 349; 353].
Отсюда и из (5), (7) получаем содержательное утверждение: если 0< s<
<яи ker G'(v) = En в анормальной точке v локального минимума функции
f(x) на множестве^1) индекс квадратичной формы (Cxx(v, X)h,h) не
превышает s при всех Л £Aa(v), или, иначе говоря, количество отрицательных
собственных чисел матрицы Cxx(v, А) не превышает s при VA G Aa(v). В
общем случае, когда в анормальной точке подпространство кёг С(у)фЕп,
можно показать, что количество отрицательных собственных чисел
матрицы P(v)£xx(v, \)P(v) не превышает s-rang{g,'(«),..., gs'(v)}, где P(v) —
матрица оператора проектирования пространства В" на подпространство
ker G'(v), ranglg^v),..., gs'(v)} обозначает ранг матрицы, столбцами
которой являются векторы <7,'(w),..., gs'(v). Заметим, что Р(v)Cxx{v, \)P(v) —
симметричная матрица, так как симметричны матрицы P(v), £xx(v, Л).
Замечание 1. Учитывая, что всякая точка локального максимума
функции f(x) на множестве X является точкой локального минимума
функции (—/(ж)) на том же множестве, из теорем 1,2 нетрудно получить
необходимые условия второго порядка для точки локального максимума. Пред-
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
73
лагаем читателю убедиться, что все утверждения теорем 1, 2 полностью
сохраняются, нужно лишь конусы A(v), Aa(v) заменить соответственно
конусами A~(v), Л~(«). Определение конуса Арутюнова A"a(v) для точки v
локального максимума функции f(x) на множестве (1) получается из
определения 3 заменой конуса A(v) на конус A~(v), в котором, в отличие от A(v),
все наборы Л = (Л0,..., Ля) имеют координату Л0 ^ 0 (см. замечание 3.1).
Для иллюстрации теоремы 2 рассмотрим несколько примеров.
Пример 3. Задача: /(ж) = -(ж')2 - (ж2)2 + (ж3)2-Mnf, х еХ = {х =
— (х,х2,х3)еЕ3: д{(х) = х1х2 = 0, д2(х) = (х^)2 — (х2)2 — 0}. Эту задачу мы
уже рассматривали в примере 2 и убедились, что точка г; = (0, 0, 0)
глобального минимума является анормальной точкой множества X и теорема 1 к
нет неприменима. Теорема 2 к этой точке, конечно, применима, и тем не
менее интересно посмотреть, как конкретно устроен здесь конус Ла(0),
подпространства П(0) и т. п. Конус Лагранжа Л(0) для точки v—О, как мы уже
знаем, состоит из всех точек Л = (Л0, Л,, Л2) ф 0 с произвольными Л0 > 0, Л,, Л2,
а конус ker G'(0) = Е_^. Покажем, что конус Арутюнова Ла(0) = Л(0). В
самом деле, возьмем VA е Л(0) и подпространство U = {h = (hl, h2, h3) е Е3:
hl =0,h2 = 0}. Здесь п = 3, а = 2, и dimП = 1 = 3 - 2, П с ker (7(0) = Е3.
Кроме того, (£ет(0, X)h, h) =2X0(h3)2 ^0 V/i еП. Таким образом, для всех
Л G Л(0) нам удалось указать одно и то же сопровождающее
подпространство П. Это значит, что Ла(0) = Л(0). Заметим, что для некоторых Л е Л(0)
можно указать и другие сопровождающие_подпространства. Например, для
А,=(0, 1^0) квадратичная форма (£^.(0, A,)/i, /i)=A,/i'/i2^0 для_всех he
en=Yl(X.)={h=(h\h2, h3): к"=ф2} с V7>0. Ясно, что dimП(А,)=2> 1
и все свойства (5)-(7)_выполнены. Нетр_удно проверить, что индекс
квадратичной формы (£ет(0, X)h,h) при всех А еЛа(0), как и положено по теореме
2, не превышает 2, причем для некоторых А, например, для А, =(0, 1, 0) этот
индекс равен 1, для А2=(1, 0, 0) индекс равен 2.
Теперь обратимся к условию (9). Здесь
(£ш.(0,Х)Л,Л) = 2А0(-(Л')а-(Л2)2 + (Л3)2) + 2А,Л'Л2 + 2А2((Л')2-(Л2)2).
В примере 2 было показано, что условие^{£хх(0, X)h, h) ^0 V/i GK(0) = E3
не может выполняться ни при каких А е Л(0) = Л^0). Это означает, что
нет единого, «универсального» для всех h набора А еЛа(0), для которого
(С (0, X)h, h) > 0 Vhe KJ0) = Е3. Однако для каждого отдельно взятого
heE3 можно указать А =_А(Л)еЛ„(0), |А(Л)| = 1, что (£ет(0, X(h))h, h) ^0.
Например, можно взять А =А(Л) = (0, 1,0) при hlh2>0, А_(Л) = (0, -1,0)
при Л'Л2<0, А(Л) = (0,0, 1) при № = 0, (Л,)2-(Л2)2>0, А(Л) = (0, 0, -1)
приЛ,Л2 = 01(Л,)2-(Л2)2<0,А(Л) = (1,0,0)приЛ,Л2 = 0_!_(Л,)2-ГЛ2)2 = 01
т е. Л, = Л2 = 0.Тогда max (£хх(0, X)h,h)> (£хх(0, X(h))h,h)>0. Из
А еЛ„(0), |А| = I
этого приме£а видно, что в условии (9) взятие максимума по множеству
{А еЛа(0) |А| = 1} существенно.
Пример 4. Пусть /(ж) — произвольная дважды непрерывно
дифференцируемая на Я4 функция, /'(0)^0, пусть Х = {хеЕ*: д(х) =
= /з;1\2 + (х2у_(хзу _(3.4)2 _о}. функция Лагранжа имеет вид: £(ж, А) =
74
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
= X0f(x) + Х[д(х), а ее производные:
Cxx(x,X)=X0f"(x)+2Xl\
Cm(x,\)=X0f(x)+2\l\ fx3
-ж4 /
1
0
0
0
0
1
0
0
0
0
-1
0
°\
0
0
-1/
Равенство £J0, А) = А0/'(0) + Хд'(0) = А0/'(0) = 0 выполняется лишь при
Л0 = 0 и любых Л,. Следовательно, точка v = 0 удовлетворяет
необходимому условию экстремума первого порядка, ее конус Лагранжа Л(0) = {Л =
= (Л0, Л,): Л0 = 0, VA, т^О}. Конусы ker G"(0), К(0) здесь совпадают со всем
пространством Е*. Ясно также, что v = 0 — анормальная точка множества
X. Число отрицательных собственных чисел у матрицы
СХХ(0,Х) = 2Х
/10 0 о \
0 10 0
0 0-10
\0 0 0 -1/
1
0
0
•0
1
о
0
0
-1
при любых А, ф0 равно 2. Однако по теореме 2 индекс квадратичной формы
(£хх(0, X)h, h) не должен быть выше s = 1 для VA еЛ (0). Это означает, что
конус Ла(0) пуст. Условие (8) нарушено. По теореме 2 и замечанию 1 точка
v = 0 не" может быть точкой экстремума функции f(x) на множестве X.
Пример 5. Пусть f(x) — произвольная дважды непрерывная
дифференцируемая на Е3 функция, /'(0) ф0, пусть X = {х G Ё3: д(х) ='(х1у +
+ (ж2)2-(а;3)2 = 0}. Тогда функция Лагранжа: С(х, А)= X0f(x) + \lg(x), ее
производные:
Ст(х,\)=Х0Г(х)+2Х1( I2), Cxx(x,X)=XJ"(x)+2\i
Нетрудно видеть, что точка v = 0 подозрительна на экстремум в силу
теоремы 3.1 и ее конус Лагранжа Л(0) = {Л = (Л0, А,): Л0 = 0, VA, ф 0},
конусы ker G'(0) — К(0) = Е3. Кроме того, v = 0 — анормальная точка
множества X. Применим к ней теорему 2. Заметим, что £^(0, Л) =
Л 0 ,0 \
= 2Л, 0 1 0 при всех Л еЛ(0). Отсюда видно, что индекс квадра-
\0 0 -1У
точной формы {£^(0, X)h, h) равен 1 при Л, >0 и равен 2 при Л, < 0. По
теореме 2 индекс этой формы не может превышать s = 1. Это означает, что
при Л, < 0 точка Л е Л(0) не может принадлежать конусу Ло(0),
Рассмотрим случай Л > 0. Тогда^ оказывается, точка Л = (0, Л) е Ла(0). В самом
деле, для каждой точки Л =(Л0 = 0, Л, > 0) G Л(0) можем указать
сопровождающее подпространство tl = {h = (hl,h2, h3), h3 = 0, V/i', h2};
Свойства (5)-(7) здесь легко проверяются: dim П = 2(= п - s), П С ker G'(0) = Е3,
(jCxx(0,X)h,h)=2Xl((h,)2 + (h2)2)^0yhen. Это и значит, что Лд(0) =
= {Л = (0, Л):^Х >0}. Далее_воспользуемся утверждением (9) теоремы 2.
Множество {Л: Л е Ла(0), |Л| = 1} здесь состоит_из единственной точки
Л =(Afi = 0, Л, = 1) и для нее неравенство (£^.(0, X)h, h) = (h1)2 + (h2)2 -
- (h3)2 >0не может выполняться при всех h е К(6) = Е3, т. е. нарушено
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
75
условие (9). В силу теоремы 2 и замечания 1 точка v = 0 не может быть
точкой экстремума рассматриваемой функции f(x) на X. ,,
Пример 6. Пусть f(x) = (c, х) + (Q0x, х), где х£ Е10, с G Е10, с фО,
Q0 — произвольная матрица размера 10 х 10. Пусть X = {хе Ею: ду(х) =
= -(х1)2-(х2)2 + (х3)2 + (х*)2+(х5у = 0, g2(x) = -(x6)2-(xf)2 + (xa)2+(x9)2 +
+ (ж'°)2 = о}. Так как ¢//(0) = 0, д2'(0)—0, то v — 0— анормальная точка
множества X, и, следовательно, она_подозрительна на экстремум. Конус Ла-
гранжаэтой точки равен Л(0) = {А =(А0, Л,, Л2): Л0 = 0, VA,, VA2, (А,, \2)ф
ф 0}, т. к. /'(0) = с ф 0; ker G'(0) = К(0) = Е(о. Найдем конус Арутюнова
Ла(0). Для VA G Л(0) квадратичная форма (£XJ0, A)ft, ft) = 2A,(-(ft')2 -
- (ft5)2 + (ft3)2 + (ft*)2 + (ft5)2) + 2A2u(-(ft6)2 - (ft*)2 + (ft8)2 + (ft9)2 + (ft"6)2).
Если А, <0или A2<0, то индекс этой формы >3, а для А еЛа(0) этот индекс
не может превышать 2. Это значит, что точки А = (А0 = 0, А, <0, А2 < 0) не
могут принадлежать Ла(0). Для точек А = (А0 = 0, А, >0, А2>0) индекс
формы (£^(0, А)ft, ft) ^ 4, поэтому такие точки также не могут принадлежать
конусу ЛДО). Следовательно, лишь лучи Л, = {А = (А0 = 0, А, > 0, А2 = 0)}
и Л2 = {А = (А0 = 0, А, = 0, А2 > 0)} могут принадлежать Ла(0). В самом
деле, для Л, можем взять сопровождающее подпространство П, = {ft 6 Е10:
ft' = ft2 = 0}, дляЛ2 — n2 = {fte Е10: ft6=ft7=0}, размерность которых
равна 8. Так как здесь ker G'(0) = Ei0, то ясно, что все условия (5)-(7)
выполняются. Таким образом, конус Ла(0) представляет собой объединение двух
лучей Л, и Л2. Проверим условие (9). Множество {А е Ла(0): |А | = 1} состоит
из двух точек A,=(A„ = 0, А, = 1, А2=0)еЛ,, А2 = (А0 = 0, А, =0, А2 = 1)еЛ2.
Возьмем ft = ft0 е El° = К (О) с координатами ft' = 1, ft6 = 1, все остальные
координаты ft* =0. Тогда (£хх(0, Ay)fto, ft0) = -2, г = 1, 2, и в точке ft0
условие (9) нарушается. В силу теоремы 2 и замечания 1 заключаем, что v не
может быть точкой экстремума функции f(x) на множестве X.
Следующий пример показывает, что теорема 2 не «всесильна» и не
всегда «распознает» точки, которые подозрительны на экстремум в силу
теоремы 3.1, но на самом деле в них нет экстремума.
Пример 7. Рассмотрим функцию/(ж) =-(ж1)2-(ж2)2 + (ж3)2 на
множестве X = {х = (х\х2,х3)е Е3: д(х) = х1 х2 — 0}. Нетрудно проверить,
что г; = 0 — анормальная точка этого множества. Следовательно, она
подозрительна на экстремум. Ее конус Лагранжа Л(0) = {А = (А0, А,): А0^0,
VA, 7^0}, конусы ker G'(0) = K(0) = E3. Опишем конус_АрутюноваЛп(0).
Согласно теореме 2 индекс квадратичной формы (£^.(0, A)ft, ft) = 2A0(-(ft')2-
- (ft2)2 + (ft3)2) + 2A,ft'ft2 не может превышать s = 1 для всех А е Ла(0).
Матрица
_ /-2А0 А 0 \
£ет(0,А)= А, -2А0 0
V 0 0 2А0/
имеет_три собственных числа 7i =-2А0 + А,, 72 = -2А0 - А,, 73 = 2А0 ^0.
Если А еЛ(0) и |А,| < 2А0, то 7i < 0, 7г < 0.J- е. индекс квадратичной формы
(£хх(0, A)ft, ft_) равен 2, и поэтому такие А не могут принадлежать конусу
Ла(0). Если А е Л(0) и |А,| ^ 2А0 ^ 0, то только одно из собственных
чисел 7, или 7г будет отрицательным, поэтому индекс формы {£ХЛ0, A)ft, ft)
будет равен 1. В качестве сопровождающего подпространства П для всех
А ф 0, |А,| ^ 2А0 ^ 0 можно взять П = {ft G Е3: ft1 = ft2 = 0, Vft3}. Тогда
76
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
(Схх(0, X)h, h) = 2X0(h3)2 ^ 0 неочевидно, все условия (5)-(7) выполнены.
Следовательно, конус Л„(0) = {А =(А0, А[): А ^0, |А,| >2А0^0}. Проверим
условие (9). Возьмем V/i — {h\ h2, h3) G K(0) = E3 и определим X = X(h)
так: A0 = 0,_A, = 1 при hlh2 ^0 и A, =-1 при hlh2 < 0. Ясно, что X(h) e
еЛа(0) и |А(Л)| = 1. Тогда _ max_ (£..(0, \)h, h) > (£xx(0, X(h))h, h) =
АеЛ„(0), |A| = I
= 2|Лj11Л.1 /i2| ^ 0 Vh G E3. Как видим, точка г; = 0 удовлетворяет всем
необходимым условиям второго порядка теоремы 2. Но v = 0, очевидно, не
является точкой экстремума функции f(x) на X. Однако теорема 2 не сумела
ее забраковать.
2. Сформулируем необходимое условие экстремума второго порядка для
множеств более общего вида:
X = {х е Еп: 9l(x) ^ 0, ..., gjx) < 0, дт+1(х) = 0,;'.., д,(х) = 0}. (10)
Пусть v — точка локального минимума функции f(x) на множестве (10),
пусть A(v)— конус Лагранжа этой точки. Напомним, что конус Лагранжа
точки v состоит из всех тех точек А =(А0, A,,..., Xs)j^0, А0>0, А, >0,...,
Am ^ 0, для которых пара (v, А) является решением системы (3.13). Пусть
J(w) = {г: 1 ^ г ^ m, g^v) = 0} U {г: т + 1 ^ г < s} — множество номеров
активных ограничений точки v, 1/(^)1— количество элементов множества
I(v). Конусом Арутюнова точки v множества (10) будем называть
подмножество Ла(г^ таких точек A G A(v), для которых существует
подпространство П = П(А) пространства Еп, обладающее следующими свойствами:
dImn(A)^max{n-.|I(w)|;0}; (И)
П(А)С ker G'(v)={h е Еп: < g/(v), h > =0, *€/(«)}, G={9i, *€/(«)}; (12)
(Ca(v,\)H,h)>0 УЛеП(А). (13)
Как и в определении 3, подпространство П(А) со свойствами_(11)-(13)
будем называть сопровождающим подпространством точки А е Aa(v).
Рассуждая также, как в случае множества (1), нетрудно убедиться, что и здесь
Aa(v) действительно является конусом. _
Заметим, что при \I(v)\ > п каждая_точка А eA(v) обладает нулевым
сопровождающим подпространством П(А) = {0}. Поэтому конус Aa(v) = A(v)
при \I(v)\ ^ п.
Теорема 3 (Арутюнов [44]). Пусть v—точка локального минимума
функции f(x) на множестве (10), пусть функции f(x),gy(x),...,gs(x)
дважды непрерывно дифференцируемы в некоторой окрестности точки
v. Тогда
Л»^0, (14)
max (Cxx(v,X)h,h)^0 Whe K(v),(f'(v), h) ^0, (15)
где ^л».1*1-
K(v) = {heEn:(gi'(v),h)^0,
i£l(v)n{i: 1<г<т}, (g{'(v), h) =0, г = m + 1, ..., s} (16)
— конус критических направлений множества (10) в точке v.
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
77
Доказательство этой теоремы проводится с помощью метода штрафных
функций в § 5.16. Сделаем несколько замечаний.
Замечание 2. Прежде всего убедимся, что при т — 0
теорема 3 превращается в теорему 2. Для этого покажем, что неравенство
(f'(v), п) ^ 0 из (15) в случае т = 0 может быть опущено без потерь. В
самом деле, очевидно, для любого вектора h е Еп выполняется одно из
двух неравенств: (f'(v), h) ^ 0 или (f'(v), h) ^ 0, и справедливо равенство
(£»(«» л)л» h) = [СЧМ x)(~h)> (-Л)>- Кроме того из (/'(«), h)^ 0
следует, что (f'(v), (—h)} > 0. Отсюда ясно, что если неравенство (У)
выполняется для V/i G K(v), (f'(v), h) < 0, то оно выполняется и для vh G .ЙГ('и),
(f'(v), h) ^ 0. Это значит, что при т = 0 в условии (15) требование
(/'(г;), /г) ^ 0 может быть опущено, а тогда теорема 3 превращается в
теорему 2.
Замечание 3. Если v — точка локального максимума функции f(x)
на множестве (10), то утверждения (14), (15) сохраняют силу, нужно лишь
конус Aa(v) заменить на Л~(«), а в условии (15) неравенство (f'(v), h) ^0
заменить на {f'(v), h) > 0. Конус Арутюнова A~a(v) для точки v локального
максимума функции f(x) на множестве (10) определяется также, как конус
Ла(г;), нужно лишь вместо A(v) взять конус A~(v) (см. замечание 3.2).
Обсудим понятия анормальной и нормальной точки для множества (10).
Мы здесь будем придерживаться трактовки этих понятий, принятой в [44].
Определение 5. Точка v множества (10) называется анормальной,
если 0 ^ т < s и градиенты gm+l'(v),..., gs'(v) линейно зависимы, т. е.
существуют числа Am + I,..., Ая, такие, что
Am + ,*4+,(«) + ... + A.ft'(«) = 0, (Am+„...,A.)96 0. (18)
При m = s, когда в (10) ограничения типа равенств отсутствуют, во
множестве (10) анормальных точек нет по определению.
Если s — т > п, то все точки множества (10) являются анормальными.
Нетрудно видеть, что всякая анормальная точка v множества (10)
является подозрительной на_экстремум для любой дифференцируемой функции
f(x), так как пара (v, А), где А имеет координаты А0 = A, = ... = Ат =0,
а Ат + 1,...,А, взяты из (18), является решением системы (3.13). Как и
в случае множества (1) можно показать, что точка v локального
минимума дифференцируемой функции f(x) на множестве (10) будет
анормальной тогда и только тогда, когда конус A(v) и {0} является неострым, т. е.
содержит прямую. В самом деле, если набор (Ат + 1)..., Ая)
удовлетворяет условию (18), то набор (—Ат + 1,..., — Ая) также удовлетворяет этому
условию, поэтому наборы А0 = (А0 = 0, А( = 0,..., Ат = 0, Ат + 1)..., Ая) и
(-А0) = (А0 = 0, л1 =0, • •., Хт=0±-Хт+1,._.., -А.) принадлежат Л(«).
Поскольку A(v) конус, то точки_*А0 и i(—X0)eA(v) при всех t > 0.
Следовательно, прямая А(£) = *А0, —оо < t < +оо, принадлежит A(v) U {0},
т. е. конус Л(г;) U {0} неострый. Обратное, если конус Л(г;)и{0}
содержит некоторую прямую А(£) = tjl, —оо < t < +оо, /1 = (/^, . .., /хя) ф 0, то
точки_ А(1) = /Г и А(—1) = -/1 принадлежат A(v). Поскольку у всех
точек А конуса A(v) координаты А0 > 0, .. ., Ат ^ 0, то /^ > 0,..., \х ^ 0,
—А*Ь > 0,..., -\ъп > 0, так что /^ = 0, ц± = 0, ..., цт = 0, и (рт +,,..., р.) ф 0.
Это значит, что условия Cx(v, /х) = 0, цфО из системы (3.13) превращаются
78
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
в условие (18) с (Am+I = /xm + I,..., As = /х„) ^0. Тем самым показано, что
если конус Л(г;)и{0} неострый, то v — анормальная точка множества (10).
Аналогично доказывается, что точка v локального максимума
дифференцируемой функции f(x) на множестве (10) анормальна тогда и только тогда,
когда конус Л~(0) и {0} неострый.
Заметим, что если в (10) m=s, то конус A(v) и {0} или Л~(0) U {0}
не _может содержать прямую. В противном случае нашлись бы точки А,
(—A) G A(v) или G A~(v). Это означало бы, что А, ^ 0,..., Ат ^ 0, —А, ^
^0,..., -Ат>0, а А0^0, -А0^0, либо А0^0, -А0<0, отсюда следует, что
А = 0. Однако, 0^Л(г;) и 0^Л_(г|). Противоречие. Приведенные соображения
оправдывают определение 5, когда в (10) т = s.
Таким образом, понятие анормальной точки множества (10), выражая
лишь специфическое свойство (18) этого множества, автоматически
является подозрительной на экстремум для любой дифференцируемой функции
f(x). Поскольку при 0< т < s наличие анормальной точки у множества (10)
не такое уж редкое явление, то возможность использования теоремы 2 для
их анализа на экстремум, представляется весьма важным. •;•
Определение 6. Точка v множества (10) называется нормальной,
если система линейных уравнений и неравенств относительно неизвестных
А,,..., Ая
EA,<fc'(«) = 0, А4<ь(«) = 0, А,>0, г = 1,...,т, (19)
i = I
имеет лишь нулевое решение.
Как видим, при т = 0 определение 6 совпадает с определением 1
нормальной точки для множества (1). Как и в случае множества (1) нетрудно
заметить, что если точка v, подозрительная на экстремум функции f(x)
на множестве (10), является нормальной, то в конусе Лагранжа все точки
А = (А0,..., Ая) имеют координату А0 ф 0. В самом деле, если бы в такой
точке существовал набор А =(А0 = 0, А,,..., \з)ф0, то как видно из (3.13),
система (19) имела бы решение. Верно и обратное: если в конусе Лагранжа
у всех точек А координата А0 ф0, то v — нормальная точка множества (10).
Заметим, что если в нормальной точке множества (1) конус Лагранжа
состоял из одного луча, то в случае т > 0 этот конус, вообще говоря, богаче.
Кроме того, не следует думать, что если точка множества (10) не является
анормальной, то она непременно будет нормальной. Так, если m = s, то в
множестве (10) по определению 5 нет анормальных точек. Однако если,
например, при этом g/(v) = 0, г = 1,..., т, и имеются активные ограничения,
то система (19) будет иметь бесконечно много решений, и, следовательно,
точка v не является нормальной. Таким образом, в множестве (10) могут
быть точки, которые не являются ни нормальными, ни анормальными.
Конечно, всякая нормальная точка множества (10) не может быть
анормальной, так как конус Л(д;) любой анормальной точки содержит А с А0 = 0.
Покажем, что v будет нормальной точкой множества (10) тогда и только
тогда, когда: 1) векторы gm+l'(v),..., gs'(v) линейно независимы, 2)
существует вектор d G Еп, для которого
(&'(«).<*>= 0, г =т + l,...,s,
(g/(v),d)<0, Уге/(г,)П{иг^т}, {Щ
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
79
где I(v) — множество номеров активных ограничений точки v
(возможность т = 0 или т = s здесь не исключается). Это условие в
литературе по экстремальным задачам (особенно зарубежной) часто называют
условием Мангасариана — Фрамовица. Убедимся, что при выполнении
перечисленных условий точка v будет нормальной. Допустим, что это
не так. Тогда система (19) имеет хотя бы одно решение А, и для него
з
0 = (Е Х{д/(ю), d) = Е Х{(д/(ю), d) ^0, что возможно только при А^ = 0
« = 1 геГ(щ)
VieJ(w)n{l ^г <m}, так что A, =.. . = Ат=0. Если при этом m = s, то это
означает А =0, что противоречит тому, что А —решение системы (19). Ес-
я я
ли же m<s, то равенство Yl Xigi'(v)=0 превращается в J2 Х{д/(ь) = 0,
г = I i = т + I
что может быть только при Am+I = ... = А, =0. Таким образом, и в случае
т < s получаем А = 0, что невозможно для решения системы (19).
Следовательно, система (19) не имеет решения, т. е. v — нормальная точка
множества (10).
Докажем обратное: если v — нормальная точка множества (10), то
условия Мангасариана — Фрамовица выполнены. Пусть это не так. Тогда либо
векторы gm+l'(v),..., gs'(v) линейно зависимы, либо система (20)
несовместна. В первом случае найдутся числа (ат+,,..., as) Ф 0, такие, что
з
Е <W(«) = 0- Тогда А =(А, =0,..., Ат=0, Ат + 1 = ат+1, . .., Ая = а.) —
i = т + I
решение системы (19), что противоречит нормальности точки v. Во втором
случае, когда система (20) несовместна, из теоремы Моцкина (см.
упражнение 3.5.14) следует, что совместна система
Е ДЭЛ«) = 0, А^0, iel{y)n{i: U«^m}, (д, * е /(«)) ф0.
г 6 I(v)
Тогда вектор А = (Аг = pt, г е I(v), X. =0, г ¢. I(v)) будет решением
системы (19), что опять-таки противоречит нормальности точки v. Таким
образом, установлено, что условие Мангасариана — Фрамовица равносильно
нормальности точки v множества (10).
Покажем, что в отличие от множества (1), в нормальных точках v
множества (10), подозрительных на экстремум, в условии (15) операция взятия
максимума, вообще говоря, не может быть опущена. С этой целью, как мы
уже это делали неоднократно, позаимствуем пример из [44].
Пример 8. Рассмотрим задачу: f(x) = — х3 —> inf хеХ = {х =
= (х\х2, х3) е Е3: д,(х) = х3 + 2х"х2 - e((z')2 + (х2)2) ^ 0- а(я) = х3-
-2хх х2-е((х1)2 + (х2)2)^0, д3(х) = х3 + ((х*)2-(х2)2)- е((х1)2 + (х2)2)^0,
д4(х) = х3 - (х1)2 + (х2)2 - е((х1)2 + (х2)2) < 0}, е > 0. Сначала убедимся,
что v = (0,0,0) = 0 — решение этой задачи. На плоскости (х\х2) введем
полярную систему координат: xl = г cos <р, х2 = г sin <р, 0 ^ <р < 27г. Тогда
gl(x) = x3+r2(s'm2(p—e), д2(х) = х3—г2 (sin 2 ip+e), g3(x) = x3 + r2(cos2ip — е),
д^(х) = х3 — r^(cos 2ip + е). Выберем е > 0 таким, чтобы
m'm{s'm2ip, — s'm2ip, cos2ip,— cos2ср} — е <0 Vip, 0 ^. ip <2тг,
например, можно взять е = 1/4. Тогда хотя бы в одном из неравенств
х3^.— r2(sin2ip — е), a;3^r2(sin2(/j+e), х3 ^ -r2(cos 2tp — e), х3 ^ r2(cos 2(р+
+ е) правая часть отрицательна при каком-либо <р, 0 ^ tp < 2тт, и любых
80
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
г > 0, и все правые части = 0 при г — 0. Это значит, что у всех точек
х = (х\ х2, х3) е X координата аг ^ 0. Следовательно, inf f(x) — 0 — /(0)
и v = 0 — решение рассматриваемой задачи. В точке v = 0 выполняется
условие Мангасариана — Фрамовица с вектором d =(0,0,-1).
Следовательно v — 0 — нормальная точка множества X. Конус Лагранжа точки
v = 0 равен Л(0) = {А =(Л0, Л,, Л2, Л3, Л4): А0 = Л, +Л2 + Л3 + Л4>0, Xt >0,
г = 1,..., 4}. Поскольку в точке v — 0 все ограничения gi(x)^.0, г = 1,..., 4,
активные, то |/(0)| =4> п = 3 и каждая точка Л е Л(0) имеет
тривиальное сопровождающее подпространство П(А) = {0}. Следовательно,
в,рассматриваемой задаче конус Арутюнова Ла(0) = Л(0). Согласно теореме 3
в точке минимума v — 0 условие (15) выполняется при всех ft еК1(0) =
= K(0)n{h: (f'(0),h)^0} = {heE3: (а'(0), ft>^0, * = 1,.. .,4, (/'(0), ft К
<0} = {ft = (h\ft2, ft3 = 0)}. Однако (£„(0, А)ft,ft) = <(E Л,9i"(0))ft, ft) =
_ _ \ = i /
= 2|ft|2[A(A)sin2(/j + i3(A)cos2(/j — e] при каждом ft = (ft1 = |ft| cos </?, ft2^=
= |ft| sin </?, ft3 = 0)e Ky(0), A еЛ(0); явные выражения величин A(\), B(X)
нам не понадобятся, поэтому мы их не будем здесь приводить. Отсюда
видно, что для VA е Л(0) = Ла(0), |А| = 1 найдется ip, 0 ^ ip < 2тт, такой,
что А(Х) sin 2ip + В (A) cos 2^ - е = ^А2(А) + В2(А) sin(2y> + V0) - е < 0
(здесь ф0 вспомогательный угол, 0 ^ V'q_< 27г, определяемый равенствами
cosVo = ^=r4(A) 9_,sinV0= , ,В{Х) , _=приА2(А) + -В2(А)^0).Та-
ким образом, при любом выборе А бЛа(0), |А| = 1 найдется ft е К(0), ft ^0,
что (£^(0, A)ft, ft) < 0. В то же время условие (15) согласно теореме 3
выполняется. Это значит, что даже в нормальной точке экстремума знак
максимума в (15) не может быть опущен.
3. Кратко обсудим один известный прием сведения задач с
ограничениями типа неравенств к задачам с ограничениями типа равенств. Этот прием,
по-видимому, впервые был предложен Н. Н. Гернет [221] для исследования
задач вариационного исчисления с односторонними ограничениями.
Опишем его для задачи поиска экстремума функции f(x) на множестве
X = {х е Еп: 9l(x) ^ 0,..., gjx) ^ 0}. (21)
Введем вспомогательные переменные w = (w\ ..., wm) и в пространстве
переменных у = (х, w) = (xi,..., хп, wl,..., wm) рассмотрим задачу поиска
экстремума функции f(x) на множестве
Y = {y=;(x,w)eE"+m: qi(y) = gi(x) + (wi)2 = 0,i = \,...,m}. (22)
Нетрудно видеть, что эта задача равносильна исходной задаче на
множестве (21). В самом деле, если xt — точка локального минимума
[максимума] функции f(x) на множестве (21), то точка yt = (xt,wt), где wt =
= (ги+',..., ги™), ги*' = (—gi(xt))l/2, г = 1,..., т, будет точкой локального
минимума [максимума] функции f(x) на множестве (22) и наоборот, если
yt = (xt, wt) — точка локального минимума [максимума] функции f(x) на
множестве (22), то х —точка локального минимума [максимума] функции
f(x) на множестве (21).
§ 4. НЕОБХОДИМЫЕ УСЛОВИЯ ЭКСТРЕМУМА
81
Допустим, что xt — точка локального минимума функции f(x) на
множестве (21). Можем считать, что в (21) все ограничения в точке xt
активны, так как удаление неактивных ограничений из (21) не повлияет на
свойство точки xt быть локальным минимумом функции f(x). Тогда точка
yt = (xt, wt = 0) е Y будет точкой локального минимума функции f(x) на
множестве (22), и для нее будет справедливы приведенные в § 3, 4
теоремы для множеств, задаваемых ограничениями типа равенств. Применим
их и посмотрим, что из этого получится для исходной задачи.
Предположим, что градиенты #/(¾))..., gm'(xt) линейно независимы. Тогда
градиенты д/(у+) = ( ^ Xе*' ), г = 1,..., т, также будут линейно независимы, т. е.
0
yt=(xt,0) — нормальная точка множества (22), и теперь можно будет
воспользоваться теоремой 1. Составим функцию Лагранжа: £(у, Х) = X0f(x)+
т
+ Y^, Х{(д{(х) + (ги*)2)> ее производными будут:
« = I
гп
4(2/.А) = А0/'(Ж)+ЕА;з/(4 £w(y, Х) = (2Х ^,..., 2 Xmw™),
i- I
т
£У(У,\) = (£ЛУЛ),£АУА)), Cas(y1X) = Xor(x)+J:Xigil>(x)1
*-<**>-* Q "• A°J' £»(йА")=(£"(о'Л1 JU)'
Согласно теореме 3.1 существует такой набор А =(А0,.. MAm)^0, Л0^0,
гп
£»(%. А) = 0. Отсюда имеем £.(%, А) = А0/'(аО + £ Xigi'(xi)=0, равенст-
_ г = I ' -
во Cw(yt, А) = 0 выполняется автоматически и полезной информации не
несет. Так как yt — нормальная точка множества (22), то можем считать
А0 = 1. Кроме того, у нас ^(¾) =0, г = 1,..., т, по предположению, и
условия дополняющей нежесткости Х(д((хф) = 0, г = 1,..., т,
выполняются автоматически. А где же условия А, > 0,..., Am ^ 0? Они, оказывается,
при рассматриваемом подходе относятся к необходимым условиям второго
порядка. В самом деле, применяя теорему 1, получим: (£m(yt, A)ft, ft) ^0
Vft G #,(%) = {ft = (ft,, ft2): ft, G E\ ft, G Em, <g'(lO, ft) =0, г = 1,..., m} =
{ft = (ft,, h2): (g/ixjji,) + (0, ft2) = (д/(х,), ft,) =0, г = 1,..., m}. Отсюда
следует, что.<£„(&, X)hu ft,) > 0 Vft, G K2(xt) = {ft G En: (ft'(zJ, ft) =0,
г = 1, ..., m}, и (£_(%, X)h2, ft2) =2A,(ft2')2 + .. • + 2Am(ft2m)2_^ 0 Vft2 e E™,
что возможно только при А, >0,..., Am ^0. Так как £xx(yt, А) =Схх(хф, А),
и, кроме того, рассуждая также, как в замечании 2, конус KJxf) без ущерба
можем заменить на K3(xt) = {(f'(xt), ft) ^ 0, (g/ixj, ft) = 0, г = 1,..., m},
то имеем (£xx(xt, A)ft, ft) ^0 Vft G K3(xt). Конус K3(xt), вообще говоря,
беднее конуса из (15), поэтому полученные на этом пути необходимые условия
второго порядка слабее, чем в теореме 3. Применение указанного приема
ко множеству (10) в общем случае также приводит к более слабым
необходимым условиям экстремума, чем это получено выше. Тем не менее
простота этого приема привлекательна, и от него не стоит совсем отказываться
при исследовании задач на экстремум при наличии ограничений типа
неравенств.
82
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Упражнения
1. Применить теоремы 2, 3 к исследованию задач из примеров, приведенных в § 3.
2. Исследовать задачи на экстремум, пользуясь правилом множителей Лагранжа и
теоремами 2, 3, если:
a) f(x) = t(xl f + х2, X = {х = (ж1, х2) е Е2: д(х) = {xi )2 + (х2)2 ~ 2 < 0};
б)/(^) = ^, ^ = (^ = (^, я2)е.Е2: ^(¢) = ^)4(^^-1^0, ^(х) = (х')3+(х2)3-1=0};
B)/0(a) = /(a)-(x")2-(x,2)2-(x,3)2J Х = {хеЕ13: 9l(x) = 0, д2(х) = 0}, где функции
/(ж), з, (ж), з2(ш) взяты из примера 6; в определении функции f(x) считать с = 0.
3. Применить правило множителей Лагранжа и теоремы 2, 3 для поиска точек экстремума
функций f(u) = x, f(u) = x2, f(x) = x2 + y2 на множестве X = {и = (х, у) еЕ2: д(и) = 0[^0,
^ 0]}, где д(и) = хр + yq или #(и) = хр -yq, p,q — натуральные числа. Найти все нормальные
и анормальные точки множества X.
4. Пусть Q0, Q,,..., Qs — симметричные матрицы размера п х п, пусть А" = {х е 15":
(<Э;ж, ж) ^0, i = l т; (<Э;Ж, х) = 0, г = пг+ 1,..., s}. Доказать, что {Q0x, х) ^0 на конусе
К тогда и только тогда, когда точка v = 0 является решением задачи:
/(a;) = (Q0a;, a;)-->inf, х£К. (23)
5. Пусть (Qq^j х) ^ 0 Ухе К (обозначения см. в упражнении 4). Доказать, что для Vft е £"*
ЭА = А(А) = (А0(А) > 0 Ат(А) ^0, Ат . ,(А) А.(Л)), что (( ± A,(A)Q,)a, ft) > 0 и
индекс квадратичной формы (I £ \i(h)Qi )£, £) не превышает |1(0)|, где /(0) —множество
активных ограничений из А" в точке v = 0, \1(0)| — количество элементов множества /(0).
Указание: применить к задаче (23) теорему 3 в точке v = 0.
6. Найти точки экстремума функций f(x) = х, f(x) = x2, f(x) = (х — 3/2)2, f(x) = (х — З)2,
f(x) = (х — 1)(х — 2) на множестве X = {х е Еи. д{(х) = —х ^.0, д2(х) = х3 - Зх2 + 2х <
<0}. Обратить внимание, что х = 0 является изолированной точкой множества X и ее можно
считать точкой локального минимума [максимума] любой функции.
7. Пусть v — изолированное решение системы уравнений gi(x) = 0, i — \ s; п> s.
Доказать, что тогда для Vft £ K(v) = {ft е Еп: (д/(у), ft) = 0, г = 1 s} существует Л =
= A(ft) = (A, А,), что
A(ft)#0, Cx(v, A(ft)) = £ M*W(«) = 0 (24)
« = i
(т. е. и—анормальная точка множества (1)), Л (г>) ^ 0, „max (£ет(и, A)ft, ft) ^0
d АеЛ», |a-|=i
\/h е K(v), где £(ж, А) = £ А^(г>), Л(г>)— множество всех А, удовлетворяющих усло-
„ i= I „
вию (24), Aa(ij) — подмножество тех А е А(и), для которых существует сопровождающее
подпространство П = П(А) со свойствами (5)-(7) при замене в (7) С на С. Указание:
убедиться, что точка v будет изолированной точкой множества (1) тогда и только тогда,
когда v —точка локального минимума функции f(x) = —|х -г>|2, и затем к функции f(x) на
множестве (1) применить теорему 2.
8. Применяя к функции f(x) =—\x—v\2 на множестве (10) теорему 3, получить необходимое
условие изолированности точки v множества (10).
§ 5. Достаточные условия экстремума
Продолжим исследование задачи поиска экстремума функции f(x) на
множестве
Х = {хЕЕп; д{(х)^0, г = 1,...,т; &(z) = 0, г = т + 1,..., в}. (1)
Приведенное в §§ 3, 4 условия первого и второго порядков являются лишь
необходимыми условиями экстремума, и поэтому те точки, которые отбира-
§ 5. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
83
ются с их помощью, являются лишь подозрительными на экстремум и, как
мы видели на примерах, в этих точках не всегда реализуется ожидаемый
экстремум. Для выяснения характера экстремума в отобранных точках
предназначены достаточные условия, в формулировке которых используются
производные второго и более высокого порядков для функций f(x), д{(х),
г — 1,..., s. Здесь мы ограничимся достаточными условиями, которые
формулируются с помощью второй производной функции Лагранжа.
Теорема 1. Пусть функции f(x), д{(х), г — 1,..., s, дважды
непрерывно дифференцируемы в окрестности точки v е X, пусть конус
Лагранжа A(v) этой точки непуст и
max <£„(„,A)ft,ft)>>0 Vft^O, heK(v), </'(«), ЛК О, (2)
АеЛ(»), |A| = I
где
K(v) = {ft е En: (g/(v), ft) ^0, i e I(v) П {»: 1 < t < m},
(ft'(w)> ^) = 0, г = m + 1,..., s},
I (v)—множество индексов активных ограничений точки v. Тогда в
этой точке реализуется строгий локальный минимум функции f(x) на
множестве (1).
Если A~(v)^0 (см. замечания 3.1,3.2) и, кроме того,
max (£„(«, А)Л, Л) >0 Vft^O, heK(v), (/'(«), ft) >0, (3)
АбЛ-(«),|А|=1
то в точке v реализуется строгий локальный максимум функции f(x)
на множестве (1).
Замечание 1. Так как конус Л(и)и{0} замкнут, то множество
{Л еЛ(щ), |Л| = 1} компактно и максимум в_(2) при любом фиксированном
ft достигается хотя бы в одной точке Л = A(ft) е A(v), |A(,ft)|_= 1. Как мы
видели в примерах 4.3, 4.8, одной «универсальной» точки Л, в которой
реализуется максимум в (2) одновременно для всех ft е K(v), {f'(v), ft) <0;
может не быть. Аналогичное замечание справедливо и для условия (3).
Если в (1) ограничений типа неравенств нет (т = 0), то в условиях (2),
(3) ограничения (/'(ж), ft) ^ 0 (> 0) могут быть опущены без ущерба —
этот вопрос мы уже обсуждали в замечании 4.2. При т — s = 0 теорема 1
превращается в теорему 2.2.
Доказательство теоремы 1. Если v — изолированная точка
множества (1), то, по определению, v — точка строгого локального
минимума [максимума]. Поэтому далее предполагается, что v не является
изолированной точкой множества (1). Допустим, что условие (2) выполнено, но
точка v не является точкой строгого локального минимума. Тогда найдется
последовательность {хк}, такая, что
xk^v, а-Ю^О, г = 1,...,т, д£хк) = 0, t =т +1, .'.., s
/(¾) ^/(«), * = 1,2,..., {xk}->v. (4)
Точки хк можем представить в виде хк = v + tkdk, где dk = , * _ ,, tk = \хк —
-«| -> 0 при к -» оо. Так как \dk\ = 1, к = 1, 2, ..., то, выбирая при
необходимости подпоследовательность согласно теореме Больцано — Вейерштрасса,
84
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
можем считать, что {dk} —> d^, |do| = 1. С учетом (4) и дифференцируемости
функций f(x), gt(x) в точке х = v имеем
О > /(¾) - /(«) = </'(«), dk) tk + o(tk),
О > 9i(xk) - 9i(v) = (g{'(v), dk)tk + o(th); i E I(v) П {г: U г ^ m},
Q = 9i(xk)-9i(v) = (gi'(v),dk)tk + o(tk), i = m + l,..., s, A; = 1,2,...
Разделив эти соотношения на tk > О и устремив А; —> оо, получим:
</'(«), 4>К 0, (ft'(«), ^) ^ 0, teI(«)n{*:U*^m},
(ft'(«). 4))=°. г =m +1,..., s, K| = l.
Это означает, что d^ принадлежит конусу Kt(v) — {v е K(v), (f'(v), d^) ^0}
и (¾фО. Если конус Kt(v) состоит лишь из^очки 0, то уже получим
противоречие. Пусть К,(г;)^{0}. Возьмем точку A = X(d0)eA(v),\_X(d0)\ = l, в
которой достигается максимум в (2) при h = d0. Тогда (£xx(v, \(d0))d0, d^} >0.
С другой стороны, учитывая (4), неравенства А^ >0, г = 0,..., т, и
соотношения g.(v) = 0 Уг el(v)n{i: 1 ^ г ^ т}, &(и)<0 и Af=0 при г $ /(г)),
\-&(щ) = 0. * = 1, •• .,"i. ft(«) = 0, г = т + 1,..., s, имеем:
£(¾. A(do)) = А0/(^) + £ А^Ю ^ А0/(^) ^ А0/(«) =
t = i
= А0/(«)+ЕА<л(«) = £(«,АЮ), Л = 1,2,...
• = i
Отсюда с помощью формулы Тейлора с учетом равенства £xx(v, A(do)) = 0
получаем
0 > Цхк, А(4,))-£(«, A(do)) = J t42<^«(«. %)К. <**>+°(*2), Л = 1, 2,...
Разделив это неравенство на tk > 0 и устремив А; —> оо, будем иметь
(£ет(и, A(do))do, dg) ^ 0, что противоречит (2) и определению AMq).
Следовательно, v — точка строгого локального минимума функции f(x) на
множестве (1).
Аналогично доказывается, что если для точки v выполнены условия (3),
то г; — точка строгого локального максимума функции f(x) на
множестве (1). Теорема 1 доказана. □
Для иллюстрации теоремы 1 приведем пример.
Пример 1. Задача: требуется найти точки экстремума функции f(x) —
= J2\x~xi\2 на шаРе X = {хе Еп: \х\2 ^ 1}; здесь ж,,..., хр — заданные
« = i
точки из Еп.
Эта задача была исследована в примере 4.3 с учетом конкретных
особенностей задачи. Убедимся, что использование теоремы 1 упрощает анализ
точек, подозрительных на экстремум. Поучительно также и то, что в
некоторых точках теорема 1 «не работает» — с ее помощью_не удается
распознать характер экстремума точки. В этой задаче С^х, А) = 2(Х0р + А,)1П,
где 1п — единичная матрица п х п. Переберем точки, подозрительные на
экстремум, в том порядке, как они перечислены в примере 4.3.
§ 5. ДОСТАТОЧНЫЕ УСЛОВИЯ ЭКСТРЕМУМА
85
1
1) точка vv = Xq = - Y^ хг ПРИ l^bl ^ 1- Нам известны соответствующие
Р i = I _
Vy два набора нормированных множителей Лагранжа: А, , = (А0 = 1, А', =0)
и А, 2 = (А0 = —1, А, =0). Набор А, ,=(1,0) принадлежит конусу Л(г),);
для него имеем {Cxx(vv, A,,)/!, h) = 2p\h\2 > 0 VheEn, НфО, в
частности, для V/i е K(v), (f'(v), h) < 0. Отсюда следует, что условие (2)
выполняется. Следовательно, г;, — точка строгого локального минимума. А
что мы получим, если точку г;, аналогично проанализируем, используя
набор А, 2 = (—1,0)? Набор А ,2 принадлежит конусу Л~(г;1); для него
(Ara(wi) ^1,2)^) h) = -2p\h\2 <0 V/i ^0. В этом случае конус Ar(vt) = {А =
= £А, 2, t >0}. Отсюда видно, что условие (3) не будет выполняться на
конусе Л~(г;1). Это означает, что, используя набор А, 2, с помощью
теоремы 1 нам не удалось распознать характер экстремума точки г;,. Впрочем,
нетрудно проверить, что здесь Л~(г;1) = 0 и согласно теореме 4.3 и
замечанию 4.3 точка г;, не может быть точкой локального максимума.
2) v2 = Дг при |а\,| > 1, А2 = (А0 = 1, А] = _р(|а\,| — 1)>0). Здесь А2 е A(v2)
и (£xx(v2, \2)h, h) =2p\xQ\\h\2>0 V/i^0. Таким образом, здесь условие (2)
выполнено, и v2—точка строгого локального минимума.
3) ^ = 1¾ при0<К|<1, Аа = (-1,А,=р(1-|яЬ|)>0)еЛ-(ч,). Здесь
(Схх{у3, \3)h, h) = -2p\x0\\h\2<0 V/i^O. Отсюда и из того, что здесь конус
Лагранжа Л"(г;3) = {A = tА3, t > 0}, заключаем, что условие (3) не
выполняется. Таким образом, в точке v3 теорема 1 «не работает». В примере 4.3
из других соображений было выяснено, что v3 не является точкой
экстремума. К такому же выводу мы придем, показав, что точка v3 не удовлетворяет
необходимым условиям второго порядка (теорема 4.3, замечание 4.3).
4) «4 = -щ при Ы >0, А4 = (А„ = -1, А, =р(1 + kl)>0) е Л"(«4). Здесь
(Cxx(v^ A4)/i, h) = 2p\h\2 >0 Wi^O. Условие (3) заведомо выполняется.
Следовательно, v4 — точка строгого локального максимума.
5) при Xq = 0 все точки v5, \v5\ — 1, подозрительны на экстремум; им
соответствует нормированный множитель Лагранжа А5 == (А0 = — 1, А, = р >0).
Здесь А5 е/тШ и {£xx(v5, \5)h, h) =0 Vft e En и VA еЛ"(^); Отсюда ясно,
что условие (3) не выполняется, и пользуясь лишь теоремой 1, мы не
можем судить о характере экстремума в точках v5. Здесь нам не могут помочь
и необходимые условия второго порядка (теорема 4.3, замечание 4.3),
которые, как нетрудно проверить, выполняются для всех точек v5. В примере 4.3
из других соображений было выяснено, что при :¾ = 0 все точки единичной
сферы |ж| = 1 являются точкой глобального максимума и f(x) = ft.
При сравнении теорем 1 и 4.3 возникает интересный вопрос,
насколько велик «зазор» между необходимыми и достаточными условиями второго
порядка? Не вдаваясь в подробности, отметим, что исследования,
проведенные в [43; 44], показывают, что для широких классов экстремальных задач
этот «зазор» является минимально возможным при использовании
вариаций, имеющих второй порядок малости.
В заключение этой главы заметим, что с помощью изложенных выше
условий экстремума лишь в редких задачах удается найти и
проанализировать все точки экстремума. Поэтому может создаться впечатление, что эти
86
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
условия имеют лишь теоретическое значение. Однако это не так. Как
увидим ниже, многочисленные методы в той или иной степени представляют
собой итерационные процессы, подсказанные условиями экстремума и
предназначенные для решения систем уравнений и неравенств, составляющих
суть этих условий. Нередко даже беглый теоретический анализ условий
оптимальности позволяет получить немало информации о свойствах решений
конкретной задачи, которая может быть использована при конструировании
и реализации численных методов.
Упражнения
1. Применить теорему 1 для исследования задач из упражнений к §§ 2-4.
2. Пусть точка v принадлежит множеству (1), пусть функции дЛх), г = 1,..., s, дважды
непрерывно дифференцируемы в окрестности точки v. Пусть конус A(v) — {А = (Л,,..., Ля):
А^О, А,^0 \т>0, £ \9»=О}^0и „max (( ± \i9i'(v)) h, h)>0 Vh^O,
i=I АеЛ(»), |A|=I \i=I , /
h e K(v)={h e En; (д{'(у), h) < О, г e I(v) n{i: 1 < г < m}, (g/(v), /i)=0, i=m + 1 s}.
Доказать, что тогда v — изолированная точка множества (1), Указание: рассмотреть
задачу минимизации функции f (x)=—\x—v\2 на множестве (1) и применить к ней теорему 1
(см. упражнения 4.7, 4.8).
§ 6. Вспомогательные предложения
Ниже приводятся некоторые формулы и различные другие сведения,
которые будут использованы в дальнейшем изложении.
1. Сначала напомним некоторые формулы для Конечных приращений
функций конечного числа переменных. Будем пользоваться
обозначениями: С1(Х) — множество всех функций, непрерывно дифференцируемых на
множестве X, С2(Х) — множество всех функций, дважды непрерывно
дифференцируемых на множестве X. ,
Возьмем какую-либо функцию f(x), определенную на множестве X с.Еп.
Пусть точки х, х + h е X таковы, что h^O, x + theX при всех t, 0 ^ t < 1.
Тогда можно рассматривать функцию одной переменной g(t) = f(x + th)
при t е [0, 1]. Оказывается, если f(x) е С(Х) при р = 1 или р = 2, то
g(t)e Ср[0, 1], причем
g'(t) = (f'(x + th),h), g"(t) = (f"(x+th)h,h) O^t^l. (1)
В самом деле, если, например, f(x)e С2(Х), то, заменив в формуле (2.5)
х на х + th, h на A.th, получим
g(t+At)-g(t)=At(f(x+th), h)+\(At)2(f"(x+th)h} h)+o(\At\2).
Такое разложение означает, что g(t) е С2[0,1], и указывает на
справедливость формул (1).
Для функции одной переменной имеют место формулы
g(t) - д(0) = ff'(0, i)i = \ д>{т)йт = g'(0)t + ±<?'Ш)*2>
о
g'(t) - д'ф) = g"(e3t)t, 0 ^ б>„ А,, в3 <: 1.
§ 6. ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ
87
Полагая в этих формулах t = 1 и пользуясь равенствами (1), получаем
различные формулы для конечных приращений функции многих переменных:
f(x + ft) - f(x) = (f'(x + 0,ft), ft) = l(f'(x + th), h)dt, (2)
f(x + ft) - f(x) = (f'(x), ft) + \{f"(x + 02ft)ft, ft), (3)
№ + h)- f(x), ft) = (f"(x + 03ft)ft, ft), (4)
где 0 ^ 0,, 02, 03 ^ 1. Далее, так как
■^(f'(x + th)) = f"(x+th)h, 0^t<l,
то, интегрируя это равенство no t на отрезке [0,1], получаем
f'(x + ft) - f'(x) = $ f"(x + th)hdt = ($ f"(x + th)dt) ft. (5)
Подчеркнем еще раз, что в формулах (1)-(5) подразумевается, что точки
х, х + ft принадлежат множеству X вместе с отрезком х + th, O^i^l.
В частности, эти формулы верны на любых выпуклых множествах —■
множествах, которые содержат вместе с любыми двумя своими точками и и v
и отрезок [u, v] = {иа = аи + (1 — a)v, 0 ^ а ^ 1}, соединяющий эти точки
(подробнее о выпуклых множествах см. § 4.1).
2. При описании и исследовании методов минимизации нам часто
придется иметь дело с функциями, градиент которых удовлетворяет условию
Липшица.
Определение 1. Пусть f(x) е С" (X). Скажем, что градиент f'(x)
этой функции удовлетворяет условию Липшица на множестве X с
постоянной L ^ 0, если
\f'(x)-fb)\^L\x-y\, х,уеХ (6)
Класс таких функций будем обозначать через С1,1(Х).
Лемма 1. Пусть X —выпуклое множество, f(x) е СК1(Х). Тогда
1/(?) - /(2/) - (/'(2/). x-y)\<L\x- 2/172 (7)
при всех х,уеХ.
Доказательство. С помощью формулы (2) имеем
/(*) - Ну) - №)> x-v) = \ (fb + t(x-y))- f(y), х - y)dt.
Пользуясь неравенством Коши — Буняковского, с учетом условия (6)
получим
\f(x)-Hy)-(f'(y),x-y)\^
< \ \ГЬ +Цх-у))- f(y)\\x - y\dt <\l\x- y\Hdt = ^у1. П
о о
3. Приведем несколько лемм о числовых последовательностях, которые
нам пригодятся при доказательстве сходимости методов минимизации, при
оценке скорости их сходимости.
Лемма 2. Пусть числовая последовательность {ак} такова, что
оо
o* + i^o* + *t. ^>°> ^=0,1,..., £<5,<оо. (8)
/t=o
88
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Тогда существует lim ак < оо. Если {ак} ограничена еще и снизу, то
lim ак конечен. к^°°
к —> оо
Заметим, что если 8k=Q), fc =0,1,..., то последовательность {ак} не
возрастает, и лемма 1 превращается в хорошо известное утверждение о
пределе монотонной последовательности.
Доказательство. Суммируя первое из неравенств (8), имеем
т ~ I оо ,
ат < о* + Е 4 < % + Е 4 (9)
i = к i = к
при всех т>к >0. Пусть lim at,~ lim afc , fcn<fcn+I, n=0, 1,...; lim kn=oo.
к ~4 OO 7l~-»00 " оо тг-~*оо
Положим в (9) к=кп. Получим am^% + Yl ^- Vm > fcn. Следовательно,
lim ат^ак + ^ <5- для всех п= 1, 2,... Отсюда при п-~>оо имеем lim am ^
т~~* оо " . _ г m -~» оо
< lim % = lim am. Но всегда lim am< lim am, поэтому lim am = lim am.
n-ioo n m—t oo m —* oo m~ioo m—» oo m~4 0o
Отсюда следует существование предела {%}. Далее, при к =0 из (9)
следует ограниченность (¾} сверху. Поэтому, если {ак} ограничена еще и снизу,
то lim ак конечен. □
к —> оо
Лемма 3. Пусть числовая последовательность {Ьк} такова, что
00
ь*+1^ь*-**> ^о< л = о,1,..., Е^<°°-
/t = o
Тогда существует lim 6^. > —оо. £сли {bk} ограничена еще и сверху, то
lim bk конечен, k^oa
k —> оо
Эта лемма сводится к лемме 2, если принять bk = —ak, к = О, 1,...
Лемма 4. Пусть числовая последовательность {ак} такова, что
ак^0, Л =0,1,...; о4-о4 + 1^Ао4, к^ко>0. (10)
Тогда ^.=0(¾-1). fc = l,2,..., т. е. найдется постоянная В>0 такая,
что
0^ak^Bk~\. fc = l, 2,... (И)
Доказательство. Если ат = 0 при некотором т > ^, то из (10)
следует, что ак — 0 при всех А; > т, и оценка (11) становится тривиальной —
в (11) достаточно взять В—т max аг. Поэтому пусть ап > 0 при всех
1 ^ г ^т
n ^ /¾. Тогда из (10) имеем
^ ^-А > А > 0, n > /¾.
\ + \ "п "п"п+1 "п+1
Суммируя эти неравенства по п от kg до некоторого А; — 1 ^ /¾. получаем
а"к -°¾ >^(fc - *b) или ai <^~'(fc - *b)-1. к > К- Но (fc _ К)~[ ^ (*Ь +
+ 1)Аг' при к > k^, поэтому 0 < ак < (к0 + l)A~~lk~l. Если 1 < к ^ ко, то
О 4: ак = какк~{ ^ ко( max ак)к~1. Остается в (11) принять Б=тах{(^ +
+ 1)А-1; к, max а,}. □
§ 6. ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ
89
Лемма 5. Пусть числовая последовательность {ак} удовлетворяет
условиям
ак^0, keN = {l,2,...}; (12)
о
a* + i^-X + ^> ке1о> (13)
ак^Вк~2р, Ле/,; (14)
ak + i^ak + Ck-2», fcel,, fc + lelo, (15)
где А, В, С, р —положительные постоянные, р^\, а множества
индексов /0,1, таковы, что 10 и I, = iV,' /0 n J, = 0 (случаи 1О = 0 или I, = 0 ме
исключаются). Тогда существует постоянная D >0 такая, что
0^ak^Dk~p, к = 1,2,... (16)
Доказательство. Можем считать, что А ^ В + С, так как если
неравенство (13) верно для некоторого А — А0 > О, то оно верно для всех
А > А0. Выберем натуральное число /¾ так, чтобы
4^^^(^+1)^6. (17)
Убедимся в том, что такое число существует. Для этого перепишем (17) в
равносильном виде: 4е ^ /¾ ^ 6е — 1, где е = р~[ ^ 1. Существование такого
числа к^ будет доказано, если покажем, что длина отрезка [4е, 6е - 1] при
любом е ^ 1 не меньше 1, т. е. 6Е — 4е — 1 ^ 1 или д(е)-6е -4е ^ 2 при всех
О 1. Но £'(е) = 6Чп6-4Чп4>1п6(6Е-4Е)>0, О 1, так что ^(е) строго
монотонно возрастает при е ^ 1. Следовательно, д(е)~^ д(1) = 2 для всех
е > 1. Таким образом, при каждом р, О < р < 1, число ^, удовлетворяющее
условиям (17), существует,
Покажем, что
aK + i <2A(k0 + iy». (18)
Может случиться, что /¾ е /0. Тогда воспользуемся неравенством (13).
Заметим, что функция fk(a) — a— a2A~l + Ак~2р достигает своего максимума
на числовой оси при а=А/2, и поэтому fk(a)^. fk(A/2) = А/А + Ак~2р для
всех о^ 1, к = 1, 2,... Тогда из (13) с учетом неравенств (17) имеем
V ^ЛК) ^ A/4+Afco~2' < А/4+А/16^ (5.4/16)6(^+1)-' < 2A(fc0+l)-p.
Если же к^ е /,, то возможно и ^ + 1 G /,. Тогда из (14), (17) следует, что
<Ч + 1 <ВД) + I)""2' ^ ВД,+ 1)->/4< 2А(*ь+ 1)">.
Если ^е I,, но ко+ 1 G /0- т0 из (14). (15). (17) получим
ah + 1 < SV2' + CV2' ^ ^ V2" < 2А(Аь + 1)-'.
Оценка (18) доказана. Далее, сделаем индуктивное предположение: пусть
при некотором к ^ /¾ + 1 верна оценка ак ^ 2Ак"Р. Возможно, что к е 10.
Тогда с учетом (17) имеем ак ^ 2Ак~р ^ 2AV ^ А/2. Поскольку Д(о)
90
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
монотонно возрастает на отрезке [0, А/2], то из (13) следует, что ak + l ^
< ЛЮ ^ 1Л2Ак~") = 2Ак~" ~ ЗАк'2» < 2А(к~» - к~2»). Но при 0 < р < 1
справедливы соотношения
к-р-к'2» < (fc'+l)-1 < (fc'+fc"-1)-1 = Ar' + ^fc+l)-1 < (k + l)-», (19)
поэтому ak + l < 2A(k + ly. Если же к G I, и к + 1 e I,, то из (14), (17)
получим
о4 + 1 ^ В(Л + I)-2' ^ В (к + 1)-'(Аь + 1)-" < 2A(fc + 1)-^.
Если к е /,, но к + 1 е 10, то из (14), (15), (17), (19) имеем
о4 + 1 < (Б + C)fc-2^ < Ак~2" < А(к£ - 1)к-2" <
< А(к" - 1)к-2» = А(к-" - к-2") <2А(к + I)-".
Этим показано, что ак^2Ак~р при всех к^к^ + 1. Если 1 ^ к ^ ^, то ак=
= кракк~р^к0к~р тахак. Остается в (16) принять L>=max-{2A; /¾ maxaj. □
1-^л^пЦ 1^л$«лЦ
Лемма 6. Пусть числовая последовательность {wk} такова, что
0^wk + l^(l-sk)wk + dk, k = 1,2,..., «;,£ 0, (20)
где
0<s4^l, dk>0, fc = l,2,..., Е^ = °о, Hmd4/e4 = 0. (21)
Тогда lim ги,. = 0.
* - ■ -- *
* = i
Доказательство. Поскольку 1 — х^. е~х при 0^ ж^ 1, то l — sk^ e~h.
Из неравенства (20) тогда имеем 0^ wk + l < wke~4 + dk, к = 1, 2,... Отсюда
с помощью индукции нетрудно получить, что
0^ + 1<(™1 + £4exp{£s.})exp{-£s.}, Л = 1,2,... (22)
Далее воспользуемся известной теоремой Штольца ([352, ч, 1, с. 88]),
которая представляет собой разностный аналог правила Лопиталя и
гласящей, что если последовательность (¾} монотонно возрастает, предел
lim (хк- xk_i )/(¾ - ук _,) существует, lim ук = оо, то также существует и
к —> оо А:™» оо
предел lim хк/ук, причем
lim а;,/%= lim (хк- хк_1)/(ук -%_,).
К ~4 ОО К —* оо
Положим ^ = ехр{- £ вЛ, ж, = ги, + £ d{ ехр{ £ ЯЛ. fc = 1, 2,... Из
условий (21) следует, что {ук} монотонно возрастает и стремится к
бесконечности. Кроме того,
Ы-,?/'}-еЧ-'5^)"'=&т^=&й)ттЬг=°-
так как функция ж/(1 — е~х) ограничена на множестве 0 < х ^ 1. По теореме
Штольца с учетом неравенства (22) получим
lim wk = lim хк/ук = lim (¾ - xk_l)/(yk - 24 _ ,) = 0.
к —> оо к —> оо л—» оо
Заметим, что неравенство (22) по существу представляет собой оценку
скорости сходимости последовательности {го,}. Однако правая часть оцен-
§ 6. ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ
91
ки (22) трудно обозрима. Поэтому полезно иметь другие, быть может, более
грубые, но более обозримые оценки. Здесь может быть полезна следующая
простая
Лемма 7. Пусть числовая последовательность {wk} такова, что
0^«»* + i^(l-s4K + dk, Л = 1,2,..., го, ^0, (23)
где
0¢sk¢l, <**^0, Л = 1,2,..., supd4/e4 = c<oo. (24)
Тогда
О ^ wk ¢ го, + с, А; = 1,2,... (25)
Доказательство легко проводится по индукции. При k = 1 оценка (25)
очевидна. Если (25) верно для некоторого к ^ 1, то из (23), (24) следует
0^™i + , ¢(1 - sk)(w{ +c) + dk¢(l -sfc)w, +(1 -sk)c + csk ¢^)^0, что и
требовалось доказать. □
Покажем, как может быть применена лемма 7 для оценки конкретных
последовательностей.
Лемма 8. Пусть числовая последовательность {ак} такова, что
0^afc+, ¢(1 - l/k)ak+cjk2, k = l,2,..., с, = const > 0, a, ^ 0. (26)
Тогда справедлива оценка
0¢ak¢c2ln(k + l)/k, к = 1,2,..., ^ = const > 0. (27)
Доказательство. Сделаем замену и!^ = акк(\а (fc+1))-1 и, пользуясь
леммой 7, докажем ограниченность {wk}. Из (26) имеем
0<«, < (\ Лк + \Ык + \) к + \
Таким образом, {wk} удовлетворяет условиям (23) при
. 1 (\ iyn(fc + D d =^_
fc + 1
kz\n(k+2)
Нетрудно видеть, что 0 < sk < 1, lim dk/sk = с,, так что sup dk/sk = c3 < oo.
Из леммы 7 имеем 0 ^'iofc ^ го, +¾. fc = 1, 2,..., что равносильно оценке (27)
с С2 = Сз + а,/1п2. П
Лемма 9. Пусть числовая последовательность {ак} такова, что
0^о4 + 1^(1-1/Л"К + с,/Лад, Л = 1,2,...,
с, = const > 0, 0</3<1, а, >0.
Тогда
0 ¢^¢(^ + ^)-^, Л = 1,2,... (29)
Доказательство. Сделаем замену го^. = ^%. Тогда из (28) имеем
о^1+,<(1-^)^», + ^.
92
Гл. 2. КЛАССИЧЕСКАЯ ТЕОРИЯ ЭКСТРЕМУМА
Это значит, что {wk} удовлетворяет условиям (23) при
,v ^-O-pOO + i)^1' ^ = ^0 + 1)% ^ = ^2.---
Поскольку (1 + 1/Jfe)-" ^ 1 - /3/к, к = 1, 2,..., то
отсюда же следует, что dk/sk < Cj/(1 — /3), к = 1, 2,... По лемме 7 тогда
О < wk < ги, + Cj/(1 — /3), что равносильно оценке (29). □
Лемма 10. Пусть {zk}, {wk} —некоторые последовательности из
евклидова пространства Еп, zt —точка из Еп такая, что
aK + i ~zk\2 + \wk + i~z*\2 <k -^12) (30)
оо
k + i-™/t + il ^ 4t> sk> 0. к =0,1,..., £<^<оо, (31)
... > к - 0
где а, 6 — положительные постоянные. Тогда существует конечный
предел
lim \zk - z,\ = lim \wk + i - zj\ (32)
а справедливо равенство
lim K + 1-zJ=0. (33)
£сл«, кроме того, точка zt из (30) является предельной для {zk}, то
обе последовательности {zk}, {wk} сходятся к z„.
Доказательство. Из (30) следует, что \wk + l — zt\ ^ \zk — zt\. Тогда
с помощью (31) имеем
k+i -**l<K+i -«'fc+il + kfc+i -**l^ w* + 1¾ - z*l (34)
или
]zk + l-ztr\^\zk-ztr\ + b6k, * =0,1,...
Отсюда и из леммы 2 при % = |гл —zj вытекает существование конечного
предела lim \zk — zt\. Из (34) следует (32), что в свою очередь гарантирует
к —> оо
выполнение равенства (33), Наконец, пусть в (30) zt — предельная точка
{zk}, пусть \zk | -> zt. Тогда lim 1¾ - zj\ = lim 1¾ - zj = 0, т. e. (¾} -> 2,,.
"• л —> оо m —» оо m
Отсюда и из (32) получим, что {wk} —> -г». □
Лемма 11. Пусть неотрицательное число z таково, что
O^zp ^bz + d, (35)
где b, d — неотрицательные числа, р>1. Тогда
0^z^(b4 + qd)il1', (36)
где q определяется равенством р"1 + q~l = 1.
§ 6. ВСПОМОГАТЕЛЬНЫЕ ПРЕДЛОЖЕНИЯ
93
Доказательство. Если d = О, то из (35) имеем 0 ^ zp~l ^ 6, или
0^2^6^-^ = 6^, что совпадает с оценкой (36) при d=0. Поэтому можем
считать, что d > 0, Рассмотрим функцию
f(x) = хр — bx — d, х^О.
Нетрудно проверить, что эта функция имеет единственную точку минимума
я» = (Ь/р)1^~1) ^ 0, ip(xt) < <р(0) = —d < 0, lim ip(x) = оо, строго монотон-
но убывает при 0 ^ х ^ xt (если xt > 0), строго монотонно возрастает при
x^xt. Отсюда следует, что уравнение <р(х) = 0 имеет единственное решение
х = 7, так что ^(я) < 0 при 0 ^ х < 7 и </?(я) > 0 при х > j. Согласно (35)
(p(z) ^ 0, поэтому справедлива оценка 0^2^7- Однако получить явное
выражение для 7 в общем случае не удается, поэтому в приложениях
удобнее оценка (36). Для доказательства оценки (36) достаточно установить,
что 7 ^ а = (b4 + qdyip. Пользуясь известным неравенством [327; 350; 393]
И^|о|7р + |Ь|7<ь
справедливым для всех действительных чисел а, 6, р > 1, q > 1, jr1 + q~{ = 1,
имеем ip(a) = ap -ab-d ^ a" -app~l -б"^1 -d = apq~i - (6" +qd)q"i =0.
Следовательно, а^ 7 и 0 < z < а = (6? + qd)qltp. □
ГЛАВА 3
Элементы линейного программирования
Изучение методов минимизации функций многих переменных начнем с методов решения
сравнительно простых и достаточно хорошо изученных задач линейного программирования.
Под линейным программированием понимается раздел теории экстремальных задач, в
котором изучаются задачи минимизации (или максимизации) линейных функций на множествах,
задаваемых системами линейных равенств и неравенств. Различные аспекты теории и методов
линейного программирования, его приложения к технико-экономическим задачам изложены,
например в [1; 13; 33; 48; 49; 52-54; 61; 76; 116; 135; 179; 203; 204; 214; 216; 231; 232; 243;
252; 259; 295; 297-299; 304; 317; 320; 330; 356; 361; 370; 373; 374; 398; 410; 422; 466; 470;
471; 487; 499; 506; 516; 517; 525; 541; 566; 584-586; 601; 612; 620; 636; 644; 652; 670; 676;
683; 685; 686; 688; 690; 719; 725; 736; 746; 747; 750-752; 775; 776; 796; 818].
§ 1. Постановка задачи
1. Общая задача линейного программирования может быть
сформулирована следующим образом: минимизировать функцию
f(x) = c{x{ +с2х2 + ... + спхп (1)
при условиях
хк > 0, к е /+, (2)
апх1 + апх2 + ... + а1пхп ^ Ъ\ \
} (3)
ат + п*' + am + i2*2 + • • • + ат + ыхп = Ът + 1Л
| (4)
a3lxl + as2x2 + ... + amxn = b\ )
где cj, Оу, Ь\ г = 1,..., s, j = 1,..., п заданные числа, причем не все из
чисел с3 и не все из ау равны нулю, 1+ —заданное подмножество индексов
из множества {1, 2,..., п}.
В частности, здесь возможно, что 1+ = 0 или 1+ = {1, 2,..., п}; не
исключаются случаи, когда отсутствуют ограничения типа равенств \т = s) или
типа неравенств (т = 0). Если ввести векторы с = (с',..., cn), ai = (ап,...
..., а1п), х = (х\ ..., хп), то задачу (1)-(4) можно кратко записать так:
f(x) = (с, х) -»inf, х е X = {х е Еп: хк > 0, к е /+,
(а{, х) ^ Ь\ i = 1,..., m; (а{, х) = Ь\ г = т + 1,.. ., s},
где (с, х), (а(, х) — скалярное произведение соответствующих векторов.
Приведем еще одну форму матрично-векторной записи задачи (1)-(4).
Предварительно договоримся о некоторых обозначениях. Если для каких-
§ 1. ПОСТАНОВКА ЗАДАЧИ
95
либо двух векторов ж = (ж1,..., х"), y = (yl,...,yp) справедливы
неравенства х1 ^ у1 при всех г = 1,..., р, то будем кратко писать: х ^ у. Тогда,
например, неравенство х ^ 0 означает, что х1 ^ 0 для всех г = 1,..., р.
Далее, не умаляя общности дальнейших рассмотрений, можем считать,
что переменные ж1, ж2,..., хп перенумерованы так, что 1+ = {1,..., П[},
О ^ п, ^ п (п, = 0 соответствует случаю I+ = 0). Отдельно выделяя
неотрицательные координаты, вектор х можем представить так: ж = (ж,, :%),
х, = (ж,1, х?,..., х?) £ Еп>, а^ = (¾1, ж|,. •., Яг"") ^ Я"2, ж, ^ О, n, + 7¾ = п.
Используя принятые обозначения, задачу (1)-(4) можем записать в
следующем виде:
/(ж) = (с,, 0:,) + (¾.¾) ->inf, ж = (ж,,ж2)еХ, (5)
Х = {ж = (ж,,ж2): ж,е.Е\
¾£■" ) АцЖ, + -^12¾ ^ "l> -^213¾ "+" -^22¾ = "2! Ж1 ^ 0})
где А у — матрица размером т{ х Пу,
m, + 77¾ = s,
Ь.еЕт<, с>еЕп', «, j = 1,2;
т,
Л„ =
■"■21 —
ь.=
А11 !
*1п,
ПТ^ _
*т + 111
а.
'm+ Irt,
-^12 —
-^22 —
*1п.+П
Чп
а.
'm + ln, + 1!
*т + \п
'•an, + 1 )
Ь1
6,=
1 + 1
¾ =
,п, + 1
Подчеркнем, что в (6) и всюду ниже в произведениях вида -А,.,ж,,
А^ж^, Аж, By,... матриц Аи, Ai2, А, В... на соответствующие
вектора ж,, 0¾) ж, у,... будем подразумевать, что ж,, ж^, ж, у,... — это векторы-
столбцы подходящей размерности, хотя для экономии места, как мы уже
делали выше, часто будем записывать эти векторы в виде строки.
Укажем еще на одну форму записи множества (6)
X = {х = (щ, Ж;): ж, ей"1, х2еЕп^,
Е а№+ £ а№ < Ьп Е Mrt + Е ^¾4 = ь», ¢,> о},
к=\ к=\ к=1 к = \
где А\- — к-й столбец матрицы А.}..
Точку xte X назовем точкой минимума функции (с, ж) на множестве
X или, короче, решением задачи (5), (6) если (с, ж„) = inf(c, ж).
, 2. Приведем примеры прикладных задач, приводящих к задачам
линейного программирования.
Задача оптимального планирования производства. Пусть на
некотором предприятии изготовляются п видов продукции из s видов сырья.
Известно, что на изготовление одной единицы продукции j'-ro вида нужно ау
единиц сырья г-го вида. В распоряжении предприятия имеется Ь, единиц
сырья г-го вида. Известно также, что на каждой единице продукции j'-ro
вида предприятие получает cj единиц прибыли. Требуется определить, сколько
единиц ж1,..., ж" каждого вида продукции должно изготовить предприятие,
чтобы обеспечить себе максимальную прибыль.
96
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Если предприятие наметит себе план производства х = {х\ ..., хп}, то
оно израсходует апх1+.. .+а^хп единиц сырья г-го вида и получит с,ж'+...
... + спхп единиц прибыли. Ясно также, что все величины ж\ г = 1,..., п,
неотрицательны. Поэтому мы приходим к следующей задаче линейного
программирования: максимизировать функцию f(x) = clxl+... + cnxn при
ограничениях х1 > 0,..., хп >0, anxl +.. . + ainxn < bl, i = 1,..., s. Поскольку
задача максимизации функции /(ж) равносильна задаче минимизации
функции —/(ж), то с учетом введенных выше обозначений сформулированную
задачу линейного программирования можно кратко записать в виде
(-с, х) ->inf; х£Х = {хеЕп: ж > О, Ах^Ь}. (7)
Ясно, что задача (7) является частным случаем задачи (5), (6).
Задача об оптимальном использовании посевной площади. Пусть под
посев р культур отведено г земельных участков площадью соответственно
в &,,..., ЬГ гектаров. Известно, что средняя урожайность г'-й культуры на
j-м участке составляет ау центнеров с гектара, а прибыль за один центнер
г-й культуры составляет с{ рублей. Требуется определить, какую площадь
на каждом участке следует отвести под каждую из культур, чтобы получить
максимальную прибыль, если по плану должно быть собрано не менее d{
центнеров г-й культуры.
Обозначим через и., площадь, которую планируется отвести под г-ю
культуру на j-м участке. Тогда
uh. + ... + upj = b., j = 1,..., г. (8)
Ожидаемый средний урожай г-й культуры со всех участков равен аиип + ...
.. - + ainuin центнеров. Поскольку согласно плану должно быть произведено
не менее \ центнеров г-й культуры, то
апиИ+... + а{пи1п^^ » = 1,...,р. (9)
Ожидаемая прибыль за урожай г-й культуры равна с{(аиии + ... + ainuin),
а за урожай всех культур —
р
Е с4(аг1ии + ... + ainuin) = /(«).. (10)
i = l
Таким образом, приходим к задаче максимизации функции (10) (или
минимизации функции —f(u)) при условиях (8), (9) и естественных
ограничениях
Щ, ^0, ъ = 1,...,р, j =},..., г.
Если умножить соотношения (9) на —1 и переменные {^.} переобозначить
через ж1,..., хп, то придем к задаче вида (1)-(4).
Транспортная задача. Пусть имеется г карьеров, где добывается
песок, и р потребителей песка (например, кирпичные заводы). В г-м карьере
ежесуточно добывается а{ тонн песка, а j-му потребителю ежесуточно
требуется bj тонн песка. Пусть су — стоимость перевозки одной тонны песка с
г-го карьера j-щ потребителю. Требуется составить план перевозок песка
так, чтобы общая стоимость перевозок была минимальной.
Обозначим через и{]. планируемое количество тонн песка из г-ro карьера
j'-му потребителю. Тогда с г'-го карьера будет вывезено
ии + ■•■ + ■".■„ = «.■) г = 1,..., г, (11)
§ 1. ПОСТАНОВКА ЗАДАЧИ
97
тонн песка, j-му потребителю доставлено
«,,- + • • • + ■%. = Ьу, j = l,...,p, (12)
тонн песка, а стоимость перевозок будет равна
/M=EEw- (13)
Естественно требовать, чтобы
■%^°> г = 1,..., г, j = l,...,p. (14)
В результате получили задачу минимизации функции (13) при
условиях (11), (12), (14), которая, очевидно, является частным случаем общей
задачи линейного программирования (1)-(4).
К задачам типа (1)-(4) сводятся также и многие другие прикладные
задачи технико-экономического содержания.
Следует заметить, что приведенные выше примеры задач линейного
программирования, вообще говоря, представляют лишь приближенную,
упрощенную математическую модель реальных задач. Вполне может оказаться,
что принятая математическая модель, обычно составляемая на основе
приближенных данных о реальном моделируемом явлении (объекте, процессе),
не охватывает какие-либо важные существенные стороны исследуемого
явления и приводит к результатам, существенно расходящимся с реальностью.
В этом случае математическая модель должна быть изменена, доработана
с учетом вновь поступившей информации, а получаемые при анализе
совершенствованной модели данные должны снова и снова критически
сопоставляться с реальными данными и использоваться для выяснения границ
применимости модели. Математическая модель лишь при высокой степени
адекватности моделируемому явлению может быть использована для более
глубокого анализа явления и проникновения в его сущность, для выработки
целенаправленного управления.
Практика показала, что линейные модели, приводящие к задачам
вида (1)-(4), вполне пригодны для исследования многих реальных явлений,
или для их анализа могут быть использованы теория и методы линейного
программирования. Линейное программирование является одним из
наиболее изученных разделов теории экстремальных задач с достаточно богатым
арсеналом методов. Ниже мы увидим, что задачи линейного
программирования нередко используются в качестве вспомогательных во многих методах
решения более сложных нелинейных задач минимизации.
3. Из общей задачи линейного программирования обычно выделяют так
называемую каноническую задачу:
f(x) = {c,x)-*lni; х е X = {х е Еп: х > О, Ах = 6}, (15)
получающуюся из задачи (5), (6) при т = О, 1+ = {1, 2,..., п}. Задача (15)
привлекательна тем, что при ее исследовании, разработке методов ее
решения можно пользоваться хорошо известной из линейной алгебры
теорией систем линейных алгебраических уравнений. Замечательно также и то,
что методы, созданные для решения канонической задачи (15),^ нетрудно
модифицировать и применять для решения общей задачи линейного
программирования (5), (6). Дело в том, что задача (5), (6) оказывается сама
равносильна некоторой канонической задаче. Покажем это.
98 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Для того, чтобы легче было понять последующие построения, прежде
всего заметим, что любое действительное число а можно представить в виде
разности двух неотрицательных чисел: а= а+ — аг, где а+ = тах{0; а} ^ О,
ее = тах{0; —а} ^ 0. Отсюда следует, что вектор х2 = (а^, ..., х£*) можно
представить в виде разности неотрицательных векторов:
x2 = zl — z2, Z\ = max{0; 3¼} ^ 0, z2 = max{0; — 3¼} >0, (16)
где операция взятия максимума проводится покоординатно: «, = («,',...
• ■ -, ^), 4 = тах{0; ж/}, z2 = (¾1,..., zp), 4 = тах{0; -ж^'}, j = 1,.. ., 9¾.
Далее, заметим, что ограничения Ах < Ь типа неравенств можно записать
в виде ограничений типа равенств Ах + v = b, добавив сюда неравенство
v ^0: ясно, что точка х будет решением неравенства Ах ^ 6 тогда и только
тогда, когда (ж, v) — решение системы Ах + v = b, v ^ 0. Отсюда следует,
что вводя переменную
v = bi-Aiixi-Ai2x2^0, (17)
ограничение Апх{ + Al2x2^.bl с учетом (16) можно представить в
равносильном виде
Aiixi + Ai2X2 + v = Апх{ + Ai2z{ + (—Al2)z2 + v = b{, v^O.
Ограничение А2,ж, + А22х2 = b2 с учетом (16) запишем в виде:
А21 ж, + A22z2 + (-A22)z2 + 0v = b2.
Учитывая эти соображения, в пространстве переменных го = (ж,, г,, z2, v),
ж, G Е"1, z, gB"1, z2e Ещ, v е Е"4, рассмотрим следующую каноническую
задачу:
3(^) = (0,,3,) + (^3,) + (-^^ + (0^)-^, weW, (18)
W = {w = (xi,zl,z2,v): А,,ж, + А,22, + (-А,2)г2 + Ь = 6,,
^21^1+^22^1+(-^22)^2=^2- ™>0}, (19)
где I — единичная матрица размера т^т^ Оказывается, задачи (5), (6)
и (18), (19) обе одновременно имеют или не имеют решение, причем, зная
какое-либо решение одной из этих задач, нетрудно получить решение другой
задачи. Точнее, справедлива следующая
Теорема 1. Задачи (5), (6) и (18), (19) равносильны, т. е.:
1) множества X и W ода пусты или непусты одновременно;
2) если X ф0, W ф0, то /t = д., где /„ = inf /(u), gt = inf g(w);
3) множества решений Xt = {u е X: /(ж) = /J, Wt = {w g ТУ: g(w) =
= #„} этих задач оба пусты или непусты одновременно; причем
если ж, = (ж,„, ж,,) G Xt, то гц, = (ж,„, zu, z2tr, г>„) G W*, где zu = max{0; :%},
22t = тах{0;-Ж2„}, г>„ = 6, - А,,ж,„ - A,2:%Mi а обратно, если w^ =
= (жи, 2U, %, «J G W„, mo xt = (ж,„, :¾. = zu - z2tf) G Xt.
Доказательство. Учитывая связи (16),(17) между
переменными ж,, а^, г,, г2, г; и определения (6), (19) множеств X, V7 заключаем,
что если точка ж = (ж,, 3¼) G-X", то w = w(x) = (ж,, г, = тах{0; %}, г2 =
= тах{0; -¾}) ^ = 6,-^,,33,-^,2¾)^^^. И обратно, если iu=jж,, г,, z2, v)e
G W, то x = x(w) = (xux2 = Z\-z2)eX. Отсюда ясно, что либо оба множе-
§ 1. ПОСТАНОВКА ЗАДАЧИ
99
ства X и W пусты, либо оба непусты одновременно. Далее, из определений
функций f(x), g(w), w(x), x(w) следуют тождества
f(x) = g(w(x))1 g(w) = f(x(w))1 Vz, m (20)
Допустим, что /„ = — оо. Тогда существует последовательность {хк}: хк£
el, к = 1, 2, ..., такая, что {f(xk)} —>/„ = —оо. Положим wk = w(xk), к =
= 1,2,.... Из (20) тогда имеем g(wk) = g(w(xk)) = f(xk) —> —оо, откуда с
учетом включения wk G W, к = 1, 2,..., получим, что gt = —оо. Аналогично
рассуждая, заключаем, что если gt = —оо, то /+ = — оо.
Пусть далее /„ > —оо, gt > —оо. Возьмем произвольное число е > 0. По
определению нижней.грани найдется точка хе е X, такая, что ft ^ f(xe) <
< /t+e. Тогда гие = w(xe) G W и из (20) следует, что #„ ^ g(we) = f(xe) < ft+e,
т. е. gt< ft + е. Аналогично, по определению #„ существует точка Ше для
которой д„ < g(ws) < д„ + е. Тогда хе = х(Ше) £1и/,^ f(xe) = f(x(ws)) =
= g(we) <gt + e, т. e. /„<&,+ е. Следовательно, /„ - е < & < /„ + е. В силу
произвольности е > 0 отсюда вытекает, что /„ = gt > — оо.
Наконец, если xt G Xt, то ги„ = w(xt) G W, и в силу вышедоказанного
д(ги4) = g(w(xtr)) = /(¾) = /„ = gt. Это значит, что w(xt) G W„ при любом
xt G X,. Аналогично доказывается, что если wt G W,, то xt = x(wt) G Xt.
Отсюда следует, что либо оба множества Xt и Wt пусты или оба непусты
одновременно. Теорема 1 доказана. □
4. В теории и методах линейного программирования наряду с
канонической задачей принято выделять так называемую основную (или
стандартную) задачу линейного программирования:
f(x) = (с, х) -»inf, хвХ = {х>0: Ax^b}, (21)
получающуюся из общей задачи (5), (6) при т = s, 1+ = {1, 2,..., п}. Это
объясняется тем, что в приложениях большое число линейных
математических моделей изначально естественным образом записывается в виде
задачи (21) (см., например, задачу (7)). Следует также отметить, что задача (21)
весьма удобна для геометрических интерпретаций, делающих наглядными
многие понятия и методы линейного программирования.
Если ввести дополнительные переменные v = (v\ ..., vm) посредством
соотношений
v = b-Ax, v^O, (22)
то задачу (21) в пространстве Еп+т переменных z = (х, v) можно записать
в канонической форме:
g(z) = (d,z)^ml, j е Z, _
Z = {z = (x,v)^0, Cz = Ax + Imv = b},
где d = (c,0)eEn + m, С = (А,1Щ), I —единичная матрица размера тхт.
Из теоремы 1 следует, что задачи (21), (23) равносильны, и зная решение
xt G Xt задачи (21| по формуле (22) нетрудно подучить решение задачи (23)
zt = (35,,-¾ = b- Axt), и обратно, если z„ = (xt, vt) G Zt, то xt G Xt.
С другой стороны, каноническую задачу (15) нетрудно записать в форме
основной задачи. В самом деле, если ограничения типа равенств Ах — Ь
заменить на равносильную систему двух неравенств: А х ^ Ь, А х ^ Ь, то
100
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
тогда задачу (15) можно записать в следующем виде
/(ж) = (с, ж) —> inf, х G X = {х ^ 0: Ах ^ 6, (-А)х ^ -6}
= {ж ^ 0: Сж < /}, С =
-А
.Г
6
-6
• (24)
Рассуждая также, как при доказательстве теоремы 1, нетрудно установить
равносильность задач (15), (24).
Как видим, все три формы задач линейного программирования — общая
задача (5),(6), каноническая (15), основная (21) — тесно связаны между
собой и простыми преобразованиями от одной формы легко перейти к
другой. Поэтому, если мы научимся решать одну из этих задач, то тем самым
будем уметь решать задачу линейного программирования, записанную в
любой другой форме. Заметим однако, что изложенные приемы сведения
задач (5), (6), (15), (21) к канонической или основной задаче могут привести
к чрезмерному увеличению размерности переменных или числа
ограничений. Поэтому методы решения задач линейного программирования обычно
разрабатывают для задач (15) или (21), как более простых для
исследования, а затем, учитывая указанную связь между задачами (5), (6), (15), (21),
модифицируют полученные методы применительно к другим классам задач
линейного программирования, стараясь, по возможности, не увеличивать
их размерность.
Упражнения
1. Требуется составить наиболее дешевую смесь, содержащую не менее Ъг единиц i-ro
вещества, i' = 1, 2,..., m, при условии, что для изготовления смеси имеется п видов продукции,
причем в одной единице j-ro продукта содержится а^ единиц i-ro вещества, а цена одной
единицы j'-ro продукта равна с3 рублей (задача о смесях). Сформулировать эту задачу в виде
основной задачи (21).
2. Задачу f(x) = xi + х2 + х3 + х4 - хъ -* sup, х = (х\ х2, х3, ж4, х5) еХ = {xl JtO, х3 ^0,
ж4^0; х1 +х2-х3 ^ 1, х1 + ж4 + ж5 = 3, х1 -х3 + х5^. 1, -1 < ж2 < 1,ж5^ 1} записать в виде
задач (5), (6), (15), (21).
3. Записать общую задачу (5), (6) линейного программирования в форме основной задачи,
доказать их эквивалентность.
§ 2. Геометрическая интерпретация. Угловые точки
1. Кратко остановимся на геометрическом смысле задачи линейного
программирования. Рассмотрим задачу (1.21) при п = 2:
/(ж) = с!ж' + с2ж2-> inf ,,.
х е X = {х = {х\ х2): хх >0, ж2$>0, апж! + ai2x2 ^ Ь', t = 1,..., m}
Введем множества: Х0 = {х = (х\ х2): ж1 > 0, х2 > 0} = Я2 —
неотрицательный квадрант плоскости; (ж1, ж2), Х( = {ж = (ж1, ж2): aaxi + ai2x2 < b'} —
полуплоскость, образуемая прямой апж' + а<2ж2 = Ь\ г = 1, ..., щ. Ясно,
что множество X является пересечением мчожеств Х0, Хг,..., X . Может
случиться, что это пересечение пусто (рис. 3.1) — тогда задача (1) теряет
смысл. Если множество X непусто, то оно, образованное пересечением ко-
§ 2. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ. УГЛОВЫЕ ТОЧКИ 101
немного числа полуплоскостей, представляет собой выпуклое
многоугольное множество, границей которого является ломаная, составленная из
отрезков каких-либо координатных осей и прямых aiXxl + ai2x2 = b\ i =
— 1,..., т. Это многоугольное множество может быть как ограниченным
(рис. 3.2) — тогда X представляет собой выпуклый многоугольник, так и
неограниченным (рис. 3.3).
Пусть а — какое-либо значение функции f(x) = (c, х) = схх1 +с2х2. Тогда
уравнение
с1х1 + с*х2 = а (2)
задает линию уровня функции f(x), соответствующую ее значению а и на
плоскости определяет прямую, перпендикулярную вектору с = (с\ с2) ф 0.
При изменении а от —оо до оо прямая (2), смещаясь параллельно самой
себе, «зачертит» («заметет») всю плоскость. При этом вектор с —градиент
функции f(x) — указывает направление, в котором следует смещать
прямую (2), чтобы увеличивать значение функции f(x) = (с, х). Может
случиться, что при изменении а от —оо до оо прямая (2) при некотором
значении а = /„ впервые коснется X и будет иметь с X общую точку xt (на
рис. 3.2-3.5 прямая (2) представлена при а = ах < ft < а2 < а3). Ясно, что
(с, ж,,) = /„ = ini(c, х), т. е. xt — решение задачи (1). Возможен случай, когда
прямая (2) при первом касании с многоугольником X будет иметь не одну
с'ж1 +с2х2 = а.
Рис. 3.1
Рис. 3.2
с = {с\с2)
с'ж' +с2х2 = а.
Рис. 3.3
Рис. 3.4
102
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Рис. 3.5
Рис. 3.6
общую точку с X, а целую сторону (рис. 3.4, 3.5) — это может случиться,
если X имеет сторону, перпендикулярную вектору с.
Если многоугольное множество X не ограничено, то наряду со случаями,
когда при первом касании прямая (2) будет иметь с X одну общую точку xt
(см. рис. 3.3) или сторону (рис. 3.5), возможна ситуация, когда прямая (2)
при всех а (-оо < а ^ а0 < оо) имеет общую точку с X (рис. 3.6) — тогда
inf(c, х) = — оо (первого касания прямой (2) с X нет), т. е. задача (1) не
имеет решения.
Из рассмотренных случаев задачи (1) видно, что задача линейного
программирования может не иметь ни одного решения (см. рис. 3.1, 3.6), может
иметь лишь одно решение (см. рис. 3.2, 3.3), может иметь бесконечно много
решений (см. рис. 3.4, 3.5), множество решений может быть
неограниченным (рис. 3.5).
Аналогично можно показать, что множество X в задаче (1.21) при п = 3
является многогранным множеством, и дать геометрическую
интерпретацию этой задачи. Предлагаем читателю самостоятельно рассмотреть этот
случай, а также исследовать задачу (1.15) при п = 2, 3.
2. На примере рассмотренной выше задачи (1) нетрудно усмотреть, что
если задача (1) имеет решение, то среди решений найдется хотя бы одна
угловая точка (вершина) многоугольного множества X. Ниже мы увидим,
что это не случайно: и в более общей задаче линейного программирования,
оказывается, нижняя грань функции (с, х) на X достигается в угловой точке
множества.
Определение 1. Точка v множества X называется угловой
точкой (вершиной, крайней точкой, экстремальной точкой) множества X, если
представление ^=0^,+(1-0)¾ при «,, v2£X и 0<о<1 возможно лишь при
^,=¾. Иначе говоря, v — угловая точка множества X, если она не
является внутренней точкой никакого отрезка, принадлежащего множеству X.
Например, угловыми точками многоугольника на плоскости или
параллелепипеда в пространстве являются их вершины; все граничные точки шара
будут его угловыми точками; при п > 2 замкнутое полупространство или
пересечение двух замкнутых полупространств не имеют ни одной угловой
точки.
В задачах линейного программирования понятие угловой точки играет
фундаментальную роль и лежит в основе многих методов решения таких
§ 2. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ. УГЛОВЫЕ ТОЧКИ 103
задач. В дальнейшем мы будем подробно исследовать каноническую
задачу (1.15). Поэтому начнем с изучения свойств угловых точек множества
Х = {хеЕп: х^О, Ах = Ь}, (3)
где А — матрица размера т х п, А ф0, Ь —вектор из Ет. Ниже будет
показано, что множество (3), если оно непусто, имеет хотя бы одну угловую
точку (см. теорему 4.1). Возникает вопрос, как узнать, будет ли та или иная
точка множества (3) угловой точкой? Приведем один достаточно простой
алгебраический критерий угловой точки множества (3). Для этого вначале
обозначим j-и столбец матрицы А через Aj и запишем систему уравнений
Ах = Ь в следующей эквивалентной форме:
А1х1 + ... + Апхп = Ь. (4)
Теорема 1. Пусть множество X определено условиями (3), А ф 0,
r = rangA —ранг матрицы А. Для того чтобы точка « = («',..., vn)eX
была угловой точкой множества X, необходимо и достаточно, чтобы
существовали номера j\,..., jr, 1 < j, < п, I = 1,..., г, такие, что
A. v*+...+ А-гЛ = b; w' = 0, j ф j„ 1 = 1,..., r, (5)
причем столбцы Aj,..., Aj линейно независимы.
Доказательство. Необходимость. Пусть v — угловая точка
множества X. Если v = 0, то из условия 0е X следует, что 6 = 0.
Поскольку А Ф 0, то г = rangA > 1 и существуют линейно независимые столбцы
Aj,..., Aj. Отсюда имеем Aj • 0 + ... + Aj -0 = 0. Для случая v = 0
соотношения (5) доказаны.
Пусть теперь v ф 0 и пусть vj>,..., vh — все положительные координаты
точки v. Отсюда и из условия Av = Ь с учетом представления (4) имеем
AjV^+... + AJtv^ = b; v'=0, j ф j„ 1 = 1,.. ., k. (6)
Покажем, что столбцы Aj,..., Ajt линейно независимы.
Пусть при некоторых a,, ..., ак имеет место равенство
0,^ + ... + 0^=0. (7)
Возьмем точку «+ = («j, ..., «") с координатами v£ = v3* + еар, w£ = О
при j ф j , р = 1, ..., к, и точку v_ = (vl,..., v?) с координатами v3j = v3> -
- есер, v[ = 0 при j фэ , р= 1,..., к. Поскольку v3> > 0, р= 1, . .., к, то при
достаточно малых е >0 будем иметь v+ ^0, v_ ^0. Кроме того, умножая (7)
на е или -е и складывая с (6), приходим к равенствам Av+ = Ь, Av_ = b.
Таким образом, v+, v_ е X. Очевидно, v = (v+ + v_)/2, т. е. v = av+ + (1-
- a)v_ при a = 1/2. По определению угловой точки это возможно лишь
при v+ = v_ = v, что в свою очередь означает, что а, = ... = ак = 0. Таким
образом, равенство (7) возможно только при а, = .. . = ак = 0. Линейная
независимость столбцов Aj,..., Aj доказана. Отсюда следует, что к.^.г.
Если к=г, то соотношения (6) равносильны (5). Если к<г, то добавим к
столбцам А,,..., А, новые столбцы А ■ ,..., А, матрицы А так, чтобы си-
стема A-,.. .,A. ,A. ,...,A . была линейно независимой, а при добавлении
104
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
любого другого столбца А3- эта система становилась линейно зависимой.
Тогда система А3-,..., А- образует некоторый базис линейной оболочки
векторов А,,.. .,АП. Размерность линейной оболочки векторов А,,.. .,АП
равна рангу матрицы А, так 4TOs=r=rangA. Добавив к первому равенству (6)
столбцы Aj ,..., Aj, умноженные соответственно на vjh*\ = 0,..., v3' = 0,
из (6) получим соотношения (5). Тем самым необходимость доказана.
Достаточность. Пусть некоторая точка v = (w',. .., г;")
удовлетворяет условиям (5), где А.,...,'А3- —линейно независимы, r = rangA.
Пусть v = av[ +(1-0:)¾ при некоторых г;,, v2 £ X, 0< а < 1. Покажем, что
такое представление возможно только при vl = v2 = v. Сразу же заметим,
что если v3 = 0, то из этого представления с учетом неравенств 0 < а < 1,
vf ^ 0, v$ ^ 0 получим 0 ^ av3 + (1 — a)v21' = v3 = 0, что возможно лишь
при v3 = vi = v3 = 0. Таким образом, для получения равенства v = v{ = v2
остается еще доказать, что v{ = v23 = v3 и при тех j, для которых v3 > 0.
По условию (5) у точки v положительными могут быть лишь
координаты v3>,..., V3*. Произведя при необходимости перенумерацию
переменных, можем считать, что v3x > 0,..., v3i > 0, v3k*% = 0,..., гЛ = 0 (случаи
А; =0 или к = г здесь не исключаются). Тогда (4) можно переписать в виде
Aj v3,+...+А}. v3'1 = Ь. Кроме того, учитывая, что по доказанному v{ = ю£=0
при всех j ф j , р = 1,..., к, равенства Av{ = Ь также можно записать в
виде А3- vfx + ... + А^ v\b = b, г = 1, 2. Вспомним, что векторы А3-, .. ., А3-
линейно независимы. Поэтому вектор Ь может линейно выражаться
через А}.,..., Ау единственным способом. Это значит, что v3f = v3vf = v32" для
р = 1, ..., к. Тем самым установлено, что v = vt = v2. Следовательно, v —
угловая точка множества X. О
Определение 2. Систему векторов А}-,..., А-, входящих в первое
из равенств (5), называют базисом угловой точки v, а соответствующие
им переменные v3'1,..., v3r — базисными координатами угловой точки v.
Если все базисные координаты угловой точки положительны, то такую
угловую точку называют невырожденной. Если же среди базисных
координат V31,..., v3' — хотя бы одна равна нулю, то такая угловая точка
называется вырожденной. При фиксированном базисе Ау,..., Ау переменные
и3'1,..., и3' называются базисными переменными угловой точки, а
остальные переменные и3' — небазисными {свободными) переменными.
Из теоремы 1 следует, что невырожденная угловая точка обладает
единственным базисом — ее базис составляют столбцы с теми номерами,
которым соответствуют положительные координаты угловой точки. Если
угловая точка вырожденная, то она может обладать несколькими базисами. В
самом деле, если v3> >0,..., vh >0, k < r = rangA, а остальные координаты
v3' угловой точки v равны нулю, то, как видно из доказательства теоремы 1,
в базис такой точки обязательно войдут столбцы А3-,..., А^ , а остальные
базисные столбцы Ау ,..., Ау, входящие в представление (5), могут быть
выбраны, вообще говоря, различными способами.
Поскольку из п столбцов матрицы А можно выбрать г линейно
независимых столбцов не более чем С£ способами (CJ — число сочетаний из п
элементов по г), то из теоремы 1 следует, что число угловых точек
множества (3) конечно.
§ 2. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ. УГЛОВЫЕ ТОЧКИ 105
Пример 1. Пусть Х = {х = (х\х2, х3, ж4) ей4: зУ ^ 0, j = 1,...,4,
х1 + х2 + 3х3 + ж4 = 3, х1 — аг + х3 + 2ж4 = 1}. Обозначим
"Г
1
) -А 2 —
1
-1
) -"-з—
У
1
) -Д-4 —
"Г
2
, 6 =
У
1
Нетрудно видеть, что точки ж, = (2, 1, 0, 0) и 0¾ = (0, 5/3, 0, 4/3)
являются невырожденными угловыми точками множества X, причем точке
х1 соответствует базис АиА2, а точке щ — базис А2, А4; угловая точка
хъ = (0, 0, 1, 0) вырожденная и ей соответствуют базисы А,, А3, или А2, А3,
или А3, А4; точка ж4 = (5, 0, 0, —2) не является угловой для множества X,
так как ж4 ф X.
Упражнения
1. При каких значениях параметра а задача: f(x) = xx+ax2-*'ml, хеХ~{хеЕ2: ж^0, хх-
- ж2 ^ 1, хх +2х2 ^ 4} имеет решение? Не имеет решения? Имеет единственное решение?
Нарисуйте график функции Д = Д(а) = inf f(x). Графически изобразите множество X (а) =
re G X \>
= {х е X: f(x) = Д(а)} при различных а.
2. Найти все угловые точки и их базисы для множеств:
Хх = {х е Я4: ж ^ 0, ж1 - 2х2 - х3 = 0, -ж1 + Зж2 + ж4 = 1},
Х2 = {же.Е5: ж^О, ж1 + ж2 + ж3 + ж4 = 1, ~хх + 2ж2 + ж3 -f х5 - 1},
X3 = {xeEs: х^0,2хх +3х3 + х6 = 3, хх + х2+2х3~2, хх +х3-\-х* = 1}.
3. При каких значениях параметров а(, b множество X ~{х€Еп: х^О, аххх +.. . + апхп =
= Ь} непусто и имеет угловые точки? Какое максимальное и минимальное число угловых точек
может иметь такое множество?
4. Пусть X = {хеЕп: (а{,х)^.Ьг, %<= 1 т}, т^п. Показать, что точка veX является
угловой точкой множества X тогда и только тогда, если обращаются в точные равенства не
менее, чем п из неравенств (ai, v) ^ bl, среди которых есть п линейно независимых.
5. Вывести теорему 1 из утверждения упражнения 4. Указание: множество (3) записать
в виде X = {а;еВ": (а;,ж) = Ь\ г — \ т; (-е;, ж) <0, i' = l п}, где е{ — i'-й столбец
единичной матрицы размера пх п.
6. Доказать, что всякая угловая точка множества (3) является угловой и для множества
Х,={ж^0; Аж<Ь}.
7. Доказать, что множество X = {ж е Еп: (а,-, ж) < 6', г — 1 т} при т<пне имеет
угловых точек.
§ 3. Симплекс-метод. Антициклин
1. Будем рассматривать каноническую задачу (1.15):
f(x) = (с, х) -»inf, *el = {a:efi": z > О, Az = 6}, (1)
где А ненулевая матрица размера тхп, с е Еп, Ь е Ет. Ниже будет
показано, что всякое непустое множество X из (1) имеет хотя бы одну угловую
точку и, кроме того, если inf (с, х) =/ > —оо, то эта нижняя грань
доге ех
стигается хотя бы в одной угловой точке множества X (см. теоремы 4.1,
4.2). Отсюда следует, что задачу (1) можно попытаться решить следующим
106
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
образом: сначала найти все угловые точки множества X, пользуясь,
например, конструкциями теоремы 2.1, затем вычислить значение функции
f(x) = (с, х) в каждой из угловых точек, число которых, как мы знаем,
конечно, и определить наименьшее из них. Однако такой подход к решению
задачи (1) практически не применяется, так как уже в задачах не очень
большой размерности число угловых точек может быть столь большим, что
простой перебор всех угловых точек множества X может оказаться
невозможным за разумное время даже при использовании самых лучших
современных компьютеров.
Тем не менее идея перебора угловых точек множества оказалась весьма
плодотворной и послужила основой ряда методов решения канонической и
других задач линейного программирования. Одним из таких методов
является так называемый симплекс-метод. Название этого метода связано с
тем, что он впервые разрабатывался применительно к задачам линейного
программирования, в которых множество X представлял собой симплекс
п
в Еп: X = {х = (ж1,..., хп); х^О, J2 х1 — 1}, затем метод был обобщен
> = i
на случай более общих множеств X, но первоначальное название за ним
так и сохранилось; в литературе этот метод часто называют еще методом
последовательного улучшения плана.
При реализации симплекс-метода осуществляется упорядоченный
(направленный) перебор угловых точек множества X, при котором значение
функции (с, х) убывает при переходе от одной угловой точки к другой, что
позволит, перебрав, быть может, лишь относительно небольшое число
угловых точек, выяснить, имеет ли задача (1) решение и, если имеет, то найти
его. Такова общая идея симплекс-метода.
Перейдем к описанию симплекс-метода для решения канонической
задачи (1). По условию 1 ^ г = rangA ^min{m, п}. Предполагая, что из системы
(Ах)1 = &', г = 1, ..., т, исключены линейно зависимые уравнения, в этом
параграфе будем считать, что г = rri, и матрица А имеет размеры гхп.
Тогда г^п. Если г = п, то система Ах = Ь будет иметь единственное решение
Xq и множество X будет либо пустым (если не соблюдается ограничение
Xq ^ 0), либо X состоит из одной точки (если :¾ ^ 0) — в этом случае
задача (1) становится малосодержательной. Поэтому будем считать, что г < п.
Тогда систему Ах = b можем записать в виде
auxl + ,.. + alnxn = b\
(2)
arlxl + ... + amxn = br, г-т<п.
Пусть известна некоторая угловая точка v = (v\ v2,..., vn) множества X
с базисом Aj, Aj,..., Aj (о том, как найти такую точку v, см. § 4).
Матрицу В = (Aj,..., А ■), столбцами которой являются базисные векторы, будем
называть базисной матрицей или просто базисом. Через I(v) = {j\,..., jr}
обозначим номера базисных переменных или, короче, базисных номеров.
Перенумеровав переменные, можем считать, что I(v) = {1,2,..., г}; тогда
столбцы АиА2,...,Аг матрицы А составляют базис точки v, а х , х2,...
..., хг — ее базисные переменные. Обозначим
' X1'
хг
, v =
'vx'
vr
, с =
"с1"
L с J
. 4,=
■°iy"
L ап J
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
107
В =
*1П
— (А,, А2,..., Аг).
Тогда систему (2) можно кратко переписать в виде
b = Alxx + ... + Arxr + Ar + lxT+x + ... + Anxn = Bx + Е Акхк. (3)
Ьг + 1
Так как столбцы Аи ..., Аг линейно независимы, то det В ф 0и;
следовательно, существует обратная матрица В~х. Кроме того, вспомним, что
согласно теореме 2.1 небазисные координаты угловой точки v заведомо равны
нулю, так что v =
, где v > 0. Отсюда и из (3) следует, что базисные
координаты v удовлетворяют системе Bv — Ь, откуда имеем v = B~xb.
Умножая систему (3) на В~х слева, получим следующее соотношение между
базисными переменными х и небазисными переменными х
т+ 1
0^v = B~xb = x + Е В~1Акхк. (4)
Обозначим (B~lAkY — ^ik — г-я координата вектора столбца гк = В~хАк.
Тогда систему уравнений (4) можно записать в покоординатной форме:
г;1 = хх
+ Ъг + х*г + [ + ■ ■ ■ + Ък*к + ■ ■ ■ + V,
vi = х1 +7<г + 1жР+1+- -- + 7^ + .. - + linxn,
v° =
+ 7,
sr + 1'
+ ...+Ъкхк+ ... +J,nxn,
xT + 1„ + ix*+' + .. . + %kxk + ... + 7mzn-
.,.-+1
(5)
Систему B~xAx = B~xb, полученную умножением исходной системы Ах = Ь
на матрицу В~х слева, называют приведенной системой угловой точки^v
с базисной матрицей В. Системы (4) и (5), таким образом, представляют
собой различные формы записи приведенной системы точки v с базисом
В=(Аи ..., А ). Подчеркнем, что из невырожденности матрицы В следует,
что системы (4), (5) равносильны исходной системе (2) или (3).
п
Пользуясь равенством х — v— Е В~х А}х\ вытекающим из (4), значе-
ния функции f(x) выразим через небазисные переменные:
f(x) = (c,x)+ Е c.xi = (c,v- Е В~ХА^) +
j=r+l n 5 = ,-+1
+ E c.x' = (c,v)- E ((c,B-xA.)-Cj)x\
j' = r+l 5 = 1- + 1
или, короче
f(x) = f(v)- E V', (6)
j = r+l
где учтено, что (с, v) = (с, v) = f(v), и использованы обозначения
А. = (с,В-хА,)-^ = ±с{Ъ-с., , = 1,..., п.., '■ (7)
!=1 "
Выражение (6) будем называть приведенной формой целевой функции,
соответствующей угловой точке v с базисом В.
108
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Входящие в (5), (6) величины -yik, v{, Д. удобно записать в виде табл. 1,
которую принято называть симплекс-таблицей угловой точки v с
базисом В = (Аи ..., АТ). В столбце Б этой таблицы перечислены базисные
переменные ж1,..., хг точки v; в столбце V помещены значения базисных
переменных v = B~lb угловой точки v; в столбце хк находятся координаты
1и = (В~1АкУ' » = 1,..., г, вектора % = В~хАк, к = 1,..., п; в столбцах
базисных переменных х1
хт отражены равенства В 'A . = е, j = 1,
вытекающие из определения обратной матрицы В , здесь е, —j'-й столбец
Г,
г<
г/
Г'г'
д
Б
X1
х{
Xs'
хг'
V
V1
v{
"v"
"vr
/(«)
X1
1
0
0
0
0
xl
0
1
0
0
0
xs
0
0
1
0
0
хт
0
0
0
1
0
xr+l
Tlr+l
T&- + l
Tsr+ 1
%T + 1
Дг + 1
xk
Ък
Ък
Ък
Ък
К
Та
X3
1\j
7у
Isj
Ъ]
ДУ
блица 1
хп
Tin
Нп
>sn
'Т71
An
единичной матрицы размера г х г. В крайнем левом столбце для удобства
изложения приведены обозначения для строк симплекс-таблицы: Г,, Г2,...
..., Г„, Д. Так, например, в строке Г{ = («',0, ...,0, 1,0,...,0,7^ + 1,...,7^)
записана вся информация, по которой удобно воспроизвести
соответствующее г-е уравнение системы (5), и, наоборот, зная г-е уравнение этой
системы легко можно восстановить строку Г\. В строке Д помещены
величины Д0 = f(v) = (с, «), Д,,..., Дп, связанные с минимизируемой
функцией f(x) = (с, х) формулами (6), (7); в этой строке отражено, что для
базисных номеров Д. = (с, е3.) — с3 = с3' — с3 =0, j = 1,..., г. По
строке Д = (/(г;), 0, ..., 0, ДГ + 1,..., Дп) симплекс-таблицы легко воспроизвести
формулу (6) и обратно, имея (6), несложно восстановить строку Д. Из
формул 7о = v = B~lb, 7,. = В~хАр Л, = (с, Я"1 Ь) = /(«), Ду = (с, В~'А^) - с3,
для величин, заполняющих симплекс-таблицу, следует, что эта таблица
однозначно определяется заданием векторов с, 6, матрицы А и базисной
матрицы В угловой ТОЧКИ V.
После сделанных преобразований каноническую задачу (1) теперь можно
сформулировать в следующей равносильной, так называемой, приведенной
форме: минимизировать функцию (6) при условиях (5) и соблюдении
неравенства х^О. Конечно, от такой переформулировки задача (1) проще не
стала, но тем не менее в новой ее формулировке с явным разделением
базисных и небазисных переменных, оказывается, легче проследить за тем, как
изменяется функция f(x) при изменении небазисных переменных, и можно
попытаться выбрать эти переменные так, чтобы в новой точке w е X было
f(w)<f(v). Однако, если мы начнем изменять все небазисные переменные
сразу, то вряд ли сможем проследить и за изменением функции f(x), и
за соблюдением ограничений х ^ 0. Поэтому мы попробуем изменить лишь
одну из небазисных переменных, скажем, переменную хк, г + 1 ^ к ¢. п,
остальные небазисные переменные положим равными нулю, а базисные пе-
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
109
ременные будем определять из уравнений (5). Иначе говоря, новую точку
w = (ги1,..., wn) будем искать среди точек с координатами
w1 = ^1 ~ 71*3!*, ..., w{ = vl - jikxk, ..., wr = vr- %кхк,
гуГ+1=0, ..., 10^=0, ги* = ж* ^ 0, гу*+1=0, ..., гип=0. ^ '
В такой точке го согласно (6) значение функции /(ги) равно
f(w) = f(v)-Akxk, хк>0. (9)
Наша ближайшая задача: выбрать номер к, r+l^fc<n, и величину
хк > 0 так, чтобы новая точка (8) удовлетворяла требованиям: A w = b,
w > 0, /(ги) ^ /(«) (будет еще лучше, если удастся получить /(ги) < /(и)).
Что касается первого требования Аги = 6, то здесь проблем нет: точка (8)
при любом выборе номера к и величины хк, очевидно, является решением
системы (5) и равносильной ей системы (2). Анализируя знаки величин А^.,
■у{к, нетрудно выяснить, можно ли удовлетворить оставшимся двум
требованиям: w ^ 0 и /(ги) < fC")> и указать правило выбора нужного номера к
и нужной величины хк ^ 0. Такой анализ приведет к рассмотрению
следующих трех взаимоисключающих друг друга случаев I — III.
С л у ч а й I. Справедливы неравенства:
Ду = (с.В-Ы^-с^О, j=r+l,...,n, (10)
т. е. в нижней строке симплекс-таблицы 1 все Дя 1 < j < п,
неположительны. Как видно из (8), (9), тогда невозможно добиться неравенства
/(ги) < /(г>) ни при каких к, г + 1 < к < п, и хк ^ 0, в лучшем случае при
or =0 получим w — v, /(ги) = /(г>). Однако это обстоятельство не должно
огорчать нас, так как оказывается, что при выполнении условий (10)
рассматриваемая точка v является решением задачи (1). В самом деле, для
любой точки х е X = {х^0: Ах = 6} с учетом представления (4) и
неравенств (10) имеем
f(x) = (c,x)+ £ c'V>(c,z) + £ {с,В-хА,)х* =
= (с,х+ £ B-lA3.xt) = (c,v) = f(v).
Таким образом, /(ж) ^ f(v) при всех ж£1,т. е. г> — решение задачи (1).
Случай II. Существует номер к, г + 1 ^ к < п, такой, что
А,>0, lik^0, г = 1,..., г, т.е. Ъ = В~1Ак^0. (И)
Это значит, что в к-м столбце симплекс-таблицы 1 над величиной Ак >0 нет
ни одного положительного числа -у1к. В этом случае при всех хк ^0 точка w,
определяемая формулами (8), будет иметь неотрицательные координаты и,
следовательно, будет принадлежать множеству X. Тогда как видно из (9),
/(w) = f(v)- Акхк -> -оо при a5fc-»+oo. Это значит, что /„= inf f(x) = -oo,
т. е. задача (1) не имеет решения. х^х
Случай III. Существует номер к, г + 1 ^ к < га, для которого Ак > 0,
причем для каждого такого номера к найдется номер г, 1 ^ г ^. г, что 7« >0^,
или, иначе говоря, в каждом к-м столбце симплекс-таблицы 1 над величиной
no
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Aj. > 0 имеется хотя бы одно положительное число ^ik. Используя
известные кванторы V, 3 всеобщности и существования, рассматриваемый случай
кратко запишем в виде:
VA,>0 37ii>0. (12)
Для точки w, определяемой формулами (8), согласно (9) здесь будем
иметь /(ги) = f(v) — Акхк ^ /(г>) при любом хк ^ 0. Остается лишь
позаботиться о выполнении условия ги ^ 0. В рассматриваемом случае множество
номеров
Ik(v) = {i: Ыг^г, Ък>О}^0.
Если г ¢. Ik(v), т. е. jik ^ 0, то как видно из формул (8), wl = v' — -)ikxk ^
> v' ^ 0 при любом выборе хк ^ 0. Если же 7«. > 0, то при слишком больших
значениях хк, а именно, при хк > min (v> pyik), величина w' = v' — ^1кхк
i£lk(v)
станет отрицательной хотя бы для одного номера г G Ik(v). Таким образом,
для обеспечения условия w > 0 для точек, определяемых формулами (8),
здесь нужно хк взять так, чтобы 0 ^ хк ^ min (v{ Hik). Пусть
-^^: = 77» seIk(v)- (13)
iSlk(v) Hk hk
Так как множество Ik(v) непусто и конечно, то хотя бы один такой номер
s существует. Величину ~ftk, где номера к, s определяются условиями (12),
(13), называют разрешающим (ведущим) элементом симплекс-таблицы 1.
Зафиксируем один из разрешающих элементов isk таблицы 1 и в
формулах (8), (9) положим хк = vj~jsk. Получим точку w = (ги1,..., wn) с
координатами
11 v' ,■ 1 v" ,_1 ,_1 Vs
w =v -7i*77' •••' w v ^77' •••' w v -7.-u=-.
hk hk hk
™s = v°-7sk^=0, W+l=v-+l--y,+ lk^-k, ..., ^ = ^-7^^, (14)
гу*-+1=0, ..., го*"1 =0,го* = —, гу*+1=0, ..., ги"=0,
Isk
и значение функции f(x) в этой точке
f(w) = (c,w) = f(v)-AkvJ%k. (15)
По построению точка ги с координатами (14) принадлежит множеству X.
Покажем, что w — угловая точка множества X с базисом '
Ах,..., As_x, Ак, А3 + х,..., Аг, (16)
получающимся из базиса точки v заменой столбца Аs на Ак. Учитывая,
что ws = wr + i.= .. . = wk~l = wk + l = ... = wn = 0, условие Aw = b можно
записать в виде Alwx + .. . + A,_lw'-l + A,+ lw' + l + . .. + Arwr + Akwk = b.
Согласно теореме 2.1 остается показать, что система векторов (16) линейно
независима. Пусть для некоторых чисел a,,..., aa_u as +,,..., аг, ак
оказалось, что
alAl + ... + at_lA._l + a. + lA. + l + ... + arAr + akAk=0. (17)
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
111
Поскольку Ак = ВВ~хАк = ^А{(В-хАкУ = Еъ^, то из (17) следует
i = \ t = l
Г г г
Е М| + «*Е7Л= Е (а«+а*7л)4, + а* 7.4^, = 0.
Но система Ах,..., As,..., Аг является базисом точки v и,
следовательно, линейно независима. Тогда последнее равенство возможно лишь при
ai + ak1ik = °. i = 1,..., г, г ф з; akjsk = 0. Но 7.4 > 0- как
разрешающий элемент, поэтому ак = 0. А тогда все остальные а{ = 0, г = 1, ..., г,
г^я. Таким образом, равенство (17) возможно лишь при а, = . .. = «,_, =
= ая + , = ... = аг = а^. = 0. Это значит, что система (16) линейно независима.
Тем самым показано, что точка w, определяемая формулами (14), является
угловой точкой множества X с базисом (16), с базисными переменными
х\ .. ,,ха~\хк,ха + 1,. . .,хг, причем /(ги) ^ f(v), так как в (15) Ак > 0,
7sk>0, v°>0.
Замечание 1. Для дальнейшего полезно подчеркнуть, что при
доказательстве того, что точка w является угловой точкой, мы нигде не
пользовались тем, что Aj. > 0. Это означает, что независимо от знака Ак,
формулы (13),(14) позволяют перейти от одной угловой точки v множества
X к другой его угловой точке w, лишь бы Ik(v) ф0, vs > 0. Если vs = 0,
то формулы (13), (14) дают ту же угловую точку, т. е. w = v, но при этом
происходит замена базиса Ах,..., Ат на базис (16).
Далее, познакомимся с правилами заполнения симплекс-таблицы точки
w (см. табл. 2), постараемся понять, как связаны симплекс-таблицы
точек v и w. Как и в таблице 1 в столбце Б укажем базисные
переменные х1,..., x'~l, xk,x' + l,.. .,хг точки w, в столбце V —
соответствующие значения wl,..., w"~l, wk, ws +',..., wr ее базисных координат,
вычисленных по формулам (14). В столбцах х3' нам нужно поместить
координаты 7у вектора Ту = В Ajt где В — матрица, обратная к матрице
В = {Ах,..., As_x, Ak,As + l,..., Аг}. Следует однако заметить, что
обращение матриц, их умножение является довольно трудоемкими операциями,
поэтому вычисление координат вектора jj, опираясь на его определение,
может потребовать большого объема вычислений. В связи с этим
полезно вспомнить, что вектор х,- совпадает со столбцом коэффициентов при
переменной х3' в приведенной системе В b = В Ах, соответствующей
угловой точке w с базисом (16). К счастью, имея приведенную систему (5)
для угловой точки v, из нее нетрудно получить такую систему и для
точки w. Покажем, как это делается. С этой целью разделим s-e уравнение
системы (5) на разрешающий элемент 7.4 > 0; учитывая, что в силу (14)
wk = Vs/jsk, получим
wk = ^- = -^-x'+ е' ?*-х' + хк + Е J*"а". , (18)
Т.4 Т.4 j _ г _|_ ] Т.4 j _ г _|_ | '.4
Отсюда выразим переменную хк через остальные переменные:
хк = т:-т:х'- £ '£*'. (19)
>зк 'зк л _ г _j_ j 'ял
и подставим ее в другие уравнения системы (5) (здесь и ниже в (20)-(24)
знак Е' означает, что суммирование ведется по всем j=r+l,..., п, исклю-
112
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
чая номер j = к). Будем иметь
-¾^+-■+(-S)--+,_£,'(•* -■«.S)-'.
откуда с учетом (14) получим
»'=«'-7*£ = «' + (-£)«'+ ±+[{ъ-^£)х\
г= 1,..., s - 1, s + 1, ..., г. (20)
Система г уравнений (18), (20) относительно неизвестных ж1, х2..., хп
равносильна системам (5), (2) и представляет собой приведенную систему для
угловой точки w (см. упражнение 7). Отсюда следует, что в строке Га
таблицы 2 согласно (18) мы должны записать величины -у^, j =0, 1,..., п,
определяемые формулами
7,0 = ^ = ^. 7,, = ^-1 ^ = ^' i = г + 1, ..., fc — 1, fc + 1, ..., гг;
7,, = 1, 7„-=0, J = 1 е- l,e + 1,..., г. (21)
В других строках 1\, г ф s, таблицы 2 , согласно (14), (20) следует поместить
величины -ftp j = 0, 1,..., п, определяемые формулами
- — i — i _ У. - _1 - __ 1 - _ Ъ]
710 — ^ V 1(к -у ) 7 и М 7 «я 7й ~ ) 7 ij lij lik -у )
У=г+1,..., fc-l.fc + l,..., n; 7Л=0, 7y=0, Ui<r, j ^ *■ (22)
Наконец, заполним строку А таблицы 2. С этой целью подставим
переменную хк из (19) в (6), с учетом формулы (15) получим следующее выражение
значения функции f(x) через небазисные переменные точки w.
«"=»i-,sy-д- (£- ±* ~Л'Лх1) -
= «-">-(-|)"'-Ё>,-А.Э''. (23)
Таблица 2
г/
Cl
г,
д
Б
о;1
х{'
'х'
Xs
Xs
хг'
V
wk
/0»)
о;1
1
о
0
0
0
о"
0
...
.
X1
0
Т
0
0
0
о"
0
.
х-х
0
о"
г
0
0
'6'
0
Xs
71,
%
7.-1»
<ЯЯ
%+ Is
<ГЯ
А,
*'+•
0
6
0
0
1
'6'
0
...
.
хт
0
о
0
0
0
т
0
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
ИЗ
Из (23) следует, что _в строке А симплекс-таблицы 2 точки w должны быть
записаны величины Дя j = 0, 1,..., п, определяемые формулами
A0 = HW) = HV)-Ak£, А>-Д4£, Д>Д,-Д4£,
j = r + l,.,.,k-l,k + l,...,n; Д4 = 0; А, = 0,
3 = 1,..., а-1,8+1,...,г. (24)
Таким образом, симплекс-таблица 2 угловой точки w с базисом (16)
полностью заполнена. Несложный анализ формул (21), (22), (24) с учетом
конкретных числовых значений 7#, 7#, А3., А,- в базисных столбцах таблиц 1,2
показывает, что элементы этих таблиц связаны следующими простыми
соотношениями:
iV = 77; 7у = %-7«77> * = 1,..-1 г, %фа, j=0,,..,n;
Ък
■Ък'
Д. = Ду-Д^, э=0,...,п. (25)
:7S4
Если элементы и строки таблицы 1 обозначить через -fi:j(v), A.(v), Tt(v),
A(v), а элементы и строки таблицы 2 через ^Aw), ДДги), ГДги), Д(ги), то
соотношения (25) можно записать в векторной форме:
Г<(-> = Й£' Г,(1») = Г4(«)-7л(«)^Й,
* = 1,..., е- 1,в + 1,...,»-; А(«;) = А(«)-А4(«)^. (26)
Соотношения (25) и (26) описывают один шаг известного метода
Гаусса— Жордана, соответствующий исключению переменной хк из всех строк
симплекс-таблицы 1, кроме строки Га, в которой переменная хк остается с
коэффициентом 7я*;(г")= 1.
Таким образом, один шаг симплекс-метода, заключающийся в переходе
от одной угловой точки v множества X к другой угловой точке w, описан.
Этот шаг формально можно истолковать как переход от одной
симплекс-таблицы 1 к другой симплекс-таблице 2 по формулам (25) или (26), где номера
к, s и разрешающий элемент 7»*=7»*(щ) выбираются из условий (12), (13).
Таблица 2
хг+1
Ът+1
7&- + 1
%-lr+l
7sr+l
7s + lr + 1
Trr+ 1
Дг+1
i*-'
7ifc-l
%-l
7,-U-i
7,4-1
Ъ+\к- 1
%k-\
4*-i
ГВ*
0
'6'
"6"
1
0
'6'
0
xk+i
7lfc + l
Tflt-t-l
%-lfc+l
Tji + 1
7,+u+i
Twt + i
Afc + 1
ж3
7>j
7s + lj
7rj
АУ
жп
7in
^171
7,-In
%-f- In
An
114
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
2. Формулы перехода (25), (26) были получены в предположении, что
множество номеров базисных переменных угловой точки v имеет
специальный вид I(v) = {1,2,..., г}, что соответствует таблице 1. Конечно,
путем перенумерации переменных всегда можно добиться, чтобы множество
I(v) имело указанный вид, но это связано с дополнительной обработкой
числовых массивов, усложняет программную реализацию симплекс-метода
на ЭВМ. Однако нетрудно убедиться, что можно обойтись без какой-либо
перенумерации переменных, а формулы перехода (25), (26) остаются
справедливыми для угловых точек с любым множеством базисных номеров.
В самом деле, пусть номера базисных переменных начальной точки v
образуют множество I(v) = {j\, j2,..., jr}. Заметим, что в процессе
применения симплекс-метода множество I(v) обновляется на каждом шаге и
нельзя ожидать, что номера j\i hi ■ ■ -i3t из этого множества будут
упорядочены, скажем, в порядке монотонного возрастания или убывания (так,
например, в таблице 2 в отличие от таблицы 1 монотонность номеров
базисных переменных в столбце Б уже нарушена). Однако это обстоятельство
нашим дальнейшим рассуждениям никак не помешает. Обозначим
х =
' X3'1 '
.х^'.
В =
, v =
" vh '
. « *.
, с=.
= 0
' с3'1 '
_cv;_
А,, А
*u
(27)
Ъ = Ъ(ъ)=В~1Ак, 7о = 7о(г;) = Б-1Ь;
^0 = 7^) = (^-1¾)% » = !,..
ц к = 1, ..., п.
Так как B~XB = B~\A.,..„ A. ) = (S"U.,..., В~ХА,. ) = (е„ ..., ег) = 1-
В "А. = е. для всех г = 1,..., г.
единичная матрица размера г х г, то 7/.
Кроме того, согласно теореме 2.1
Bv — A,v3i +... + AjV3-
поэтому v = В~х 6 = 7о' щУ' = (-^-1Ь){ = 7<01 i = l,,. .,r; v3 =0, j ¢1(^). Таким
образом, умножая систему Ах = J2 А{х* = & слева на матрицу В~х как и
« = i
при выводе системы (4), (5), получим приведенную систему угловой точки
v с базисом В в векторной форме
0^v = B~lb = % = x + Е (в~1Ак)хк
kil(v)
или в покоординатной форме
Ер',
/;=]
= 1ю = х'<+ Е Ъкхк
kil(v)
Т,Ъкхк, * = 1|.
*=i
(28)
По аналогии с (6), (7) для целевой функции получим ее приведенную форму
f(x)=(c,x)+ Е c3x3 = (c,v- Е(£-Ч>У> +
НН») НИ»)
+ £ с'х* = (£,€)- £ [(с,В-хА.)~с3]х3,
НИ») НИ»)
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
115
которую можно переписать в виде
До = /(*)+ Е Akxk = f(x)+±Akx»,
kil(v) к=\
где приняты обозначения
(29)
A0=f(v)=(c, v), Ак=(с, В~*Ак) - ск=(с, Ъ)-с"= £ с'<7л-с*, .„.
/С ^ lj Zij . » .j /ij
причем учтено, что для всех к =j{£ I(v) величина Д^ = (с, В~ХА.) — с3' =
t
i) ~ с3
CJ'
с3' = 0, г = 1, .. ., г, т. е. Ак = 0, Vfc G /(«).
1нформацию из (27)-(30) об угловой точке v с базисом В = (А..,..., А}.)
удобно записать в виде симплекс-таблицы 3: строка Г\ в ней соответствует
г-у уравнению (28), строка Д — представлению (29) для целевой функции.
Таблица 3
г/
К'
д
Б
хзХ
X3''
V
7;о
7s0
7r0
До
X1
7ц
7п
7,1
7Г1
Д.
...
...
X1
7и
Hi
Isi
Iri
А*
...
...
хк
Ък
Ък
Ък
Ък
А,
...
...
X3'
7-."= 1
д.=,о
...
...
...
хп
71 п
'in.
>sn
'T7l
An
Отметим, что в столбце базисной переменной x3i вектор т,-. = ei> т- е- 7у. = 0
при всех I ф г, 1 ^ I < г, 7#. = 1; в нижней строке этого'столбца Ду '= 0.
Симплекс-таблицу 3 можно кратко записать в виде матрицы
S = <«,*)= (¾.
7п • • •) 7П
А„ ..., Дп
размера (г+1)х(п+1), где столбцы % подматрицы Г = 1 ... I и элементы
строки Д вычисляются по стандартным формулам: \ГГ/
Ъ = В~хАк, Ак = (с,В'хАк)-ск=(с,Ъ)-ск, к=0,1,...,п; (31)
здесь для единообразия формул принято Ь = А0, предполагается, что с0 =0,
остальные обозначения взяты из (27).
Опишем один шаг симплекс-метода в общем случае. По аналогии с (10)-
(12) рассмотрим следующие три взаимоисключающие возможности.
Случай I. Справедливы неравенства
Д, = (с, В^АЛ-С^О, j = 1,...,п,
(32)
т. е. в нижней строке симплекс-таблицы 3 все величины Д,, ..., Дп непо-
116
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
ложительны. Тогда с учетом равносильности систем (2) и (28) для любой
точки хе X имеем
f(x) = (c,x)+ £ с3х3^(с,х) + £ (с,В-1А;)х' =
= (c,x+ £ B-lA3.x3) = (c,v)=f(v),
Это значит, что v — решение задачи (1),
Случай II. Существует номер к >0, к $I(v), такой, что
Д,>0, Ъ = В~<Ак^0, (33)
т. е. в к-м столбце симплекс-таблицы 3 над Д^. > О нет ни одной
положительной величины 7й> Тогда точка х = x(t) = (ж1,..., хп) с
координатами хк — t, х3' = v3' — jikt, i = 1,. .,, г; х3' = О, j ¢. I(v), j фк, будет
принадлежать множеству X при всех t ^ 0. Отсюда и из (29) следует, что
f(x(t))=f(v)—Akt —>— оо при t —>+оо. Это значит, что /„= inf /(ж) = — оо,
т. е. задача (1) не имеет решения.
Случай III. Существует номер к > 0, fc ¢. /(^), для которого Afc > 0,
причем для каждого такого номера к найдется номер г, 1 ^ г ^ г, что 7¾ >0,
или, короче,
VA,>0 3Ък = (В~<АкУ>0. (34)
Это значит, что в каждом fc-м столбце симплекс-таблицы 3 над величиной
Ак>0 имеется хотя бы одно положительное число ^.к. Тогда выберем номер
s и разрешающий элемент %к > 0 из условий:
min Ja = Jo, selk(v) = {i: Ц^г, 7*>0}. (35)
Далее, рассуждая также, как выше (см. формулы (14)-(16) и пояснения к
ним), убеждаемся, что точка w = (w\ ,,,, wn) с координатами
w3'=v3' -7.-4^- = 7,0-7,4^7, г = 1,..., г, г^я; ^'=0,
Ък Ък ^36)
^ = ^- = ^: ^'=0, Jil(v), i + k,
Isk Isk
принадлежит множеству X, является угловой точкой этого множества с
базисом _
(А.,... ,А,_ ^Ak,AJiu,...,AJr) = B, (37)
значение функции /(ж) в этой точке равно
f(w) = Hv)-Ak^ = A0-Ak^. , (38)
Замечание 1 с очевидными изменениями сохраняет силу в
рассматриваемом общем случае. Приведенная система точки w выводится так же, как
система (18), (20), и имеет вид:
wk = _Lxi.+ £ '^х3 + х\
hk jil(v) hk
w3< = x3< + (-^)x3- + Е'(^-7^)^
§ 3, СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
117
аналогичное (23) выражение для функции f(x) выглядит так
f(x) = f(w)-(-^)xi-- £ '(д.-A^W; (40)
в (39), (40) знак £' означает, что суммирование ведется по всем j ¢. 1{у),
j фк. Нетрудно видеть, что если 1(^) = (1, 2,,.., г}, то формулы (35)-(40)
переходят в соответствующие формулы (13)-(16), (18), (20), (23),
Анализируя коэффициенты при переменных х\ х2,,,,, хп в выражениях (39), (40),
получаем аналогичные (21), (22), (24) формулы для величин, которые
должны находиться в строках ГДги), г = 1, 2,,,,, г, А(ги) симплекс-таблицы
точки w, и убеждаемся в том, что переход от симплекс-таблицы точки v с
базисом В = (А}.,,,,, А}.) к симплекс-таблице точки w с базисом (37)
совершается по тем же формулам (25), (26), где номера fc, s определяются из
условий (34), (35),
Для иллюстрации вышеизложенного приведем несколько примеров.
Пример 1, Будем минимизировать функцию /(х) = \6х2 — х3+4х* + х5
на множестве X ={х = (х\ х2,,,,, ж5)>0: хх+2х3 + х^=2, 2х1 — х3+х5 = 3,
—Xх + х2 + х3 = 1}. Уравнения, задающие это множество можно записать в
виде
Г 21
3
1
=
Г 1 1
2
-1
хх +
Г01
0
1
х2 +
Г 2 1
-1
1
х3 +
Г11
0
0
ж4 +
Г 01
1
0
Как и выше, столбец из коэффициентов при переменной х{ будем
обозначать через А{. Нетрудно видеть, что выписанная система уравнений
является приведенной системой для угловой точки v0=(0, 1, 0, 2, 3) с базисом
А2, А„, А5; здесь 1(^)=(^=4, i=5, %=2},В=(А^ А5, А2). Внесем
коэффициенты этой системы в строки Г,,Г2,Г3симплекс-таблицы 4 точки v0.
Пользуясь формулами (30), (31), вычислим значения величин Ajt j =0, 1,, ,,, 5
Таблица 4
Гз
д
Б
хь
х2
V
2
3
1
21
хх
1
2
-1
-4
х2
0
0
1
0
X3
2
-1
®
18
X*
1
0
0
0
х5
0
1
0
0
и впишем их в строку А таблицы 4, В этой строке величина А3 > 0, а в
столбце х3 имеются положительные элементы 7i3 = 2, 7зз = ^ Это значит, что в
точке v0 реализовались условия (34), Определим номер s из условия (35):
min{710/7i3) 7зо/7зз} = т'п{2/2, V4= ^ Как видим, здесь минимум
достигается сразу при двух значениях s = 1 и s = 3, Для определенности возьмем
s = 3, Тогда разрешающий элемент равен j33 = l, к = 3, s = 3.B таблице 4 и в
последующих таблицах разрешающий элемент будем обводить кружочком,
В соответствии с выбранным разрешающим элементом переменную xh = х2
и столбец Aj = А2 будем выводить из базиса и заменим их переменной х3 и
столбцом А3 соответственно. Согласно формуле (26) разделим строку Г3 на
733 = 1 и полученные величины внесем в строку Г3 таблицы 5, Затем будем
118
Гл. 3, ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
последовательно умножать строку Г3 таблицы 5 на величины 713==2, 723=~~^<
723 = — 1) Аз = 18> получившиеся строки вычтем соответственно из строк Г,,
Г,, А таблицы 4 и результат вычитания внесем в строки Г,, Г2, А таблицы 5,
Таким образом, придем к симплекс-таблице 5 следующей угловой точки
Таблица 5
г2
Гз
д
Б
я4
хь
X3
V ,
0
4
1
3
хх
1 ф
1
-1
14
X*
-2
1
1
: -18
X3
0
0
1
0
X*
1
0
0
0
хь
0
1
0
0,
«, =(0,0, 1,0,4) с базисом Bi = (AJl, А5, А3), со множеством базисных
номеров 1(^,)=(^,=4, i2=5, j3=3} и со значением функции /(^,)=3 < f(v0)—2l,
В строке А таблицы 5 величина А, = 14 > 0, в столбце х[ имеются
положительные элементы 7ц =3, 721 = 1> т- е> снова реализовались условия (34),
По правилу (35): min{0/3;4/l|=0 однозначно определяем номер s~l и
разрешающий элемент jH=3. Это значит, что переменную х^=х4 и столбец
А}- =А4 выводим из базиса и заменяем их переменной х1 и столбцом Ах
соответственно. По формулам (26) вычислим симплекс-таблицу 6 следующей
Таблица 6
г2
гз
д
Б
я4
хь
X3
V
0
4
1
3
X1
1
0
0
0
х2
-2/3
5/3
1/3
-26/3
X3
0
0
1
0
X*
1/3
-1/3
1/3
-14/3
х5
0
1
0
0
угловой точки v2 = (0, 0, 1, 0,4) с базисом В2 = (А,, А5, А3), со
множеством I(v2) = {j\ = 1, j2 = 5, J3 = 3} и со значением функции /(^) = 3 = /(^,),
В строке А этой таблицы среди величин А,,.,., А5 нет положительных.
Это значит, что реализовался случай (32), точка v2 = (0, 0, 1,0,4) является
решением рассматриваемой задачи, /, = /(^2) = 3,
Заметим, что точки г;, и v2 совпадают и различаются лишь базисами.
Выясняется, что еще в таблице 5 мы, оказывается, уже получили решение
задачи, но не смогли это распознать и вынуждены были сделать еще один
шаг симплекс-метода.
Пример 2, Рассмотрим задачу: минимизировать функцию f(x) = х1 +
+ х2 — х3 — ж4 + х6 при условиях х = (ж1,,,., х°) ^ 0, ж1 — X3 + Ж4 + X5 = 1,
х2 + х3 — ж4 + х6 = 1. Нетрудно видеть, что v0 = (l, 1, 0, 0, 0) — угловая
точка с базисом В0 = (Аи А2), со множеством I(v0) = {jx = 1, j2 = 2} и
система уравнений, задающая множество, уже записана в приведенной форме.
Табл. 7 представляет собой симплекс-таблицу точки и,. В строке А имеется
несколько положительных величин Д3 = Д4 = Д5 = 1. В качестве
разрешающего элемента выберем величину 723 = 1 из столбца х3. По формулам (26)
§ 3, СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
119
при s~2, к=3 совершим переход к симплекс-таблице 8 угловой точки
г;,=(2, 0, 1, 0, 0) с базисом 5,=(^1,, А3), со множеством /(^,)=(^,=1, j2=3},
В строке А таблицы 8 имеется величина А4=2 >0, но столбец ж4 не
содержит положительных элементов. Это значит, что реализовался случай (33).
Следовательно, /, = —оо, рассматриваемая задача не имеет решения.
Таблица 7
Б
X1
х2
V
1
1
2
хх
1
0
0
х2
0
1
0
X3
-1
©
1
X*
1
-1
1
X5
1
1
1
Таблица 8
хх
X3
2
1
1
1
0
0
1
1
-1
0
1
0
0
-1
2
2
1
0
Подобно тому, как это сделано в таблицах 7, 8, в последующих симплекс-
таблицах мы иногда будем опускать обозначения строк или столбцов,
полагая, что читатель уже привык к обозначениям.
3. Из вышеизложенного следует, что, имея какую-либо начальную
угловую точку v0 множества X, с помощью симплекс-метода последовательно
переходя от одной угловой точки к другой, можно построить
последовательность угловых точек v0, «,,..., vp,. ., Согласно (38) на каждом шаге имеем:
Hvp+\) = f(vp) - л*Ы|^д'
где Ak(vp) > 0, -ysk(vp) > 0, 7s0(%) = <' ^ °- Отсюда следует, что
/Ы £/(«,) £...£/(«„)£..• (41)
Процесс получения последовательностей {wp}, {f(vp)} в дальнейшем будем
кратко называть симплекс-процессом.
Заметим, что в примерах 1, 2 симплекс-процесс завершился за
конечное число шагов выполнением одного из условий (32) или (33). Однако
всегда ли это будет так? Возможно, существуют канонические задачи, для
которых симплекс-процесс может неограниченно продолжаться? Для
ответа на этот принципиально важный вопрос, внимательнее проанализируем
описанный симплекс-процесс. Прежде всего заметим, что поскольку
варианты (32)-(34) изменения знаков величин Ak(v), jik(v) исчерпывают все
возможности и взаимоисключают друг друга, то симплекс-процесс может
быть бесконечным лишь в том случае, когда на каждом шаге этого процесса
будут реализовываться условия (34). Каждая реализация условий (34) свя^-
зана с переходом от одной угловой точки к другой угловой точке, от одной
симплекс-таблицы к другой симплекс-таблице. Это значит, что всякий
бесконечный симплекс-процесс порождает последовательности угловых точек
120
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
{vp}, их базисов {Вр}, симплекс-таблиц {Sp}, где S является симплекс-
таблицей точки vp с базисом В , причем, как видно из (41),
соответствующая последовательность {f(vp)} не возрастает. Поскольку угловых точек и
их базисов в задаче (1) конечное число, то конечно и множество симплекс-
таблиц этой задачи. Отсюда следует, что симплекс-процесс может быть
бесконечным лишь в том случае, когда хотя бы одна из симплекс-таблиц
S, соответствующая некоторой угловой точке v с базисом В, будет
повторяться бесконечно много раз. Это значит, что найдется бесконечная
подпоследовательность номеров {р,}: рх < р2 < ... < pt < ..., такая, что vp — v,
Вр== В, SPi=S, f(vPi) = f(v) при всех I = 1,2,... В силу (41) это возможно
лишь тогда, когда
/(г,р) = const Vp^jv (42)
Таким образом, необходимым условием бесконечности симплекс-
процесса является условие (42), которое должно выполняться, начиная с
некоторого номера р.. Посмотрим, когда это возможно. Начнем с выяснения
того, когда /(ги) = j(v) и когда /(ги) < f(v), где угловая точка w
получена из угловой точки v в результате одного шага симплекс-метода. В силу
условий (34), (35) Ak(v) > 0, 7^(^) > 0 и, кроме того, %0(v) = v3'- > 0 как
базисная переменная угловой точки v. Отсюда и из формулы (38) следует,
что f(w) = f(v) тогда и только тогда, когда v3- = 0, т. е. v — вырожденная
угловая точка. Такое явление мы наблюдали в примере 1 при переходе от
таблицы 5 к таблице 6. Таким образом, среди канонических задач имеет
смысл выделять задачи вырожденные и невырожденные.
Определение 1. Задачу (1) называют вырожденной или
невырожденной, если множество X в этой задаче содержит хотя бы одну
вырожденную угловую точку или не содержит таковые.
Покажем, что в невырожденных задачах (1) симплекс-процесс всегда
конечен. В самом деле, в таких задачах все базисные координаты угловой
точки v будут положительны. Поэтому какими ни были номера к, s,
определяемые из условий (34), (35), всегда v3'- >0, и, согласно (38), тогда f(w)<f(v).
Отсюда следует, что в невырожденных задачах симплекс-процесс
порождает такую последовательность угловых точек v0, «,,...,«,..., для которых
/Ы>/(¾) >..•>/(«„)>... (43)
Поскольку угловых точек конечное число, и из-за строгих неравенств они
повторяться в симплекс-процессе не могут, то этот процесс закончится на
каком-то шаге выполнением либо условия (32), либо (33). Впрочем,
конечность симплекс-процесса здесь вытекает и из несовместимости
соотношений (42), (43). Таким образом, доказана
Теорема 1. Пусть в канонической задаче (1) множество X
непусто и невырождено, rangA = г = т <п, пусть v0 — произвольная
угловая точка этого множества. Тогда симплекс-процесс, начинающийся с
точки Vq при выборе разрешающего элемента %к из условий (34), (35),
завершится за конечное число шагов определением некоторой угловой
точки vp множества X, в которой реализуются либо условия (32),
либо (33), причем в случае (32) vp—решение задачи (1), f(vp) = ft> —оо,
в случае (33) задача (1) не имеет решения, /„ = — оо.
Заметим, что хотя теорема 1 справедлива при любом выборе номеров fc, s
из условий (34), (35), но продолжительность симплекс-процесса и послед-
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
121
няя точка vp могут существенно зависеть от выбора этих номеров.
Впрочем, интересно отметить, что если номер к из условий (34) как-то уже
выбран и зафиксирован, то в невырожденных задачах номер s условием (35)
определяется однозначно. В самом деле, для невырожденной угловой точки
w — (ги1,..., wn) с базисом (37) координаты w3< > 0 для г ф s, 1 <г ^ г. Из
формул (36) тогда следует, что v3i — "yikv3-/7^ > 0 или v3iJ~jik > v3'/%k для
всех г е Ik(v), ъфз, так что минимум в левой части (35) будет достигаться
на единственном номере s е Ik(v).
Отсюда следует, что условие (35) может неоднозначно определять номер
s лишь в вырожденных задачах. Кстати говоря, если в (35) минимум
достигается по крайней мере на двух номерах s, I е Ik(v), s Ф I, то, согласно
формулам (36), w3- = w31 = О, т. е. угловая точка w непременно будет
вырожденной (так случилось в таблицах 4, 5). Конечно, точка w может быть
вырожденной и в том случае, когда условие (35) однозначно определяет
номер s G 4(^)- Для которого v3'- = 0 (как видим, тогда сама точка v
вырожденная); в этом случае, как видно из (36), у точки w базисная координата
wk =0 (см. табл. 5, 6). Впрочем, если
a€lk(v), v3-=0, (44)
то минимум в (35) равен нулю и будет достигаться именно на этом номере
s, (и на всех других номерах I G IJv), для которых v3' =0) и, согласно
формулам (36), (38), тогда w = v, f(w) — f(v). Это значит, что при
выполнении условий (44) мы сделаем один шаг симплекс-метода и останемся в
той же точке w = v, лишь заменив один ее базис В = (А^,..., А.) на
другой базис (37) (именно так случилось в таблицах 5, 6). Здесь возникает
естественный вопрос: при выполнении условий (44) не может ли привести
дальнейшее применение симплекс-метода к бесконечному перебору базисов
угловой точки v, не может ли здесь реализоваться бесконечный симплекс-
процесс? Оказывается, так вполне может быть. Приведем пример
вырожденной задачи [775], в которой симплекс-процесс приводит к так
называемому зацикливанию, заключающемуся в бесконечном циклическом переборе
базисов одной и той же угловой точки (другой пример — см. упражнение 6).
Пример 3. Рассмотрим задачу минимизации функции
f(x) = xl -ж4- х5 + х6 (45)
при условиях
х = (х\ X2, . . ., X7) ^ 0, ХХ + Ж4 + X5 + ХЬ + X7 = 1,
-2хх + х2 + х*-3х5 + 4х6 = 0, Зхх + х3 + 4х*-2х6 + х6 = 0. (46)
Нетрудно видеть, что точка v0 = (0, 0, 0, 0, 0, 0, 1) является угловой точкой
с базисом (А7, А2, А3) = В0, система (46) представляет собой приведенную
систему этой точки. Образуем симплекс-процесс, взяв в качестве
начальной точку v0 с указанным базисом. В таблицах 9-15 приведены результаты
вычислений для первых точек v0, «,,..., v7; в кружочках
указаны^разрешающие элементы этих таблиц. В таблицах 9, 11, 13 разрешающий элемент
условием (35) определяется неоднозначно, в таблицах 10, 12, 14
разрешающий элемент находится однозначно. Как видно, таблицы 9 и 15 совпадают
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Таблица 9
Б
х7
х2
х3
V
1
0
0
0
я1
1
-2
-3
-1
х2
0
1
0
0
х3
0
0
1
0
X*
1
®
4
1
х5
1
-3
-2
1
хе
1
4
1
-1
х7
1
0
0
0
Таблица 10
X7
х4
хл
1
0
0
0
3
-2
@
1
-1
1
-4
-1
0
0
1
0
0
1
0
0
4
-3
10
4
-3
4
-15
-5
1
0
0
0
Таблица 11
X7
я4
х{
1
0
0
0
0
0
1
0
7/5
-3/5
-4/5
-1/5
-3/5
2/5
1/5
-1/5
0
1
0
0
-2
о;
2
2
6
-2
-3
-2
1
0
0
0
Таблица 12
X7
хь
х1
1
0
0
0
0
0
1
0
1/5
-3/5
2/5
1
1/5
2/5
-3/5
-1
2
1
-2
-2
0
1
0
0
2
-2
CD
2
1
0
0
0
Та блица 13
Б
х7
х5
X6
V
1
0
0
0
х1
-2
2
1
-2
х2
-3/5
(T7D
2/5
1/5
х3
7/5
-4/5
-3/5
1/5
х4
6
-3
-2
2
х5
0
1
0
0
х6
0
0
1
0
X7
1
0
0
0
Таблица 14
х7
X*
хь
1
0
0
0
4
10
-3
-4
0
1
0
0
-1
-4
0)
1
-3
-15
4
5
3
5
-2
-1
0
0
1
0
1
0
0
0
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
123
Таблица 15
Б
X1
х2
х3
V
1
0
0
0
X1
1
-2
-3
-1
х2
0
1
0
0
X3
0
0
1
0
я4
1
®
4
1
X5
1
-3
-2
1
X6
1
4
1
-1
X1
1
0
0
0
и поэтому, если на следующих шагах продолжать выбор тех же
разрешающих элементов в том же порядке, то придем к бесконечному симплекс-
процессу, в котором будет осуществляться циклический перебор базисов
точки v0 в следующем порядке: (А7, А2, АЛ-> (А7, А4, А,)-> (А7, Ал, Ах)-*
(А7, А5, А,) -> (А7, А5, А6) -> (А7, А2, А6) -> (А7, А2, А3) -»... Любопытно
отметить, что длина цикла в задачах линейного программирования меньше
шести не бывает [775].
Этот пример показывает, что описанный выше симплекс-метод
действительно может привести к бесконечному симплекс-процессу и с его помощью
может быть решена не всякая каноническая задача (1). Если функция
f(x) = (с, х) принимает одинаковые значения в нескольких вырожденных
угловых точках, то, по-видимому, возможны более сложные бесконечные
симплекс-процессы, в частности, явления зацикливания с участиемв цикле
базисов различных таких точек.
4. Можно ли избежать зацикливания или, точнее, появления
бесконечных симплекс-процессов? Нельзя ли уточнить правило (34), (35) выбора
разрешающего элемента так, чтобы для любой задачи (1) симплекс-процесс,
начинающийся с произвольной начальной угловой точки, завершался за
конечное число шагов реализацией одного из условий (32) или (33)?
Положительный ответ на эти вопросы имеет важное значение для обоснования
симплекс-метода и означал бы, что можно, по крайней мере в принципе,
решить любую задачу линейного программирования симплекс-методом.
Определение 2. Любое уточняющее (34), (35) правило выбора
разрешающего элемента, с помощью которого можно избежать зацикливания
или, точнее, появления бесконечного симплекс-процесса во всякой
канонической задаче (1), назовем антициклином.
На практике правило (34), (35) нередко уточняют следующим образом:
среди номеров к, удовлетворяющих условиям (34), выбирают тот, для
которого Ак принимает максимальное значение, а если таких номеров
несколько, то берут минимальный из них, и затем, после такой фиксации номера
к, берут номер s минимально возможным из условий (35). Такое уточнение
правил (34), (35) действительно гарантирует однозначность выбора
разрешающего элемента "ysk, выглядит вполне естественным и в примере 3, как
легко проверить, на самом деле позволяет избежать зацикливания.
Однако пример задачи из упражнения 6 (см. ниже) показывает, что в общем
случае в классе канонических задач линейного программирования такое
уточнение правила (34), (35) не спасает от зацикливания и,
следовательно, не может служить антициклином. Это говорит о том, что построение
антициклина — дело тонкое, и с первого взгляда неясно даже, существуют
ли они. К счастью, антициклины существуют, и к настоящему времени уже
созданы различные и не очень сложные антициклины (см., например, [52;
54; 116; 148; 259; 499; 517; 652; 685]).
124
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Остановимся на одном из них [52]. Для описание этого антициклина нам
понадобится понятие лексикографического упорядочения конечномерного
пространства.
Определение 3. Говорят, что вектор х = (ж1,..., ж') е R'
лексикографически положителен (отрицателен), и обозначают х у О [х -<0],
если ж^Ои первая ненулевая координата вектора х положительна
(отрицательна). Говорят, что вектор жеЕ' лексикографически больше (меньше)
вектора у G R', и пишут х У у [х ~< у], если х — у У О [х — у -< 0].
Другими словами, запись х у 0 означает, что существует номер р, 1 ^ р ^
^ I, такой, что ж1 = ... = хр~1 = 0, жр > 0, остальные координаты жр+1,...
..., хп могут быть любыми. Лексикографическое неравенство х у у означает
существование такого номера р, \^.р0, что х1=у\ ..., х'"1 =ур"\ хр>ур.
Для любых х, у е R' выполнено одно и только одно из соотношений: х у у,
х -< у, или х = у. Ясно, что отношение У транзитивно, т. е. если х У у,
у у z, то х у z. Упорядочение векторов в их лексикографическом убывании
(или возрастании) вполне аналогично упорядочению слов в словарях, что и
объясняет присутствие слова «лексикографический» в определении 3.
Опираясь на определение 3, несложно вывести следующие, важные для
дальнейшего, свойства отношения >-:
1) если х У 0, то ах У 0 для всех чисел а > 0;
2) если х У у, то ах У ау для всех а > 0;
3) если х У 0, у У 0, то х + ау У 0 для всех а > 0;
4) если х У 0, то у У у — ах для всех а > 0 и у е R'.
Определение 4. Пусть М0 — некоторое' множество целых чисел
(номеров), пусть G = {y.=(y!,..., у\) G R', г е М0}. Вектор у„ s G М0
называется лексикографическим минимумом множества G, если для всех
г е М0 либо у, У ys, либо у. = ж . Обозначение: 'у, = lex minyf.
>еМ0
Лемма 1. Пусть М0 — конечное множество номеров и пусть во
множестве G = {yi е R', г е М0} все векторы различны. Тогда
лексикографический минимум множества G достигается на единственном
векторе у е. G, т. е. у„-<у{ УгеМ0 (случай у^ —у, npui^s исключается).
Для определения номера s нужно последовательно строить множества
М0, Af, = {s: s е М0, ys! = min у!}, ..., М = {в:-'в е М _„ у? = min у?} до
тех пор, пока не будет обнаружено множество Mv,Q^v <I, состоящее
из единственного номера s, который и будет искомым.
Доказательство. В простейшем случае, когда множество ]Ц,
состоит из единственного номера s, то, по определению, ys — искомый вектор.
Поэтому пусть М0 содержит более одного номера. Тогда строим множество
М,. Если Щ содержит лишь один номер s, то у] < у] для всех г G М0, г ф s,
и ясно, что ys = lexminj/j. Если М, содержит по крайней мере два номера,
>еМ0 . . .
то строим множество М2 = {г е М,: y2a = min у?} и т. д. Пусть уже постро-
i еМ,
ены множества M0D MXD . .. D М,, р<1, причем множества М0,..., Мр_,
содержат более одного номера. Если Мр состоит из одного номера s, то
уа — искомый вектор. Если Мр содержит более одного номера, то строим
множество Мр + 1 и т. д. В крайнем случае, когда множества М0,..., М1_х
окажутся состоящими более чем из одного номера, этот процесс закончится
построением множества М, = {s е М,_,: у\ = min у!}. Если бы М1 содер-
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
125
жал два различных номера s, q, то у векторов ys, yq все координаты были
бы одинаковыми, т. е. ys = yq- Однако по условию во множестве G нет двух
одинаковых векторов. Следовательно, М, состоит из единственного номера
s, причем у =\ехтту-. Лемма доказана. D
i 6 М0 г д
Опираясь на отношение у между векторами, введем отношения у, у на
множестве симплекс-таблиц. Не стремясь к общности построений, мы
можем ограничиться следующим определением, достаточным для дальнейших
рассмотрений.
Определение 5. Симплекс-таблицу 5 = S(v, В) угловой точки v
с базисом В назовем лексикографически положительной и будем обо-
г
значать 5 У О, если все ее строки Г4 = (7*0! 7«и • • •> 7«п) '"О» г = 1,.. ., г
(см. табл. 3). Скажем, что симплекс-таблица 5, = 5(^,,.0,)
лексикографически больше другой симплекс-таблицы 52 = S(v2, В2) и будем обозначать
5, >- 52, если строка А, =(Д,0,..., Д,п) таблицы 5, лексикографически
больше строки А2 = (А20,..., А2п) таблицы 52.
Для примера укажем, что таблицы 4-8, 13 лексикографически
положительны, таблицы 9-12, 14, 15 не являются таковыми; симплекс-таблица 12
лексикографически больше симплекс-таблицы 11.
Нетрудно видеть, что если угловая точка v с базисом В = (А^,..., А3-)
невырожденная, то ее симплекс-таблица 5 У О, так как тогда (см. табл. 3)
■yi0 = v3' > О и, следовательно, Tt у О при всех i = 1,..., г. Если точка v
вырожденная, то 7;о = 0 хотя б"ы Для одного номера г, 1 ^ г ^ г, и
первый отличный от нуля элемент в строке Г\ может оказаться отрицательным
и тогда Г,. -<0. (см., например, строки Г2, Г3 таблицы 9). Впрочем, такой
«недостаток» строки Г\ легко исправить, если соответствующий базисный
столбец xji симплекс-таблицы переставить между столбцами V и хх. Такая
перестановка, равносильная перенумерации переменных, приведет к тому,
что в строке Г; сразу после величины 7<о = 0 окажется величина 7# = 1
и строка Г; станет у 0, а на лексикографической положительности или
отрицательности других строк это не отразится, так как 7,у. = О ПРИ всех
s Ф г, 1 ^ s ^ г. Отсюда ясно, что последовательно переставляя указанным
образом базисные столбцы х3'1 для всех строк Г, -< 0, нетрудно добиться,
чтобы симплекс-таблица стала лексикографически положительной. Так,
например, в таблице 9 для этого достаточно переставить столбцы х2, х3 между
столбцами V и ж1. После сказанного теперь неудивительно, что симплекс-
таблица 1 лексикографически положительна. А вот симплекс-таблица 2
может потерять это свойство, если в строке Гя окажется wk =0, 7„ <Q-
Используя введенные лексикографические понятия, перейдем к описанию
обещанного антициклина. Напомним, что применение симплекс-метода во
всякой невырожденной задаче приводит к построению последовательности
угловых точек v0, «,,..., vp,... со свойством (43). Так как Ар0 = /(¾). то
согласно определению 4 свойство (43) будет означать, что соответствующие
этим точкам симплекс-таблицы 50, 5,,..., 5р,... таковы, что
Д Д Д Д , .*,-
S0yS,y...ySpy... (47)
При написании цепочки лексикографических неравенств (47) мы учли
д д д
транзитивность отношения >- для симплекс-таблиц: если Sxy S2, S2y S3, то
126
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Sly S3. Так как симплекс-таблиц конечное число, а в (47) повторение
таблиц невозможно, то еще раз убеждаемся в конечности симплекс-процесса
в невырожденных задачах. А в вырожденных задачах последовательность
{/(%)} обладает, вообще говоря, лишь свойством (41), а свойство (47), как
видно из примера 3 (см. табл. 9-15), может не выполняться. Возникает
идея: нельзя ли как-то дополнить правило (34), (35) выбора разрешающего
элемента так, чтобы и в вырожденных задачах получались
последовательности симплекс-таблиц со свойством (47)? Реализация этой идеи приведет
нас к антициклину.
Пусть v — какая-либо угловая точка множества X с базисом В ={Aj,...
...,А3) и с симплекс-таблицей S = S(v, В), пусть это будет таблица 3.
Предположим, что таблица S удовлетворяет условиям (34), и уже
зафиксирован какой-либо номер к $ I(v), к > О, из (34). Выберем номер s и
разрешающий элемент ~/вк из условия
^ = lexmin£-, ве14(«) = {»: U»<r, 7а>0}. (48)
hk « 6 Ik (v) Нк
С помощью леммы 1 убедимся, что условие (48) однозначно определяет
г.
номер s. Для этого нам надо показать, что множество G = (¾ = —S г е
Нк
eIk(v) — M0j состоит из различных векторов. Допустим, что два
вектора из этого множества оказались равными: Г\/7Й = ^P/lPk> Р> к £ Ik(v),
рфк. Тогда Г; = bik/%k)Tp, т. е, строки Г„ Гр в матрице Г = (•%, 7н • • •
..., 7П) = (5"1Ь, В~ХАХ,.. .,В~хАп) = В-х\Ь,:А) пропорциональны. Однако
по предположению множество X непусто, поэтому система (2), Ах — Ь,
совместна, и тогда, согласно теореме Кронекера — Капелли [192; 353],
rang(6, A) = rangA — г. Отсюда и из невырожденности матрицы В~х
следует, что rangr = rangA = г. Это значит, что строки Г,,..., Гг матрицы Г
образуют линейно независимую систему векторов, и никакие строки Г;, Гр
в этой матрице пропорциональными не могут быть. Полученное
противоречие показывает, что множество G состоит из различных векторов. Согласно
лемме 1 условие (48) однозначно определяет номер s G Ik(v), причем для
его практического нахождения можно воспользоваться конструкциями,
указанными в этой лемме.
Важно заметить, что лексикографическое правило (48) выбора
разрешающего элемента не отменяет ранее сформулированное правило (34), (35),
а, наоборот, включает его в себя, дополняет и уточняет его. В самом деле,
в соответствии с конструкциями леммы 1 для поиска номера s из
условия (48) мы в первую очередь образуем множество Мх = {s G M0 = Ik(v):
Iso/lsk= т'п lio/lik}> которое в точности совпадает со множеством номеров
>еМ0
s, определяемых условием (35). Отсюда, кстати, следует, что если
множество М, состоит из единственного номера (так будет, например, в
невырожденных задачах), то оба правила (34), (35) и. (48) определяют один и
тот же номер s, один и тот же разрешающий элемент %к. Если же М,
содержит более одного номера, то правило (48) устраняет возможную в
вырожденных задачах неоднозначность в выборе разрешающего элемента
при пользовании правилом (34), (35). Итак, выберем номера к, s и
разрешающий элемент т,& = l,klv) из условий (34), (48) и по правилам (26)
совершим переход от симплекс-таблицы S(v, В) угловой точки v с базисом
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
127
В к симплекс-таблице S(w, В) угловой точки w с координатами (36) и с
г
базисом (37). Оказывается, если исходная симплекс-таблица S(v, В) у О,
то имеют место следующие лексикографические неравенства:
S(w, В) У О, S(v,B)yS(w,B). (49)
г
В самом деле, если S(v, В) У 0, то по определению 5 в этой симплекс-
таблице строки Г; = T.(v) у О, г = 1,..., г. Тогда из (26), из неравенства
ъ>0и свойства 1) отношения >- следует, что ^s(w) = rs(v)J'ysk(v) уО.
Пусть теперь г ф s. Тогда, возможно, либо 7¾ >0, либо jik ^ 0 . Если 7&> О,
то i&L(v) и, согласно правилу (48), имеем ^ i(v)/iik(v)yY s(v) /~jsk(v). В
силу свойства 2) отношения >- тогда Tt(v)y (7^(^)/7^(^))^(^), т. е. ГДги) =
= Г*(г;)-(7Лг;)/7,А>))ГяН>-0- Если lik ^ 0, то a = -(7й(«)/7*(«)) > ° и
Ti(w) = T,(v) + T(w)(—2ik(v)/^sk(v))yO в силу свойства 3) отношения >-.
Таким образом, Гдги) У 0 для всех г = 1,..., г, что означает, что симплекс-
г
таблица 5(ги, В)уО. Наконец, из того, что Гя(го) >-О, Д^. = Ak(v) > О,
из формулы (26) для строки А(ги) и свойства 4) отношения >- имеем:
Д(г;)>- А(г;)-АА:(г;)Гя(го) = А(ги). Это значит, что S(v, В)У S(w, В).
Лексикографические неравенства (49) доказаны.
Теперь посмотрим, к какому симплекс-процессу приведет применение
правил (34), (48). Пусть у нас имеется некоторая угловая точка v0 с бази-
г
сом В0, с симплекс-таблицей 50 >- 0. Пользуясь правилами (34), (48), (26),
организуем симплекс-процесс, начинающийся с точки v0, и получим
последовательности угловых точек {vp}, их базисов {Вр}, симплекс-таблиц {Sp},
где Sp — симплекс-таблица точки vp с базисом Вр. Оказывается,
последовательность {Sp} удовлетворяет лексикографическим неравенствам (47), в
чем легко убедиться с помощью математической индукции, основываясь на
г
неравенствах (49) и 50 >- 0. Так как в цепочке неравенств (47) повторение
симплекс-таблиц невозможно в силу транзитивности отношения >- и в
задаче (1) множество симплекс-таблиц конечно, то такой симплекс-процесс
закончится на каком-то шаге реализацией одного из условий (32) или (33).
Это значит, что правило выбора разрешающего элемента по формулам (34),
(48) является антициклином. Тем самым доказана
Теорема 2. Пусть в канонической задаче (1) множество X ф0,
rangA = г = т<п, пусть v0 — какая-либо угловая точка этогомножест-
г
ва с симплекс-таблицей S0 у 0. Тогда симплекс-процесс, начинающийся
с точки v0, при выборе разрешающего элемента jsk из условий (34), (48)
завершится за конечное число шагов определением некоторой угловой
точки vp множества X, в которой реализуются либо условия (32),
либо (33), причем в случае (32) vp —решение задачи (1), /(г>р) = ft > —00, а
в случае (33) задача (1) не имеет решения, ft = —00.
Напомним, что построенный антициклин (34), (48) обоснован при усло-
Г
вии, что начальная симплекс-таблица 50 у 0. Но это условие нельзя считать
серьезным требованием к антициклину, так как выше мы показали, что
переставив некоторые из базисных столбцов и соответствующим образом
перенумеровав переменные, любую симплекс-таблицу 50 легко сделать
лексикографически положительной. К тому же такую операцию с перестановкой
128 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
столбцов и перенумерацией переменных нужно сделать самое большее один
раз в самом начале симплекс-процесса. Впрочем, операцию с перестановкой
столбцов и перенумерацией переменных можно явно и не делать, если эту
операцию учесть при порядке формирования множеств М,, М2,...,
указанных в лемме 1 и используемых при поиске номера s из условия (48). Более
того, можно доказать, что условия (34), (48) являются антициклином и без
требования 50 У О [148; 259].
Заметим также, что антициклин (34), (48) оставляет некоторый
произвол в организации симплекс-процесса из-за того, что условие (34)
определяет номер к, вообще говоря, неоднозначно; для устранения указанной
неоднозначности к правилу (34), (48) можно сделать дополнение,
руководствуясь какими-либо другими соображениями, например, можно выбирать
минимальный или максимальный номер к, удовлетворяющий условиям (34).
Пример 4. Для иллюстрации изложенного антициклина (34), (48)
рассмотрим задачу (45), (46), в которой, как обнаружилось выше,
использование правила (34), (35) выбора разрешающего элемента может
привести к зацикливанию. Сначала симплекс-таблицу 9 начальной угловой точки
v0 = (О,0,0,0, 0,0, 1) сделаем лексикографически положительной,
переставив базисные столбцы х2, х3 между столбцами V и ж1; в результате придем
к таблице 16, в которой сохранена первоначальная нумерация переменных.
Таблица 16
гз
д
Б
X7
х2
X3
V
1
0
0
0
х2
0
1
0
0
X3
0
0
1
0
хх
1
-2
-3
-1
X*
1
1
©
1
X5
1
-3
-2
1
х6
1
4
1
-1
х7
1
0
0
0
Таблица 17
х7
х2
я4
1
0
0
0
0
1
0
0
-1/4
-1/4
1/4
-1/4
7/4
-5/4
-3/4
-1/4
0
0
1
0
<т.
-5/2
-1/2
3/2
3/4
15/4
1/4
-5/4
1
0
0
0
Таблица 18
х5
х2
X*
2/3
5/3
1/3
-1
0
1
0
0
-1/6
-2/3
1/6
0
7/6
5/3
-1/6
-1
0
0
1
0
1
0
0
0
1/2
5
1/2
-2
2/3
5/3
1/3
-1
В строке А таблицы 16 величина А4 = 1 > 0 и весь столбец ж4 заполнен
положительными числами: 7м = 1. 724 = ^ 7з4 = 4. Таким образом
получаем, что условия (34) здесь выполнены и 14(г;0) = {1, 2, 3}. Для применения
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
129
лексикографического правила (48) выпишем следующие строки:
^- = (1,0,0, 1, 1, 1, 1, 1), ^- = (0, 1,0,-2, 1,-3,4,0),
i = (0,0,i,-f,l,-i,i,0).
Последовательно сравнивая по величине первые, вторые и т. д.
координаты этих векторов-строк Г\/7Л, г G М0 — IJv0), легко находим указанные в
лемме 1 множества М,={2,3}, М3 = {3}, искомый номер s=3, так что
здесь lexmin{r,/7U) Г2/724) Г3/73Л = ^з/7з4- Понятно, что те же множества
М,, М2 и номер s = 3 можно было получить непосредственно из таблицы 9,
просматривая ее столбцы в таком порядке: V, X • X • X • X « X • X • X 1. Таким
образом, с помощью правила (48) мы однозначно нашли разрешающий
элемент 7з4 = 4- Далее, по формулам (26) в базис вводим переменную ж4 и
выводим из базиса х3. В результате придем к симплекс-таблице 17 угловой
точки «,, совпадающей с v0, но имеющей другой базис (А7, А2, А4). В этой
таблице разрешающим элементом может быть лишь величина 7is = 3/2. Из
базиса выведем переменную х7, заменив ее х5, по формулам (26) получим
табл. 18. В строке А все величины Д;, 1 ^ г ^ 7, неположительны,
реализовались условия (32). Симплекс-процесс на этом заканчивается. Выясняется,
что невырожденная угловая точка v3 = (0, 5/3,0, 1/3, 2/3,0,0) является
решением задачи (45), (46), f(v3) = ft = — 1.
Заметим, что хотя среди задач линейного программирования
вырожденные задачи встречаются довольно часто, но тем не менее на основе
всего практического опыта применения симплекс-метода к таким задачам
сложилось убеждение, что вероятность получения бесконечных симплекс-
процессов ничтожно мала. Добавим также, что использование антициклина
на каждом шаге симплекс-метода может привести к заметному увеличению
машинного времени ЭВМ, требующегося для решения задачи, поэтому на
практике чаще всего пользуются упрощенным правилом выбора номеров к
и s из условий (34), (35), беря, например, наименьшие или наибольшие
номера, удовлетворяющие этим условиям.
Из сказанного следует, что наличие симплекс-метода, снабженного анти-
циклином, для практики, видимо, не является слишком актуальным, но в
теоретическом плане это принципиально важно и ставит симплекс-метод на
надежный математический фундамент.
5. Кратко остановимся на применении симплекс-метода для решения
канонической задачи максимизации:
/(ж) = (с, х) -» sup, хеХ = {хеЕп: х^0, Ах = Ъ}, (50)
где А — ненулевая матрица размера г х п, се Еп, b е Ет, г = rangA < п.
Конечно, эту задачу можно свести к равносильной задаче минимизации
д(х) = —f(x) —> inf, х£ X, и к ней применить описанный выше симплекс-
метод без каких-либо изменений. В то же время нетрудно несколько
видоизменить симплекс-метод и приспособить его для непосредственного
применения к задаче (50). Легко понять, посмотрев на формулы (6),(9) и (29), что
при решении задачи максимизации (50) нас прежде всего будут
интересовать величины Ак <0, и мы естественно придем к рассмотрению следующих
трех случаев, аналогичных случаям (32)-(34).
Случай I. В нижней строке симплекс-таблицы 3 все А,,..., А
неотрицательны. Исходная угловая точка v является решением задачи (50).
130
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Случай II. В нижней строке симплекс-таблицы 3 найдется величина
Ак <0, 1 ^ к ^ п, и находящийся над ней столбец % неположителен. Тогда
/* = sup(c, х) = +оо, задача (50) не имеет решения.
Случай III. В нижней строке симплекс-таблицы 3 имеются
величины Aj. < 0, 1 ^ к ^ п, причем в каждом столбце над величиной А^. < 0
найдется хотя бы одно число 7¾ > 0. Тогда фиксируем один из таких
номеров к с Д^. < 0 и выбираем разрешающий элемент jsk по правилу (35)
или, точнее, (48), а затем по формулам (36) совершаем переход от
угловой точки v с базисом В к точке w, которая согласно замечанию 1 также
будет угловой точкой множества X с базисом В, имеющим вид (37),
причем /(ги) > f(v). Один шаг симплекс-метода для задачи (50) описан. Как
г
и выше, можем считать, что исходная симплекс-таблица S(v, В) >-0. Тогда
будут справедливы следующие лексикографические неравенства, аналогич-
г д —
ные неравенствам (49); S(w, В)у0, S(v, В) -< S(w, В). Отсюда следует,
что симплекс-процесс для задачи (50) будет конечным и закончится
реализацией одного из случаев / или II,
Все высказанные здесь утверждения, касающиеся задачи (50),
доказываются совершенно также, как и аналогичные утверждения, касающиеся
задачи (1). Предлагаем читателю убедиться в этом самостоятельно.
Остается напомнить, что в течение всего этого параграфа задача (1) (а
также задача (50)) рассматривалась в предположении, что т — г = rangA <
< п, и нам известна хотя бы одна угловая точка множества X. В следующем
параграфе покажем, как избавиться от этих ограничений.
Упражнения
1. С помощью симплекс-метода решить следующие канонические задачи:
а) /(ж) = хх + ж2 + ж3 + ж4 + ж5 -+ inf; х = (ж1, х2,..., ж5) ^ 0, ж1 + х2 + 2х3 + ж4 ~ 2ж5 = 2,
2х1-х2 + х3+2х*+х5 = 1',
б) f(x) = хх + Зж2 + 2х3 + ж4 - Зж5 -+ lnf; х = (хх,..., ж5) > 0, хх + 2ж2 - 42ж3 - х5 = 0,
-х2 + ж4 - 2ж5 = 3;
в) /(ж) = ж! - 2ж2 + ж3 - ж4 -+ inf; ж = (ж! ж4)>0, ж1-2ж3 + ж4 = 1, ж2 + ж3-2ж4 = 1;
г) /(ж) = ж1 + ж2 + ж3 + ж4 + ж5 -+ inf; ж = (ж1,..., ж6) > 0, ж1 + 2ж2 - ж4 + 2ж5 = 1, ж2 + ж3 +
+ 2ж4-ж5=0, -ж2-2ж4 + ж5 + ж6=1.
2. Проверить, что точка v0 является угловой, найти ее базис, приведенную систему и, взяв
v0 в качестве начальной точки, с помощью симплекс-метода решить следующие задачи:
а)/(ж) = ж1+2ж2 + ж4 + ж6-»тГ[5ир];ж=(ж1,..., ж6)^0, ж'+2ж2-ж3 + 2ж4-ж5 + 2ж6 = 0,
ж1 ~4ж2 + 2ж3+2ж4-4ж6 = 1, 2ж'-2ж2 + ж3+4ж4 + ж5-2ж6 = 3; v0 = (1, 0,0,0, 1, 0);
б)/(ж) = ж1+ж2 + ж3 + 2ж4+Зж5+2ж6-нпЦ5ир];ж = (ж1,..., ж6)^0, ж1+ж2+4ж4 + 2ж6 = 5,
ж2 + ж3 + ж4 - ж5 + 2ж6 = 0, ж1 + ж3 + ж4 - ж5 + 2ж6 = -1; 1¾ = (0,1,0,1, 2,0);
в)/(ж) = ж1+2ж2 + Зж3 + ж4 + ж5-»1пГ[5ир];ж = (ж1,..., ж^)>0, ж1+2ж2+4ж3-ж4 + ж5 = 1,
ж1 -ж2-2ж3 + ж4 + ж5 = 1, -ж1+ж2-6ж3 + ж4 + ж5 = 1; и0 = (1, 1,0,1,0).
3. Найти начальную угловую точку v0, ее базис, приведенную систему и решить следующие
задачи:
а) /(ж) = -ж1 + Зж2 + 5ж3 + ж4 -+ inf [sup]; ж = (ж1,..., ж4) ^ 0, ж1 + 4ж2 + 4ж3 + ж4 = 5,
ж1+7ж^ + 8ж3 + 2ж4 = 9;
б) /(ж) = ж2 - ж3 + ж5-» inf [sup]; ж = (ж1,..., ж5)>0, ж1 +ж4-ж5=1, ж1 +ж2 + 2ж4=3;
ж3 + ж4 = 1;
в) /(ж) = 4ж! -ж2 -Зж3 - 10ж4 -»inf [sup]; ж = (ж1,..., ж4) ^0, ж1 +ж2 -ж3 +ж4 = 0, 14s1 +
+ ж2 + 10ж3-10ж4=11.
§ 3. СИМПЛЕКС-МЕТОД. АНТИЦИКЛИН
131
4. С помощью приемов, описанных в § 1, записать задачи линейного программирования в
каноническом виде и решить их с помощью симплекс-метода:
а) /(жЫ-ж1 +4^-5a;3-»inf[sup]; ж = (х', ж2, ж3) JtO, 2ж! + ж2+ж3 = 4 [<4;>4], ж1 -
- ж2 - ж3 < 2 [< 2- = Ц
б) /(ж) = ж! + х2 + ж3 -+inf [sup]; ж = (ж!,ж2,ж3) >0, -1<ж'+ж2+ж3<1, -ж'+ж2 + ж3<1,
х1 -х2 + х3< 1;
в) /(x) = x1+x2 + x3+x4-»inf[sup];x = (x1,..., х5)>0, х'-х2>0, х1+,х2-ж3+х4-х5>1.
5. При каких значениях параметра а задача /(х) = х'и-2х2+3хэ+4х4—»'mf [sup]; ж==(ж',...
..., х4) >0, х1 + х2 + х3 + ах4 < 1, [^ 1; = 1] имеет решение? Не имеет решения? Единственное
решение? , ,
6. С помощью симплекс-метода с антициклином (48) решить задачу [216]:
/(х) = -|х! + 150х2-jJLx3+6x4-Mnf; х = (х1,..., х7)>0,
jx1-60x2-^x3 + 9x4 + x5 =0
ix1 -90х2- 4jx3 + 3x4 +х6 =0
X3 +х7=1,
взяв в качестве начальной угловую точку и0 = (0,0, 0, 0,0,0,,1) с базисом Вп = (А5, Ае, А7).
Показать, что если разрешающий элемент "fsk выбирать по правилу (34), (35) так, что к —
наименьший из номеров, для которых Д^. = max Д{, s—наименьший из номеров,
удовлетворяющих условию (35), то придем к циклическому перебору базисов точки Vq по схеме:
(Ас, А6, А7) -* (Л,, А6, А7) -* (Л,, А2, А7) -* (А3, А2, А7) -* (А3, Л4, А7) -> (Д5, Л4, А7) -*
->(А5,А6,А7)-+...
7. Пусть v — угловая точка множества X — {х ^ 0: Ах = Ь} с базисом В = (Aj ,..., А-),
где А —матрица размера тх п, г = rangA = т<п. Пусть некоторая система уравнений
//< = ** + £ t^xk, f= 1,-..., г;-/(«) = {У, jr} (51)
равносильна системе Ах = Ь. Доказать, что система (51) является приведенной системой для
точки v с базисом В, Указание: сначала покажите, что системы (51) и (28) равносильны,
затем подставьте в (51) следующие решения системы (28): xq = v; хр = (х^,..., ж™), р ^ I(v),
гдех^=и3'-7;р, г = 1,...,г, ж£ = 1, ж^=0, j ¢1^), ]ф р, и убедитесь, что ц3' = иЛ, /^ = 7¾.
к il(v), г = 1,...., г. -,
8. Пусть задача (1) имеет своим решением угловую точку v с симплекс-таблицей 3. Можно
ли утверждать, что тогда Д . ^ 0 для всех j = 1, 2,..., п? (см. табл. 3, 4).
9. Для того, чтобы задача (1) имела своим решением угловую точку v, необходимо и
достаточно, чтобы для какого-либо базиса В точки v соответствующая симплекс-таблица
удовлетворяла условиям (32). Доказать.
10. Пусть угловая точка v с базисом В = (А^ ,..., А^ ) является решением задачи (1) и
пусть ее симплекс-таблица (см. табл. 3) удовлетворяет условиям (32). Пусть при некотором
к ¢. I(v) = {j\ j } величина Ак = 0 и в столбце хк имеется величина 7¾ > 0. Пусть
разрешающий элемент "/sk определен по правилам (35) или (48), и получена угловая точка w
с координатами (36) и с базисом (37) (см. замечание 2), Доказать, что тогда w — решение
задачи (1). Можно ли таким способом получить все угловые точки множества X, являющиеся
решением задачи (1)?
11. Пусть v — угловая точка множества Х = {ж^0: Ах=Ь}, В ~(Aj А}-)— ее базис,
А — матрица размера г х п, г = rangA < п; пусть в матрице Г = (70,7i> • • •> 7П) (см'
обозначения (27)) один из столбцов ук ¢. 0, к $ I(v) = {jx,. ..,jr}. Доказать, что тогда
множество X неограничено, и найдется такой вектор с = (с,,..., с ), для которого inf (с, х) = —оо.
Указание: взять с; =0, г е/(г>), ск=~\, остальные с. —произвольные числа, составить
симплекс-таблицу точки г> для задачи (1) с выбранным с. Можно ли утверждать обратное:
если множество X неограничено, то в матрице Г найдется столбец ук < 0, к ¢ I(v)?
132
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
§ 4. Поиск начальной угловой точки
1. Будем рассматривать каноническую задачу
f(x) = (с, х) ->inf, х G X = {х = (х\ ..., хп) ^ 0, Ах = Ъ}, ' (1)
где А — матрица размера т х п, се Еп, Ь е Ет, в самом общем виде,
отказавшись от ограничительных требований rangA — т < п, принятых в
предыдущем параграфе. Можем считать, что А ^0, так как при А = 0 либо
X = Е™ = {х^0} (случай 6=0), либо X — 0 (ЪфО), и задача (1) становится
малосодержательной. Нас будут интересовать вопросы, как узнать, не пусто
ли множество X, и если оно непусто, то имеет ли оно хотя бы одну угловую
точку? Как найти эту угловую точку, ее базис, ее симплекс-таблицу?
Ниже будут даны ответы на все эти вопросы. Здесь замечательно то, что для
ответа на них может быть использован изложенный выше симплекс-метод
с антициклином. Оказывается, по задаче (1) легко можно составить новую
вспомогательную каноническую задачу, к которой очень удобно применять
симплекс-метод, и в зависимости от того, чем закончится симплекс-процесс
для вспомогательной задачи, можно будет сказать, пусто или непусто
множество X, найти ее угловую точку. Этот метод поиска начальной угловой
точки в литературе часто называют методом искусственного базиса.
Можем считать, что в (1) вектор 6^0, так как если Ь{ < 0 при
некотором г, 1 ^ г ^ т, то соответствующее г-е уравнение {Ах)1 = ¥
системы Ах — b можно умножить на (—1). Наряду с основными
переменными х — (хх,..., хп) введем вспомогательные (искусственные) переменные
и — (и1,. .., ит) и в пространстве Еп + т переменных у = (и, х) = (и1,...
..., ит, хх,..., хп) рассмотрим следующую каноническую задачу линейного
программирования:
g(y) = ul+u2 + ... + um=<lm,u>->M; yeY, 2
Y = {у = [и, х] е Еп + т: у^О, Cy = u + Ax = b}, ( '
где lm = (l,..., 1)е Ет, С = (1т,А), 1т — единичная матрица размера тх
х т. Систему Су = и + Ах = Ь перепишем в покоординатной форме:
Ь1 = u1 + anxl + . .. + aXjxj + ... + alnxn, ,
Ь{= и1 +anxl +... + afV +... + ainxn,
bm= um + amlxx+ ... + amjx* + ... + amnxn.
При ux = ... = um — 0 система (3) превращается в систему Ах = Ь.
Множество Y непусто: оно содержит, например, точку z0 = (6,0)^0. Более
того, с помощью теоремы 2.1 легко убедиться, что точка z0 является
угловой точкой множества Y с базисом (е1,..., ет) = 1^ Система (3)
является приведенной системой этой точки, rangC = т. Для целевой
функции приведенная форма равна д(у) = (lm, Ь — Ах) = g{zQ) — (ATlm, х), где
АТ — транспонированная матрица А. Теперь симплекс-таблица точки z0
составляется просто (см. табл. 19): в столбце Б — базисные координаты
и\ ..., ит, в столбце V — % = Ь, в столбцах и\ ..., ит вспомогательных
переменных 7i' = ер • • •! lm = ет, в столбцах ж1,..., хп основных переменных
§ 4. ПОИСК НАЧАЛЬНОЙ УГЛОВОЙ ТОЧКИ
133
7i = ImA\ = АХ, ..., ^п = 1тАп = Ап. Элементы строки А легко вычисляются
по формулам (3.30), которые применительно к задаче (4) дадут:
величины Д,,...,Дт, соответствующие базисным переменным их,...,ит равны
нулю, а величины А0, Д,,..., Дп равны сумме элементов соответствующих
т т
столбцов V, хх,..., хп: А0= J2 Ь{ = g(z0), Д. = J2 ац- Привлекательно так-
1=1 г=1
же и то, что симплекс-таблица 19 лексикографически положительна и
поэтому здесь удобно применять симплекс-метод с антициклином (3.48).
Таблица 19
г,
г/
'С
д
Б
их
'и1
и™
V
Ьх
До
их
1
о
'6'
0
и1
0
i
'6'
0
ит
0
0
"Г
0
хх
о,,
ап
Ai
Ж3
а •
ДУ
жп
а1п
а-
а
тп
д"
Поскольку д(у)~^0 при всех j/еУ, то & = inf д(у) ^ 0 и случай gt =
= — оо здесь невозможен. Поэтому, взяв в качестве начальной точку z0, с
помощью симплекс-метода с антициклином за конечное число шагов найдем
угловую точку zt = {ut, vt) множества Y, являющуюся решением задачи (2):
g{zt) = gt ^ 0. Имеются две возможности: или g(zt) > 0 или g(zt) = 0. Если
g(zj) = uj + . . .+ u™>0, то щфО и, оказывается, множество Хв(1) будет
пустым. В самом деле, если бы существовала хотя бы одна точка Xq G X, то
точка у0 = (0, Xq) принадлежала бы множеству Y и, кроме того, тогда #(%) =
= 0, что противоречит неравенствам д(у0) ^ g(zt) = gt > 0. Таким образом,
при g(zt) = gt > 0 множество X пусто, и задача (1) не имеет смысла.
Пусть теперь g{zt) = их + ... + и™ = 0. Тогда и, = 0и zt = (0, vt). Кроме
того, по построению zt = (0, vt) угловая точка множества X. Покажем, что
тогда г^ — угловая точка множества X. Прежде всего ясно, что из zt~^0
следует vt ^ 0, а из Gzt = Ь имеем Avt = Ь. Это значит, что vt G X. Далее,
рассмотрим представление
ах,
+ (1-0:)¾) 0<а<1; хх,х%еХ,
(4)
и покажем, что оно возможно лишь при vt = хх = :%. Точки ух = (О, хх),
у2 = (О, :%), очевидно, принадлежат Y. Тогда (4) можно переписать в виде
zt = аух + (1 — а)у2, 0< а < 1. Но zt — угловая точка множества Y. Поэтому
последнее равенство для zt возможно лишь при zst = yl = y2. Отсюда следует,
что vst = xx = x2. Таким образом, vt — угловая точка множества Х.Тем самым
доказана важная
Теорема 1. Если множество Х = {х е Еп; х ^0, Ах = 6} непусто,
то оно имеет хотя бы. одну угловую точку.
Таким образом, с помощью изложенного метода искусственного базиса,
составной частью которого является симплекс-метод с антициклином, мы
получили возможность узнать, пусто множество X задачи (1) или непусто,
а в случае непустого X определили одну из его угловых точек vt. Найденная
точка « вполне может быть использована как начальная угловая точка для
134
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
организации симплекс-процесса для исходной канонической задачи (1).
Зная координаты точки vt, с помощью теоремы 2.1 можно определить
номера базисных переменных и ранг матрицы А. В самом деле,
положительные координаты («/',...,«»*) точки vt заведомо являются базисными
(см. доказательство теоремы 2.1). Остается добавить к линейно
независимым столбцам Аз-,..., Aj матрицы А другие ее столбцы и получить
базис {A.,..., Aj*)=B линейной оболочки векторов, натянутых на столбцы
Аи ..., Ап матрицы А. Номера ju . ..,jr будут базисными для точки vt и
r=rangA. Далее, с помощью процесса Гаусса — Жордана можем выразить
базисные переменные через неоазисные и, попутно исключая линейно
зависимые уравнения из системы Ах=Ь, придем к приведенной системе угловой
точки vt с базисом В. Остается применить симплекс-метод с антициклином
и получить решение задачи (1) или узнать, что эта задача не имеет решения.
2. Таким образом, доказана принципиальная возможность использования
симплекс-метода, оснащенного антициклином, для решения произвольной
канонической задачи. Более того, с помощью симплекс-метода мы доказали
важную для теории и методов линейного программирования теорему 1.
Приведем еще две теоремы, касающиеся канонической задачи, в доказательстве
которых симплекс-метод также играет существенную роль.
Теорема 2. Если задача (1) разрешима, то среди ее решений
найдется хотя бы одна угловая точка множества X.
Доказательство. По условию теоремы X ф0 и существует точка
vte X такая, что (с, vt) = /, > —оо. По теореме 1 тогда множество X имеет
хотя бы одну угловую точку; Отправляясь от одной из этих угловых точек,
с помощью симплекс-метода с антициклином за конечное число шагов
придем к угловой точке xt, являющейся решением задачи (1)-(3). Теорема 2
доказана. □
Теорема 3. Для того, чтобы каноническая задача (1) была
разрешима, т. е. существовала точка xt е X такая, что (с, xt) = inf(c, х) =
= ft>—oo, необходимо и достаточно, чтобы:
1) множество X было непустым;
2) функция f(x) = (с, х) была ограничена снизу на X.
Доказательство. Необходимость очевидна. .Докажем
достаточность. Из того, что X ф 0, по теореме 1 следует
существование угловой точки множества X. Принимая эту точку за начальную,
будем решать задачу (1) с помощью симплекс-метода, снабженного
антициклином. Так как по условию ft > —оо, то случай (3.33) здесь
невозможен, и симплекс-процесс завершится за конечное число шагов реализацией
случая (3.32) и отысканием точки xt, являющейся решением задачи (1).
Теорема 3 доказана. □
Применение симплекс-метода для доказательства других важных теорем
теории линейного программирования изложим в следующем параграфе.
3. На этом заканчиваем изложение симплекс-метода для канонической
задачи (1). Учитывая возможность сведения общей задачи линейного
программирования к канонической задаче (теорема 1.1), можно сказать, что
симплекс-метод является универсальным методом решения задач
линейного программирования. Конечно, компьютерная реализация описанной
выше схемы симплекс-метода требует огромной дополнительной работы: надо
выбрать подходящую модификацию метода, изучить влияние погрешности
§ 4. ПОИСК НАЧАЛЬНОЙ УГЛОВОЙ ТОЧКИ
135
на симплекс-процесс, организовать хранение исходной и текущей
информации о задаче и т. п. — эти практические проблемы обсуждаются, например,
в [116; 516; 586; 620].
Симплекс-метод относится к так называемым конечным методам,
позволяющим найти решение задачи линейного программирования или обнаружить
ее нерешаемость за конечное число арифметических действий. Это число,
конечно, зависит от размерностей т, п задачи (1). Известен пример задачи
линейного программирования с п переменными и т = 2п ограничениями
(этот пример приведен в [586], стр. 360), для решения которого требуется
не менее 2П — 1 шагов симплекс-метода, и, следовательно, число
арифметических операций, необходимых для получения решения, не меньше 2П.
Отсюда следует, что количество вычислений для решения «плохих» задач
линейного программирования симплекс-методом оценивается
экспоненциальной функцией параметров m, п размерности задачи, и уже при не очень
больших т, п решение таких задач симплекс-методом невозможно за
обозримое время даже на самых мощных компьютерах. Как принято говорить,
на классе задач линейного программирования симплекс-метод имеет
экспоненциальную сложность. Однако вопреки такому пессимистическому
выводу в практических задачах симплекс-метод показывает высокую
эффективность, причем в абсолютном большинстве реальных задач количество
необходимых арифметических операций имеет порядок п2т [52]. Причина
этого удивительного явления пока еще не выяснена. В последнее время
появились методы, имеющие полиномиальную сложность. Так называются
конечные методы, для которых число элементарных операций, необходимых
для получения решения задачи линейного программирования с нужной
точностью, не превышает некоторого полинома от размерностей т, п задачи —
более точные формулировки см. в [525; 676; 736]. Эти методы в самом деле
эффективнее симплекс-метода на «плохих» искусственно придуманных
задачах линейного программирования, но на реальных задачах пока не могут
успешно конкурировать с ним. На практике симплекс-метод по-прежнему
остается основным методом линейного программирования.
Кроме симплекс-метода имеется множество других (конечных,
итерационных) методов решения задач линейного программирования [52; 7о; 77;
116; 203; 259; 586; 620; 685; 719; 775; 776]. Для специальных классов задач
линейного программирования таких, как, например, транспортная задача,
существуют методы, лучше учитывающие конкретные особенности этих
задач [52; 203; 232; 259; 471; 493; 620; 685; 725; 743]. Содержательный обзор
многих существующих методов линейного программирования дан в [586].
В заключении подчеркнем, что всюду выше предполагалось, что исходные
данные задачи линейного программирования — матрица А, векторы 6, с—
известны точно и, кроме того, все промежуточные вычисления в симплекс-
методе проводятся без погрешностей. Такая идеализация позволила нам
дать строгое обоснование симплекс-метода, доказать ряд важных теорем
линейного программирования. Однако на практике исходные данные
задаются, как правило, неточно, промежуточные вычисления проводятся с
округлениями. Поэтому применение симплекс-метода или других методов в
конкретных задачах линейного программирования может^привести к
большим погрешностям, неверным выводам из-за возможной неустойчивости
решения по отношению к возмущениям исходных данных таких задач, и
для получения их решения с нужной точностью могут понадобиться
специальные методы регуляризации, которые будут рассмотрены в главе 9.
136 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Упражнения
1. С помощью метода искусственного базиса найдите какую-нибудь угловую точку
следующих множеств:
а) х = (х1,..., х4) > 0, х!+х2 + х3--х4 = 2, х!+х3 + 2х4=1, х!+х2 + х4 = 2;
б) х = (х1,...,х4)>0, х1+х2 + 2х3-х4=1, х1-х2 + х3 + х4 = 2, х,43х2+3х3-3х4=0;
в)х = (х1,...,х4)^0, x!+a:2 + x3+x4 = l, х1 +2х2-2х3 + х4 =0, 2х! +3х2-х3 + 2х4 = 2;
г) х = (х!,..., х5)^0, х1+2х2 + 2х3-х4+х5 = 1, 2х' - х2 + х3 + х4 + 2х5 = 2, 5х2+
+ 3х3-3х4=0, х!-3х2-х3 + 2х4 + х5 = 1;
д) х = (х!,...,х5)^0, х1+2х2 + х3 + х4 + 2х5 = 5, х1 - Зх3 - 2ж4 - х5 =i 2, 2х! + х2-
-х* + х4 + х5 = 1;
е) х = (х1,..., х6) ^0, х1 + х2 + х3 + х4 + х5 + х6 = 2, х1 + 2х2 + х3 + 2х4 - х5 + х6 = 3,
х1+ж2 + 3х3 + х4+х5-х6 = 2, х'+2х2 + х3+4х4-х5-х6 = 3.
2. С помощью симплекс-метода решите следующие канонические задачи:
a)/(x) = x1-x2-x3-x4 + 2x5-^inf[sup], х = (х!,..., х5) ^0, х> +3х2 + х3 + х4-2х5 = 10,
2х1+6х2 + х3 + 3х4-4х5 = 20, Зх1 + 1Ох2 + х3 + 6х4-7х5 = 30;
6)/(x) = x1 + 2x2 + x3 + 2x4 + x5-»inf[sup], х = (х1,.... х6)^0, х1 -ж2 + 2х3 + х4-3х5-
-хй = 3, х!+х3 + 2х4-х5 + 2х6 = 2, 2х!+х2 + х3-х4 + 2х5 + х6 = 3;
в) /(х) = х! + 2х2 - 2.-е3 + 5х4 -+ inf [sup], х = (х1,.,., х4) J: 0, х1 + 2х2 - х3 - х4 = 1,
-х1 + 2х2+Зх3 + х4 = 2, х1+5х2 + х3-х4 = 5;
г) Дх) = х' + 2х2 + Зх3 + 4х4 + 5х5 -+ inf [sup], х = (х1,..., х5) ^ 0, х1 + х3 - 2х4 - 6х5 = 2,
х2 + х3 - 2х4 + 7х5 = 2, х1 + х2 - 2х4 + 7х5 = 2;
д.) f(x) = xl+x3 + x5 + x7->ini[sup], х = (х1, .. ., х7) >0, х1 +3х2 + х3 + 2х4 + х5 + х6 = 10,
2х!+х2-х3 + 5х4+3х6-х7 = 20, х1+13х2 + 7х3 + 5х5-х6 + 2х7 = 10.
3. С помощью приемов, описанных в § 1, запишите задачу линейного программирования в
каноническом виде и решите ее с помощью симплекс-метода:
а) f(x)=2xi+x2-x3+xb-> inf[sup], х=(х\..., х5)^0, 0<х'—х4<2, х!+х2+х3-х4-х5^1;
б) /(х) = Зх1 + 10х2 + 8х3 - 6х4 -+inf [sup], х = (х1, ..., х4) ^ 0, Зх1 + 2х2 + х3 - х4 ^ -1,
х'+Зх2 + Зх3-2х4 = -1, х'^4;
в)/(x) = x1+3x2-x3-»inf[sup], х1 >0, х3^0, -1<х!-х2 + х3>1, х1+х2 + х3<4;
r)/(x) = 6x1-12x2+5x3+2x4+3x5->inf[supl, х = (х\ ..., x5)Jt0, Зх1-6х2+5х3+4х4 <3,
х1 - 2х2 + 4х4 + х5 = 2, -х1 + 2х2 - Зх3 - 2х4 - х5 >-7;
4. Суточный рацион группы животных включает не менее 10 кг продукта П], 25 кг продукта
П2, 15 кг продукта П3, 30 кг продукта П4, 5 кг продукта П5. Эти продукты содержатся в
концентратах трех видов fc,, А^, fcj, причем концентрат fc] содержит продукты П], П2, П3, П4.
П5 в пропорциях 3:1:0:1:0, концентрат к^ — в пропорциях 1:1:2:1:1, концентрат к% —
1 :0:1 :0 : 2, цены концентратов соответственно 0, 5; 0, 9, 0, 7 рублей за килограмм. Сколько
нужно в сутки покупать концентратов, чтобы необходимый суточный рацион был наиболее
дешевым?
5. Показать, что множество X = {х = (х',..., я6) ^0: х + 4х2 — 5х - 5х4 — Зх5 — х = 2,
-4х1+4х2-12х3-2х5+2х6 = 2, х' +2х2-3х3+3х4 + х5 + х6 = 1} состоит из единственной
точки. Указание: применить метод искусственного базиса, выбрав в начальной симплекс-
таблице разрешающий элемент из столбца х2 с помощью лексикографического правила (3.48).
6. Множество X задано условиями: х=(х ,..., х )^0: х'-2х +х3=1, х'-2х +2х3+х4 =
= 1, х'-2х2+2х3+2х4-хй=1, х'-2х2+2х3+2х4-2х5+х6=1, х'+ж2+х3+х4+х5+х6 = 1.
Симплекс-методом решите задачу /(х)=(с, х) —»inf, х е X при различных сей6и убедитесь,
что минимум достигается в одной и той же точке множества X. Объясните это явление.
7. Примените симплекс-метод к основной задаче (1.21) с вектором Ъ ^0,'сведя ее к
канонической задаче (1.23). Указание: сравните системы (1.22) и (3) и найдите угловую точку
множества Z задачи (1.23).
8. Обобщить симплекс-метод на задачу; /(х) = (с, х) —»inf; х е X — {х е Еп\ х ^ 0, Ах —
= Ь, ai < х1 < ft, г = 1,..., п}, где а;, ft заданные величины,;»; < ft (возможно, некоторые
а( = —оо и некоторые ft- =,+оо) [775].
9. Пользуясь упражнением 8, рассмотреть задачи из упражнений 1 -3 при дополнительных
ограничениях 0 < хг < 2.
§ 4. ПОИСК НАЧАЛЬНОЙ УГЛОВОЙ ТОЧКИ
137
§ 5. Условие разрешимости задач линейного
программирования. Теоремы двойственности
Будем рассматривать общую задачу линейного программирования:
f(x) = (c,x) = (cl,xl) + (c2,x2)-*mi, х = (х1,х2)еХ, (1)
X = {х = (х1,х2): 05, еЕ^, х2еЕп*,
АпХх + АХ2Х2 ^ О], А2ХХХ + А22Х2 = 02, 05,^0}, (2)
где Ац — матрицы размера т{ х п., с}. е Еп>, bt е Ет>, г, j = 1, 2. Как и
выше, будем обозначать /„ = inf f(x), подразумевая при этом, что X ф
х€ X
Ф 0. Для случая, когда ft > —оо, введем множество Х^ = {х е X: f(x) =
= /„}. Напоминаем, что задача (1), (2) называется разрешимой, если Х,ф(д;
каждую точку xt е Xt называют решением этой задачи.
1. Приведем теорему существования решения задачи (1), (2), которая
дополняет теоремы Веиерштрасса из § 2.1 и характеризует специфику задач
линейного программирования.
Теорема 1. Задача (1), (2) разрешима тогда и только тогда, когда
X ф0 и целевая функция f(x) ограничена снизу на X, т. е. ft > —оо.
Нетрудно видеть, что для нелинейных задач такая теорема неверна.
Например, задача: f(x) = е~х ->inf, хеХ = {хеЕ1: х^О} не имеет решения,
хотя и /„ = 0 > —оо.
Доказательство. Необходимость очевидна, так как условие
Х^ф0 предполагает, что X ф 0 и ft > -оо. Докажем достаточность.
Пусть X Ф 0, /„ > -оо. Покажем, что тогда Xt ф 0. Пользуясь
конструкциями теоремы 1.1, задачу (1), (2) запишем в канонической форме:
f(x) = (с, х) -»inf, хеХ = {хеЕп: Ах = Ь, х^О}, (3)
при этом с е Еп, Ь е Ет, А —матрица размера mxn.C этой целью
положим (см. § 1)
x2 = zl—z2, 2, = max{0;:%}, z2 = max{0;—:%}, v = 6, — Aux{ — Апх<1^
и в пространстве переменных w = (х{, г,, %, г;) е Еч, q = n, + 2^+ т,,
рассмотрим задачу:
g(w) = (с,, z,) + (¾. г,) + (-¾. г2) + (0, «) -> inf, ад G W, (4)
W = {w е Е": w ^ 0, ^,,2:,+^,2^,+(-^,2)^2 + /^^ = 6,,
^21^1 + ^22^1 + (-^22)^2 + 0^ = ¾}. (5)
где I —единичная матрица размера т, х т,. Задача (4) ,(5) совпадает с
задачей (3), если принять с = (с,, ^ —с2, 0) е Еп,
ь = (Ь,Л)еЯт, ^ = (1"' I'2' "I'2' 'о1)
\Л2П Л22) —л22) и /
— матрица размера тхп, где m = m, + 77¾. n = q = n, + 2¾ + m,. Согласно
теореме 1.1 изХ^0, /»> -оо следует, что W Ф 0, & = inf g(w) > -00.
138 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Тогда по теореме 4.3, примененной к канонической задаче (4), (5),
множество Wt = {w G W: g(w) = gt} ф0. Возьмем произвольную точку гц, =
= (хи, zu, z2t, vt) е Wt. В силу теоремы 1.1 тогда точка xt = (хи, :% = zu -
— z2t)— решение задачи (1), (2), т. е. Х^ф0. Теорема 1 доказана. □
Следствие 1. Задача максимизации
(d, х) ->sup, хе X
имеет решение тогда и только тогда, когда X ф 0 и функция (d, х)
ограничена сверху на X.
Для того, чтобы убедиться в справедливости этого утверждения,
достаточно заметить, что такая задача максимизации равносильна задаче (1), (2)
с с = —d, и воспользоваться теоремой 1.
2. Прежде чем переходить к изложению так называемых теорем
двойственности, докажем несколько важных лемм.
Лемма 1. Для того чтобы некоторая точка xt из множества
X была решением канонической задачи (3), т. е. xt е Х^, необходимо и
достаточно существования точки A* = (Aj1,..., А^) е Ет такой, что
АТУ + с>0, (c,xt) = -(b,\*), (6)
где АТ —матрица, полученная транспонированием матрицы. А.
Доказательство. Необходимость. Возьмем произвольную
точку xt е Xt, Покажем, что тогда необходимо существует точка А* е Ет
со свойствами (6).
Сначала рассмотрим случай т= г = rangA. Применим к задаче (3)
симплекс-метод с антициклином. По условию f(xj = ft > — ос, поэтому
симплекс-процесс закончится обнаружением некоторой угловой точки vt
множества X с базисом В = (А3-,..., Ау), f{vt) — ft, причем будут
выполняться неравенства (3.32):
Ак = (с,В-'Ак)-ск^0, А = 1,2,...,п; с = (с\ ...., с*). (7)
Положим А* = — (В~1)Тс. Пользуясь известным из линейной алгебры
тождеством {Мх, у) = (ж, Мту), справедливым для любых xeRn, ye Em и любых
матриц М размера m х п, из (7) имеем
0^А4 = ((В-')тс,А4)-с* = -(А*,А4)-с*, Л = 1,2,..., п.
В векторной форме эти неравенства можно записать так: АтА* + с^0.
Далее вспомним, что у угловой точки vt базисные координаты vt = (vp,...
..., у}') = B~lb, а небазисные координаты равны нулю. Поэтому
(с, xt) = Л = (с, „,) = (с, «,) = (с, В-Щ = <(£М)тс, Ь) = -(6, А*).
Таким образом, искомая точка А* со свойствами (6) найдена. Случай
т = г = rangA рассмотрен. Пусть теперь т> г = rangA. Тогда в системе
уравнений Ах = Ь, которую можем записать в виде (аи х) = Ь\ г = 1,..., т,
где о,- — строки матрицы А, имеются ровно г линейно независимых
уравнений. Перенумеровав уравнения, можем считать, что первые г
уравнений этой системы линейно независимы, а остальные уравнения с
номерами г=г+1,..., т, линейно выражаются через первые, базисные уравнения
г = 1,..., г. Удаление линейно зависимых уравнений приведет к равносиль-
§ 5. УСЛОВИЕ РАЗРЕШИМОСТИ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ 139
ной системе Ах = Ь, где А — матрица, состоящая из строк аи <%,..., аг
матрицы А, Ь = (б1,..., Ьг), и задача (3) сведется к равносильной
канонической задаче:
f(x) = (с, х) -» inf, хеХ = {х^0; Ах = Ь}.
В этой задаче число уравнений равно г = rangA, и по доказанному
существует точка А = (А|",..., A*) G Ег такая, что
АТГ + с^0, (с, ¢,) = -(6, Г). (8)
Определим точку А* = (А*, 0)е Ет, полученную добавлением к координатам
А нулевых координат А* + 1 =0,..., А^ = 0. Тогда из (8) следует, что АТА*+
+ с ^ 0„ (с,,х±)> = — (6, А*). Необходимость доказана.
Достаточность. Пусть для каких-либо точек х^е X, А* е Ет
выполнены соотношения (6). Тогда для всех х е X имеем
0 < (х, АТХ* + с) = (с, х) + (Ах, А*) = (с, х) + (6, А*) = (сгх) - (с, xt).
Это значит, что xt е Х^. Лемма 1 доказана. □
Лемму 1 нетрудно обобщить на случай общей задачи линейного
программирования (1), (2).
' Лемма 2. Для того чтобы некоторая точка xt = (хи,:%) из
множества (2) была решением задачи (1), (2), необходимо и достаточно,
чтобы существовала точка X* = (AJ", А2), Х*х е Ет<, А2 б Е""2 такая, что
AJxX*x+AJxX*2 + cx>0, AJ2X*x+AJ2X*2 + c2 = 0, А*>0, (9)
<с„ хи) + (¾. x2t) = -<Ь„ At) - (62) А2*), (10)
где AJj —матрица, полученная транспонированием матрицы Ац.
Доказательство. Возьмем произвольную точку xt — (хи, х2 ) е Xt.
(5), заключаем, что это возможно тогда и только тогда, когда существует
точка Х* = (Х*Х,Х*2), А*е£"\ Х2еЁщ, такая, что
АТХ* + С
Ат
т
А^ ~А^
М2
А1
+
Ау*1 + -^21^2 + С[
>о,
I о
ft=gt=9(4)=(c\, ^,.)+(¾. ^)+(-¾. %*Ж°> «*>=-(fy» МНЬ2> AJ).
Учитывая, что :% = zu — гъ, эти соотношения нетрудно переписать в
равносильном виде (9), (10). Лемма 2 доказана. □
С задачей (1), (2) тесно связана следующая задача линейного
программирования:
^(А) = ~(Ь„ А,> - <&,, А2> -* sup, А=(А„А2).еЛ,.. (И)
Л = {А=(А„А2):ХхеЕт>, А2 G _Е"\
AjxXx + AJxX2 + cx>0, АТ2А1+А2т2А2 + с2 = 0, А,>0}. (12)
140
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Задача (11), (12) называется двойственной задачей по отношению к
исходной задаче (1), (2), переменные А =(А,, А2) называются двойственными
переменными по отношению к исходным переменным х = (ж,, :%). Будем
обозначать гр* = supчр(А), Л* = {А еЛ: ip(\) = ip*}. Как видим, двойствен-
ЛеЛ
ная задача (11), (12) однозначно определяется по элементам с,, с^, &,, Ь2,
Ахх, АХ2, А2Х, А22 исходной задачи (1), (2).
Лемма 3. Если в задачах (1), (2) и (11), (12) множества X и А
непусты, то величины f'„ = mlf(x), /ф* = &иуф(\) конечны и
</>*</*• (13)
Доказательство. Возьмем произвольные хЕ. X, АеЛ. Тогда
справедлива следующая цепочка неравенств, вытекающая из определений (2)
и (12) множеств X и Л:
f(x) - ф(Х) = (с,, ж,) + (с2, :%) + (Ь„ А,) + (62, А2) >
^ \с1> Ж]) + (Cg, 0½) + (А]]^ + АХ2Х2, А,) + (-42i^i + -^22¾) А2) =
= (с, + AJXА, + А2Т,А2) в,) + (¾ + АТД, + А2Т2А2) 3¾) ^ 0. (14)
Таким образом,
/(х)^ф(\), WxeX, АеЛ. (15)
Последовательно переходя в неравенстве (15) сначала к нижней грани по
х е X, затем к верхней грани по А еЛ, убеждаемся, что величины /„, ф*
конечны и удовлетворяют неравенству (13). Лемма 3 доказана. □
Выясним, как выглядит задача, двойственная по отношению к
двойственной задаче (11), (12). Замечательно, что эта задача, оказывается, с
точностью до эквивалентной формы совпадает с исходной задачей (1), (2).
Чтобы убедиться в этом, перепишем задачу (11), (12) в равносильном виде,
как задачу минимизации:
-V(A) = (bMA,) + (b„A2)-*lnf, АеЛ,
Л = {А=(А„А2):А,е^1 А2еЯ"\ (-AJX)\X + (-AJx)X2 <с„ (16)
(-АТ)Л1 + (-А2т2)А2 = с2) А,^0},
по форме совпадающей с исходной задачей (1), (2), и затем, пользуясь тем
же правилом, с помощью которого была сконструирована двойственная
задача (11), (12) на основе исходной задачи (1), (2), составим двойственную
к (13) задачу. Обозначив двойственные к A =^, А2) переменные через
х =(хх, а^), придем к следующей задаче:
-(0,,2:,)-(¾. 0¾)-» sup, х = (хх,х2)еМ,
М={х=(хх, х2): z,e.E\ х2еЕ^, (^-AJxyxx+(-AJ2)Tx2+bx^0, (17)
{-AJxfxx + {-AJ2fx2 + b2 = 0, xx > 0},
являющейся двойственной по отношению к задаче (16). Так как (—АТ-)Т =
= —Ai., г, j = 1, 2, то нетрудно видеть, что М = Х и задача (17) равносильна
задаче (1), (2). Таким образом, с учетом сделанных эквивалентных
переходов от задачи (11), (12) к задаче (16), от (17) к (1), (2), можем сказать, что
задача, двойственная по отношению к двойственной задаче (11), (12),
совпадает с исходной задачей (1), (2), и, следовательно, задачи (1), (2) и (11),
(12) образуют пару взаимодвойственных задач. Оказывается, параллельное
изучение взаимодвойственных задач способствует более глубокому понима-
§ 5. УСЛОВИЕ РАЗРЕШИМОСТИ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ 141
нию природы этих задач, оказывается полезным при разработке методов
их решения, обогащает теорию линейного программирования. Связь между
взаимодвойственными задачами (1), (2) и (11), (12) отражена в следующих
теоремах, называемых теоремами двойственности.
Теорема 2. Задача (1), (2) имеет решение тогда и только тогда,
когда имеет решение двойственная к ней задача (11), (12). Иначе
говоря, взаимодвойственные задачи линейного программирования либо обе
одновременно разрешимы, либо ни одна из них не имеет решения.
Если задачи (1), (2) и (11), (12) разрешимы, то значения их экстремумов
совпадают, т. е.
/, = </>*• (18)
Доказательство. Пусть задача (1), (2) имеет решение, т. е. Xt Ф 0.
Возьмем произвольную точку xt е Xt. Согласно лемме 2 тогда
существует точка А*еЛ, для которой справедливо равенство (10). Таким образом,
Аф0, и, кроме того, /, — f(xt) = ф(Х*) < ф*. Отсюда и из (13) следует
ft —/(х) = ф(Х*) = ф*, т. е. Л*еЛ*. Таким образом, из разрешимости
задачи (1), (2) следует разрешимость двойственной к ней задачи (11), (12). Так
как задача (1), (2) в свою очередь является двойственной к двойственной
задаче (11), (12), то из разрешимости задачи (11), (12) следует разрешимость
задачи (1), (2), причем ф* — ft. Теорема 2 доказана. □
Теорема 3. Взаимодвойственные задачи (1), (2) и (11), (12) имеют
решение тогда и только тогда, когда существуют точки xt = {xu,:%),
А* = (Лj, Лг) такие, что
х,еХ, А*еЛ, f(x,) = 1>(\*). (19)
Соотношения (19) справедливы, для всех точек xt е Xt, А* еЛ* и только
для них.
Доказательство. Необходимость. Пусть задачи (1), (2)
и (11), (12) разрешимы, т. е. Xt ф 0, А* ф 0. Возьмем любые точки xt е Xt,
УеК. Это означает, чтоа^еХ,, f(xt) = ft, Х*еА*, ф(Х*) = ф*. Но согласно
теореме 2 тогда ft = ф*, поэтому /(¾) = ф(Х*). Таким образом, в качестве
точек х„ А*, удовлетворяющих условиям (19), можно взять любые точки из
множеств Xt, Л*.
Достаточность. Пусть для каких-то точек xt = (жи, %), Л* =
= (Лр XI) выполняются соотношения (19). Это значит, что множества X и
Л непусты и по лемме 3 тогда ft > -оо, ф* < +оо. Отсюда, из теоремы 1 и
следствия к ней следует, что задачи (1), (2) и (11), (12) разрешимы, т. е.
Xt ф0, Л* ф 0. Согласно теореме 2 тогда /„ = ф*. Отсюда и из (19) имеем
Л ^ f(x*) — Ф(^*) ^ Ф* ~ /*• Это значит, что все неравенства здесь
обращаются *в равенства, т. е. f(xt) = ft, ф(Х*) = ф* и, следовательно, xt eXt,
X* е Л*. Теорема 3 доказана. □
Замечание. Условия (19) равносильны условиям
xt€X, А*еЛ, 1(х,)^ф(У). (20)
В самом деле, совмещая неравенство из (20) с неравенством (15) при x = xt,
X = Л*, приходим к равенству f(xj = ф(Х*).
Теорема 4. Взаимодвойственные задачи{\), (2) а (11), (12) имеют
решение тогда и только тогда, когда существуют точки xt — (xu,:%),
Л* —(Л^Лг) такие, что
xt€X, А*еЛ, xUAJlX\ + AJlX*2 + ciy = 0, j = 1,..., п,,
(л*)Ч^-^п%-^12^)' = о» * = i,...,"v
142 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Соотношения (21) справедливы для всех точек xteXt, A* G Л* и только
для них.
Равенства из (21) называются условиями дополняющей нежесткости
(ср. с аналогичными условиями из § 2.3, теорема 2).
Доказательство. Необходимость. Пусть задачи (1), (2)
и (11), (12) имеют решение. Согласно теореме 3 тогда условия (19)
справедливы при всех x^eXt, А*еЛ*. В частности, f(xt)—ip(А*)=0. Отсюда и
из (14) заключаем, что при x=xt, А=А* все неравенства в (14) обращаются
в равенство, что с учетом ограничений (2), (12) возможно только при
(AJxyx+Aiy2 + cx,xu) = j:{Al\\ + Alxy2 + cxyxi = 0. (22)
3 = 1
В силу (2), (12) каждое слагаемое в сумме (22) неотрицательно. Поэто"
му из (22) следуют первые равенства (21). Для доказательства остальных
равенств (21) воспользуемся неравенствами
f(x) -ф(\) = (сх, хх) + (с2, :%) + (ЪХ,\Х) + (Ъ2, А2) ^
> (—-А | j A J — А21А2, хх) + (—А12А, — А22А2, :%) +
+ (ьи А,) + {Ь2, А2) = (6, - Ахххх - А^, А,) +
+ (Ь2-А2Хх1-А22х2,\2)^0 ЧхеХ, УАеЛ, (23)
аналогичными (14) и также вытекающими из определений (2), (12)
множеств X, Л. Из (23) при х = xt, А = А* с учетом равенства (19) имеем
щ
(Ьх - Ахххи - АхА, Х*х) = J2(bx- Ахххи - А12ХъУ{\1У =,0. (24)
Из неотрицательности каждого слагаемого в сумме (24) следует вторая
группа равенств (21).
Достаточность. Пусть для каких-то точек xt — (хи, :%), А* =
= (АрА2) выполнены условия (21). Тогда для них справедливы
равенства (22), (24). Отсюда и из (2), (12), следует, что в (23) при х =.xt, А = А*
все неравенства обращаются в равенства и, следовательно, f(xt) — ф(У).
Таким образом, точки xt, У удовлетворяют условиям (19). Согласно
теореме 3 тогда xt е Xt, А* е Л*. Теорема 4 доказана. □
Покажем, что двойственные переменные в задачах линейного
программирования можно истолковать как обобщение понятия множителей Лагранжа,
используемых в классическом анализе при исследовании задач на условный
экстремум, см. гл. 2. Введем функцию
L(x,\)=(cx,xx)+(c2,x2}+(\x,Axxxx+AX2x2-bx)+(X2,A2Xxx+A22x2-b2) (25)
переменных х — (хх, :%) е Х0 = {х = (хх,:%): хх G Е"1, ¾ G Е"2, хх ^ 0}, А =
= (А„А2)еЛо ={А = (А,,А2): А,е^, А2 € Я™», А,^0}. Эта функция
называется функцией Лагранжа задачи (1), (2), переменные А =(А1,А2)
называются множителями Лагранжа, причем А, ^ 0 — множители,
соответствующие ограничениям типа неравенств в определении множества (2),
А2 — множители, соответствующие ограничениям типа равенств. Пользуясь
тождеством {А^хр А{) = (ж-, АТ}\{), функцию (25) можно записать в виде
L(x, А) = (-Ь„ А,) + (-Ь2) А2) + (a;,, AJXXX + AJX\2 + сх) +
+ (x2,AJ2\x + AJ2\2 + c2), хеХ0, АеЛ0. (26)
§ 5. УСЛОВИЕ РАЗРЕШИМОСТИ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ 143
Определение 1. Точка (xt, Х*)еХ0хА0 называется седловой точкой
функции Лагранжа, если
L(xt,X)^L(xt,X*)^L(x,X*) VxeX0, VA G Л0. (27)
Теорема 5. Взаимодвойственные задачи (1), (2) и (11), (12) имеют
решение тогда и только тогда, когда существуют точки xt = (xu, av)6
еХ0, А* = (Ар А^еЛд, образующие седловую точку (xt, А*) функции
Лагранжа. Точка (ж+, А ) е Х0 х Л0 будет седловой точкой тогда и только
тогда, когда xt е Xt, А* 6 Л*, т. е. множество седловых точек функции
Лагранжа совпадает со множеством Xt хЛ*. Справедливы равенства
L(xt1X*) = ft = f(xt) = i>(X*) = i>* У(^,А*)е^хЛ*. "(28)
Доказательство. Необходимость. Пусть задачи (1), (2)
и (11), (12) имеют решение. Возьмем произвольную точку (xt, У), где xte.
G Xt, А* еЛ*. Согласно теоремам 2-4 тогда
f(xt) = i>(X*) = ft = r, (xt,AJlX\ + A?lX*a +^)=0,
(А,, о, — Axlxu — Al2x2t) = 0;
кроме того A2lxu + A22x2t = b2, AJ2X\ + AJ2X*2 + cx =0 по определению
множеств X, Л. С учетом перечисленных равенств из (25), (26) при х = xt,
А = А* получим равенства (28). Кроме того, из (26) при А = А* имеем:
L(x, Х*) = ф(Х*) + (ж,, AJXX*X + AJXX2 + с,) \/х е Х0. Отсюда и из уже
доказанных равенств (28) следует
L(z, A*) -L(xt, X*) = (xv AJXX*X + AJXX*2 + с,) ^ 0 Ух е Х0.
Правое неравенство (27) доказано. Далее, из (25) при х = xt имеем
L(xt, X) = f(xt) + (X,,Axxxu + AX2x2t-bx) VA еЛ0. Отсюда и из (28) следует
левое неравенство (27)
L(xt,X*)-L(xt,X) = (Xl,bl-Allxu-Al2xlt)Z0 УАеЛ0.
Тем самым установлено, что любая точка (ж+, X*)eXt хЛ* является седловой
точкой функции Лагранжа.
Достаточность. Пусть (xt, X*)eXt хЛ* — какая-либо седловая
точка функции (25). Покажем, что тогда xt е Xt, X* еЛ*, т. е. задачи (1), (2)
и (11), (12) разрешимы. С учетом представлений (25), (26) функции
Лагранжа перепишем неравенства (27) в развернутом виде
f(x*) + <А'„ Апхи + А12х^ -6,) + (А2, А2Ххи + A22X2t - Ь2) ^
< L(xt, У) ^ ф(У) + (хх, AJXX*X + AJXX*2 + сх) +
+ (x2,AJ2X*x+AJ2X*2+c2) ЧхеХ0, VAeA0. (29)
Точка A = (A ,=0, А2 = t(A2Xxu+A22x2t-b2))eA0 Vi еЕ. Подставив эту
точку в (29), из левого неравенства имеем: t\A2Xxu + А22х^ — b2\2 ^L(xt, А*) —
— f(xt) Vt G Е. Разделим обе части этого неравенства на t, считая t >0, и
устремим t —> +оо. Получим \A2Xxu + A22x2t — 6,|2 ^ 0, что возможно только
при A2XxXt + A22x2t = Ь2. Далее, положим в (29) A = (ХХ = (0,..., 0, А(, 0,...
..., 0), А2 = 0), считая Х\ ^0. Получим А\(Аххх.^ + Al2x2t-bl)i ^.L(x^, X*) —
— f(xt) VAj ^ 0. Разделим это неравенство на А^ > 0 и устремим Aj —> +оо.
144 Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Будем иметь (A,lxu + Al2x2t — bx){ < 0 при каждом г = 1,..., п,, т. е.
Апхи + А12^ < Ь,. Следовательно, xteX. Аналогичными рассуждениями,
полагая в (29) ж = (ж,=0, x2 = t(AJ2\\+A2x2\*2+c2)), Vt еШ, и ж = (ж,=(0,...
..., О, ж/, 0,..., 0), ^2 = 0), ж/ >0, устанавливаем, что А*еЛ. Таким образом,
показано, что всякая седловая точка (ж„,А*) функции (25) принадлежит
X х Л. Наконец, положив в (29) ж = (ж, = 0, х2 = 0), Л = (А, = 0, Л2 = 0),
получим /(жн,)<Ь(ж+, Л*)< ф(л*). С Другой стороны для точек xteX, А* еЛ
справедливо неравенство (17): /(х^)^ф(\*). Следовательно, f(xj = ip(\*).
Это значит, что точки ж+, А* удовлетворяют всем условиям (19). В силу
теоремы 3 тогда xt е Xt, А* е Л*. Тем самым показано, что все седловые
точки функции Лагранжа принадлежат множеству Xt х Л*. С другой стороны,
выше было установлено, что каждая точка из Xt х Л* является седловой.
Следовательно, множество седловых точек функции Лагранжа задачи (1),
(2) совпадает со множеством Xt х Л*. Теорема 5 доказана. □
В следующей теореме вопросы разрешимости и неразрешимости
взаимодвойственных задач обсуждаются в терминах пустоты или непустоты
множеств X, А. Предварительно отметим, что согласно теореме 1 и следствия к
ней неразрешимость задачи (1), (2) означает, что либо X = 0, либо X ф0,
но ft = — оо, а для двойственной задачи (11), (12) неразрешимость
равносильна тому, что либо Л = 0, либо Л Ф 0, но ф* = +оо.
Теорема 6. Справедливы следующие утверждения а)—г):
а) взаимодвойственные задачи (1), (2) и (11), (12) разрешимы тогда
и только тогда, когда множества X и А непусты одновременно;
б) в задаче (1), (2) X ф0, /„ > —оо тогда и только тогда, когда в
задаче (11), (12) Лф0, ф* < +оо;
в) если в задаче (1), (2) X ф0, /„ = — оо, то в двойственной
задаче (11), (12) Л = 0; обратно: если Аф0, ф* — +оо, то X = 0;
г) если в задаче (1), (2) X ф0, а в задаче (11), (12) Л = 0, то j't = -со;
обратно: если X =0, Аф0, то ф* — +оо.
Доказательство, а) если задачи (1), (2) и Г11), (12) разрешимы,
то, конечно, X ф0, Аф0. Обратно, если X ф0, Аф0, то из леммы 3
следует, что ft > —оо, ф* < +оо, и разрешимость задач (1), (2) и (11), (12)
вытекает из теоремы 1 и следствия к ней.
б) Пусть в задаче (1), (2) X ф0, ft> -оо. Тогда согласно теореме 1
задача (1), (2) разрешима, а по теореме 2 разрешима и двойственная
задача (11), (12), т. е. Аф0, ф*<+оо. Обратно: изЛ^0. ф* <+оо следует
разрешимость задачи (11), (12), поэтому разрешима и двойственная к ней
задача (1), (2), так что X ф0, ft> -оо.
в) Это утверждение легко доказывается рассуждениями от противного.
Пусть X ф0, ft = -оо, но Лф0. Согласно утверждению б) тогда обе
задачи (1), (2) и (11), (12) имеют решение и /„>—оо, что противоречит условию.
Аналогично доказывается, что если Аф0, ф* = +оо, то X = 0.
г) Пусть X ф 0, А — 0, но /„ > -оо. Тогда в силу утверждения а) Л ф 0,
ф* < +оо, что противоречит условию Л = 0. Аналогично убеждаемся, что
если X = 0, Аф0, то ф* = +О0. Теорема 6 доказана. □
Следующий пример показывает, что возможен случай, когда во
взаимодвойственных задачах (1), (2) и (11), (12) оба множества X и Л пусты.
Пример 1. Исходная задача: /(ж) = ж1 — 2ж2 —> inf, ж е X = {ж —
= (ж , ж2)^0: ж1 — ж2 = 1, ж1 — ж2 = 2}. Двойственная задача: ф(Х) = — А' —
-2A2->sup, А еЛ = {А =(А!, А2): А' + А2^-1, А! + А2<-2}. Ясно, что
X = 0, А = 0.
§ 5. УСЛОВИЕ РАЗРЕШИМОСТИ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ 145
Задачи линейного программирования с противоречивыми условиями,
когда X = 0 или Л = 0, изучались в [49; 297; 298; 644]. Приведенные выше
теоремы двойственности часто позволяют получить содержательную
информацию о рассматриваемой задаче линейного программирования, иногда на
этом пути удается провести полное исследование задачи и даже получить
ее решение. Для иллюстрации рассмотрим задачу линейного
программирования, не содержащую ограничения типа неравенств.
Пример 2. Рассмотрим задачу
/(ж) = (с, ж)->inf, хеХ = {хеЕп: Ax = b},
где А — матрица размера тхп, се Еп, Ь е Ет. Эта задача является
частным случаем задачи (1), (2), когда п, — О, 9¾ = n, m, = 0, т2 = т, А22 = А,
Ь2 = Ь, матрицы Ахх, АХ2, А2Х, Ьх отсутствуют. Двойственной к ней является
задача:
V»(A) = -(b,A)-*sup, ЛеЛ = {Л еЕт: АтА+с = 0}.
Если X ф 0, /„ > —оо, то, согласно теореме 6, Л Ф 0, ф* < +оо и,
следовательно, вектор с представим в виде с=—АТ\0, где Л0 еЛ. Но тогда
/(ж) = (с, ж) = -(АТЛ0, ж) = -(А0, Ах) = -(А0, Ь) = const
при всех ж е X, так что Xt = X. Аналогично, если ¾ G -X", то Ь — Ах0 и
ф(\) = -(Ь, A) = -(Axq, A) = -(¾) АТХ) = (хд, с) = const VA е Л, так что
■ф* = (¾) с) =/„, Л* =Л. Как видим, задачи линейного программирования без
ограничений типа неравенств малосодержательны и большого интереса не
представляют.
3. В заключение докажем еще одну теорему, известную в литературе
под названием теоремы Фаркаша. Эта теорема имеет важные приложения
в выпуклом анализе, в теории экстремальных задач и может быть легко
доказана на основе приведенных выше теорем двойственности.
Теорема 7. Пусть множества X, А определены согласно (2),
(12), X ф 0, пусть а —заданное число. Тогда для того чтобы /(ж) =
= (с,, жЛ + (¾) х^^а для всех х = (хих,)еХ, необходимо и достаточно,
чтобы Л Ф0 и существовала точка А = (А*и \*2) е Л такая, что ф(\*) —
=-{Ьх, \\) - (Ь2, У2) > а.
Доказательство. Необходимость. Пусть X ф0 и /(ж) ^ а
при всех ж е X. Тогда /„ = inf /(ж) ^ а> -оо и в силу теоремы 1 задача (1),
(2) имеет решение. Согласно теореме 2 двойственная задача (11), (12)
также будет разрешима, т. е. Аф0 и найдется точка А*еЛ, для которой
ф(У) = &\хрф(\) = ф* = 1^а.
Достаточность. Пусть X ф0, Аф0 и точка А* е Л такова, что
■г/>(А*)>а. Тогда с помощью неравенства (15) при А =А* имеем /(ж) ^
^ Ф(А*) > а при всех ж G X. Теорема 7 доказана. □
В приложениях чаще всего используется следующий частный вариант
теоремы Фаркаша.
Теорема 8. Пусть Аи А2 —матрицы размера тх х п, щ х п,
вектор с е Еп. Тогда для того чтобы (с, ж) ^ 0 при всех ж таких, что
Ахх :¾ 0, А2х = 0, необходимо и достаточно, чтобы существовала точка
A* = (At,AJ), AJeE™', At ^ 0, А^еЯ"1* /пшшя, ч/по
c = -ATAt-AJA2*. (30)
146
Гл. 3. ЭЛЕМЕНТЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ
Доказательство. Положим X = {х е Еп: А^х^.0, А2х = 0}, А =
= {А=(А,,А2): Х^еЕ™), \2еЕт\ А]\х +AJ\„ + с = 0}. Эти множества
являются частными случаями множеств X, А из (2), (12) при А,, = 0, АХ2 =
— Аи A2i =0, А22 — А2, 6, =0, Ь2 = 0, с, =0, (¾ = с. Здесь X f=0, так как
0е X. Отсюда и из теоремы 7 при а = 0 следует утверждение теоремы 8,
причем в качестве искомой точки А* = (Ар А£) можно взять любую точку
A* G Л. Попутно отметим, что здесь ф(Х) = 0 = -ф* = ft = /(0) ^ f(x) при
всех ж G X, A G Л, Л* = Л, а равенство (30) вытекает из принадлежности
точки А* множеству Л. Теорема 8 доказана. □
Другие теоремы двойственности для задач линейного программирования,
их обобщения на случай нелинейных экстремальных задач будут приведены
ниже в § 4.9, там же будет установлена связь между двойственными
переменными и множителями Лагранжа, объяснены некоторые тайны
происхождения двойственных задач. Различные методы решения задач линейного
программирования, основанные на теории двойственности, экономические
и игровые интерпретации этой теории, ее приложения к теории линейных
неравенств изложены, например, в [48; 49; 52; 76; 116; 203; 216; 231; 232;
259; 295; 297-299; 330; 356; 373; 470; 586; 612; 620; 670; 719; 746; 747;
750-752; 775; 776].
Упражнения
1. Напишите двойственные задачи к задачам из упражнения 1-4 к § § 3, 4 и решите их
симплекс-методом, преобразовав их при необходимости к каноническому виду.
2. Напишите двойственные задачи для канонической и основной задач (1.15) и (1.21).
Сформулируйте для них аналоги теорем 2-6.
3. Приведите примеры взаимодвойственных задач линейного программирования, в которых
множества решений Xt, Л* непусты и, кроме того, 1) оба эти множества состоят из
единственной точки; 2) оба содержат более одной точки и ограничены; 3) оба неограничены; 4) одно
из них состоит из единственной точки, другое ограничено и содержит более одной точки; 5)
одно из них состоит из единственной точки, другое неограничено; 6) оба множества содержат
более одной точки, но одно из них ограничено, другое неограничено.
4. Приведите примеры взаимодвойственных задач линейного программирования, в которых
реализуются случаи, описанные в утверждениях а)-г) теоремы 6.
5. В теореме 4 утверждается, что любые точки xt е X , Л* е Л* удовлетворяют условию
дополняющей нежесткости, т. е. в каждом из произведений ?21) хотя бы один из сомножителей
(возможно и оба) равны нулю. Доказать, что можно подобрать такие xt е Xt, А* еЛ*, когда
в каждом из произведений (21) лишь один сомножитель обращается в нуль (условие строгой
дополняющей нежесткости) (см. [670]).
6. Пусть в задаче (1), (2) Ьх = 0, Ь2 = 0, и пусть эта задача разрешима. Доказать, что тогда
/(0) = Д = ф* = 0. Указание: написать двойственную задачу и заметить, что ф(Х) = 0
УЛеЛ, ОеХ.
7. Доказать, что задача (1), (2) разрешима при любых с = (cj, с^), с, ей"", с2&ЕПг, тогда
и только тогда, когда множество (2) ограничено.
8. Пусть множества X, Л определены согласно (2), (12), пусть X ф0. Доказать, что тогда
совместна одна и только одна из систем: iel, f(x) < а или Л еЛ, ф(\) ^ а. Убедиться,
что это утверждение равносильно теореме Фаркаша. Указание: пользуясь
неравенством (17) и теоремой 7, показать, что эти системы не могут быть одновременно совместными
и одновременно несовместными.
9. Доказать, что совместна одна и только одна из следующих систем: уЦж^О, А2х = 0,
(с, х) <0 или Aj\x + А2Х2 + с = 0, Л] ^0 (обозначения см. в теореме 8). Убедиться, что это
утверждение равносильно теореме 8.
10. Доказать, что непустое множество (2) неограничено тогда и только тогда, когда
существует вектор сей"1"1""2, для которого inf (с, х) = —оо.
§ 5. УСЛОВИЕ РАЗРЕШИМОСТИ. ТЕОРЕМЫ ДВОЙСТВЕННОСТИ 147
11. Доказать, что множество X, определенное согласно (2), непусто тогда и только тогда,
когда (Ь,, А,) + (Ь2, А2)>0длявсех АеА = {А = (А,, А2): А,е£"\ А2е£"\ А,^0, AjxXx +
+ AL\2 >0, Aj2X, +Л22А2 = 0}. Указание: для задачи д(Х) = (6,, A,) + {h^, А2) —»inf,
А е Л написать двойственную задачу и воспользоваться теоремой 7.
12. Пусть множества X, Л взяты из упражнения 11. Доказать, что тогда совместна одна
и только одна из двух систем: х £ X или А е Л, (Ь|, А|) + (Ь2, А2) < 0. Убедиться, что это
утверждение равносильно утверждению из упражнения 11.
В следующих упражнениях приведены формулировки ряда важных теорем теории линейных
неравенств. Доказательства этих и других важных теорем из упомянутой теории читатель
найдет, например, в [48; 54; 752].
13. Пусть А —матрица размера т х п, Ъ ей™, Доказать, что совместна одна и только
одна из двух систем:
1) Ах ^ Ъ или (Ь, А) <0, АТХ = 0, А ^ 0 (теорема Александрова — Фана [54, стр. 75]);
2) Ах=Ь илиЛтА=0, (6, А) <0 [54, стр. 55, 74];
3) Ах=Ь, х^О или АтХ^0, (Ь, А)<0 (теорема Минковского — Фаркаша, [54, стр. 55, 74]).
14. Пусть At—матрица размера m; х n, b. е Em<, г~ 1,2,3; пусть система уЦх^&р
А2х = Ь2 совместна. Доказать, что тогда совместна одна и только одна из систем:
уЦж^Ь], А2х=Ь2, А3х < Ь3
или
AJ\1+AJx2 + AJ\3 = 0, <Ь,, А,> + <Ь2, А2> + <Ь3, А3> ^0, A, ^0, А3 >0, А3 ^0
(теорема Моцкина, [54, стр. 78]).
15. Пусть А —матрица размера тхп. Доказать, что совместна одна и только одна из двух
систем [54, стр. 79]:
1) Ах = 0, х^0, хфО или АТХ >0 (теорема Гордана);
2) Ах = 0, х > 0 или АТХ ^ 0, АТХ ф 0 (теорема Штимке);
3) Ах < 0, х ^ 0, х ф0 или АТХ > 0, А > 0 (теорема Билля);
4) Ах < 0, х > 0 или АТХ > 0, АТХ ф 0, А > 0.
ГЛАВА 4
Элементы выпуклого анализа
Прежде чем переходить к изложению численных методов решения задач, более сложных,
чем задачи линейного программирования, остановимся на элементах выпуклого анализа —
области математики, в которой изучаются свойства выпуклых множеств и выпуклых функций,
и которая играет фундаментальную роль в теории и методах решения экстремальных задач [5;
14; 15; 34; 48; 49; 54; 61; 83; 84; 106; 133; 186; 191; 204; 209; 225; 233; 264; 265; 278; 286:
295; 297; 314; 315; 358; 364; 366; 374; 446; 449; 471; 472; 499; 511; 543; 584; 587; 603-605,
613; 617; 636; 670; 683; 689; 735; 747; 767; 774; 785; 795; 798; 814].
§ 1. Выпуклые множества
1. Начнем с рассмотрения конкретных примеров выпуклых множеств.
Сначала напомним
Определение 1. Множество X называется выпуклым, если для
любых и, v G X точка иа =v + a(u — v) = au + {\ — a)v принадлежит X при
всех а, 0^ а ^ 1. Иначе говоря, множество X
выпукло, если отрезок [v, и] = {иа: иа =va(u — v), 0^ а ^ 1},
соединяющий любые две точки и, v из X целиком
лежит в X (рис. 4.1).
Все пространство Еп, очевидно, образует выпуклое
множество. Пустое множество и множество, состоя-
Рис. 4.1 щее из одной точки, удобно считать выпуклыми. Тогда
из определения 1 непосредственно следует, что пересечение любого
числа выпуклых множеств является выпуклым множеством. Приведем другие
примеры выпуклых множеств.
Пример 1. Шар
S(u0,R) = {u:ueEn,\u-uQ\^R} (1)
радиуса -R > 0 с центром в точке 1¾ является выпуклым множеством. В
самом деле, если и, v е S(uq, R), то, пользуясь неравенством треугольника,
имеем
\аи + (1- a)v — гь0\ = \а(и — 1¾) + (1 — a)(v — 1^)1 ^
^ ск|г* — г*о| + (1 — ск)|г; — г*о| ^ aR + (1 — a)R = R,
т. е. иа = аи + (1 — a)v G S(uq, R) для всех a G [0, 1].
Пример 2. Напомним, что гиперплоскостью в Еп называется
множество
Г = Г(С,7) = {и:иеЯп,<с,и> = 7}, (2)
где с = (с,,. .., сп)ф0) — вектор из Еп, j—действительное число. Это
множество всегда непусто: если, например, с. ф 0, то точка и§ с координатами
и{ = ^)с{, uj = 0 (j = 1,.. ., п, зфг) удовлетворяет равенству (с, и0) = 7, т. е.
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
149
1¾ G Г. Если и0 — какая-либо точка из Г, т. е. (с, Uq) = 7, то гиперплоскость
Г можно представить в виде
Г = Г(с, щ) = {и: и£ Еп, (с, и - щ) = 0}.
Напоминаем, что два вектора а,ЬеЕп называются ортогональными,
если (а, Ь) = 0. Предыдущее представление для Г означает, что гиперплоскость
состоит из тех и только тех точек и, для которых вектор и — щ ортогонален
вектору с. Вектор с называют нормальным вектором гиперплоскости Г.
Возьмем произвольные точки и, v£T, т. е. (с, и) = (с, v)=^. Тогда (с, аи+
+ (1 — a)v) = а {с, и) + (1 — а)(с, w) = 7 при всех a G [0, 1]. Следовательно,
Г — выпуклое множество.
Пример 3. Пусть Г = {и: (с, и) = 7} — некоторая гиперплоскость.
Тогда множества
Г+ = {и: (с, и) > 7}) Г"" = {и: (с, и) < 7}
называются открытыми полупространствами, а множества
Г = {и: (с, и)^7}» г = {«: (с, «) < 7}
называются замкнутыми полупространствами. Нетрудно видеть, что Г+,
Г", Г , Г —выпуклые множества. Например, если u,veT+, то (с, аи +
+ (1 — a)v) = а {с, и) + (1 — а)(с, v) > «7 + (1 — a)l = 7 Для всех а £ [0> !]•
Пример 4. Прямая и луч вй" (см. определение в § 2.1) — выпуклые
множества.
Пример 5. Важным примером выпуклого множества являются
аффинные множества (или линейные многообразия).
Определение 2. Множество М из Еп называется аффинным,
если аи + (1 — a)v G М при всех u,v£M, a G Е, т. е. прямая, проходящая
через любые две точки и, v е М, целиком лежит в М.
Все пространство i?n является аффинным множеством. Пустое
множество и множество, состоящее из одной точки, удобно считать
аффинными. Любое подпространство пространства Еп представляет собой аффинное
множество. Множество M — L +Uq, получаемое сдвигом подпространства
L на произвольный фиксированный вектор 1¾. также является аффинным.
Верно и обратное: всякое аффинное множество М может быть получено
сдвигом некоторого подпространства L на некоторый вектор щ. В самом
деле, возьмем произвольную точку u,GMh положим L =M — uq. Ясно, что
L — аффинное множество, причем 0 е L. Тогда для каждого и е L имеем
аи = аи + (1 — a)-0eL при всех а е Е. Кроме того, если u,v£L, то
(u + v)/2 = u/2 + (l - \/2)v GL и, следовательно, и + v = 2((u + v)/2) G L.
Таким образом, сумма двух векторов из L и произведение вектора из L на
любое число принадлежат L, т. е. L — подпространство.
Убедимся, что подпространство L = М — 1¾ не зависит от выбора точки
щ G М. В самом деле, пусть Lx — M — ux, где u, G М. Возьмем любую точку
и£ L. Поскольку и, — 1¾ G L, то и + (и, — 1¾) G L и, следовательно, u G L —
-(и, -u0) = (L +¾)-и, = М — и, =L,. Это значит, что L С L,. Обратное
включение L, С L доказывается совершенно так же. Следовательно, Lx—L.
Таким образом, всякое аффинное множество М из Еп представимо в виде
М = Ь+щ, (3)
где L — подпространство, однозначно определяемое множеством М, щ —
произвольная точка из М. Подпространство из этого представления
называют параллельным аффинному множеству М.
150
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Опираясь на полученное представление (3), можно дать алгебраическое
описание аффинных множеств на Еп. Поскольку всякое подпространство L
из Еп представимо в виде L ={u G Еп: Аи = 0} = {и G Еп: (aou) = 0,i =
= 1, ..., т\, где А — некоторая матрица размера т х п, а{ — г-я строка
матрицы А (например, в качестве векторов а;, i = 1,..., т, можно взять
базис ортогонального дополнения к L в Еп). Отсюда и из (3) следует, что
всякое аффинное множество изВ" может быть задано в виде
М = {и е Еп: Аи = 0} + щ = {и G Еп: и = щ + v, Av = 0} =
= {ие Еп: А(и - щ) = 0} = {и G Еп: Аи = 6} =
= {«€£?": <о4,«) = Ь„» = 1,...,т}, (4)
где 6 = Au0 = (61,..., 6т). Нетрудно проверить, что верно и обратное: всякое
множество вида (4) является аффинным. В самом деле, если и, v е М, т. е.
Аи = b, Av = 6, то А(аи + (1 — a)v) = аАи + (1 — а)Аг; = 6 или, иначе,
аи + (I — a)v е М при всех a G Е. Таким образом, множества вида (4) и
только они являются аффинными.
Согласно теореме Кронекера — Капелли [192; 351; 353] множество (4)
непусто тогда и только тогда, когда матрица А и расширенная матрица
В = (А, Ь) имеют один и тот же ранг. Если rangA < rangi? (например,
А = 0, b ф 0), то М — 0. Если А = 0, 6 = 0, тоМ = £°. Рассмотрим случай
А фО, rangA =rangi? = г. Тогда множество (4) состоит из тех и только тех
точек, которые представимы в виде [192; 351; 353]
п ~ г
и = щ+ J2 г.щ, (5)
где 'щ — какое-либо частное решение неоднородной системы линейных
алгебраических уравнений Аи — Ь, а и,,..., ип_г — линейно независимые
решения однородной системы Аи = 0; *,,.. ., tn_r — действительные числа.
Векторы u,,..., ип_г образуют базис подпространства
L ={иеЕп: Аи = 0} = {иеЕп: и = "Ц t{u{1tteR\,
так что dim L — размерность L и равна п — г. С помощью введенного
подпространства L равенство (5) можно переписать в виде М — и^ + L — мы
снова пришли к представлению (3).
Размерность аффинного множества М по определению принимается
равной размерности подпространства L, параллельного М. Таким образом,
размерность dim М аффинного множества (4) равна п — г, где г = rangA =
= rangi?. Аффинное множество размерности р часто называют
гиперплоскостью размерности р. В частности, если в (4), (5) г = п, то L = {0} и
М = {щ} состоят из одной точки и dim L — dim М = 0. Если г = п — 1, то
Mj = {и е Еп: и = Uq + tux, t е.Ш} — прямая (см. пример 4). Далее,
гиперплоскость (2) также является аффинным множеством: в этом случае в (4)
нужно принять А = с, 6 = 7- Поскольку с ф 0, то rangA = rang(A, 6)=1 и,
следовательно, гиперплоскость имеет размерность п — 1. Согласно (5)
тогда Г = МП_, = (ие£л: « = 1^,+ ][] ^и., t. GEj, где u,,..., un_, — базис
параллельного подпространства Ln_l = {иеЕп\ (с, u) = 0}. Как видим,
вектор с ортогонален к1„_, и является базисом ортогонального дополнения
к Ln_x до Еп, а векторы и,,..., п„_м с образуют базис в£".
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
151
Заметим, что пересечение любого числа аффинных множеств само
является аффинным множеством и, следовательно, представимо в виде (4).
Определение 3. Пересечение всех аффинных множеств,
содержащих множество X из Еп, называется аффинной оболочкой множества X
и обозначается через aiiX; подпространство L, параллельное aiiX,
называется несущим подпространством множества X и обозначается через
LinX.
Таким образом, aff X представляет собой минимальное аффинное
множество, содержащее X. Пользуясь (3)-(5), нетрудно показать, что:
1) aff X = 1¾ + Lin X, где 1¾ — произвольная точка из X;
2) если ОеХ, то affX=LinX;
3) и = v — w G Lin X для всех v, w G aff X, в частности, для v, w G X;
4) если d G Lin X, v G aff X, то и = v + ed G aff X при всех eel.
Определение 4. Размерностью произвольного множества X из
Еп называется размерность его аффинной оболочки; размерность
множества X обозначают А\тХ.
Согласно этому определению отрезок [и, v] = {ua = v-j-a(u—v), 0^ а ^ 1},
соединяющий две точки u,veEn (и^ v), имеет размерность 1, так как его
аффинной оболочкой является прямая Г={ги: w = v+t(u—v), — оо< t < оо}.
Размерность шара (1) равна п.
Пример 6. Предлагаем читателю самостоятельно доказать, что
множество
Х={х=(хи :%): ZjGЕ"1, х2€.Е^, Anxl+Al2x2^. 6,, A2lxl+A22x2=b2, хх ^0},
где А у — матрица размера mi х пр су е Еп', Ь{е Ет<, г, j = 1, 2 (см.
задачу (3.5.1), (3.5.2)), выпукло. Это множество называют многогранным
множеством или полиэдром.
Пример 7. Множество X = {и = (и\ . .., ип): а{ ^.и*^.(Зп г = 1,..., п},
где а;, /¾ — заданные величины, as < /¾ (возможно, что некоторые из at =оо
и некоторые из /3. = оо), выпукло и имеет размерность п. В частности,
неотрицательный ортант пространства Еп — это
множество Е" = {и: uGfi",u^0} — выпукло,
причем dim Е" = п. Если в определении множества X
величины аа /3. конечны при всех г = 1,..., п, то это
множество называют n-мерным параллелепипедом.
2. Выше было отмечено, что пересечение
любого числа выпуклых множеств выпукло. Нетрудно
видеть, что объединение двух выпуклых множеств,
вообще говоря, невыпукло (рис. 4.2). Посмотрим, как
влияют на выпуклость другие операции над
множествами: сложение, вычитание, умножение множества
на число, замыкание и т. п.
Определение 5. Суммой множеств А,,..., Ат называется мно-
т
жество A=Al+ ... +Ат= J^ А{, состоящее из тех и только тех точек а,
г = 1 т
которые представимы в виде а= J2 «,> гДе а» е -^-»■ * = !>•••> т. Разностью
t = i
двух множеств А и В называется множество С = А — В, состоящее из
тех и только тех точек с, которые представимы в виде с = а—Ь, ое А,
152
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Ь е В. Произведением множества А на действительное число А
называется множество В = \А, состоящее из всех точек вида Ь = Ха, ае А.
Теорема 1. Если A,,..., Ami А, В — выпуклые множества, то
множества С = Ах + ... + Ат, С — А — В, С = ХА выпуклы.
Доказательство. Проведем его, например, для множества С — А —
— В. Пусть с,, (¾ — произвольные точки из С = А — В. Это значит, что
существуют а{£ А, Ь{£ В такие, что ci—ai — bi (г = 1, 2). Из выпуклости А
и В следует, что аа = аа, + (1 — «)%£ A, ba = а&, + (1 — a)b<, е В при всех
ае[0, 1]. Тогда са — асх + (1-0:)¾ = а(а,-6j) + (1-а)(а2-62) = аа-Ьа, так
что саеС при всех a G [О, 1]. Выпуклость С = А — В доказана. Аналогично
доказывается выпуклость множеств С = Ах + ... + Ат и С = ХА. О
Определение 6. Замыканием множества X называется
множество, являющееся объединением множества X и всех_его предельных точек.
Замыкание множества X будем обозначать через X.
Для любой точки v и любого множества X из Еп имеет место одна и
только одна из следующих трех возможностей.
1. Найдется е-окрестность точки v, которая целиком принадлежит
множеству X —тогда точка v называется внутренней точкой множества X.
Совокупность всех внутренних точек множества X будем обозначать через
int X. Множество X, все точки которого являются внутренними, называют
открытым множеством.
Примером открытого множества является открытое полупространство из
примера 3.
2. Найдется е-окрестность точки v, которая не содержит ни одной точки
множества X — такая точка называется внешней по отношению ко
множеству X.
3. Любая е-окрестность точки v содержит как точки из X, так и точки
из Еп\Х —тогда точка v называется граничной точкой множества X.
Совокупность всех граничных точек множества X будем обозначать через
ГрХ.
Всякая внутренняя точка множества, очевидно, является его предельной
точкой. Однако не всякая граничная точка множества будет его предельной
точкой — исключение здесь составляют изолированные точки множества.
Точку v е X называют изолированной точкой этого множества, если
существует е-окрестность этой точки, не содержащая ни одной точки множества
X, отличной от v.
Таким образом, замыкание X множества X состоит, вообще говоря, из
точек четырех типов: 1) внутренние точки множества X; 2)
изолированные точки множества X; 3) предельные граничные точки множества X,
принадлежащие X; 4) предельные граничные точки множества X, не
принадлежащие X. Отсюда ясно, что замыкание любого множества является
замкнутым множеством.
Очевидно, выпуклое множество, содержащее не менее двух точек, не
может иметь изолированных точек.
Шар (1) замкнут и его замыкание состоит из внутренних точек
int 5(¾) R) = {и: \и - и0\ < R} и граничных точек Гр (щ, R) = {и: \и -
-Uo\ = R}. Множество X ={и = (х, у)е Е2: 0^ж^1,0^2/^1,а; + 2/<1}
выпукло, но не замкнуто — точки прямой х + у= 1 при 0^ х, у^. 1 являются
предельными граничными для X, но не принадлежат X; X = {и — (х, у):
0< х, у^. 1, х + 2/:¾ 1}. Множество X =Ju = (x, у)еЕ2: - 1 < х < 1, у = 0}
выпукло и не имеет внутренних точек; X = {и = (х, у): — 1 ^ х ^ 1, у = 0}.
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
153
Для любого аффинного множества М из Еп имеем М = М, так что М —
замкнутое множество: это видно, например, из представления (4)
аффинного множества; для множеств из примеров 6-8 также X = X. В частности,
aff X = aff X, откуда будет следовать, что aff X = aff X для любого
множества X из Еп.
Теорема 2. Если А — выпуклое множество, то его замыкание
тоже выпукло. _
Доказательство. Пусть а и Ь — произвольные точки множества А.
Поскольку выпуклое множество не имеет изолированных точек, то точки
а и b будут предельными для А. Тогда существуют последовательности
{ак}, {6Л е А, сходящиеся соответственно к а, Ь. Возьмем произвольные
а G [0, 1]. В силу выпуклости А тогда ск = аак + (1 — а)Ьк G А. Отсюда
при к —► оо получим lim ск = са = аа + (1 — а)Ь. Таким образом, точка са
является предельной для А и, следовательно, принадлежит А при любом
ае[0,1]. □
Теорема _3. Пусть X — выпуклое множество и int X ф0. Пусть
Uq е int X, v G X. Тогда va = v_+ а(и0 -v)e int X при всех а, 0 < а ^ 1.
Если uGint X, 2/^ int X, у£Х, то wx = и + Х(у- u)¢X при всех А > 1.
Доказательство. Поскольку точка 1¾ G int X, то найдется ее
6-окрестность 0(^, 8) = {и: |u-u0| < <5}, целиком принадлежащая X.
Сначала рассмотрим случай, когда v G X. Возьмем произвольное а, 0 < а < 1.
Рис. 4.3
Покажем, что окрестность 0(va, а6) = {и: \и-иа\< а6} точки va
принадлежит X. С этой целью возьмем произвольную точку и G 0(va, а6) и положим
а = «0 + (и- va)/a (рис. 4.3). Поскольку |a-uj= |и - wj/а < <5а/а = <5,
то aG 0(^, (5) С X. Из определения точки а имеем представление u = va +
+ a(a-u0) = v + a(uQ-v)+a(a-u0) = aa+(l-a)v, где a, veX иО<а <1.
Тогда и£1в силу выпуклости X. Тем самым показано, что произвольная
точка и из 0(va, аб) принадлежит X. Следовательно, 0(va, а6)сХ, т. е.
va — внутренняя точка X.
154
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Пусть теперь v е X \ X. Поскольку v — предельная точка X, то найдется
точка w е X такая, что \v — w\ < а(1 — а)'16. Возьмем точку гиа = го +
+ a(iL0 — w) (рис. 4.4). В силу только что доказанного точка w принадлежит
множеству X вместе со своей окрестностью 0(wa, а8). Но \va — wa\ = \v +
+ 0:(1¾ — v) — w — a(vq — w)\ =(1 — a)\v — w\ <(1 — a)a(l — a)'16 = aS.
Следовательно, va e 0(wa, аб) С X. Убедимся, что окрестность 0(va, (3)
(/9 = 6а — \va — wa\) точки va также принадлежит X. В самом деле, если
и ^ 0(va, /3), то \и - ги„| ^ \и - va\ + \va - wa\ < (3 + \va - wa\ = 8a, т. e.
0(va,(3)eO(wa,a6)eX.
Рис. 4.4
Наконец, пусть гиА =_и + \(у-и) (А > 1), где и е int X, у$. int X, у еХ.
Допустим, что wx е X при каком-либо А > 1. Из представления для гиА
имеем у = и + (гиА — и)/А = гиА + (1 — 1/А)(и — wx) = wx + а(и — wx), где
а = 1 — 1 /А е(0, 1), гиА eJ, uGint X. По доказанному выше тогда j/Gint X,
что противоречит условию. Следовательно, wx ¢. X при всех А > 1. □
Теорема 4. Если X — выпуклое множество, то int X тоже
выпукло.
Доказательство. Пусть u, v -*— произвольные точки из int X. В
теореме 3 было показано, что иа = аи+( 1—a)v£int X при всех а, 0<а < 1.
Это и означает выпуклость int X. О
3. В тех случаях, когда рассматриваемое множество X невыпукло, часто бывает полезно
расширить его до выпуклого множества. Посмотрим, как это делается.
Определение 7. Точка и называется выпуклой комбинацией точек и^,..., ит, если
существуют числа сех ^ 0 ат ^ 0, <*] + ...+ ат = 1 такие, что и = а,^ + ... + am«m.
Теорема 5. Множество выпукло тогда и только тогда, когда оно содержит все
выпуклые комбинации любого конечного числа своих точек.
Доказательство. Необходимость. Пусть X — выпуклое множество. Тогда
по определению 1 множество X содержит выпуклые комбинации любых двух своих точек.
Сделаем индуктивное предположение: пусть множество X содержит выпуклые комбинации
любых т— 1 своих точек. Рассмотрим выпуклую комбинацию ахщ+.. .+ атит произвольных
т точек из X. Можем считать, что а{ > 0, г = 1 т. Поскольку «, + ...+ otm = 1, то
т — I
О < а( < 1, i = l т. Следовательно, точка v = J2 a^l — am)" u( является выпуклой
i = l
комбинацией точек и, ит-\ и п0 предположению индукции принадлежит X. Однако
т — I ;
^ = (1-0 £ ^(1-ату1щ + атит = (1-am)v+amumeX вешу выпуклости X.
i = l
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
155
Достаточность. Если множество X содержит все выпуклые комбинации любого
конечного числа своих точек, то оно содержит, в частности, выпуклые комбинации любых двух
своих точек и, следовательно, выпукло. D
Определение 8. Пересечение всех выпуклых множеств, содержащих множество X,
называется выпуклой оболочкой множества X и обозначается через соХ.
Ясно, что соХ, как пересечение выпуклых множеств, является выпуклым множеством.
Кроме того, соХ содержится в любом выпуклом множестве, содержащем X. Так что со X —
это минимальное выпуклое множество, содержащее X.
Теорема 6. Выпуклая оболочка множества X состоит из тех и только тех
точек, которые являются выпуклой комбинацией конечного числа точек из X. Если X —
выпукло, то со Х = Х. '
Доказательство. Пусть W — множество всех точек, являющихся выпуклыми
комбинациями любого конечного числа точек из X. Нам надо показать, что соХ = W. Поскольку
X С со X и со X — выпуклое множество, то по теореме 5 со X содержит все выпуклые
комбинации точек из со X и, в частности, точек из X. Следовательно, W С со X.
Покажем, что W — выпуклое множество. В самом деле, пусть и, v е W, т. е. и = ах их + ...
■ ■ ■ + атит- ui^X- ai > °. t = 1, ■ ■ -, m, a, + .. . + am = 1, V = Р\Щ,+ • ■ ■ + Ppvp, v{ e X,
m p
/3;3*0, i = l p, /3, +... + /Зр = 1. Тогда ua=au + (\-a)v= £ aaiui + E (1 ~ °0/?jV
m p « = 1 3=1
где aat > 0, (1 - a)/3^. > 0, X) aai + E (1 ~ a)Pj — 1 Для каждого a e [0, 1]. Следовательно,
i - 1 J = 1
ua является выпуклой комбинацией точек их ит, vx vp е X и принадлежит W при
всех а е[0,1]. Таким образом, W — выпуклое множество, содержащее X. Но со X по своему
определению принадлежит всем выпуклым множествам, содержащим X, и поэтому со X С W.
Сравнивая с ранее доказанным включением W С со X, заключаем, что соХ = W. Если X —
выпуклое множество, то с учетом теоремы 5 имеем X = W = со X. Теорема 6 доказана. D
Заметим, что выпуклая оболочка двух точек на плоскости представляет собой отрезок,
выпуклая оболочка трех точек, не лежащих на одной прямой, —треугольник. В общем случае
выпуклая оболочка конечного числа точек на плоскости образует выпуклый многоугольник, а
в пространстве — выпуклый многогранник.
Определение 9. Выпуклая оболочка множества точек «q, щ, ..., ит изЕп таких,
что система векторов {щ — щ,г = 1 т} линейно независима, называется симплексом,
натянутым на эти точки, и обозначается через Sm = Зт(щ, ии ..., ит). Точки щ, их,..., ит
называются вершинами симплекса.
В случае т — 0, 1,2,3 симплекс представляет собой соответственно точку, отрезок,
треугольник, тетраэдр.
Согласно теореме 6 симплекс Sm представим в виде
' sm = \u- и= Е aiui>ai >Q,i = 0>...,m, E a, = 1 [■
По теореме 6 любая точка выпуклой оболочки множества X является выпуклой
комбинацией конечного, но, быть может, довольно большого числа точек из X. Замечательно, однако, то,
что в Еп для получения множества соХ достаточно ограничиться рассмотрением выпуклых
комбинаций не более чем п+ 1 точек из X. Точнее, верна
Теорема 7 (Каратёодори). Пусть X —произвольное непустое множество из Еп.
Тогда любая точка и е со X представима в виде выпуклой комбинации не более чем п + 1
точек из X.
Доказательство. Согласно теореме 6 любая точка и е со X представима в виде и =
= ахих + ... + атит, где щ еХ, а( > 0, г = 1,..., т, щ + ... + ат = 1. Пусть т> п+ 1 и
все ai > 0 (если at = 0, то число т может быть уменьшено). В п + 1-мерном пространстве
рассмотрим векторы й{ = (и{, 1), г = 1,..., т. Поскольку т > п + 1, то эти векторы линейно
зависимы, т. е. существуют числа 7i,-..,7m. не все равные нулю и такие, что 7^1 +■■■
... + 7 йт — 0. Это равенство эквивалентно следующим двум равенствам:
71и,+... + 7тит = 0, 7i+..- + 7m = 0.
Тогда точка и представима другими выпуклыми комбинациями тех же точек их,...,ит:
т mm
E(at--<7t)ui= Е aiui~ Е 1гЩ-и- в самом деле, здесь а{>0 и, следовательно, a;-i7; ^0,
i = l i = l i=l т mm
г = 1,.. ., т при всех достаточно малых t и, кроме того, Е (ai ~ *7;)= Е а{ ~ * Е It ~ ' ■
1=1 г =1 г = 1
Поскольку не все 7; равны нулю, но 7i + ■ ■ ■ + 7m = 0, то среди {^{} найдутся положительные.
156
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Пусть as7s = mln a("f{ '. Положим t — as"fs . При таком выборе t все а( — Щ останутся
неотрицательными, причем as — tjs = 0. Это значит, что точку и удалось представить в виде
выпуклой комбинации меньшего числа точек щ,..., us_ ,, us+ | ит. Ясно, что
последовательно применяя описанный прием далее, число точек, участвующих в выпуклой комбинации,
можно уменьшить до п + 1. П
Теорема 8. Если X —замкнутое ограниченное множество из Еп, то со X
замкнуто и ограничено.
Доказательство. По условию существует число R > 0 такое, что \и\ ¢. R для всех
и е X, т. е. X С 5(0, R) — шар радиуса R с центром в точке 0. Но шар — выпуклое
множество. Согласно определению 8 тогда со X С 5(0, R), так что \и\ ^ R для всех и е со X.
Ограниченность со X доказана.
Докажем замкнутость со X. Пусть и — предельная точка со X, {и,} е со X и lim uk = и.
к —> оо
Согласно теореме 7 существуют точки иы еХ, числа ак( ^ 0, i = 1 п + 1, afcI + ...
■■•+afc,n+i = ! такие- чт0 иц = а11иы + - + ам+1\»+1' Заметим, что |иы|< Я, 0<
< aki < 1 при всех г = 1 п + 1 и всех fc = 1, 2,... Пользуясь теоремой Больцано — Вей-
ерштрасса, сначала из {икХ}, {секХ) выберем подпоследовательности {икх}, {ак\},
сходящиеся соответственно к некоторым и^,а^; затем из {t^o}' iak2} — подпоследовательности
{^2)-^¾. {^2)-^¾ ит- Д- наконец, Кп+,„ + 1> "+ ип+ \< (акп^п+ 1> -+ ап+\- Тогда из
п+1 п+1 '
и* =Е ак +.ик +л>ик ,л^х<ак ^.-^0.^ = 1 п+1< Е afc {=1, предельным пе-
реходом при fcn+1 -»оо получим и= ■ Е aiuii а< 3*0, X) а,- = 1> где и; еХ, г = 1 п+ 1,
1=1' > = 1
в силу замкнутости X. Следовательно, по теореме 6 и есоХ, что и требовалось. D
Заметим, что требование ограниченности множества X в теореме 8 существенно: Например,
множество X = {и = (х, у) е .Е2: х > 0, у = -у/а;} замкнуто, но со X = {и = (х, у) е Е2: х >
> 0, 0 < у ¢. </х} и {(0, 0)} незамкнуто. Если X —выпуклое, замкнутое множество из Еп, то
соХ будет замкнутым и без требования ограниченности X, поскольку в этом случае в силу
теорем 5, 6 со X = X = X = со X.
Теорема 9. Пусть А — произвольное непустое множество из Еп. Тогда
sup (с, a) = sup (с, a) = sup (с, a) = sup (с, a) Vc еЕп■
аеА аеА аетА аесо А
Доказательство. Поскольку А С А, то sup(c, а) < sup(c, а). С другой стороны, для
' " " А А
любого tie А существуют ак еА, {а^.}—» а. Поэтому из (с, ah) < sup(c, а) при к —»оо получим
_ А
(с, a) ^sup(c, а) для всех йеА. Следовательно, sup(c, a) <sup(c, а), так что sup(c, a) = sup(c, а).
A J А X А.
Отсюда же имеем sup = sup(c, а). Далее, так как А С со Л, то sup(c, а) < sup(c, а). С другой
со А тд А со А
стороны, для любого аесо А согласно теореме 6 найдутся а,еА, а. • ^ 0, г = 1 г, а. +...
... + аГ = 1 такие, что а= J2 а^{. Поэтому
г г
(С, О) = J2 ai (С. ai) =¾ Е ai SUP (С> °) = SUP(C. а)
г — I г = I аеА А
для каждого аесо А. Следовательно, sup(c, а) < sup(c, а), так что sup(c, a) = sup(c, a). D
со А А со А А
4. Приведем условия существования внутренней точки выпуклого множества.
Теорема 10. Пусть X —непустое выпуклое множество из Еп. Для того чтобы
int X ^ 0, необходимо и достаточно, чтобы dim X = п.
Доказательство. Необходимость. Пусть int X ф. Si. Тогда для любой
внутренней точки v множества X существует е-окрестность 0(v, е) = {и: \и — v\ < е}, также
принадлежащая X. Отсюда вытекает, что минимальным аффинным множеством, содержащим
множество X и, следовательно, шар 0(v, е), является все пространство Еп. Это значит, что
aiiX = En, dimX = n.
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
157
Достаточность. Пусть dim Х = п. Тогда aff X = Еп и найдутся точки щ, их,..,, ип е
е X такие, что векторы щ — щ ип — щ — линейно независимы. Натянем на эти точки
симплекс , п п -,
5„={ue£n:u=. Е 0,11(,0,^0^=0 n, Е о1 = 1].
Согласно теореме 5 Sn сХ, а по теореме 6 Sn выпукло. 1~°
Рассмотрим систему линейных алгебраических уравнений
п
Е К- - Ч>К- = u - «о. ue.En. (6)
• = i
Матрица этой системы А = (щ — «g un — «g), столбцами которой являются линейно
независимые векторы и. — «Q, £ = 1 п, имеет размеры n х п и невырождена. Поэтому система (6)
для каждого и е Еп имеет и притом единственное решение х = х(и) = (хх(и) хп(и)). Из
известных формул Крамера [192, 353] видно, что функции xt (и) непрерывно (и даже линейно)
зависят от и. п
Опираясь на это свойство решений системы (6), покажем, что любая точка w — Е aiui
i = 0
симплекса Sn при ог- > 0, г ~0 п является внутренней точкой Sn. В самом деле, для такой
п п п
точки ш имеем w—Ug = Е aiut~ X) агЧ)= X) ai(ui~'uo)' Сравнение с (6) показывает, что
г=0 г=0 г=0
а. = х{(ги), г = 1,..., п. В силу непрерывности х((и) тогда xt(u) > 0, г = 1,..., п для всех а£
тг
£ 0(tii, е) = {и\ \и — tii| < е}, где е > 0 — достаточно малое число. Функция Xq(u)= 1 — Е xt(u)
п t = l
также непрерывна, причем a^(tii) = 1 - J2 ai~ ао>®- Взяв е > 0 достаточно малым, можем
i = l
считать, что х$(и) > 0 для всех и е 0(tii, е).
Таким образом, для каждой точки и е 0(w, е) в силу (6) имеем представление и — щ +
п п п
+ Е ffii(u)K-4))= Е xi(u)ui< гдежг-(и)>0, Е жг(и)=1.Это означает, что 0(w, e)cSn.
i = l ■ « = о t = 0
Следовательно, tii е int Sn. Отсюда и из включения Sn С X следует, что 0(tii, е)сХ, т. е.
w е int X и int X ^ 0. D
5. Выпуклое множество 1 = {и = (г,1/,г)е .Е3: ж2 + у2 < 1, z = 0}, представляющее собой
единичный круг в плоскости Г = {и = (х, у, z) е Е3: z — 0}, не имеет внутренних точек. Кстати,
здесь плоскость Г представляет собой аффинную оболочку множества X. В то же время,
если это множество X рассматривать лишь относительно плоскости Г (т. е не «признавать»
точки Е3, лежащие вне Г), то X — единичный круг — конечно же, имеет внутренние точки.
Приводимая ниже теорема 11 показывает, что это не случайно. Для ее формулировки нам
понадобится
Определение 10. Точка иеХ называется относительно внутренней точкой
множества X, если существует е-окрестность 0(v, е) = {и е Еп; \и — v\ < е} точки v такая, что
пересечение 0(v, e)naffX целиком принадлежит X. Множество, всех относительно
внутренних точек множества X обозначается через riX (иногда обозначают reliht X).
Например, если X = {и = (х, у, z) е Е3; х2 + у2 < 1, z ~ 0}, то йХ = {и = (х, у, z) е Е3;
x2 + yi<\,z = Q}.
Если множество X С Еп имеет размерность п, т. е. dim aff X = п, то понятия внутренней и
относительно внутренней точки для множества X совпадают и ri X = Int X, Нетрудно указать
множества X (например, множество, состоящие из двух различных точек Е ), у которых
ri X — 0, Однако для выпуклых множеств верна
Теорема 11. Если X непустое выпуклое множество из Еп, то ri X непусто,
выпукло. При этом если щ eri X, veX, то va = v + а^г/Q —и) е ri X при всех а, 0< а < 1.
Если и е ri X, у ¢ ri X, у е X, то и>х = и + \(у - и) ¢ X при всех А > 1.
Доказательство. Можем считать, что точка Ое X, так как в противном случае вместо
множества X мы рассмотрели бы множество X - {v} = {w eEn;w = u — v, и e X}, где v —
какая-либо точка из X. Тогда OeaffX = LinX —подпространство в Еп. Пусть множество X
имеет размерность dim X = m, 1 < m < п, (в случае m = 0, когда X состоит из единственной
точки, утверждения теоремы тривиальны; случай т = п рассмотрен в теоремах 3, 4, 10). Тогда
найдутся такие точки щ, их и еХ, что векторы е, = их — «g em = ит — щ линейно
независимы и образуют базис aff Л. Можно дополнить систему ех ет векторами ет+ ,,...
..., еп до базиса Еп, причем можно считать, что (е;, е^ — 0, г = 1,..., т, j = m+ 1 п.
В этом базисе aff X = {и = (и1 ип) е Еп: ит+ ' = {ет+ „ и) = 0,..., и" = (е„, и) = 0} =
= {и=(ж, um+ ' =0,..., u" = 0): a;ei5m}, так что aff X можно отождествить с пространством
158
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Е". Повторив в этом пространстве соответствующие рассуждения из доказательств теорем 3,
4, 10, убеждаемся в справедливости утверждений доказываемой теоремы. П
Теорема 12. Пусть X — непустое выпуклое_множество из Еп и у е X, у ¢ ri X.
Тогда существует последовательность {yk}, yh ¢ X, yk£ aff X, As = 1, 2,..., сходящаяся
к у.
Доказательство. Возьмем какую-либо точку ueriX. Согласно теореме 11 тогда
ъих = и + \(у — и) £ X при всех А > 1. Кроме того, поскольку aff X = aff X, то и,у е aff X и,
следовательно, wx еaff X. Тогда yk = wx = и + \к(у — и), где Afc > 1, {А^.} —»1, — искомая
последовательность. D
Заметим, что если множество X не является выпуклым, то утверждение теоремы 12 может
оказаться неверным. Например, пусть X —множество точек на числовой оси Е1, имеющих
рациональные координаты. Тогда aff X = Е , и любая точка у€.Е является граничной для X.
Таким образом, Х=Е1,и последовательности {ук}^Х, сходящейся к у здесь не существует.
Теорема 13. Пусть X — выпуклое множество из Еп. Тогда rl X = ri X, X = ri X.
Доказательство. Возьмем любую точку v g riX. Согласно определению 10 тогда
существует такое е > 0, что 0(v, e)naff X = 0(v, e)naff X clcl. Это_з_начит, что ve ri X.
Следовательно, ri X С ri X. Докажем обратное включение. Возьмем w е ri X. Тогда существует
такое е > 0, что 0(w, e)naff X с X.
Возьмем какую-либо точку v е ri X и положим wx = w + \(w - v), A e E. Поскольку v,we
e affX= aff X, то wx e affX при всех A e E. Кроме того, существует такое А0 > 0, что и>х е
еО(ги, е) для всех А, |А|< А0. Следовательно, wx еО(и, e)naff X<zX, |А|< А0. Из выражения
для wx следует, что w = wx + j-^r-(v—u>x). При 0< А < А0 имеем a = g (0, 1). Согласно
теореме 11 тогда w е ri X. Это значит^что ri X С ri X. Тем самым установлено, что ri X = ri X.
Далее, так как riX сХ, то r\X С.Х. Возьмем любую точку иеХ ииепХ.По теореме 11
иа = и + a(v - и) е ri X при всех а е(0, 1], причем иа —> и при а —> 0. Следовательно, ueriX.
Это значит, что X С ri X. Таким образом, показано, что X — ri X. D
Некоторые другие свойства выпуклых множеств будут рассмотрены ниже.
Упражнения
1. Пусть X — некоторое множество из Еп, X — замыкание множества X. Если X выпукло,
то можно ли утверждать, что X также выпукло?
2. Существует ли невыпуклое множество, удалив из которого одну точку (или несколько
точек), можно получить выпуклое множество? Рассмотреть пример X'= {и = (х, у) е Е : х >
>0,y>0,!B + y<l}u{(0Il)}U{(l,0)}1
3. Показать, что равенство ri X ~ ri X для невыпуклых множеств, вообще говоря, неверно
(рассмотреть круг с выколотым центром).
4. Доказать, что если А с В, то А С В, int А с int В, но, вообще говоря, не будет включения
ri Л с ri В даже для выпуклых А и В. Рассмотреть пример В — куб в Е3, А — одна из его
граней.
5. Если А —выпуклое множество из Еп, то aff Л =aff(riA). Доказать.
6. Доказать, что размерность выпуклого множества X совпадает с максимальной
размерностью симплексов, содержащихся в X,
7. Если А, В — выпуклые множества из Еп, то А + В С А + В, rl А + ri В = ti(A + В),
r\(XA) = A ri А для любых действительных чисел А. Доказать.
8. Доказать, что если А, В — выпуклые множества из Еп, ri А П ri В ф 0, то ri А П ri В =
= i\{A П В). Существенно ли здесь требование rii П ri В ф01 Рассмотреть пример А = {и =
= (х, у) б Е2: х > 0}, В = {и = (ж, у) е JS2: ж < 0}.
9. Если X —открытое множество, то со X открытое Доказать.
10. Доказать, что со(Л + В) = со А + со В.
11. Доказать, что соХ = соХ, где соХ —пересечение всех выпуклых замкнутых множеств,
содержащих X.
§ 1. ВЫПУКЛЫЕ МНОЖЕСТВА
159
12. Доказать, что вершины «д,^ ит m-мерного симплекса Sm = Sm(«g, их ит)
являются его угловыми точками (см. определения 9, 3.2.1).
13. Доказать, что аффинная оболочка множества X состоит из точек вида a, u, + .. -Л-сити
при всевозможных и{ ит еХ, at —действительные числа, i = 1,..., m, <*] +.. , + ат = Т,
и только из них.
14. Пусть А, В — выпуклые замкнутые множества из Еп, причем хотя бы одно из них
ограничено. Доказать, что тогда А+В — выпуклое замкнутое множество. Будет ли А + В
замкнутым, если А, В не ограничены? Рассмотреть примеры:
а) А = {а = (х,у) еЕ2:у = 0}, В = {Ь = (х,у)е Е2: у < ех};
б) множества А, В из рис. 4.14;
в) А = {а=(х, y,z)eE3: x = z = 0,y^0}, В = {Ь = (х,у, z) е Е3: х2 + у2 ^2yz,y> 0}.
§ 2. Выпуклые функции
1. В главе 1 были рассмотрены некоторые свойства выпуклых функций
одной переменной. Здесь мы продолжим изучение свойств выпуклых функций
многих переменных.
Определение 1. Функция /(ж), определенная на выпуклом
множестве X, называется выпуклой на этом множестве, если
f(au + (l-a)v)^af(u) + (l-a)f(v) (1)
при всехи, v&X, всех а, О^а^ 1. Если в (1) при ифь равенство возможно
только при а=0 и а = 1,то функция f(x) называется строго выпуклой
на X. Функцию f(x) называют вогнутой [строго вогнутой] на выпуклом
множестве X, если (-f(x)) выпукла [строго выпукла] на X.
Если множество X пусто или состоит из одной точки, то функцию на
таком множестве нам будет удобно считать выпуклой (или вогнутой) по
определению. Подчеркнем также, что всюду, если не оговорено противное,
будем рассматривать лишь функции, принимающие конечные значения во
всех точках области определения.
Примерами выпуклой функции на всем пространстве Еп служат
линейная функция f(x) = (с, х) и норма /(ж) = |ж|. Кстати, линейная функция
f(x) — (с, х) одновременно является и вогнутой на Еп.
В теореме 1.5 было показано, что выпуклое множество X содержит вы-
т т
пуклые комбинации £) а{Щ, скг ^ 0, г — 1, ..., т, Yl a.l = 1, любых своих
точек и,,..., ит при любых m = 2, 3,... Пользуясь индукцией по той же
схеме, какая была использована при доказательстве теоремы 1.5, нетрудно
показать, что для любой выпуклой функции /(ж) на выпуклом множестве
имеет место неравенство Йенсена
E«i^E«f/W (2)
для любых т = 1, 2,..., любых х{ G X, а1 > 0, г — 1, ..., т, J^ а. = 1.
i = i
2. Как и в случае выпуклых функций одной переменной, выпуклые
функции многих переменных на выпуклом множестве не могут иметь локальных
минимумов. Точнее, верна
Теорема 1. Пусть X — выпуклое множество, а функция f(x)
определена и выпукла на X. Тогда всякая точка локального минимума
160
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
f(x) одновременно является точкой ее глобального минимума на X,
причем множество
X. = {х:хе X, f(x) = Л = inf /(h)}
и G Л
выпукло. Если f(x) строго выпукла на X, то Xt содержит не более
одной точки.
Доказательство. Пусть и„ — точка локального минимума функции
f(x) на множестве X. Это значит, что существует окрестность 0(щ, е) =
= {■"Ни — щ\ < е} точки и„ такая, что /(и„) < f(v) для всех v е 0(ut, е) П
П X. Возьмем произвольную точку iGXh число а > 0, столь малое, что
а\х — щ\ < е. Тогда щ + а(х — u„) G 0(ut, е)Г\Х, и с учетом выпуклости
функции f(x) имеем /(u„) ^/(и„ + а(х-щ)) ^ /(и„) + а(/(х)-/(щ)) или
0 ^ a(f(x) ~ /(ч))- Сокращая на а > 0, отсюда получаем f(x) ^ /(и„) при
любом ж£1. Следовательно, щ е Xt.
Пусть теперь и, г; G Д„, т. е. /(и) = f(v) = /„, и, v е X. Тогда
Л < /(an + (1- a)«) ^ a/(n) + (1- <*)/(«) = /ф, (3)
т. е. /(аи + (1 — «)!;) = /» при всех a, 0^ a ^ 1. Следовательно, au + (l —
-a)f)£ Xt, 0 ^ а ^ 1. Выпуклость Xt доказана.
Если и ф v, то для строго выпуклых функций неравенства (3) не
могут обратиться в равенства при 0 < а < 1. Следовательно, строго выпуклая
функция может достигать своей нижней грани на выпуклом множестве не
более чем в одной точке. □
Примеры 1.11.1, 1.11.3-1.11.5 показывают, что у выпуклых функций
множество Xt может быть пустым, может содержать одну или бесконечно
много точек.
3. Далее, остановимся на одном характеристическом свойстве гладких
выпуклых функций.
Теорема 2. Пусть X —выпуклое множество. Если функция f(x)
выпукла на X и дифференцируема в точке v е X, то
/(«)>/(«)+</'(«)»«-«) VueX (4)
Если f(x) G С\Х), то f(x) выпукла на X тогда и только тогда, когда
неравенство (4) выполняется при всех u,v&X.
Доказательство. Необходимость. Пусть f(x) выпукла на
X и дифференцируема в точке v е X. Перепишем неравенство (1) в виде
/(« + а(и - «)) - /(«) < <*(/(«) - /(«)) Va е [0, 1], Vu, v е X.
С учетом дифференцируемости f(x) в точке v отсюда имеем
(/'(«), а(и - «)) + о(а\и - v\) ^ <*(/(«) - /(«))
Деля обе части этого неравенства на а > 0 и устремляя а —> +0, получим
неравенство (4). Если /(ж) е С^(Х), то неравенство (4) верно для всех
u,v £ X.
Достаточность. Пусть f(x) е С1(Х), X —выпуклое множество и
пусть неравенство (4) выполняется при всех u,veX. Покажем, что тогда
f(x) выпукла на X. Возьмем произвольные точки и, v G X и число а, 0 ^
^ a < 1. Положим иа = аи + (1 — a)v. Из (4) получим
/(«) - /К) ^ </'Ю,« - «„), /(«) - /К) > </'Ю, «-«„)•
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
161
Умножим первое из этих неравенств на а, а второе — на 1 — а и сложим.
Получим a/(u) + (l — a)f(v) — /(ua)> (f'(ua), иа — иа) = 0, что равносильно
неравенству (1). П
Неравенство (4) имеет простой геометрический смысл. Как известно
[327; 350; 352; 534], гиперплоскость Г= {(u, 7) еЕп + и. ueEn,j = f(v) +
+ (f'(v), и — v)} является касательной плоскостью к графику функции
7 = дж) в точке v. Поэтому неравенство (4) означает, что график выпуклой
функции лежит не ниже касательной плоскости к этому графику в любой
точке v £ X, в которой существует производная f'(v) (ср. с теоремой 1.8.4).
4. Следующая теорема, называемая критерием оптимальности для
выпуклых функций, дает необходимое и достаточное условие минимума
гладких функций на выпуклом множестве.
Теорема 3. Пусть X — выпуклое множество, Xt — множество
точек минимума функции /(ж) на X. Если в точке x,elt функция /(ж)
дифференцируема, то необходимо выполняется неравенство
{Г(ъ),х-ъ)>0 УхеХ, (5)
которое в случае ж„ £ int X превращается в равенство: /'(жф) = 0.
Если, кроме того, функция /(ж) выпукла на X, то условие (5) является
достаточным для того, чтобы ж„ £ Xt.
Доказательство. Необходимость. Пусть ж, £ It. Тогда при
любых х £ X и а £ [0, 1] с учетом дифференцируемое™ функции /(ж) в
точке ж„ имеем
0 < /(ж„ + а(х - ж„)) - /(ж„) = а(/'(ж„), х - х,) + о(а)
или
0 ^ (/'(я*), х-х,)+ о(а)/а, Уж £ X, Va £ (0, 1].
отсюда при а —> +0 получим условие (5). Если ж„ £ int X, то для Ve £ Еп
найдется е0 > 0 такое, что х = ж„ + ее £ X при всех е, |е| < е0. Полагая
в (5) х = ж, + ее, получим е(/'(ж„), е) > 0 при всех е, |е) ^ (¾. что возможно
только при (/'(ж„), е) = 0. Пользуясь произволом в выборе е, здесь можем
взять е = /'(ж„), что приводит к равенству /'(ж„) = 0.
Замечание 1. Несколько подправив приведенное доказательство
необходимости, нетрудно убедиться, что если ж,— точка локального
минимума /(ж) на множестве X, то мы также придем к условию (5).
Достаточность. Пусть функция /(ж) выпукла на X, пусть для
некоторой точки ж„ £ X выполнено условие (о). Тогда из неравенства (4)
при v = xt получим f(x)~f(xt)^(f'(xt), ж-ж,)>0или /(ж)>/(ж„) УхЕХ.
Следовательно, ж„ £ Xt. Теорема 3 доказана. П
Условие (5) имеет простой геометрический смысл и означает
неотрицательность производной по направлению е = , _ *. функции /(ж) в точке
минимума ж„ — об этом подробнее см. ниже в п. 8. Если X = Еп, то
условие (5) эквивалентно равенству /'(ж„) = 0. Таким образом, условие (5)
является естественным обобщением условия стационарности (2.2.6) для задач
на условный экстремум с выпуклым множеством X. Заметим, что если ж, —
граничная точка множества X, то равенство /'(ж„) = 0 может выполняться,
может и не выполняться. Например, если f(x) = x2, X = {хе Е1: 1 ^ ж < 2},
то ж„ = 1, /'(ж») = 2, и условие (5) в точке ж„, конечно, выполняется. Если
туже функцию /(ж) = ж2 рассматривать на отрезке X = {ж£ Ех: 0^ ж^ 2},
то ж„ = 0, f'(xj = 0, хотя ж„ = 0 — граничная точка X.
162
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Неравенство (5), как и условие стационарности (2.2.6), вообще говоря,
может быть записано в виде системы п уравнений с п неизвестными ж„ =
= (ж,!,..., ж"). Поясним это на примере.
Пример 1. Рассмотрим задачу: f(x)->inl, хеХ = E2 = {x = (xl, х2)е
G Е2: хх > 0, х2 > 0}, предполагая, что /(ж) дифференцируема на Е2. Тогда
условие (5) равносильно системе уравнений
¢.7..00 = 0, г = 1,2.
В этом нетрудно убедиться, последовательно анализируя возможности: 1)
х, = (0, 0); 2) х, = (¾1, а;,2) > 0; тогда ж, е Int Я+2 и /'(ж,) = 0; 3) ж,1 = 0, ж2 > 0;
тогда /./(¾) > 0, /./(¾) = 0; 4) х} > 0, ж2 = 0; тогда /./(¾) = 0, //(¾) > 0.
Если X = Е" = {х е Еп: ж = (ж1,..., хп) > 0}, то условие (5) аналогично
сводится к системе уравнений
а£Л<(О = 0, г = 1,...,п.
В общем случае для множеств X с «хорошей» границей неравенство (5)
также может быть записано в виде системы уравнений, составленной из
условий принадлежности ж„ границе множества X и условий равенства
нулю производных функции /(ж) по некоторым касательным направлениям к
границе в точке ж„; правда, получающаяся при этом система может
оказаться громоздкой и сложной для исследования. Не вдаваясь в детали, заметим,
что для некоторых классов задач минимизации на множествах вида (2.3.10)
условие (5) тесно связано с правилом множителей Лагранжа
(подтверждение этим соображениям читатель найдет ниже, в § 9),
Так как неравенство (5) при ж = ж„ обращается в равенство, то условие (5)
можно записать в равносильном виде
тт(/'(ж,), ж-ж„)=0.
X G X
Неравенства вида (5) называются вариационными неравенствами, они
подробно рассмотрены в [31; 227; 378; 397; 407; 536; 640].
5. Сформулируем и докажем ниже два критерия выпуклости для гладких
функций.
Теорема 4. Пусть X —выпуклое множество, /(ж)е С1 (X). Тогда
для выпуклости функции /(ж) на X необходимо и достаточно, чтобы
(f'(u)-f'(v),u-v)t>0 Vu,veX. (6)
Доказательство. Необходимость. Пусть /(ж) выпукла на
X. Тогда для любых u,veX имеет место неравенство (4). Поменяв в (4)
переменные и u v ролями, получим
f(v)>f(u)+(f(u),v-u).
Сложив это неравенство с (4), придем к условию (6).
Достаточность. Пусть для некоторой функции f(u)eCl(X)
выполнено условие (6). Тогда с помощью формулы конечных приращений (2.6.2)
для любых u,v £ X и a G [0, 1] имеем
af(u) + (1- <*)/(«) - Наш + (1 - a)v) =
= <*[/(«) - /(cm + (1- a)v)] + (1- <*)[/(«) - /(<«* + (1- <*)«)] =
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
163
= а J(/'(au+(l — a)v+t(u—аи —(1—a)v)), и—аи —(1 — a)v)dt +
о I
+(l — a)^(f'(au+(l — a)v+t(v — au—(l — a)v)),v — au—(l — a)v)dt =
о I
= а(1 - «)$(/'(сш + (1 - а)« + t(l - а)(и - «)) -
0 — /'(аи + (1 — а)и + ta(u — v)), и — v)dt,
ИЛИ
а/(и) + (1 - <*)/(«) - /(аи + (1 - а)«) =
= а(1 - «)}</'(*,) - /'(^, г, - z2)\dt, (7)
о
где г;, = аи + (1 — a)v + £(1 — а)(и — v), z2 = аи + (1 — а)г; + £а(и — и).
Поскольку г, = /Зи + (1 - /3)«, /3 = i + а(1 - i) е [0, 1], г2 = ти + (1 - 7)«,
7 = а(1 — t)e[0, 1] и множество X выпукло, то г,, ¾ е Х. Отсюда и из
условия (6) имеем (/'(г,)—f'(z2), zx— z2)~^Q) при всех t, 0< t ^ 1. Это значит,
что правая часть (7) и, следовательно, левая часть (7) неотрицательна при
любом выборе u,veX, а е [О, 1], т. е. f(x) выпукла на X. □
Заметим, что для функций одной переменной неравенство (6)
равносильно неубыванию производной f'(x). Это значит, что доказанная теорема 4
является естественным обобщением теоремы 1.8.8 на случай гладких
функций многих переменных.
Следующий критерий выпуклости обобщает теорему 1.8.9.
Теорема 5. Пусть X — выпуклое множество из Еп, /(ж)еС2(1).
Тогда для выпуклости f(x) на X необходимо и достаточно, чтобы
</»£,£>> о (8)
при всех иеХ и всех £ = (£',..., £"), принадлежащих подпространству
L =Lin X, параллельному аффинной оболочке множества X (в
частности, если int 1^0, то (8) выполняется при всех £ ей").
Доказательство. Необходимость. Пусть f(x) выпукла на
X. Пусть aff X — {и е Еп: Аи — Ь}, где А —некоторая матрица размера
т х п, а Ь е Еп (см. пример 1.5). Тогда подпространство L, параллельное
aff X, имеет вид L ={£ е Еп: А£ = 0}. Далее, согласно теореме 1.11 ri X ф
Ф 0. Возьмем произвольные £ G L, ueriX. Тогда А (и + е£) = Аи + еА £ —
= Аи = 6, т. е. и + е£ е aff X при всех е.
По определению 1.10 относительно внутренней точки множества
найдется такое число £„ > 0, что и + е£ £ X при всех е, |е| ^ е0. Поскольку для
гладкой выпуклой функции справедливо неравенство (6), то из него с
учетом формулы (2.6.4) имеем (/'(и + е£)-/'(")• Ое = (/"(и + ^К, £ >е2 >0,
0^ 0< 1, или (/"(и+0е£)£, £) >0 для всех е, 0< |е| ^ е0. Отсюда, пользуясь
непрерывностью f"(x), при е —> 0 получим условие (8) для всех и G ri X.
Если и е X \ri X, то существует последовательность (¾} е ri X,
сходящаяся к и. По доказанному (f"(uk)£, £) >0 при всех £ G L. Отсюда при fc —>00
получим неравенства (8) и для точек ие X \пХ.
Достаточность. Пусть f(x)eC2(X) и выполнено условие (8).
Возьмем произвольные точки и, v е X. Тогда £ = и — v G L. Пользуясь
формулой (2.6.4) и неравенством (8) при £, —и — v, получим
(/'(■") - /'(«). « - «) = </"(« + 6'(и - v))(u ~v),u-v)^0 Vu,v£ X.
164
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Таким образом, для функции f(x) выполнено условие (6). Из теоремы 4
следует выпуклость f(x) на X. О
Замечание 2. Следующий пример показывает, что при int X — 0
условие (8) может и не выполняться при каждом £ е Еп.
Пример 2. Пусть /(и) = х2 — у2, X — {и — (х, у) е Е2: у — 0}. Ясно,
что /(и) выпукла на X. Но условие {/"(«)£, £) = 2(¾1)2 — 2(£2)2> 0 не
выполняется, например, для £ = (0, 1). Здесь int Х = 0, ali X = X — L.
Замечание 3. Условие (8) при int X ф& представляет собой условие
неотрицательности квадратичной формы
2j
<Л«К. О = Е ШМ'
на Еп. Как было отмечено в замечании 2.2.1, для того чтобы (/"(«)£, £) >
> 0 при всех £=(£',...,£")■ необходимо и достаточно, чтобы все главные
миноры матрицы были неотрицательны.
Напомним также, что неотрицательность квадратичной формы {f"(u)£, £)
равносильна тому, что собственные числа А,(и),..., Ап(и) матрицы /"(«)
(т. е. решения уравнения det !/"(■") — XIn\ — 0, 1п — единичная матрица
размера п х п) неотрицательны при всех и е X.
Пример 3. Определим, при каких а, 6, с функция
/(«)= х2 + 2аху+ by2 + cz2, u = (x,y,z),
будет выпуклой на Еп. Здесь
!"{U):
2 а 0
2а 26 0
0 0 2с
Условие неотрицательности всех главных миноров этой матрицы дает
искомые условия на а, Ь, с: Ь — а2 > 0, с > 0.
Пример 4. Пусть
/(n) = i(An,n)-(6,n), не Я", (9)
где А — симметричная неотрицательно определенная матрица размера п х
х п, Ь е Еп. В частности, если А — 21п — единичная матрица, 6 = 0, то
/(«) = {и, и) - \и\2.
Приращение функции (9) нетрудно записать в виде
/(u + h) - /(и) = (Аи -b,h) + \(Ah, h) (10)
при любых u,he Еп. Из (10) имеем
/'(и) = Аи - 6, /"(и) = А
По условию А > 0. Отсюда и из теоремы 5 следует выпуклость функции
/(и) на i?n. Согласно теореме 3 для того, чтобы функция (9) достигала
своей нижней грани на Еп в точке щ, необходимо и достаточно, чтобы щ
являлась решением линейной алгебраической системы Аи—Ь. Указанная
связь между задачей минимизации функции (9) на Еп и системой Аи—Ь с
матрицей А>0 лежит в основе ряда численных методов линейной алгебры
[74; 89; 481].
Пример 5. Пусть
/(u)=|Au-6|2, иеЕп, (11)
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
165
где А — матрица порядка m х п, be Еп. Покажем, что такая функция
выпукла на Еп. Для этого вычислим ее производные.
Пользуясь формулой {Ах, у) — (х, Ату), хеЕп, уеЕп, где Ат —
матрица, полученная транспонированием матрицы А, нетрудно представить
приращение функции (11) в виде
/(u + ft) - /(и) = 2{Ат(Аи - 6), ft) + \{2ATAh, ft)
при всех u,heEn. Отсюда имеем
/'(u) = 2AT(Au-6), f"(u) = 2ATA.
Но </»£, £) = 2(АТА£, £) = 2(А£, А£) = 2|А£|2 > 0 при всех £ е Еп. В
силу теоремы 5 функция (11) выпукла на Еп.
Согласно теореме 3 для того, чтобы функция (11) достигала своей нижней
грани на Еп в точке и, необходимо и достаточно, чтобы и удовлетворяла
системе линейных алгебраических уравнений
АтАи = АтЬ.
6. Посмотрим далее, как влияют на выпуклость сложение, умножение
на число и некоторые другие операции над выпуклыми функциями. Легко
доказывается
Теорема 6. Если функции /;(и), г =1,..., т, выпуклы на выпуклом
множестве, то функция
/(н) = а,/,(н) + ... + ат/т(н)
выпукла на этом множестве при любых а( > 0, г = 1,..., т.
Теорема 7. Пусть /;(u), г el, — произвольное семейство функций,
конечных и выпуклых на выпуклом множестве X, пусть
/(u) = sup/j(u), иеХ.
iel
Тогда функция f(u) выпукла на X.
Доказательство. Возьмем произвольные точки и, v е X, число а е
е [0, 1] и положим иа — аи + (1 — a)v. Для каждого фиксированного г е
е I функция f.(u) выпукла на X, поэтому /{(п„) ^ atf.(u) + (1- a)ft(v) <
^ a/(u) + (l — a)f(v) Vi el. Переходя в левой части этих неравенств
к верхней грани по iel, получим: f(ua) ^ af(u) + (1- a)f(v) \/i е I,
У а е [0, 1]. Выпуклость функции /(и) доказана. П
Следует заметить, что хотя каждая из функций /;(u), iel, принимает
конечное значение в каждой точке и еХ, но тем не менее в каких-то
точках и е X возможно /(u) = +оо. Несмотря на указанное обстоятельство,
приведенное доказательство, очевидно, сохраняет силу.
Следствие 1. Пусть функция д(и) выпукла на выпуклом
множестве X. Тогда функция
g+(u) = max{g(u);0}
выпукла на X.
Теорема 8. Пусть функция p(t) одной переменной выпукла и
не убывает на отрезке [а, Ь] (возможность а— — оо или Ь — оо здесь не
166
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
исключается), пусть функция д(и) выпукла на выпуклом множестве
X с Е'п, причем <д(и)е[а, Ь] при всех и е X. Тогда функция
f(u) = w(<g(tuf)
выпукла на X.
Доказательство. Возьмем произвольные ад, ve X и а е![0, 1]. Тогда
f(au+(l-a)v) = ip(g(au+(l-a)v)) ^ ip(ag(u)+(l-a)g(v)) <
^,®!p(:g(u)) + (1- a)tp(g(u)) = af(u) + (1 - a)f(v),
что и требовалось. '□
Иногда удобнее пользоваться другим вариантом этой теоремы: если
функция p(t) выпукла и «е возрастает на отрезке [a, b], a g{u) вогнута на!выпук-
лом множестве X С Еп, д(ы) £ [а, Ь] при иеХ, то функция /(н) = <р(д(и))
выпукла на X..
Следствие 1. Если функция д(и) выпукла и неотрицательна на
выпуклом множестве X, то функция
f(u) = (g(u))"
выпукла на X при всех р > 1.
Следствие 2. Если функция д(и) выпукла на выпуклом
множестве X, то функция
1(и)=(тах{0;д(и}у = (дЦи)У
выпукла на X при всех р ^ ;1.
С л е дст.вие 3. Если функция д(и) выпукла на выпуклом
множестве X, причем д(и) < О при всех и е X, то функции
/(h) = -ЭДн), /(h) = тах{- \п(-д(и)); 0}р, р > 1,
выпуклы на X,.
Как увидим ниже, функции, указанные в следствиях к теоремам 7, 8,
будут использованы при описании различных методов минимизации
(например, в методах штрафных и барьерных
функций и др.).
7. Выпуклые функции являются
удобным средством для задания выпуклых
множеств. Это связано с тем, что надграфик
всякой выпуклой функции является
выпуклым множеством.
Определение 2. Надграфиком
(или эпиграфом) всякой функции f(x),
определенной на множестве X с Еп, назы-
„ . . ,„ .ч вается множество (рис. 4.5)
Рис. 4.5 (Надграфик) vl^ '
epi / = {(z, 7) G S»t«: х е X, 7 > f(x)}.
Теорема 9. Для того чтобы функция f(x), определенная на
выпуклом множестве X была выпуклой на X, необходимо и достаточно,
чтобы ее надграфик был выпуклым множеством.
Доказательство. Необходимость. Пусть функция f(x)
выпукла на выпуклом множестве X. Возьмем две произвольные точки
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
167
zl = (u,, 7i), z2 = (щ, 72) G epi / » составим их выпуклую/ комбинацию za =
= az[ + (l — a)z2 = (aul-i-(l — a)u2, 0:7, + (1- a)72), 0^ o>^ Г. Из выпуклости
X следует, что иа = ащ + (1 — а)щ е X. Из выпуклости функции /(ж),
учитывая, что г;,, %eepi /..имеем f(ua)^ocf(u,)+(l — a)/(¾)^017,+(,1-а)72.
Следовательно, 2а G epi / при всех а е [0, 1]. Вьшуклоеть. epi / доказана.
Достаточность. Пусть epi / — выпуклое множество. Возьмем
произвольные и,, и2еХ и а е[0, 1]. Тогда zy =•(«,, /(■",)), ^2 = (1^,, /(¾).)Gepi /.
В силу выпуклости epi / точка 2а = а-г, + (1 — a)z2 е epi /. Это>значит, что
af(u{) + (1: - 0:),/(1½) :¾ /(au, + (1- 0:)¾). Выпуклость /(ж) доказана. П
Теорема1 10. Пусть X — выпуклое множество}, а функция f(x)
выпукла на X. Тогда множество М(с) = {и: и е X,f(u) < с} выпукло
при любом с.
Доказательство. Возьмем произвольные u, v еМ(с), а е[0, 1].
Используя выпуклость множества X и функции /(ж), имеем f(au+(i — a.)v)^
^ o:/(u) + (l — a)f(v)^. с, т. е. аи + {\ - a)v еМ(с), что и требовалось. □
Заметим, что обратное утверждение здесь неверно:: из; выпуклости
множества М(с) при любом с, вообще говоря, не следует выпуклость функции
f(x). Например, множество М(с) = {и: ие E\.u3i4. с} выпукло при любом
с, а функция f(u) = u3 невыпукла на Е1 (см. упражнение 33).
Теорема 11. Пусть Х0 — выпуклое множество) функции д{(х),
i — 1,... ., т, выпуклы на Х0, а д{(х) = (аа x) — bt, г = т+Ь,... ., s, где а{ —
заданные векторы, из Еп, Ь( —заданные числа, г = т + 1,..., s. Тогда
выпукло множество
Х={и-:иеХ0, д{(и)4.0, г = 1,...,т; д{(и)=0, г = т + li,. . ., s}. (12)
Доказательство. В силу теоремы 10 множество Х{, = {и: ие
G Х0, д((и) ^ 0} выпукло при всех г = 1,.. ., т. Выпукло также множество
М = {иеЕп: (щ, u)-bi = 0, i - m + 1,..., s) — см. пример 1.5. Тогда
множество (12), являющееся пересечением выпуклых множеств*.Х-,,,,..., Хт, М
само будет выпуклым. □
8. Рассмотренное в теореме 3 условие оптимальности сформулировано для непрерывно-
дифференцируемых функций. Однако аналогичное условие можно получить при гораздо
меньших ограничениях на функцию, используя лишь существование производных по направлениям.
Напоминаем, что производной функции f(x) в точке и по направлению е,.|е| = 1, называется
«*/(") = ijm f(u + te)-f(u) (13)
de t->+0 t
Заметим, что для определения производной по направлению в точке w нужно, чтобы и + te
принадлежало области определения f(x) при 0:¾ t ¢. t0 хотя бы при малом i0 >0.
Определение 3. Пусть X — некоторое множество из Е п, пусть и е X. Направление
е ^0 называется возможным в точке и, если существует число t0 >0 такое, что и+te е X при
всех t, 0 ¢. t ¢. t0. Иначе говоря, достаточно малое перемещение из точки и по возможному
направлению не выводит за пределы множества X.
Очевидно, если и е int X, то любое направление е ^0 является возможным в этой точке.
В граничных точках множества возможное направление может и не существовать.
Пример 6. Пусть X = {и = (х, у)еЕ2: х ^ 0, х2 < у 4 2ж2}. Нетрудно видеть, что в
граничной точке (0, 0) нет ни одного возможного направления.
Для выпуклых множеств X, содержащих не менее двух точек, приведенная в примере 6
ситуация невозможна: в любой точке и такого выпуклого множества X имеется хотя бы одно
возможное направление, причем направление е ^0 будет возможным в точке и тогда и только
тогда, когда существуют точка v е X, v фи, и число 7 >0 такие, что e = ^{v — и).
Таким образом, если функции f(x) определена на множестве X, анаправление е, |е|= 1,
является возможным в точке иеХ, то функция g(t) = f(u + te) определена на отрезке [0, i0],
где t0 >0, и df(u)/de = g'(+0) — правая производная g(t) в точке t = 0.
166
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
исключается), пусть функция д(и) выпукла ма /выпуклом множестве
X с Еп, причем (д(и)-е\а, Ъ] при всех и е X. Тогда функция
1(и) = р(д(<и.Щ
выпукла на X.
Доюазл т^ел ьст во. Возьмем произвольные u, veX и а е[0, 1]. Тогда
f(au+(l-a)v) = ip(g(au+(l~a)v)) ^ ip(ag(u)+'(l-a}g(v)) <
^^(:д(и)) + (1- a)tp(g(u)) = af(u) + (1 - <*)/(«),
что и требовалось. О
Иногда удобнее пользоваться другим вариантом этой теоремы: если
функция <£>(£) выпукла.и яе возрастает на отрезке [a, b], a д(и) вогнута на
выпуклом множестве X СЕп, д(ш)е[а, Ь] при иеХ,то функция /(н) = ip(g(u))
выпукла на X,.
Следствие 1. Если функция д(и) выпукла и неотрицательна на
выпуклом мнвжеотве X, то функция
f(u) = (g(u)Y
выпукла на X при всех р ^ 1.
С.л едет в яке 2. Если функция д(и) выпукла на выпуклом
множестве X, то функция
Ми) = (тах{0;д(и}У = (дЦи))"
выпукла на X при всех р~^1.
Следствие 3. Если функция д(и) выпукла на выпуклом
множестве X, причем д(и) < О при всех и е X, то функции
/(h) = -Vfa(u), /(h) = max{- Щ-д(и)); 0}р, р > 1,
выпуклы на Ж..
Как увидим ниже, функции, указанные в следствиях к теоремам 7, 8,
будут использованы при описании различных методов минимизации
(например, в методах штрафных и барьерных
функций и др.).
7. Выпуклые функции являются
удобным средством для задания выпуклых
множеств. Это связано с тем, что надграфик
всякой выпуклой функции является
выпуклым множеством.
Определение 2. Надграфиком
(или эпиграфом) всякой функции f(x),
определенной на множестве X с Еп, назы-
Рис. 4.5 (Надграфик) вается множество (рис. 4.5)
epi / = {(х, 7) G ЯП': хеХ,-/^ f(x)}.
Теорема 9. Для того чтобы, функция f(x), определенная на
выпуклом множестве X была выпуклой на X, необходимо и достаточно,
чтобы ее надграфик был выпуклым множеством.
Доказательство. Необходимость. Пусть функция f(x)
выпукла на выпуклом множестве X. Возьмем две произвольные точки
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
167
2, = (u,, 7,), ¾ = (щ, ъ) G epi / и составим их выпуклую комбинацию za =
= azl + (l — a)z2 = (aul + (l — a)u2, 07, + (1-^)72)1 0< о^ 1. Из выпуклости
X следует, что иа = ащ +(l-ak е X. Из выпуклости функции f(x),
учитывая, что 2,, z2 G epi /, имеем f(ua) < af(u.)+(1 - а )/(%>€ <*7,+(1 —а )72-
Следовательно, za е epi / при всех а е [0, 1]. Выпуклость epi / доказана.
Достаточность. Пусть epi / — выпуклое множество. Возьмем
произвольные и,, и2 е X и а£[0, 1]. Тогда zx = (и,, /(и,)), ^ = (^, /(^))6 epi /.
В силу выпуклости epi / точка 2а = «г, +-(1 — 0)¾ е epi /. Это.значит, что
af(u\) + 0: ~~ а)1(щ) ^ /(aui + (1 — ^)^)- Выпуклость 1 (ж) доказана. □
Те о рем;а 10. Пусть X — выпуклое множество], а функция f(x)
выпукла на X. Тогда множество М(с) = {и; и е X,f(u) < с} выпукло
при любом с.
Доказательство. Возьмем произвольные и, v G М(с), а е[0, 1].
Используя выпуклость множества X и функции f(x), имеем f(au+(l — a)v)^
^ а/(и) + (1 — a)/("u)< с, т. е. аи + {\ — a)v еМ(с), что и требовалось. □
Заметим, что обратное утверждение здесь неверно:: иа выпуклости
множества М(с) при любом с, вообще говоря, не следует выпуклость функции
f(x). Например, множество М(с) = {и: u е Ei, и3 ^ с} выпукло при любом
с, а функция f(u) = u3 невыпукла на Ei (см. упражнение 33).
Теорема 11. Пусть Х0 — выпуклое множество^ функции д^х),
г = 1,...., т, выпуклы на Х0, a gt(x) = (щ,х)-Ь{, г = т + Ь,... ., s, где а{ —
заданные векторы, из Еп, bt —заданные числа, г = т+ 1,..., s. Тогда
выпукло множество
Х={и: иеХ0, gt(u)^0, г = 1,...,т; д((и)=0, г=т + It,. . ., s}. (12)
Доказательство. В силу теоремы 10 множество Х{ = {и: и £
G Х0, д((и) ^ 0} выпукло при всех г = 1,..., т. Выпукло также множество
М = {ие Еп: (а0 и) — Ь{ = 0, г = т+ 1,..., s} — см. пример 1.5. Тогда
множество (12), являющееся пересечением выпуклых множеств^,,,..., Хт, М
само будет выпуклым. □
8. Рассмотренное в теореме 3 условие оптимальности сформулировано для непрерывно-
дифференцируемых функций. Однако аналогичное условие можно получить при гораздо
меньших ограничениях на функцию, используя лишь существование производных по направлениям.
Напоминаем, что производной функции f(x) в точке и по направлению е,.|е| = 1, называется
число
Щ»±= lim /(" + fe)-/M. (13)
Заметим, что для определения производной по направлению в точке м-нужно, чтобы и + te
принадлежало области определения f(x) при 0:¾ t < i0 хотя бы при малом t0 >0.
Определение 3. Пусть X —некоторое множество из Еп, пусть «el, Направление
е^0 называется возможным в точке и, если существует число t0>0 такое, что и+te е X при
всех t, 0^ t < t0. Иначе говоря, достаточно малое перемещение из точки и по возможному
направлению не выводит за пределы множества X.
Очевидно, если и е int X, то любое направление е ^0 является возможным в этой точке.
В граничных точках множества возможное направление может и не существовать.
Пример 6. Пусть X = {и = (х, у) е Е2: х ^ 0, ж2 < у < 2ж2}. Нетрудно видеть, что в
граничной точке (0, 0) нет ни одного возможного направления.
Для выпуклых множеств X, содержащих не менее двух точек, приведенная в примере 6
ситуация невозможна: в любой точке и такого выпуклого множества X имеется хотя бы одно
возможное направление, причем направление е ^0 будет возможным в точке и тогда и только
тогда, когда существуют точка v е X, v^u, и число 7 > 0 такие, что 6 = 7(^ ~ и)-
Таким образом, если функции f(x) определена на множестве X, а направление е, |е] = 1,
является возможным в точке иеХ, то функция g(t) = f(u + te) определена на отрезке [0, i0],
где i0 > 0, и df(u)/de = /(+0) — правая производная g(t) в точке t =0.
168
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Заметим, что если функция f(x) определена в некоторой е-окрестности точки и и
дифференцируема в этой точке, то f(x) имеет производные по всем направлениям, причем
4££il = </'(„), е), |е|=1 (14)
(ср. с (2.6.1) при i —»+0). Однако обратное неверно: из того, что функция в некоторой точке
имеет производные по всем направлениям, вообще говоря, не следует ее дифференцируемость
в этой точке, и более того, нельзя гарантировать даже ее непрерывность.
Пример 7. Пусть 2
I 0, и = (0,0) = 0.
Возьмем произвольное направление е = (cos a, sin а). Тогда
/(0+te)-/(0)sl/(icog lng)= cos2 a sin a t>Q
1 г i^cos4 a + sin а
Отсюда имеем
d/(0) _ ( cos2 a/ sin a, sin а ф 0,
de I 0, sina=0.
Однако эта функция разрывна в точке и =0. В самом деле, устремим точку и = (х, у) к нулю
по параболе у = х2. Тогда f(x, х2) = 1/2 -** /(0,0) = 0.
Таким образом, требование существования производных по направлению существенно
менее жесткое, чем требование дифференцируемое™. В связи с этим представляет интерес
получить условия оптимальности в терминах производных по направлению.
Теорема 12. Пусть X — выпуклое множество, Xt — множество точек минимума
функции f(x) на X, пусть в точке % е Х+ функция f(x) имеет производные по всем
возможным направлениям. Тогда необходимо выполняется условие
для всех возможных направлений е, |е| = 1, в точке и+. Если, кроме того, функция f(x)
выпукла на X, то условие (15) достаточно для того, чтобы «,£!,.
Доказательство. Необходимость. Пусть и+е Х+ и е, |е| = 1—возможное
направление в точке ut. Тогда /(¾ + ie) ^ /(¾) или (/(¾ + ie) - f(ut))/t ^ 0 при всех
достаточно малых i >0. Отсюда при i —»+0 получим условие (15).
Достаточность. Пусть f(x) — выпуклая функция на X, пусть в некоторой точке
и+ е х выполняется условие (15). Возьмем любую точку и е X, ифи%, и положим е = (и -
- %)/\и — uj. Направление е — возможное в точке ut, так как u+ + ie е X при всех i, 0 <
< i < i0 = \и — uj, Ц > 0. Из условия (15) тогда имеем #'(+0) ^ 0, где g(t) = /(¾ + ie).
Ниже в теореме 13 будет показано, что g(t) выпукла на [0, i0]. Из неравенства (1.8.6)
тогда следует, что g(t) - g(0) ^ g'(+0)t или g(t) ^ #(0) при всех i е [0, i0]. В частности, при
i = i0 = \и — wj отсюда имеем f(u) ^ /(¾). что и требовалось. О
В частности, если в точке и+ существует градиент f(%), то для е = (и — ut)/\u - uj,
n£l, ифи%, согласно формуле (14) имеем d/(ut)/de = {}'(%), и — %)/\и - ut\, и в этом
случае условие (15) превращается в условие (5). Таким образом, теорема 12 является
обобщением теоремы 3 на существенно более широкий класс функций. Более того, условие (15)
является наиболее естественным для класса выпуклых функций. Дело в том, что, оказывается,
всякая выпуклая функция в любой внутренней точке множества имеет производные по всем
направлениям. Это вытекает из следующих двух теорем.
Теорема 13. Пусть X —выпуклое множество, функция f(x) определена на X.
Для того чтобы f(x) была выпуклой на X, необходимо и достаточно, чтобы для любой
точки и е X и любого возможного направления е в точке и функция g(t) = f(u + ie)
одной переменной t была выпукла на отрезке [а, Ь], где о= inf{i: и + te е X], b = sup{i:
u + teeX] (ясно, что а^.0<Ь; еслии + аефХ илии + ЪефХ, то функцию g{t) не следует
рассматривать соответственно при t = а или t = b ).
Доказательство. Необходимость. Пусть f(x) выпукла на X. Возьмем
произвольную точку и еХ, какое-либо возможное направление е в этой точке и составим
функцию g(t) = /(u + ie), а< i ^ b. Пусть i,, i2 — произвольные точки из [а, Ь] и а е[0, 1]. Тогда
g(atl+{l-a)t2) = f(a(u + tie) + (l-a)(u + t2e))^af(u + tle) + (l-a)f(u + t2e) = ag(tl) +
+ (1- a)g(t2), что и требовалось.
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ 169
Достаточность. Пусть для всех и е X и всех возможных направлений е в точке и
функция g(t) = f(u + te) выпукла на соответствующем отрезке [а, 6]. Возьмем любые точки
u,»el, u^v, положим е = v — и — это возможное направление в точке и, так как и + t(v —
— и) е X при 0 < i < 1. Из выпуклости g(t) = f(u + te) получим f(av + (1 — а)и) = д(а) =
= д(а ■ 1 +(1 -a) ^0)^0^(1) + (1 - а)д(0) - af(v) + (1 - a)f(u) при всех о е [О, 1]. О
Теорема 14. Пусть X —- выпуклое множество, функция f(x) выпукла на X. Тогда
в любой точке и е п X функция f(x) имеет производные по всем направлениям е е Lin X.
В частности, если int X ^0, то в точке и е int X существуют производные функции f(x)
по всем направлениям е€.Еп, |е| = 1.
Доказательство. Зафиксируем какое-либо направление eeLinX, |е| = 1, и точку
и е riX. Согласно определению 1.10 существует е-окрестность О (и, е) = {и е Е : \v - и\ < е}
точки и, такая, что пересечение 0(и, e)naffX целиком принадлежит X. Учитывая, что -е
также принадлежит ЦпХ, можем сказать, что и + te еХ для всех t, \t\ ^.t0,0<tQ< е. Это
значит, что функция g(t) = f(u + te) определена на отрезке [—%, t0] и согласно теореме 13
она выпукла на этом отрезке. Поскольку t =0 — внутренняя точка отрезка [-¾. i0L т0 п0
теореме 1.8.2 существует
,/(+0)= lim 9(t)-9(0)= lim /(" + te)-/(tx) = j»u1
Если и e X \ ri X, то в такой точке у выпуклой функции производные по возможным
направлениям могут и не существовать—об этом свидетельствует пример 1.8.2. О
9. Приведенный выше пример 7 показывает, что существование производных по всем
направлениям не гарантирует непрерывности функции. Но для выпуклых функций такая
ситуация, оказывается, невозможна.
Теорема 15. Пусть множество X выпукло и intX^0. Тогда выпуклая
функция f(x) во всех внутренних точках множества X непрерывна. В частности, функция,
выпуклая на всем пространстве Еп, непрерывна во всех точках.
Доказательство. Возьмем произвольные и е int X и:е > 0. По определению
внутренней точки существует число S >0 такое, что u + h€.X, u+nh*ei еХ для всех Л = (Л', ..., hn),
\h\ < S/n; здесь et- = (0 О, 1, 0,..., 0), i = 1,..., п — базис в Еп. Поскольку по теореме 14
функция f(x) в точке и имеет производные по направлениям ег, то она непрерывна в этой
точке по направлениям eit г = 1,..., п. Поэтому можно взять число S столь малым, чтобы
\f(u + nhlе{) — f(u)\ <е при всех h, \h\< S/n, г = 1,..., п. Тогда, пользуясь неравенством (2),
получаем
f(u + h)-f(u) = f(l E(u + nft4))-/(uK^ 't(f(u+nhiei)-f(u))<e (16)
Х г = 1 ' i = I
для всех h, \h\ < 6/п. В частности, для —h, удовлетворяющих неравенству |— h[< S/n, из (16)
следует f(u — h) — f(u) < е. Но в силу выпуклости f(x) имеем f(u) = f((u + h)/2+(u — /i)/2)<
< (f(u + h) + f(u ~ h))/2, поэтому f(u) - f(u + h) < f(u -h)- f(u) < е. Отсюда и из (16)
следует \f(u + h) - f(u)\ < e при всех h, \h\ < S/n. О
Заметим, что если int X = 0, то, рассматривая лишь точки из affX, аналогично можно
доказать непрерывность выпуклой на X функции во всех точках и е ri X. В качестве базиса
{ej}. участвующего в доказательстве, в этом случае нужно взять базис подпространства LinX.
В точках и е X \ ri X выпуклая функция может терпеть разрыв — об этом говорит пример 1.8.1.
Теорему 15 дополняет доказываемая ниже теорема 6.6.
10. Рассмотрим выпуклые функции на выпуклом множестве X, принадлежащие классу
С' 1(Х) (см. определение 2.6.3), т. е. гладкие выпуклые функции, градиент которых
удовлетворяет условию
\f'(u)-f'(v)\4L\u-v\ Уи, v е X, L = const ^ 0. (17)
Для таких функций имеют место неравенства
0^<f'(u)-f'(v),u-v>^L\u-v\2 Vu,veX. (18)
В самом деле, левое неравенство следует из теоремы 4, а правое — из условия (17).
Оказывается, при int X ^ 0 эти два неравенства можно записать в виде одного равносильного
неравенства [24; 234; 525], полностью характеризующего класс выпуклых функций из С' '(X)
с данной постоянной L ^ 0.
170
Гд. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Теорема 16. Пусть X — выпуклое множество из Еп, int X ф 0. Для тоео чтобы
функция f(x) из класса С1''1,(Х) была выпуклой и удовлетворяла условию (17) с
постоянной L, необходимо и достаточно, чтобы
\f'(u)-f'(v)\24L(f'(u)-f'(v),u-v) V«,«eX (19)
Из (19) следует неравенство [24]
{f'(u)-f'(v),v-w)^^L\u-w\2 \/u,v,weX. (20)
Доказательство. Достаточность. Если выполняется неравенство (19), то из
него, во-первых, следует, что (/'(и) - /'(■"), и — v)~£ 0, Vu, «el, и выпуклость f(x)
гарантируется теоремой 4, и, во-вторых, применяя к правой части (19) неравенство Коши— Буня-
ковского и деля на \f'(u) - f'(v)\, получаем условие (17). Из выпуклости f(x) и условия (17)
имеем неравенства (18). Таким образом, из (19) следует (18).
Кроме того, из (19) имеем
(/'(«) - /'(«), «-«,) = {/'(и) - /'(«), u-w)- (f'(u) - /'(«), u-v)4
< (f'(u) - f'(v), u-w)- \-\f(u) - f(v)\2 = -\L->l2(f'(u) - /'(«)) -
- iL'/2(u-w)|2 + ^L|u-w|2< iL|u-w|2 V«,n,t»el
неравенство (20) установлено. Заметим, что при доказательстве достаточности условие int X ф
Ф 0 не использовано.
Необходимость. Пусть функция f(x) выпукла и удовлетворяет условию (17). Тогда,
как было показано выше, справедливы неравенства (18). Остается из (18) получить (19).
Сначала рассмотрим случай, когда f(x) е С2(Х). Тогда
0 ^ (/"(«К, £Kb|£l2 VneX (21)
при всех £ £Еп. В самом деле, из неравенств (18) с помощью формулы (2.6.4) в случае
и е int X имеем
0^{f'(u + ea-f'(u),eO = s2(f"(u + e£^,O^^\2^
или0^(/"(и+бе£)£, £):gL|£|2, О^в^. 1, для всех е, |е| ^¾. £о>0. Отсюда при е-»+0
получим (21) для точек и eintX. Если и еГрХ, то оценка (21) доказывается с помощью предельного
перехода от внутренних точек так же, как это делалось при доказательстве теоремы 5.
Далее, пользуясь формулой (2.6.5), имеем
i
f'(u + h) - f'(u) = Ah, A = lf"{u+th)dt, h = v-u. (22)
0
Разумеется, матрица А зависит от и, v, но эту зависимость мы для краткости не будем явно
указывать. Согласно (21) 0 ^ (/"(u + th)£, £) ^ Ь|£|2, 0 ^ t ^ 1, откуда, интегрируя по t,
получаем
0^<Л£,£КЬ|£|2, £еЯп. (23)
Таким образом, симметричная матрица А неотрицательно определена. Тогда существует
симметричная неотрицательно определенная матрица Л1/2 такая, что (АХ12)2 = А [192, 353].
Пользуясь оценкой (23) при £ =All2h, с помощью формул (22) имеем
\f'(u)-f'(v)\2={Ah, Ah)={AA,t2h,A1t2h)^L\All2h\2=L(Ah, h)=L(f'(u)-f'(v), u-v).
Неравенство (19) доказано при дополнительном предположении f(x) е С2(Х).
Наметим схему доказательства для случая, когда f(x) е С1(Х). Построим
последовательность функций {fk(x)}, i€l, и последовательность {Хк} строго внутренних и выпуклых
подмножеств множества X таких, что X = [j Хк, Хк с Хк +,, к = 1, 2,..., для всех к > 1
£> I
и всех т Z к функция fm(x) выпукла на Хк, fm(x) е С2(Хк), \fm'(u) - fm'(v)\ ^ L\u - v\
для любых n,iieX,, lim fm(u) - f(u), lim f '(u) = f'(u) при всех u£Xk. В силу дока-
771 —* ОО 1Т1 —* ОО
занного тогда \fm'(u) - fm'(v)\2 ^ L (fm'(u) - fm'(v), u-v) при всех u,v&Xk и всех т > к.
Отсюда при т —»оо получим неравенство (19) на множестве Хк. Далее, при к —»оо
убеждаемся в справедливости (19) для всех и, v е int X. Наконец, для граничных точек множества
X (неравенство (19) доказывается с помощью предельного перехода от внутренних точек).
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
171
Как построить упомянутые последовательности {Хк} и {Д(ж)|? В качестве {Хк\ может
быть взята последовательность подмножеств всех внутренних точек множества X, удаленных
от границы X на расстояние не менее чем 36к, где lim 6к =0, 6к > 8к + 1 > О, к = 1, 2 В
качестве fk(x) могут быть взяты средние функции Стекдова — Соболева [534], например,
fk(x)= I f(w)uik(w-x)dw, шк{х) = 6кп%-х ш{\х\8кх),
i
где uj(r) = ехр{—1/(1 — г2)} при |г| < 1, ш(г) = 0 при [г| ^ 1, *= $ ui(r)dr и функция f(x)
вне X доопределена тождественным нулем. О -1
Приведем пример, показывающий, что условие int X ф0 в теореме 16 существенно [798].
Пример 8. Рассмотрим функцию f(u) = ху на множестве Х = {и = (х, у) £Е2: у = 0}.
Так как f(u) = 0 VueX, то ясно, что f(u) выпукла на X. Далее, f'(u) = (у, х), так что
f'(u) = (0, х) \/и е X. Возьмем произвольные точки и = (х, 0), v = (а, 0) е X, иф v. Тогда
\f'(u)—f'(v)\ = \x—а|,т. е. условие (17) выполнено с L = 1. Наконец, здесь \f'(u)-f(v)\2=\x-
— а|2> L{f (u)-f'(v), u—v) = 0 Уи, иеХ, v,y£v. Как видим, неравенство (19) не выполняется.
Остается заметить, что здесь int X = 0.
11. Остановимся на одном замечательном свойстве выпуклых множеств, задаваемых
ограничениями д(х) < с, где д(х) — выпуклая функция.
Теорема 17. ПустьХ0— непустое выпуклое замкнутое множество из Еп, функция
д(х) выпукла и полунепрерывна снизу на Х0, пусть
М(с) = {и:и£ Х0, д(и) ^ с}.
Тогда для ограниченности множества М(с) при каждом с необходимо и достаточно,
чтобы при некотором а множество М(а) было непустым и ограниченным.
Доказательство. Необходимость. Она очевидна. Достаточность.
Пусть М(а) ф 0 и это множество ограничено. Поскольку М(с) С М(а) при всех с ^ а, то
М(с) ограничено при всех с ^ а (пустое множество ограничено по определению). Остается
рассмотреть случай с > а. Предположим, что при некотором с > а множество М(с) не
ограничено. Заметим, что М(с) выпукло и замкнуто, что следует из леммы 2.1.1 и теоремы 10.
Покажем, что существует вектор е^0 такой, что u+te&M(c) при всех t ^0 и всех и£М(с)
(направление, задаваемое таким вектором е, принято называть рецессивным направлением
неограниченного выпуклого множества).
Поскольку множество М(с) не ограничено по предположению, то существует
последовательность {ик} &М(с) такая, что |iifcf—юо при к —»оо. Возьмем какую-либо точку йеМ(с) и
построим вектор ек = (ик - й)х \ик — й\~х, к = 1, 2,.... По теореме Больцано — Вейерштрас-
са из последовательности {е^.} можно выбрать подпоследовательность {ек }, сходящуюся к
некоторому вектору е, |е| = 1.
Возьмем произвольное t > 0. Поскольку 0 < t/\uk — й\ < 1 при всех к ^ к§, то в силу
выпуклости М(с) имеем
^+^ = ^ + (1^)^^11 к>к°-
Отсюда при кт —» оо получим й + te е М(с), так как М(с) замкнуто. В силу произвольности
t > 0 заключаем, что й + te С М(с) при всех t ^ 0.
Теперь возьмем любую точку и &М(с) и покажем, что и + te е М(с) при каждом t ^ 0. По
доказанному й + \хе е М(с), /м > 0. В силу выпуклости М(с) тогда
1(в + ^е) + (l - 1)u = u + te + И^й е М(с)
при всех /л> t. Отсюда при д-sooc учетом замкнутости М(с) получим u + ie е М(с) при
каждом i ^ 0.
Зафиксируем какую-либо точку v еМ(а) С М(с). В силу построения вектора е тогда v + teG
еМ(с), i >0. По условию множество М(а) ограничено, поэтому луч {v + te, t ^OJ- пересекает
границу выпуклого множества М(а) в некоторой точке, или, точнее говоря, найдется число
i0 = sup{i: v + te еМ(а)} такое, что v + te фМ(а) при всех t > t0. Это значит, что v + t®GX0,
но с > g(v + te) > а > #(и) Для всех * > V
Зафиксируем какое-либо i > i0- Тогда, пользуясь представлением
и + ie = A(u + je) +(1 -Л)и, 0 < Л < 1,
и выпуклостью функции #(ж), имеем g(v + te)4Xg(v + (t/X)e)+(l-X)g(v),nnn g(v+(t/X)e)^:
> (ff(u + te) - g(v))/X + g(v), 0 < Л < 1. Поскольку g(v + te) > g(v), TO при A -»+0 отсюда
172
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
получим g(v + (i/A)e) —> оо. Тогда найдется число А0 > 0 такое, что g(v + (i/A)e) > с при
всех А, 0 < А < А0. С другой стороны, по построению вектора е имеем v + (t/X)e е М(с) или
g(v + (i/A)e) ^ с при всех А, 0 < А < 1. Полученное противоречие доказывает теорему. О
Отметим, что требование полунепрерывности снизу функции в теореме 17 существенно
(см. ниже упражнение 21).
12. Наконец, получим оценку снизу скорости роста выпуклой функции для случая, когда
множество точек ее минимума ограничено.
Теорема 18. Пусть f(x) — выпуклая функция на X = Еп, Д = inff(x)> —оо, Х+=
= {и&Еп: f(u) = Д} ф 0, причем Xt — ограниченное множество, т. е. существует такое
число R >0, что Xt С Я, = {и€Еп: \u-uj <R}, где и„ —какая-либо фиксированная точка
из Xt. Тогда lim /(u) = oo и, более того, верна оценка
\и\ —» ОО
/(u)>|u-tij^pk+/. Vu*S„ (24)
где Ъп = Jnl s f(u)> U Гр S^{uc Еп: \и- %\ = R}.
Доказательство. Возьмем любую точку ^^¢8^. Поскольку
v = и„ + R.U"U* = , Д ,и +(\- , Д ,)и„ е Гр St,
то с учетом выпуклости f(u) имеем
Ал </<«>< W~jfM + 0-1^)/^)-
Отсюда получаем требуемое неравенство (24). Согласно теореме 15 функция f(x) непрерывна
на Еп, и в силу теоремы 2.1.1 на замкнутом ограниченном множестве Гр St она достигает
своей нижней грани хотя бы в одной точке. Отсюда и из того, что замкнутые множества Xt и
Гр St не пересекаются, следует, что Дд > Д. Тогда из оценки (24) имеем lim f(u) = oo. О
juj —»оо
Отметим, что для функции f(u) = \и\, и &Еп, неравенство (24) превращается в
тождественное равенство. Это значит, что оценка (24) на классе выпуклых функций является точной.
Некоторые другие свойства выпуклых функций и множеств будут рассмотрены ниже.
Существуют более широкие, чем выпуклые, классы функций, которые наследуют некоторые
важные свойства выпуклых функций [774, 806]. Некоторые такие классы приведены ниже в
упражнениях 33, 34.
Упражнения
1. При каких а, Ь, с функция f(u) = ах2 + 2Ьху + су2 переменных и = (х, у) е Е2 будет
выпуклой на Е2? Вогнутой на Е2?
2. Найти области выпуклости и вогнутости функций f(u) = sin(a; + у + z), f(u) = sin(a;2 +
+ 2/2+ z2).
3. При каких р, q функция f(u) = xppq будет выпуклой (или вогнутой) на множестве X =
= {и = (х, у) е Е2: х > 0, у > 0}? Аналогичное исследование провести для функции f(u) =
= xpyqzr на X = {и = (х, у, z): х > 0, у > 0, z > 0}.
4. Если функция f(u) выпукла, то будет ли выпуклой функция |/(и)|?
5. Если функция f(x) выпукла на Ет, а А — матрица размера т х п, то функция д(и) =
= f(Au) выпукла на Е™. Доказать.
6. Если f\(u),f2(u) выпуклы, то будет ли их произведение выпуклой функцией?
Рассмотреть пример /] (и) = и, f2(u) = и . Что изменится, если от функций /, (и), /2(и) потребовать
неотрицательности? Или монотонности?
7. Пусть функции fk (и) выпуклы на выпуклом множестве X при всех к — 0, 1,... и пусть
00
существует предел lim fk(u) = f(u) или сходится ряд J2 fk(u) = f(u) ПРИ всех и^Х.
к -»оо k=0
Доказать, что функция f(u) выпукла на X.
8. Выяснить, когда в неравенстве (2) возможно равенство, если f(u) — строго выпуклая
функция.
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
173
9. Доказать неравенства:
а) 45^1 ■ ■ ■ ^т < ЖО"! + ■ ■ ■ + хт)> xl>° ffim>°;
б) (as, + ... + xjn ^ т"" '« + . .. + <), х{ > О ят ^ 0, n ^ 1;
в) (ж, + ... + ят)(яГ' + ... + О > т2,хх > 0 жт >0;
г) Е КНУ < (.£ lailP)'/P(;?, I6*'*)' * Vo,, 6,. GR. i + i = 1, р > 1, в > 1;
Д) (а/- ■ ■ <*т)1/т +"('b, ■ ■ ■ bm)4lm~i ((a, +6,)--- (а + Ьт)) l'm Va. ^ О, Ь, > 0.
Указание: воспользоваться неравенством (2) для выпуклых функции /(а) = -ши,
u>0; /(u) = u", u^O, njtl; /(u) = u_1, u >0, f(u) = UP, u>0, p>l; f(u) = ln(l + e") при
подходящим образом выбранных аг-, х{, г = 1 т. Выяснить, при каких условиях в этих
неравенствах возможно равенство.
10. Пусть функция f(u), и е Еп, такова, что /(ом + (1 — a)v) ¢. af(u) + (1- a)f(v) при
всех а,«е Е , а е Е. Проверить, что аффинная функция f(u) =< а, и > +Ь, а е 15", Ь е
£ Е , удовлетворяет этому неравенству. Существуют ли другие функции, обладающие этим
свойством?
11. Для того чтобы функция fx) была строго выпуклой на выпуклом множестве X,
необходимо и достаточно выполнения неравенства (4) (а в случае f(x) е О'(Х) — неравенства (6)),
которое может обратиться в равенство лишь при u = v. Доказать.
12. Доказать, что если X — выпуклое множество, f(x) е С2(Х) и неравенство (8) является
строгим при всех £ eLinX, £ ^0, то функция f(x) строго выпукла на X. Верно ли обратное
утверждение? Рассмотреть пример f(x) = xi, xgE1.
13. Пусть X —выпуклое множество, f(x) выпукла на X и f(x) е С'(Х). Доказать, что
тогда критерий оптимальности (5) равносилен неравенству {/'(и), u — ut) ^ О при всех и еХ.
14. Пусть f(x) — выпуклая функция на выпуклом множестве X, /(ж) е с'(Х) и Д =
= inf f(x) > —оо. Доказать, что для того чтобы некоторая последовательность {ик} е X
была минимизирующей, т. е. lim /(%) = /*, необходимо и достаточно выполнения условия
к -»оо
lim (f'(uh), и — ик)^0 при всех uel (ср. с теоремой 3).
к —»оо
15. Пусть строго выпуклая функция f(x) достигает на Еп своей нижней грани. Доказать,
что тогда lim f(u) = оо.
juj—»00
Указание: воспользоваться теоремами 1, 18.
16. Пусть функция f(x) выпукла и полунепрерывна снизу на выпуклом замкнутом
множестве X из Еп, ft >-оо, Х„ ^0, причем Х„ С S„ = {и еХ: \u-uJ<R}, где ut —какая-либо
фиксированная точка из Х„. Тогда
/(ц)^|ц-ч1Длд Д+/« Vue-Х, u*s„,
где Дд = inf /(и)>Д,Гр S,t = {ueX: |u-ut| = Л}. Доказать, пользуясь схемой доказатель-
Гр 5t
ства теоремы 18.
17. Выпуклая функция, отличная от постоянной, может достигать своей верхней грани на
выпуклом множестве лишь в его граничных точках. Доказать.
18. Для того чтобы функция р(и, X) = inf \и — v\ была выпуклой на Еп, необходимо и
чел:
достаточно, чтобы замыкание множества X было выпуклым. Доказать.
19. Пусть X — ограниченное множество из Еп. Доказать, что функция <5(с, X) = sup (с, и)
иех
переменной с&Еп, называемая опорной функцией множества X, выпукла на Еп.
20. Пусть X —выпуклое множество из Еп, О е int X. Доказать, что функция ц(и, Х) =
= inf а, Аи = {а: а > О, и/а е X}, называемая функцией Минковского, выпукла на Еп.
21. Пусть X = {и = (х, у): х ^ 0, у > 0} = Е2. Показать, что функция
Г 2/, х ^ 0, у > О или 0 < х ^ 1, У = О,
\ х- 1, ж> 1, 2/ = 0,
выпукла и полунепрерывна сверху, но не является полунепрерывной снизу на X. Убедиться,
174 Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
что множество М(с) = {и е X: д(и) ^ с} ограничено при с = 0 и не ограничено при всех с > О
(ср. с теоремой 17). Показать, что М(с) не замкнуто при каждом с>0.
22. Множество Хс = {и е 15": #г(и) < с, г = 1,..., m}, где &(«) — выпуклая функция на
Еп, будет ограничено при любых с тогда и только тогда, когда Хс ограничено хотя бы при
одном значении с = cq. Доказать.
23. Пусть X —неограниченное замкнутое выпуклое множество из Еп. Доказать, что
1) для любой точки v е X существует ненулевой вектор е такой, что луч {и = v + te, t ^
?>0}еХ;
2) если луч {u = v + te, t ^ 0} е X при некотором »еХ, то луч {u = w + te, t ^ 0} е X при
всех ш е X. Показать, что требование замкнутости X существенно для обоих утверждений,
рассмотрев множество X = {и = (ж, у): 0 < ж < 1} и {(0, 0)}.
Указание: воспользоваться рассуждениями из доказательства теоремы 17.
24. Доказать, что функция
П ' 10, 2/ = 0.
выпукла на множестве Х = {и = (ж, у): у>0}и{(0, 0)} и полунепрерывна снизу на X.
Убедиться, что /(и) не является полунепрерывной сверху в точке «д = (0, 0), и, более того, показать,
что для любого числа А ^0 существует такая последовательность {ui.}eX, {%}—> 0, что
lim f(uk) = A.
к —> оо
25. Пусть X = {и е 152: Ли ^6} — многогранное множество, функция f(u) выпукла на X.
Доказать, что f(u) полунепрерывна сверху на X [617, стр. 101].
26. Пусть функция f(x) выпукла и ограничена сверху на Е* = {и = (и1,..., ип)£Еп: и' ^
^0 ип ^0}. Доказать, что /(ж) монотонна и не возрастает на Е" по каждой переменной.
27. Доказать, что если выпуклая функция f(x) на Еп ограничена сверху, то f(x) постоянна.
28. Пусть f(u) — выпуклая дифференцируемая функция на отрытом выпуклом множестве
И^из Еп. Доказать, что тогда градиент f'(u) = (df(u)/dul,..., df(u)/dun) непрерывен на W
[617, стр. 263] (см. теорему 6.7).
29. Пусть /(ж) — выпуклая функция на выпуклом множестве X из Еп. Доказать, что '/(ж)
удовлетворяет условию Липшица на каждом ограниченном множестве V, замыкание которого
принадлежит п'Х. [617, стр. 103].
30. Пусть f(x) — выпуклая функция на открытом выпуклом множестве W из Еп. Доказать,
что /(ж) почти всюду на W дифференцируема [617, стр. 262].
31. Пусть Х0 — выпуклое замкнутое множество из Еп, д(и) — выпуклая функция на Х0,
Х = {иеХ0: д(и)^0}. Пусть {ик}сХ0, {д(ик)}-*0. Можно ли утверждать, что {р(ик, Х)}->
->0? Рассмотреть пример Х0 = {и = (х, у) elS2: ж^1}, д{и) = у2/х, ик = {к, \/к), к=\,2
32. Пусть X — выпуклое замкнутое множество из Еп, f(u) — выпуклая непрерывная
функция на X, Д>-оо, Х+^0. Пусть {ut}el, {/(%)}->/*• Можно ли ожидать, что
{p(uk,Xt)}->0? Рассмотреть пример Х = {и = (ж, у) ей2: ж^ 1}, f(u) = y2/x, ик = {к, Vk),
к = Г, 2,....
33. Пусть X — выпуклое множество. Функция /(ж) называется квазивыпуклой на
множестве X, если
f(ax + (1- а)у) < тах{/(ж); /(у)} Уж, у е XVa е [0, 1].
Доказать, что [774; 806]:
1) если /(ж) выпукла на X, то /(ж) квазивыпукла на X. Показать, что функция /(ж) = ж3
квазивыпукла на любом отрезке а < ж ^ Ь, где а < 0, но невыпукла на [а, 6];
2) функция /(ж) квазивыпукла на X тогда и только тогда, когда множество Лебега М(х) =
= {у е X: /(у) ^ /(ж)} выпукло при всех ж е X (ср. с теоремой 10);
3) унимодальная функция на отрезке [а, Ь] (определение 1.1.7) квазивыпукла на [а, 6];
4) привести пример квазивыпуклой функции, имеющей разрывы во внутренних точках
множества X (ср. с теоремой 15);
5) будет ли сумма двух квазивыпуклых функций квазивыпуклой? Рассмотреть пример:
/,(ж) = ж3, /2(ж) =-Зж, жеХ = 151;
6) если /(ж) е СХ{Х), то /(ж) квазивыпукла на X тогда и только тогда, когда для всех
ж, у е X, для которых /(ж) ^ f(y), справедливо неравенство {f'(y), у-х)^0;
§ 2. ВЫПУКЛЫЕ ФУНКЦИИ
175
7) привести пример квазивыпуклой функции, для которой выполнение неравенства (5) не
гарантирует, что ж„ е Xt;
8) можно ли утверждать, что точка локального минимума квазивыпуклой функции f(x),
х&Х, является точкой ее глобального минимума на X? Рассмотреть пример: f(x) = О при
\х\^\, /(ж) = -(ж+1)2 при x<-l,f(x) = (x-l)2 прих>1, X = Е{.
34. Пусть X — выпуклое множество. Функция f(x) е С1(Х) называется псевдовыпуклой
на X, если для всех х,у£Х, для которых (f'(x), у — х) ^0, справедливо неравенство f(y) ^
^ fix) (ср. с п. 6 упражнения 33).
Доказать, что [315; 774; 806]:
1) если f(x) выпукла на X, f(x) е С'(Х), то f(x) псевдовыпукла на X. Указание:
воспользоваться неравенством (4): (f'(x), y-x)^.f(y)—f(x) Ух, у&Х. Показать, что функция
f(x) = — х2, х е X = {х е Е1: х < 0} псевдовыпукла, но невыпукла на X;
2) если f(x) псевдовыпукла на X, то f(x) квазивыпукла на X. Показать, что функция
f(x) = — х2, x£X — {x€El: х ^ 0} квазивыпукла, но не является псевдовыпуклой на X;
3) если f(x) псевдовыпукла на X, то для того чтобы xt е Xt, необходимо и достаточно,
чтобы (/'(х„), х — ж„) ^ 0 Уж е X (ср. с теоремой 3 и с п. 7 упражнения 33);
4) всякая точка локального минимума псевдовыпуклой функции f(x) на X является точкой
ее глобального минимума на X (ср. с теоремой 1 и с п. 8 упражнения 33);
5) будет ли сумма двух псевдовыпуклых функций псевдовыпуклой? Рассмотреть пример:
/,(х) = х3 + х, /,(х) = -х, i£l=B';
6) функция }{х) псевдовыпукла на X тогда и только тогда, когда для всех х, у е X, для
которых f(y) <f(x), справедливо неравенство (f'(x), у — х) < 0;
7) если f(x) псевдовыпукла на X СЕ1, то f(x) — унимодальная функция
(определение 1.1.7). Верно ли обратное утверждение?
8) дробно-рациональная функция f(x)= ах^ , ad — bc^0, псевдовыпукла на любом
отрезке [а, 6], не содержащем точку х = --g-;
9) для гладких выпуклых функций из (4) следует двойное неравенство
(f'(x),y-x)^f(y)-f(x)^(f'(y),y-x) Чх,у&Х.
Автор полагает, что левое из этих неравенств подсказывает определение псевдовыпуклой
функции, а правое — определение квазивыпуклой функции (в форме п. 6 упражнения 33).
Подумайте над этим эвристическим соображением.
35. Пусть f(x) е С1' '(Я") (см. определение 2.6.3). Доказать, что [234; 525]:
/„= inf. f(x)£f(x)~ 2г1/'(*)|2 VsB.eS». (25)
Указание: в неравенстве (2.6.7) принять х = у — у f'(y).
36. Пусть функция f(x) е Су>у{Еп) и выпукла на Еп. Доказать, что [234; 525]:
jn\f'(x)-f'(y)\4f(x)-f(y)-(f,(y),x-y) \/х,усЕп. (26)
Указание: к функции g(x) = f(x) - f(y) - (f'(y),x - у) применить неравенство (25);
убедиться, что gt = inf д(х) = д(у) = 0. Сравните неравенство (26) с (4).
х£Еп
37. Для выпуклых функций f(x) е С1' *(Еп) доказать неравенство (19), опираясь на
неравенство (26) [234; 525]. Указание: в (26) поменять ролями х, у и сложить получившееся
неравенство с (26).
38. Остается ли верной теорема 5, если функция f(x) в некоторых точках множества X
не имеет второй производной, но непрерывна в них? Рассмотреть примеры: f(x) = (\x\ - I)2
/(х) = -|х|, х€ Е1.
39. Доказать, что каждая дважды непрерывно дифференцируемая функция f(x) на
компактном множестве представима в виде разности двух выпуклых функций. Указание:
рассмотреть функции /,(х) = f(x) + ах2, f2(x) = ах2, где а достаточно большое
положительное число.
40. Доказать, что всякая непрерывная функция на компактном множестве является
пределом равномерно сходящейся последовательности функций, представимых в виде разности
двух выпуклых функций.
176
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
41. Пусть функция f(x) конечна и выпукла на Еп, множество X непусто и выпукло, {хк} —
произвольная последовательность из Еп, для которой lim р(хк, X) = 0. Доказать, что тогда
_Щп_/Ы>/.= ш!у1(х)[Щ. *-*<*>
к-кх> х^х
42. Пусть X —выпуклое замкнутое множество из Еп, функция f(x) выпукла и
полунепрерывна снизу на X, пусть Д > —оо, Xtt^0, Xt — ограничено. Тогда для Уа > 0 множество
M{ft + a) = {xeX: f(x) </„ + а} ограничено и каждая минимизирующая последовательность
{хк} сходится к Xt. Доказать. Указание: воспользоваться теоремой 17.
§ 3. Сильно выпуклые функции
1. Непрерывная выпуклая функция на выпуклом замкнутом множестве
может не достигать своей нижней грани на этом множестве. Например,
если f(x) = \/х, X = {хеЕ1: ж> 1}, то /„ = inf fx) = 0, но /(ж)>0при всех
х Е X. Однако можно выделить подкласс выпуклых функций, для которых
подобная ситуация невозможна.
Определение 1. Функция f(x), определенная на выпуклом
множестве X, называется сильно выпуклой на X, если существует постоянная
х > 0 такая, что
f(au + (l-a)v)^af(u) + (l-a)f(v)-\a(l-a)x\u-v\2 (1)
при всех u, v Е X и всех а, 0^ а < 1. Постоянную х называют постоянной
сильной выпуклости функции f(x) на множестве X.
Очевидно, сильно выпуклая на X функция будет выпуклой и даже строго
выпуклой на X. Примером сильно выпуклой функции на всем пространстве
Еп может служить функция
П(х) = (х, х) = \х\2, хеЕп.
Для этой функции неравенство (1) превращается в тождественное
равенство с постоянной х = 2:
\аи + (I — a)v\2 = а\и\2 + (I — a)\v\2 — а(1 — а)\и — v\2 (2)
при всех и, v Е Еп, а Е [0, 1]. Линейная функция f(x) = (с, х) выпукла на
Еп, но не сильно выпукла. Упомянутая выше функция f(x)= 1/х при ж> 1
выпукла, но не сильно выпукла.
Нетрудно видеть, что сумма выпуклой функции на выпуклом множестве
X и сильно выпуклой функции на том же множестве с постоянной х будет
сильно выпуклой функцией на X с той же постоянной х. Если f(x) сильно
выпукла на X с постоянной х, то д(х) = cf(x) при любом с = const > 0
будет сильно выпуклой на X с постоянной сх.
Теорема 1. Пусть множество X выпукло и замкнуто, а функция
f(x) сильно выпукла и полунепрерывна снизу на X. Тогда:
1) множество Лебега
M(v) = {u:ueX, f(u)^f(v)}
выпукло, замкнуто и ограничено при всех v Е X;
2) ft = inf/(и) > —оо, множество Х^ = {и: и е X, /(и) = /„} непусто и,
более того, состоит из единственной точки %;
3) имеет место неравенство
ix|n-nt|2^/(n)-/(4) VhgX; (3)
§ 3. СИЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
177
4) любая минимизирующая последовательность {ик}: ик е X, к =
= 1,2,..., lim f(uk) = ft, сходится к точке ut.
к —* оо
Сформулированная теорема является обобщением теоремы Вейерштрас-
са 2.1.1. В отличие от теоремы 2.1.1, здесь на функцию накладывается более
жесткое ограничение, но зато от множества X не требуется
ограниченности. В частности, в теореме 1 возможно X = Еп.
Доказательство. Если множество X ограничено, замкнуто, т. е.
компактно, то все утверждения теоремы 1, кроме неравенства (3), следуют
из теоремы 2.1.1. Поэтому пусть X —неограниченное множество. Возьмем
произвольную точку v Е X и рассмотрим множество
S = S(v,l) = {u: иеХ, |и-«|<1}.
Из теоремы 2.1.1 следует, что inf/(u) = ftS > —оо, так что
/(«)>/.* = /(«)-* VhgS, i/= /(«)-/., >0. (4)
Возьмем произвольную точку и е X \S, т. е. и е X, |и — «| > 1. Тогда
0<ао=1/|«-«|<1. (5)
При а = а0 из (1) получаем
«о/(и) > f(v + ао(и - «)) - (1 - at0)f(v) + а0(1 - a0)z|u - v\2/2. (6)
В силу (5) aJu — v\ = 1, поэтому v + а0(и — v) е S. Согласно (4) тогда
f(v + а0(и — vf) > f(v) — v. Учитывая эту оценку, из (6) получаем
aof(u) > aof(v) - v + а0(1 - a0)z|u - v\2/2.
Отсюда, сокращая на а0 > О и вспоминая определение (5) величины а0,
получаем
/(и) > /(«) + (1 - а0)«|« - v\2/2 - v/a0 =
= Hv) + x\u-v\2/2-(\u-v\Jf)(J*+vJI)
Применяя к последнему слагаемому неравенство аЬ ^ (а? + Ь2)/2, будем
иметь
/(н)>/(г,) + *|и-г,|2/4-(У| + ^)2/2 (7)
для всех и е X \S. Нетрудно видеть, что неравенство (7) справедливо и
при и е S. В самом деле, если и б S, т. е. \и — v\ ^ 1, то
Отсюда и из (4) следует справедливость (7) и для и е S.
Таким образом, неравенство (7) имеет место для всех и е X. Для любых
и е М(у) из (7) следует
«1« - 474 -{41+ ^\/1)2/2 ^ /(«) - /(«) < О
или
|и -«| ^ 1 + 2v/x \/ueM(v).
178
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Ограниченность M(v) доказана. Выпуклость M(v) следует из теоремы 2.10,
а замкнутость M(v) — из леммы 2.1.1. Из теоремы 2.1.2 имеем ft > — оо,
Xt ф 0. Поскольку сильно выпуклая функция строго выпукла, то в силу
теоремы 2.1 множество Xt состоит из единственной точки щ.
Докажем неравенство (3). Учитывая, что f(%) < /(и) при всех иеХ,
из (1) имеем 0^/(au + (l -a)u,)-/(«,)< a(/(u)-/(ut))-а(1-а)ж|и-
-uJ2/2, или 2a(l-a)z|u-uJ2^ a(/(u)-/(ut)) при всех аб[0,1]и«б1.
Деля на а>0 и устремляя а —>+0, отсюда получаем неравенство (3).
Наконец, пусть {uh} е X, lim f(uk) = ft. Полагая в (3) и = ик получаем
к —»оо
2*\щ -ч|2 ^f(uk)-f*' к = 1,2,.. .. Отсюда при к —> оо следует, что \щ -
- иJ —>0. Теорема 1 доказана. □
Замечание 1. При выполнении условий теоремы 1 утверждение
/„ > —оо, Х%ф& остается верным для любого замкнутого (необязательно
выпуклого) подмножества W С X — это следует из замкнутости и
ограниченности М(у) = {и: и е W, f(u) < f(v)} и теоремы 2.1.2.
2. Укажем теперь критерии сильной выпуклости для гладких функций,
аналогичные теоремам 2.2. 2.4, 2.5. Сначала докажем одно вспомогательное
утверждение.
Лемма 1. Пусть X —выпуклое множество. Функция f(x) сильно
выпукла на X с постоянной сильной выпуклости х > 0 тогда и только
тогда, когда функция g(u) = f(u) — х\и\2/2 выпукла на X.
Доказательство. Необходимость. Пусть функция f(x)
сильно выпукла на X, т. е. выполнено неравенство (1). Умножим равенство (2)
на х/2>0 и почленно вычтем получившееся равенство из (1). Будем иметь
неравенство, которое с помощью функции д(и) можно написать в виде
д(аи + (I - a)v) ^ ад(и) + (I - a)g(v) Vu,veX, а е [О, 1]. (8)
Это значит, что д(и) выпукла на X.
Достаточность. Пусть функция д(и) выпукла на X, т. е.
выполняется (8). Сложив (8) с равенством (2), умноженным на х/2 > 0, придем
к неравенству (1). Это значит, что f(x) сильно выпукла на X. □
Теорема 2. Пусть X —выпуклое множество. Если функция f(x)
сильно выпукла на X и дифференцируема в точке v е X, то
f(u)^f(v)+(f(v),u-v) + x\u-v\2/2 Vu,veX. (9)
Если f(x) е С1(Х), то она сильно выпукла на X тогда и только тогда,
когда f(x) удовлетворяет неравенству (9).
Доказательство. Заметим, что для сильно выпуклой функции
Щх) = \х\2 неравенство (9) превращается в легко проверяемое
тождественное равенство с постоянной х = 2.
|и|2 = Н2 + (2г;,и-г;) + |и-г;|2 Vu,veX. (10)
Теперь нетрудно доказать, что условие (9) равносильно неравенству
g(u)^g(v) + (g'(v),u-v) Vu,veX, (И)
где g(u) = f(u)-x\u\2/2, g'(u) = f'(u)-хи. В самом деле, если умножить
равенство (10) на ж/2 и сложить с (11), то получим неравенство (9). И
обратно: вычитая из (9) равенство (10), умноженное на ж/2, приходим к (11).
§ 3. СИЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
179
Из равносильности неравенств (9) и (11), из леммы 1 и теоремы 2.2 следует
утверждение теоремы. □
Теорема 3. Пусть X—выпуклое множество, f(x)e С1 (X). Тогда
для сильной выпуклости функции f(x) на X необходимо и достаточно
существования такой постоянной \i > О, что
(f'(u)-f'(v),u-v)^ix\u-v\2, Vu,veX. (12)
Доказательство. Легко проверить, что неравенство (12)
равносильно неравенству
(g'(u) - g'(v), и - и) > О \/u,veX
для функции д(и) = /(и) — х|и|2/2, где х = \i. Отсюда и из леммы 1,
теоремы 2.4 следует утверждение теоремы. □
Теорема 4. Пусть X выпуклое множество из Еп, f(x) е С2(Х).
Тогда для сильной выпуклости функции f(x) на X необходимо и
достаточно существования такой постоянной /л > О, что
</»,£, £>>Ж12 (13)
при всех иеХ и всех£=(£',...,£"), принадлежащих подпространству
L =Lin X, параллельному аффинной оболочке множества X (в
частности, если int X ф0, то (13) выполняется при всех f е Еп ).
Доказательство. Для функции g(n) = f(u) — z|u|2/2 ее вторая
производная равна д'"(и) = f"(u) - %In, где Тп — единичная матрица. Отсюда
ясно, что неравенство (13) с \i = х равносильно неравенству
№)£,£>> 0 УиеХ, V£eL.
Отсюда и из леммы 1, теоремы 2.5 следует справедливость теоремы. □
Замечание 1. Пример 2.1 показывает, что при int X =0,
условие (13) может и не выполняться при каждом £ е Еп.
Замечание 2. Для функций одной переменной неравенство (13)
имеет вид /"(и) > ц > 0 при всех и е X. Отсюда нетрудно вывести, что
функция /(и) = ир при любом р > 1 будет сильно выпукла на множестве
Хе = {и е Е1: и > е} при всех е > 0; если здесь е ^ 0, то такая функция
сильно выпукла лишь при р = 2. Функция f(u) = sin и сильно выпукла на
Хе = [—7г + е, -е] при всех е, 0 < е < 7г/2, но не сильно выпукла на [—щ 0].
Замечание 3. Условие (13) в теореме 4 не может быть заменено
условием
</»£,£>>0 УиеХ, V£eL, е^О. (14)
Например, для функции /(и) = е", и е X = El = L имеем (/"(«)£, £) =
= е"£2 > 0 при всех и е X, £ G L, £ ф0, но эта функция не является
сильно выпуклой. Однако если int X ф 0, f"(u) = А — постоянная матрица,
то условие (14), означающее положительную определенность квадратичной
формы (А£, £), влечет за собой условие (А£, £) > И£|2. £ е Е"' где Iх =
= inf (А£,£)>0. Согласно критерию Сильвестра для положительной
определенности квадратичной формы (А£, £) необходимо и достаточно, чтобы
все главные угловые миноры матрицы А были положительны (см.
замечание 2.2.1). Пользуясь этим условием, для функции f(u) = x2+2axy+by2+cz2
180
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
из примера 2.2 находим, что /(и) будет сильно выпукла на Е3 тогда и
только тогда, когда b — а2 > 0, с > 0.
Далее, для функции
f(u) = (Au,u)/2-(b,u), иеЕп,
из примера 2.3 сильная выпуклость на Еп будет тогда и только тогда, когда
А — положительно определенная матрица. Аналогично для функции
f(u) = \Au-b\2
из примера 2.4 сильная выпуклость на Еп будет тогда и только тогда, когда
матрица АТА —невырожденная.
3. Рассмотрим теперь сильно выпуклые функции f(x) из класса С1,1(Х),
т. е. гладкие сильно выпуклые функции, градиент которых удовлетворяет
условию
\f'(u)-f(v)\^L\u-v\, и, veX. (15)
Полезно установить связь между постоянными х, /х, L из (1), (9), (12), (13),
(15). Из условия (12) с помощью неравенства Коши — Буняковского и
условия (15) имеем \х ^ L. При доказательстве теорем 3, 4 было установлено,
что /х = х. Поэтому х ^ L.
Из определения 1 видно, что если неравенство (1) имеет место при
некотором х, то оно будет иметь место и для всех меньших положительных
значений х. Можно поставить вопрос об определении самой большой,
точной постоянной х в (1). Очевидно, такой постоянной в (1) будет
-_ inf inf "/(Ц) + (1 ~ a)f(v) ~ f(au + (1 - «И t
0<a<iv,veX a(l - a)\u - v\2/2
Аналогично самые большие постоянные в (12), (13) соответственно имеют
вид
inf </'(*)-/>),—>, ^1=ы- м <£Ш1>.
и u,veX \u-vf иеХ feLinX, ¢^0 |£f
Из доказательства теорем 3, 4 следует, что /^ = /х, = х0, причем для функций
из С1,1(Х) все эти постоянные не больше L. Заметим, что для функции
П(х) = \xf на Е" имеем /^ = /х, = Xq = £ — 2.
4. Продолжим рассмотрение сильно выпуклых функций f(x) е С1'' (X). Для таких функций
из (12) и (15) имеем неравенства
fj,\u-v\2^(f'(u)-f'(v),u-v)^L\u-v\2, u,v<=X. (16)
Оказывается, как в теореме 2.16, два неравенства (16) можно записать в виде одного
равносильного (16) неравенства [24; 234; 525], полностью характеризующего класс сильно выпуклых
функций из С1' (X) при int X ф 0 с данными постоянными L, ц, L > р, > 0.
Теорема 5. Пусть X — выпуклое множество из Е", int X ф 0 и f(x) е С1(Х).
Тогда для того чтобы функция f(x) была сильно выпуклой с постоянной х = \х > 0 и
удовлетворяла условию (15) с постоянной L >0, необходимо и достаточно, чтобы
\f(u) - f'(v\2 + L»\u - v\2 4(L+ v)(f'(u) - /'(«), u-v) (17)
при всех u,uel,
Доказательство. Необходимость. Пусть функция f(x) е С1' 1(Х) и сильно
выпукла на X. Тогда справедливы неравенства (16). Введем функцию
д(и) = /(и)-1л\и\2/2, иеХ.
§ 3. СИЛЬНО ВЫПУКЛЫЕ ФУНКЦИИ
181
Имеем д'(и) = f'(u) — ци. Тогда из левого неравенства (16) следует
(д'(и) - g'(v), u-v) = (f'(u) - f'(v), u-v)-v\u- v\2 > 0, Vu, »el,
а из правого неравенства (16) получим
(ff'H - g'(v), u-v)4(L-n)\u- v\2 \/u, veX.
Объединяя оба полученных неравенства, имеем
0 ^ {д'(и) - g'(v), и - v) ^ (L - ц)\и - v\2 Уи, v£X.
Таким образом, функция д(и) удовлетворяет неравенствам вида_(2.18). Согласно
теореме 2.16 эти два неравенства равносильны одному неравенству
\д'(и) - g'(v)\2 <С (L - 1л)(д'(и) - g'(v), и - v) \/u,ve X.
Подставляя сюда д'Ы) = /'(■") - ци, после несложных тождественных преобразований
получаем неравенство (17).
Достаточность. Пусть некоторая функция f(x) еС1(Х) и удовлетворяет
неравенству (17). Покажем, что тогда функция f(x) сильно выпукла с постоянной х = ц и
удовлетворяет условию (15) с L, где ц, L взяты из (17). С помощью неравенства Коши — Буняковского
из (17) имеем
\f'(u) - /'(„)|2 + L»\u - v\2 4(L+ n)\f'(u) - /'H| • |u - V|.
Приняв x= \f'(u)- f'(v)\, последнее неравенство можно переписать в виде х ~(L +ц)\и-
— v\x+ Ьц\и - -и|2 < 0. Квадратный трехчлен в левой части этого неравенства имеет корни
ж, = ц\и — v\, Х2 = L\u — v\. Поэтому ж, ^ х ^ :¾. т. е.
^\u-v\^\f'(u)-f'(v)\4L\u-v\ \/u,veX. (18)
Тогда (f'(u) - f'(v), и -v) ^. L\u - v\2 — правое неравенство (16) получено.
Используя левое неравенство (18), из (17) имеем 1л2\и- v\2 + L/л\и- v\2 ¢. (L +n)(f'(u)-
- f'(v, и — v). Поделив обе части этого неравенства на L + ц > 0 придем к левому
неравенству (16). Таким образом, из (17) получили неравенства (18) и (16). Левое неравенство (16)
согласно теореме 3 означает сильную выпуклость f(u) с постоянной х = /л, а правое
неравенство (16) (или (18)) дает условие (15). D
Из (17) вытекает неравенство
(/'(«) - /'И- v-w)^\(L + ц)\и - w\2 - xq^jk - «|2 Vu, v,weX
Оно доказывается так же, как и подобное неравенство (2.20).
Упражнения
1. При каких а, Ь, с функция f(u) = ax2 + 2bxy+cy2 переменных и = (ж, у) еЕ3 будет сильно
выпукла на Е21
2. Найти области сильной выпуклости функций f(u) = sln(x + y + z), f(u) = sm(x2 + у z2).
3. Рассмотреть функцию одной переменной
f<x) = { ж2(1 + ^sin(ln|a;|)), ж^О
\ 0, х = 0.
При каких значениях параметра v и на каких отрезках а< х ^ Ъ эта функция выпукла? Строго
выпукла? Сильно выпукла? Нарисуйте график этой функции.
4. Доказать, что функция f(x) сильно выпукла на выпуклом множестве X с постоянной
сильной выпуклости х >0 тогда и только тогда, когда функция g(t)=f(v+t(u—v)) переменной
t, 0 < t ^ 1, при любых u,veX сильно выпукла с постоянной сильной выпуклости x\u-v\2
[364].
5. Пусть функция /(ж) сильно выпукла и дифференцируема на выпуклом множестве X.
Пользуясь теоремами 1 -о, доказать, что:
а) }'(и) Ф } (■") Vu, v е X, и ^ v;
182
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
б) \u~v\4^\f'(v)\2 при всех ueM(v) = {u€X: /'(и)</(«->}, veX;
в)0</(и)-Д<^|/'(«)12, \u-u,\^^\f'(v)\ УиеХ.
6. Для того чтобы симметричная матрица А порядка п х п была положительно
определенной, необходимо и достаточно существования постоянных L, /л, О < /л < L, таких, что
\Ае\2 + Ьц\е\24(Ь+ц){Ае,е) \/е<=Еп,
Доказать. Убедиться, что в приведенном неравенстве в качестве \х можно взять
минимальное собственное число матрицы А, в качестве L —максимальное собственное число.
Указание: к функции f(x) = (Ах, х)/2 применить (17).
7. Пусть X —выпуклое множество, f(x) е С1(Х). Показать, что для того, чтобы функция
f(x) была сильно выпуклой и удовлетворяла условию (15), необходимо и достаточно
выполнения неравенств (18) при каких-нибудь постоянных L,(i, 0<ц^.Ь.
8. Можно ли утверждать, что сильно выпуклая функция обладает более лучшими
дифференциальными свойствами по сравнению с выпуклыми функциями? Рассмотреть функцию
f(x) = {х, х) + д(х), где д(х) — выпуклая функция.
9. Пусть X —• выпуклое множество, f(x, а) при каждом значении параметра а е А сильно
выпукла на множестве X с постоянной сильной выпуклости te(a), inf х(а) > щ > 0. Дока-
а £ А
зать, что функция f(x) = sup f(x, а) сильно выпукла на X с постоянной ка. Указание:
воспользоваться схемой доказательства теоремы 4.2.7.
10. Функция f(x), определенная на выпуклом множестве X, называется сильно
квазивыпуклой на X, если существует постоянная х > 0, такая, что
f(au + (l-a)v)^max{f(u);f(v)}-^a(l-a)x\u-v\2 \/u,veX, Vae[0, 1]
(ср. с упражнением 2.33). Доказать, что: .
а) функция g(t) = \t + a\ сильно квазивыпукла на любом отрезке [0, с] с х = ^-, но не
является сильно выпуклой (а — параметр, аеЕ);
б) функция g(t)= y(t + a)2 + b2 - а2 сильно выпукла на [0, с] с постоянной х = (Ь2 -
— а2)(тах{д(0), д(с)})~3 и сильно квазивыпукла на [0, с] с постоянной х = (тах{#(0),#(с)})~'
(a, b — параметры, a, b е Е);
в)функция f(x) = \х\, жеЕ", сильно квазивыпукла на любом ограниченном выпуклом
множестве X с постоянной х = -и-, где R —радиус шара, содержащего X, и не является сильно
квазивыпуклой на неограниченном множестве X. Функция f(x) = \х\ не является сильно
выпуклой ни на каком выпуклом множестве X с int X ф 0 [364].
§ 4. Проекция точки на множество
1. При описании и исследовании некоторых методов минимизации ниже
нам понадобится понятие проекции точки на множество.
Определение 1. Пусть X — некоторое множество из Е".
Проекцией точки и из Е" называется ближайшая к и точка w множества X,
т. е. точка w е X, удовлетворяющая условию
\и — w\ = inf \и — v\.
vzX
Проекцию точки и на множество X будем обозначать через Vx(u) = w.
Поскольку р(и, X) = inf \и — v\ — расстояние от точки и до множества
v е X
X, то из определения 1 следует, что
p(u,X) = \u-Vx(u)\^.\u-v\ VveX, УиеЕ".
§ 4. 'ПРОЕКЦИЯ ТОЧКИ НА МНОЖЕСТВО 183
Если иеХ ,то, очевидно, всегда Vx(n) = и. Однако проекция на
множество существует we всегда. Например, если X = {иеЕ": |и| < 1} — открытый
единичный шар в Е", то ни одна точка и ф X не будет иметь проекции на
это множество. Однако если множество X замкнуто, то любая точка и е Еп
имеет проекцию на X — это было доказано в следствии 1 к теореме 2.1.3.
Рис. 4.6 Рис. 4.7
Проекция точки на множество может определяться неоднозначно
(рис. 4.6). Однако, как показывает следующая теорема, для выпуклых
множеств такая ситуация невозможна (рис. 4.7).
Теорема 1. Пусть X — выпуклое замкнутое множество из Е".
Тогда:
1) всякая точка ие Е" имеет, и притом единственную, проекцию на
это множество;
2) для того чтобы точка weX была проекцией точки и на
множество X, необходимо и достаточно выполнения неравенства (см. рис. 4.7)
(w - и, v - w) > 0 Vv е X. (1)
При этом если X—аффинное множество (см. пример 1.4),, то
вместо (1) можно писать
(w-u,v-w) = 0 Vve X. (2)
Доказательство. Рассмотрим функцию g(v) = \v— и\2 переменной
v е Е" при произвольной фиксированной и е Е". Поскольку g(v) сильно
выпукла на Е", то по теореме 3.1 эта функция достигает своей нижней
грани на X в единственной точке w еХ. Это означает, что \v — u|2>|u> — и\2
или \v—и\ ^\w—и\ при всех veX, причем равенство здесь возможно только
при v = w. Остается принять Vx(u) = w.
Докажем второе утверждение теоремы. Согласно теореме 2.3 для того,
чтобы функция g(v) достигала минимума на X в точке w, необходимо и
достаточно, чтобы (g'(w), v — w) = 2(w — u, v — w) > 0 при всех v e X, что
равносильно неравенству (1).
Наконец, пусть X = {и е Е": Аи = Ь} — аффинное множество.
Поскольку это множество выпукло и замкнуто, то неравенство (1) сохраняет силу
и здесь. Аффинное множество обладает следующим замечательным
свойством: если v, v0eX, v^v0, то и 2v0—veX, что проверяется непосредственно.
Поэтому если здесь взять v0 = Vx(u) = w б X, то 2w — v б X при любом
184
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
выборе v G X. Подставим в (1) вместо v точку 2w — v. Получим (w — и, 2w—
—v — w) — (w — щ w — v) > 0 при всех v G X. Сравнивая полученное
неравенство с (1), приходим к равенству (2). □
Покажем, что оператор проектирования на выпуклое множество обладает
сжимающим свойством.
Теорема 2. Если X —выпуклое замкнутое множество из Е", то
l^(«)-^(«)l^l"-«l V«,«eS". (3)
Доказательство. Из неравенства (1) имеем
(Vx(u)-u,Vx(v)-Vx(u))>0.
Поменяв ролями точки и и v в последнем неравенстве, получим
CPx(v)-v,Vx(u)-Vx(v))^0.
Сложим эти два неравенства. Имеем
(Vx(u) -u- Vx(v) + «. ^(«) - ?М«)> > °-
Отсюда следует
\-Px(u)-Vx(v)\2^(Vx(u)-Vx(v),u-v) Vu,„eS". (4)
Применим к правой части (4) неравенство Коши — Буняковского:
\Px(n)-Vx(v)\2^\Px(u)-Vx(v)\-\u-v\ u,veEn.
Разделив на \Vx(u) — Vx(v)\^0, получим требуемое неравенство (3). Если
1^(^)-^(^)1 = °. т0 (3) очевидно. П
Теорема 3. Пусть X — выпуклое замкнутое множество из Еп,
пусть РХ(М) = {ие X: Зх е М, что u = Vx(x)} —множество значений
оператора проектирования на множестве М с Е". Если М —
компактное множество, moVx(M) также компактно.
Доказательство. Возьмем Ух е М. Так как № \v — x\2 = [Px(x) —
ve X
— х\2, то, применяя к сильно выпуклой функции д(у) = \v — х\2
неравенство (3.3), получим: \v - Vx(x)\2 < tp(v) - <р(Рх(х)) ^ (p(v) = \v - х\2 или
v - Vx(x\\ < \v — х\ Ух е М, Vv е X. Отсюда, фиксируя v е X имеем:
Vx(x)\ ^ |«| + \v - х\ < 2|«| + |ж| < 2|«| + sup \z\ \/х G М. Ограниченность
множества Vx(v) доказана. Докажем замкнутость VX(M). Возьмем
произвольную последовательность {xk}eVx(M), {xk} —> х. По определению
множества Т>Х(М) найдется точка икеМ, такая, что хк=Тх(ик), к = 1, 2,... Из
ограниченности М следует ограниченность {иЛ. Применяя теорему Боль-
цано — Вейерштрасса, можем считать, что {ик} —> 1¾. Так как М замкнуто,
то щ е М. По теореме 2 оператор проектирования непрерывен, поэтому
ixk =Pxi.uk)} -^ х ='Рх(ио)- Это значит, что х eVx(M), т. е. множество
РХ(М) замкнуто. Следовательно, VX(M) компактное множество. Теорема
3 доказана. □
2. Приведем примеры множеств, проекция на которые может быть
выписана явно.
§ 4. ПРОЕКЦИЯ ТОЧКИ НА МНОЖЕСТВО
185
Пример 1. Пусть X = S(uq, R) = {ueE": \u-v^\ <-R} — шар радиуса
R >0 с центром в точке 1¾. Из геометрических соображении (рис. 4.8) ясно,
что проекцией точки и <£ X является точка
W = Uq + R (и — Uq)/\U — Uq\.
Для строгого доказательства этого факта достаточно проверить выполнение
неравенства (1). Имеем
(w — и, v — w) — (R/\u — Ugl — l)((u — ид, v — Uq) — R \u — Uq\) > 0,
так как \u — i^| > R, a (u — Uq, v — 1¾) < \u — Uq\ ■ \v — Uq\ < \u — Uq\R в силу
неравенства Коши — Буняковского для всех v G X.
Рис. 4.8 Рис. 4.9
Пример 2. Пусть X = Г = {и 6 Е": (с, и) = 7} — гиперплоскость;
здесь с G Еп, с ф0), -у = const. Пользуясь геометрическими соображениями
(рис. 4.9), проекцию точки и <£ X на X будем искать в виде w = и + ас.
Определяя число а из условия w Е X, имеем
w — и + (7 — (с, и))с/\с\2.
Поскольку (w — и, V — w) =(7 — (с, и))с/\с\2 ■ (c,v — w} — 0 при всех v G X, то
согласно теореме 1 найденная точка w представляет собой проекцию точки
и яг. X.
Пример 3. Пусть X = {и Е Е": (а0 u) = 6\ i = 1,. .., m} —
аффинное множество; здесь щ & Е", b' = const, г = 1,..., т. Можем считать, что
векторы at, ..., а линейно независимы и т < п (если т = п, то X будет
состоять из одной точки). Проекцию точки и на множество X будем искать
в виде
т
w — u+Y^ 01,аг (5)
3 = 1
Из требования w Е X имеем систему линейных алгебраических уравнений
т
Е «,<а4, в,-) = ^-(¾.¾). * = 1,...,т, (6)
3=1
для определения коэффициентов а,,..., ат. Определителем этой системы
является определитель Грама [89; 192; 353], который для линейно независи-
186
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
мых о,,..., ат будет отличным от нуля. Поэтому искомые ar,,..., ат
существуют и однозначно определяются из системы (6). Для точки w из (о)
будем иметь
т т / т \
{W-U,V-W)=J2 «у(«у. « - U) - Е аг{ Е «у<'0«, «у) )' = О'
для всех ve X. Следовательно, по теореме1 Г найденная из (5), (6) точка
w будет проекцией точки и на множество X. Если ввести матрицу А,
строками которой являются векторы а{, г = 1,..., т, то точку (5) можно
записать в виде
w'•= и - АТ(ААгУ{Аи - Ь).
Предлагаем читателю провести проверку того, что такая точка w
принадлежит X, т. е. Aw>= Ь, и выполняется условие (1) (см. пример 9.3).
Пример 4. Пусть X = {иеЕ": (с, и) ^ 7} — замкнутое
полупространство, определяемое гиперплоскостью (с, и) = 7. Пусть и ф'Х, т. е. (с, и) > 7.
Как и в примере 2, попробуем представить проекцию точки и на X в виде
и> = и + (7 — (р;.и))с/\с\2.
Имеем (w — u, v — w) = (7 — (с, и),)с/|с|_2(;(с, «) — 7)> 0 при всех г; е X.
Следовательно, точка и> — искомая проекция.
Пример 5. Пусть X = {и = (и\ .. .,ип)е Е": ai < и* < Д, г = 1,...
..., п} — n-мерный, параллелепипед, где а0 Д, а; < Д — заданные числа,
г = 1,.. ., п. Пусть и^Х. Положим. w — (wl,..,., wn), где
Г аг, иг <а;,
™« = <^ Д, иг>Д,
t u\ а. ^и1 ^ /3!, г = 1, .. ., п.
Тогда (г</—иг)(г/ — и>г) > 0; для всех v*„ а{ ^. vf ^. Д, г = 1!,...., п. Отсюда,
суммируя по г от 1 до п, получаем, (и>—и,,г;—и>) > 0 для всех г; е X. Следом
вательно, построенная точка w является проекцией точки и на множество
X.
Пример б-. Пусть X = Е? = {и = (и\. ..,ип)еЕп: и1 > 0, г = 1,...
..., п} — неотрицательный ортант пространства Е". Легко проверить, что
проекцией точки и на X является точка и+ = ((и')+,..., (и")+), где (и{)+ —
= тах{0; и{}, г — 1,..., п.
3. Критерий оптимальности, сформулированный ранее в теореме 2.3, с
помощью оператора проектирования может быть переформулирован
следующим образом.
Теорема 4. Пусть X — выпуклое замкнутое множество, Xt —
множество точек минимума функции f(x) на X. Если ute Xt и f(x)
дифференцируема в точке ut, то необходимо выполняется равенство
Ч=7Мч-«/'К)) Va>0. (7)
Если, кроме того, /'(ж) выпукла на X, то всякая точка ut,
удовлетворяющая уравнению (7), принадлежит Xt.
До к а з а т е л ь с т в о. Согласно теореме 1 равенство (7) эквивалентно
неравенству (ut-(ut~af'(ut)), v-ut)^0 \/vGX, откуда имеем a(f'(ut), v-
§ 4. ПРОЕКЦИЯ ТОЧКИ НА МНОЖЕСТВО
187
—ut) ^0 Vv е X. Так как а >0, отсюда получим неравенство (/'(ч.), v —
— ut) ;> О при всех v еХ. Таким образом, условия (7) и (2.5) эквивалентны.
Отсюда и из теоремы 2.3 следует утверждение теоремы 3. □
Таким образом, если ввести отображение А из Е" в Е" по формуле
Аи — Рх(и - af'(u)), а >О,
то условие (?) перепишется в виде ut = Aut, т. е. ut —неподвижная точка
отображения А. Ниже мы увидим, что при некоторых условиях на функцию
f(x) отображение будет сжимающим идля определения точки ut могут быть
использованы свойства сжимающих отображений [89; 393].
Упражнения
1. Найти проекцию точки и е Е" на множество
X = {и е Е": ,(о,., и)^Ьл, ,((¾, и) <.ь2}.
I. Найти проекцию точки и е Еп на множество
X = \и-= (и\.. „ ип): а{ < и1 < ,/¾, i = 1, . .., n}
(здесь af :¾ /¾,.причем возможно, что а( = /¾, или<а • = —оо, или рк — оо при некоторых г, j, к).
3.;Выяснить геометрический смысл ^равенства (2).
4. Будут ли верными неравенство (1,) или равенство (2), если-Х —невыпуклое множество?
5. Охарактеризовать все множества X из Е", для которых существует точка и£Х такая,
что Т>х'{и) = v ,для лсех г> е X.
(6. Для того чтобы точка ше!;была'проекцией точки и на.выпуклое множество X,
необходимо и достаточно, чтобы (v—u, v — vi)"^'Q при всех v eJf..Доказать. Выяснить геометрический
смысл этого условия.
7. Доказать, что для любого замкнутого множества X имеет место неравенство \\и -
-'^'(и)! — |и —Яд.(^)11 ^ |и —ij| для всех ,и, veX (Ср. с леммой 2,1.2).
8."Пусть X выпуклое замкнутое множество изЕ". Доказать, что тогда
\v-"Px(u)\2<{v-4'v-Px(u)) 4v,£X,VueEn,
,\v -Р,х(и)\2 + \и - Vx(u)\2 ^\v - и\2 Vve-X, Vu-e'S".
9. Пусть f(u) = \Au — b\2, тде A —матрица порядка ,m>x n, b e Sm (см. пример 2.4).
Доказать, что
Xt = {ueE":f(u) = Mf.(u) = ft}^0.
Указание: взять проекцию точки b на множество Х = {»е Sm: v = Аи, и е Е"} и
показать, что /(u) =]Au—,'Px'<;b)\2 + \b -Vx(b)\2, ft = \b~Px(b)\2; доказать замкнутость X.
10. Убедиться, что если X = L —подпространство из Е", то условие (2) можно заменить
равенством
(w-u,g)=0 УдеЬ. (8)
II. Пользуясь (8), доказать, что оператор V проектирования на подпространство L С Еп
является линейным, самосопряженным оператором и, кроме того, \\V\\ = 1, V =V.
188
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
§ 5. Отделимость выпуклых множеств
1. В теории экстремальных задач важную роль играют теоремы,
называемые теоремами отделимости. Основное содержание этих теорем
сводится к тому, что для некоторых двух множеств А а В утверждается
существование гиперплоскости такой, что множество А находится в одном
из открытых или замкнутых полупространств, определяемых этой
гиперплоскостью, а множество В — в другом открытом или замкнутом
полупространстве (см. пример 1.3), т. е. гиперплоскости, которая отделяет эти два
множества.
Определение 1. Пусть А и В—два множества из Е". Говорят,
что гиперплоскость (с, х) = -у с нормальным вектором сфО отделяет
(разделяет) множества А и В, если (с, а) ^ •у при всех ае А и (с, b) ^ -у
при всех Ъ е В, или, иначе говоря, выполняются неравенства
sup(c, Ъ) ^ 7 < inf (с, а). (1)
ЬеВ "еА
Если sup(c, Ъ) < inf (с, а), то говорят, что множества А и В сильно от-
делены. Если (с, Ъ) < (с, а) при всех ае А, Ъ е В, то говорят о строгом
отделении этих множеств. Если выполнено (1), причем существуют такие
точки а0 е А, Ь0е В, что (с, Ь0) < (с, а0), то говорят, что множества А, В
собственно отделимы.
Понятие собственной отделимости введено для того, чтобы выделить
из (1) вырожденный случай, когда оба множества А, В лежат в
разделяющей гиперплоскости и, возможно, даже имеют общие относительно
внутренние точки.
Заметим, что в определение 1 множества А и В входят несколько
несимметрично. Однако симметрию здесь нетрудно восстановить: нужно лишь
взять вектор —с вместо с, постоянную —■у вместо ■у и записать уравнение
отделяющей гиперплоскости в виде (—с, х) = —7- Очевидно, если
гиперплоскость (с, ж) = 7 отделяет множества А и В, то гиперплоскость (цс, х) = /ту
при \i фО также отделяет эти множества. Поэтому при необходимости
можно считать, что \с\ — 1.
На рис. 4.10-4.14 изображены случаи, когда два множества собственно
отделимы, на рис. 4.13 — сильно отделимы, на рис. 4.14 — строго
отделимы. Однако ясно, что не всякие два множества можно отделить
гиперплоскостью (рис. 4.15). Ниже приводятся теоремы об отделимости выпуклых
множеств.
Теорема 1. Пусть X —непустое выпуклое множество из Еп.
Тогда для любой точки у $. ri X существует гиперплоскость (с, х) — -у,
собственно отделяющая множество X и точку у, или, точнее,
(с, ж)>7 УхеХ, 7>(с, у), ,2,
(с, х) > 7 Vz G ri X. '
Если точка у не принадлежит X —замыканию X, то множество X (а
также и X ) сильно отделимо от у.
Доказательство. Сначала рассмотрим случай у ф X. Напомним,
что если X — выпуклое множество, то X также выпукло (см. теорему 1.2).
§ 5. ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
189
Рис. 4.10
Рис. 4.11
Рис. 4.12
Рис. 4.13
СА
Рис. 4.14
Рис. 4.15
190
Гл. 4, ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Согласно_теореме 4.1 тогда существует проекцияjz=Vy(У) точки у на мно
жество X, причем (z — у, х — z) > 0 для всех х£ X. Положим с = z — у. С
учетом предыдущего неравенства будем иметь (с, х — у) = (z_— у,х — z) +
+ (z — у, z — у) > |с|2 >0 или (с, х) > (с, у) + |с|2> (с, у), жб1. Это значит,
что гиперплоскость (с, ж) = (с, у) = 7 сильно отделяет точку у от множества
X и, тем более, множества X. Нетрудно видеть, что такая гиперплоскость
не единственна. Например, гиперплоскость (с, х) = (с, z) = 70 также сильно
отделяет X и у, так как (с, ж — г) > 0 при всех ж£1, (c,y — z) = (z — y,y —
-г) = -|с|2<0. _
Теперь пусть уеХ, уфпХ. Согласно теореме 1.12 тогда существует
последовательность {ук} —> у: ук ¢. X, уке allX, к = 1, 2... По
доказанному гиперплоскость^, х) = {ск, ук), где ск = (zk - yk)/\zk - ук\, zk=VK(yk),
сильно отделяет X и ук, так что (ск, х) > (ск, ук) при всех х е X. По
теореме Больцано — Вейерштрасса из последовательности {ск}, \ск\ = 1,
можно выбрать подпоследовательность, сходящуюся к некоторому вектору с,
\с\ = 1. Без умаления общности можем считать, что вся последовательность
{cjJj-j- с. Переходя к пределу при к —> оо в неравенстве (ск, х) > (ск, ук),
х е X, получаем (с, х) > (с, у) = 7 для всех хе X. Отсюда следует первое
из неравенств (2).
Далее, возьмем любую точку хепХ. Согласно определению 1.10
существует такое е > 0, что 0(х, 2е) П aff X G X. Тогда ик = х — еск G
€ 0(х, 2е) П aff X G X, А; = 1, 2... Ясно, что {ик} —> u = х -_ес.
Покажем, что и = х — ее G ri X, Поскольку zk = 7^(¾) £ X с all X = all X,
ук G aff X, то zk — yke Lin X — подпространство, параллельное aff X, Тогда
cfc = (zk - yk)/\zk — yk\ G Lin X. Поскольку Lin X замкнуто в En, {ck} —> c,
то cGLinX. Отсюда следует, что n = x — ее G aff -X". Кроме того, так
как \uk — х\ = е, к = 1, 2,..., то при к —> оо имеем |и — ж| = е, так что
и = х — ее G 0(ж, 2е). Следовательно, и = ж-есеп1сХсХ. Тогда
7 = (с, у) ^ (с, и) = (с, х — ее) = (с, х) — е < (с, ж), или 7 < (с, х) для каждой
точки ж е ri X, т. е. ri X и у строго отделимы. □
Теорема 2. Пусть А и В — непустые выпуклые множества из Еп,
ri Ann В=0 (например, АпВ=0). Тогда существует гиперплоскость
(с, и) = 7, строго отделяющая множества ri А и ri Bj_ собственно
отделяющая множества А и В, а также их замыкания А, В, причем если
А и В имеют общую граничную точку у, то 7 = (с, у). Верно и
обратное: если два выпуклых множества А и В собственно отделимы, то
ri А П ri В = 0.
Доказательство. Введем множество X = ri А — ri В = {х е Еп:
х = а—Ь, aeriA, Ъ е ri В}. Согласно теоремам 1.1, 1.11 множество X вы-
пукло. Посколькуп A nri В = 0, то 0 ф X, Возможно два случая: 0 ф X или
0е X. Если Оф X, то согласно теореме 1 точка 0 и множество X сильно
отделимы, т. е. существуют такие с ^0, е > 0, что (с, х) > (с, 0) + е = е при
всех хеХ. Если 0еХ( то по той же теореме 1 найдется такой вектор с^0,
что (с, х) > 0 для всех х£ X, причем (с, х) > 0 при ж G ri X. Таким образом,
в обоих случаях существует такой вектор с ф 0, что
(с, ж)>0 VzeX, (с, ж)>0 VzeriX (3)
Из первого неравенства (3) с учетом определения множества X имеем
(с, а) > (с, Ь) Vo G ri А, Ь е ri Я (4)
§ 5, ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
191
Далее, по теореме 1.11 r\X^<Z>. Это значит, что существуют cue riA,
b0 е ri В такие, что х0 = (¾ — b0 е ri X. Из второго неравенства (3) тогда
имеем (с, :¾) = (с, а0 — Ь0) > 0, или
(с, Oq) > (с, Ь0), % е ri А, Ъ0еПВ. (5)
Неравенство (4) остается справедливым для всех предельных точек мно-
жеств ri А, ri В, т. е. для всех aeriA, ЪеПВ, Но_по теореме 1,13
riA = A, ri В = В, так что (с, а) > (с, Ь) при любых ае А, Ь е В. Отсюда
in£(c, a) > sup(c, Ь). Возьмем гиперплоскость (с, ж) = 7, где 7 — произволь-
ное число, удовлетворяющее неравенству inf_(c, a) > sup(c, Ь), Тогда
(с, а) > 7 > (с, Ь) VaeA, Ь G В. (6)
Из (5), (6) следует собственно отделимость множеств А и В и, тем более,
множеств А и В. Если у е А ПВ, то j = (с, у).
Покажем, что построенная гиперплоскость (с, х) = 7 строго отделяет
множества ri А и ri В. Из (5), (6) следует, что либо (с, (¾) > 7> либо (с, Ь0) < 7-
Пусть (с, Од) > 7 (случай (с, Ь0) < 7 рассматривается аналогично).
Возьмем произвольную точку ае ПА. Тогда a— 0¾ G Lin А, а+ е(а — %) е all А
при всех е е 1 и по определению относительно внутренней точки
найдется такое е > 0, что d = а+ е(а— %) е ri А. Отсюда а= аа^ + (1 — a)d,
a = е/(1 + е) е (0, 1). Умножим неравенство (с, au) > 7 на а, (с, d) > 7 на
1 —а и сложим. Получим а (с, Оо) + (1 — а)(с, d) = (с, а) >7. Таким образом,
(с, а) > 7 при всех а е ri А. Отсюда и из (6) следует, что множества ri А и
viB строго отделимы.
Докажем вторую часть теоремы. Пусть множества А и В собственно
отделимы, но пусть тем не менее ri A nri В Ф<2>, Возьмем какую-либо точку
u е ri A nri В. Тогда при достаточно малом е > 0 имеем ae = u — e(a„ — u) е
е П А, Ьв = и — е(Ь0 — и) е ri В, где %, Ь„ взяты из (5). В силу (4) (с, аЕ) =
= (с, и)(1 + е) — е(с, (¾) > (с, ЬЕ) = (с, и)(1 + е) — е(с, bq). Отсюда получаем
(с, Oq) < (с, Ь0), что противоречит (5). Следовательно, riA nri В =0. □
Приведем одну теорему о сильной отделимости двух выпуклых множеств.
Теорема 3. Пусть А и В — два выпуклых замкнутых
множества, не имеющие общих точек, причем хотя бы одно из этих множеств
ограничено. Тогда множества А и В сильно отделимы.
Доказательство. Введем множество X = А — В. Покажем, что оно
замкнуто. Пусть х — некоторая предельная точка множества X, пусть
последовательность {хк} е X сходится к х. Поскольку хк е X, то найдутся
акеА, Ъке В такие, что хк = ак — Ък, к = 1, 2,.... По условию одно из
множеств А или В ограничено. Пусть для определенности ограничено
множество А. Тогда последовательность {ак} е А ограничена. По теореме Боль-
цано — Вейерштрасса найдется подпоследовательность {ак } сходящаяся к
некоторой точке а. В силу замкнутости А точка а принадлежит А. Тогда
*Ч = ак~Хк ~^Ь = а— х при кп —> оо, причем Ъ е В в силу замкнутости В.
Таким образом, для точки х получили представление х = а—Ъ, где ае А,
Ъ е В. Это значит, что хеХ. Замкнутость X доказана.
Далее^о условию множества А и В не имеют общих точек. Поэтому
О ¢. X = X. По теореме 1 тогда существует гиперплоскость (с, х) — 0 такая,
что (с, х) >|с|2>0 для всех хеХ. Отсюда имеем (с, а— Ъ) > |с|2, или (с, а) >
192
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
> (с, Ь) + |с|2 для всех aG A, be В. Следовательно, inf (с, a) >sup(c, Ь) + |с|2.
Любая гиперплоскость (с, х) = 7, где sup (с, Ь) ^ 7 ^ iflf (с> а) будет сильно
66В обА
отделять множества А и В, что и требовалось. □
Заметим, что требование ограниченности хотя бы одного из множеств в
теореме 3 не может быть ослаблено (см. рис. 4.14).
2. Теоремы отделимости являются одним из важных инструментов исследования свойств
выпуклых функции и множеств, экстремальных задач. Ряд приложений этих теорем будут даны
в последующих параграфах. Здесь же мы воспользуемся ими для получения представления
любого выпуклого замкнутого множества из Еп в виде пересечения некоторого семейства
полупространств.
Определение 2. Гиперплоскость Г= {и е Еп: (с, и) = 7} называют опорной к
множеству X, если (с, х) ^ 7 при всех х е X и (с, у) = у для некоторой точки у е X. Опорную к X
гиперплоскость Г называют собственно опорной к X, если
X не содержится в Г, т. е. (с, я^) > 7 при некотором xq е X.
Вектор с, являющийся нормальным вектором опорной
[собственно^ опорной] к X гиперплоскости, проходящей через точку
у е X, называют опорным [собственно опорным] вектором
множества X в точке у (рис. 4.16).
Отметим, что через любую граничную точку у
выпуклого множества X из Еп может быть проведена хотя бы одна
опорная к X гиперплоскость. В самом деле, если int X ф 0,
то граничными для X будут только точки у е X, у ¢ int X, и
согласно теореме 1 через каждую такую точку у можно прове-
(с,х—у) = 0 сти собственно опорнуюк X гиперплоскость. Если int_X = 0,
то aff X ^ Еп, Гр X = X, и через каждую точку у е X можно
Рис. 4.16 провести гиперплоскость Г: (с, ж — у) = 0, где с — любой
ненулевой вектор из ортогонального дополнения к LinX. Тогда
X С aff X С Г, так что Г — опорная к X гиперплоскость, не являющаяся собственно
опорной. Теорема 1 уточняет, что если j/eX, y¢riX, то среди опорных к X гиперплоскостей,
проходящих через точку у, можно найти собственно опорную.
Заметим, что выпуклое множество с непустой внутренностью не может иметь опорных
гиперплоскостей, не являющихся собственно опорными. Это вытекает из следующего несколько
более общего утверждения.
Теорема 4. Пусть X—выпуклое множество из Еп, int X ф0. Пусть вектор с ^0
и число 7 таковы, что (с, ж) ^ 7 при всех ж е X. Тогда
(с, ж) > 7 Vж е int X
Доказательство. Допустим противное: пусть существует такая точка xq е int X, что
(с, xq) = 7. По определению внутренней точки найдется такое е0 > 0, что z = 2¾ — ес/|с| е X
при всех е, 0< е < е^. Тогда 7 ^ (с, z) = {c, xq) — е|с| = -у — е|с| <7. Получилось противоречивое
неравенство, из которого и следует утверждение теоремы, П
Следствие 1. Пусть X — выпуклое множество из Еп, int X ф 0. Тогда любая
гиперплоскость (с, ж—у) = 0, опорная к множеству X в какой-либо точке у е Гр X, является
собственно опорной к X, или, точнее,
{с,х-у)>0 Уж е int X.
Доказательство. Из определения опорной гиперплоскости к X в точке у следует,
что (с, ж) ^ (с, у) = inf (с, ж) = inf_(c, ж) = 7 при всех ж е X. В силу теоремы 4 тогда (с, ж) >
«^ ieZ
> 7 = (с, у) для любой точки ж е int X. D
В следующей теореме показывается, что выпуклое замкнутое множество полностью
характеризуется своими опорными гиперплоскостями.
Теорема 5. Всякое непустое выпуклое замкнутое множество X из Еп (X фЕп )
является пересечением замкнутых полупространств, образованных всевозможными
опорными гиперплоскостями к множеству X, содержащими X.
Доказательство. Поскольку X фЕп, то Гр X ф 0. Возьмем любую точку у е Гр X.
Множество всех опорных векторов множества X в точке у обозначим через С . Выше было
замечено, что С' ф 0 при всех у е Гр X. Обозначим А = П (~| {ж: (с, х — у)~£ 0}. Нам
j/erpXceCy
О
§ 5, ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
193
надо показать, что А = X, Если х е X, то для всех у е Гр X и всех се С имеем (с, х — у) ^ О,
т. е, х е Л, Следовательно, X С Л,
Докажем обратное включение Л С X, Допустим противное: пусть существует точка ае А,
а ¢ X, Поскольку X — замкнутое множество, то по теореме 1 множество X и точка а сильно
отделимы. Точнее, при доказательстве теоремы 1 было показано, что гиперплоскость (cz, и -
— z) = 0, где £ = 7^(3), cz = z — а, такова, что (cz, ж — г) ^0 при всех жеХ = Х, а (сг, а—г) <0,
Это значит, что cz е С,, z е Гр X, и поэтому для точки а е Л должно бы быть (сг,а-г)^0в
силу определения Л. Полученное противоречие показывает, что Л С X. Требуемое равенство
Л = X доказано, D
Согласно теореме 5 выпуклое замкнутое множество характеризуется системой неравенств
(с, х) ^ (с, у), х е X, которые можно записать в виде inf(c, х) = (с, у), с е С , у е Гр X,
Если заменить с на е = —с, то эти условия приводят к равенствам sup(e, х) = (е, у), е е — С ,
2/ е Гр X, Таким образом, всякое выпуклое замкнутое множество X характеризуется
значениями функции 6(е, X) = sup(e, х), называемой опорной функцией множества X (здесь
х
возможны значения 6(е, X) = оо для некоторых е^Еп). Это обстоятельство отражено также
и в следующей теореме.
Теорема 6. Пусть для двух, множеств А, В из Еп известно, что
sup (е, а) ^ sup (е, b) Ve е Еп, |е|=1.
оеА беВ
7Ъгба со Л С со В; в частности, если А, В выпуклы и замкнуты, то АС В, Если
sup (е, a) = sup (е, b) Ve е Еп, |е|=1,
оеЛ беВ
то со Л = со В; s частности, если А, В выпуклы и замкнуты, то А = В.
Доказательство. Допустим, что со Л $£ со В. Тогда существует точка адесо Л, но а^
¢ со В. По теореме 1 множество со В и точка oq сильно отделимы, т. е. существуют такое eg е
еЕп, |ео| = 1, е0>0, что (eg, 6)<(eg, Oq)—е0 при всех Ьесо В. Отсюда, пользуясь теоремой 1.9,
имеем (eg, Ь) ^ sup (eg, а) - Bq = sup (¾. а) - е0 при всех b есо В, так что sup (eg, Ь) =
oeioJ «еЛ ьеВ
= sup (eg, Ь) ^ sup (eg, а) - е0 < sup (eg, а). Пришли к противоречию с условием теоремы.
Следовательно, со Л С со В, Если А, В выпуклы и замкнуты, то в силу теорем 1.2, 1.6 Л =
= со Л=Л= со Л, соВ = В, и поэтому А С В. Справедливость последнего утверждения
теоремы следует из того, что равенство 6(е, А) = 6(е, В) эквивалентно двум неравенствам
6(е,А)^6(е,В), 8(е,В)^6(е,А), е е Еп. П
3. Теорему 2 можно истолковать как необходимое условие пустоты пересечения двух
выпуклых множеств А к В: если АпВ = 0, А к В выпуклы (тогда ri Л П ri В = 0), то необходимо
существуют вектор с е .Е™, с ^ 0, и число 7 такие, что (с, а) ^у при всех ае Л и (с, 6) ^ 7 ПРИ
всех Ь е В. Положим С| = с, (¾ = —с, 7i = 7. Ъ = ~ 7> Тогда приведенное необходимое условие
пустоты пересечения двух выпуклых множеств А к В может быть записано в следующей
симметричной форме:
(c,,u)^7i Vuei,
(C2,u)^72 VueB,
с, + (¾ = 0, 7i + 72 = °>
где хотя бы один из векторов сх или с^ не равен нулю.
Следующая теорема обобщает это утверждение и дает необходимое условие пустоты
пересечения любого конечного числа выпуклых множеств [83; 225; 278]. Она называется теоремой
Дубовицкого А. Я., Милютина А. А., которые впервые ее доказали для конусов.
Теорема 7 [465]. Пусть непустые множества А0,Ах,...,Ат из Еп выпуклы и
ЛопЛ]П...пЛт = 0. Тогда необходимо существуют векторы eg, с, стеЕп, не все
равные нулю, и числа "/0, 7], • • •, 7т такие, что
{Ъ,и)>Ъ УиеА{, 1 = 0,..., т, (7)
^ + с1 + ,,, + ст = 0, (8)
7о + 7i + • • • + 7т = 0. (9)
194
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Для доказательства этой теоремы нам понадобится прямое (декартово) произведение
конечного числа множеств, а также прямое произведение евклидовых пространств. Напомним
соответствующие определения.
Определение 3. Пусть Л,,..., А какие-либо множества. Множество А, состоящее
из всевозможных упорядоченных наборов (точек) а= (а, ат), где аг- = Ait i = 1,..., m,
называется прямым произведением множеств А\,...,Ат и обозначается через Л, х...
...хАт = А.
Пусть L"',..., L"" — вещественные линейные пространства. Положим L = L п> х...х£"».
Для элементов (точек) о = (о,,..., ат), 6 = (6,,..., 6m)eL определим сумму а+ 6 = (а,+ 6,,...
..., ат + 6т) и произведение на вещественное число аа= (аа,,..., аат), где под а{ + Ь{ и аа{
понимаются соответствующие операции в Ln', г = 1,..., т. В результате получим
вещественное линейное пространство L, называемое прямым произведением линейных пространств
Ln',..., Ln". Если ЬЛ| = Eni — евклидовы пространства размерности п{, г = 1,..., т, то
в прямом произведении Е = Еп> х ... х ЕПт также можно ввести скалярное произведение
(о, 6) = (а,, 6,) + .. , + (ат, 6т) и норму |а| = (а, а)!/2=(|а,|2 + .. . + |ат|2)!/2, где (а{, 6,.) и |о(| -
соответственно скалярное произведение и норма в Еп<. Полученное евклидово пространство
Е называют прямым произведением евклидовых пространств EUi,..., ЕПт; размерность
пространства Е равна п, + ... + пт. Например, само евклидово пространство Еп является
прямым произведением п одномерных евклидовых пространств: Еп = Е х ... х Е .
Параллелепипед {u = (ul,..., ип): а, <и* < /Зц г = 1,..., п} представляет собой прямое произведение
отрезков [(*(, Р{], г = 1,..., п.
Прямое произведение выпуклых множеств, очевидно, само выпукло.
Доказательство теоремы 7. Пусть Е =Еп х.. .хЕ™—прямое произведение т
n-мерных евклидовых пространств. Тогда Л = Л, х . ..х А еЕ. Введем в Е «диагональное»
множество В = {6 = (6,,..., 6т): 6, =. .. = Ьт = а0, ОдеЛд}. Нетрудно видеть, что пересечение
т
П А{ пусто тогда и только тогда, когда А Г) В пусто. Далее, А к В —выпуклые множества.
t = i
По теореме 2 множества А и В отделимы, т. е. существует с= {с,,..., ст} е Е, не все с;
равны нулю и (с, а) ^ (с, 6) при всех а е А, 6 е В, или
т т т
Е<«Ч,в,>>Е<С(.М = <Е«Ч.«0> Vase7lt., t=0 m. (10)
г=1 i = \ г =1
Положим cq = —(cj+, , .+cm), так что равенство (8) будет выполнено. Тогда неравенство (10)
принимает вид
т
£(сг,а^0 Va,.eA,., ; = 0,...,т. (11)
¢ = 0
Если в этом неравенстве зафиксируем какие-либо а; = а{ еА{ при всех г = 0,..., т, кроме
г = к, то получим (ск, ак) ^ J^ (с{, о;) = const для всех ак £ Ак. Следовательно,
(ск>и)>Ъ= inf(ci.a)>-°° VueAk, к = 1,...,т. ..,.'", , (12)
а6 *
Положим
Tb = -(7i+... + 7m)- (13)
Тогда, переходя в (11) к нижней грани по всем ateAt, г = 1,..., m, получаем (eg, Oq)+
т
+ Е 7; = (со> %) - 7о ^ ° Для каждого Og е Л0 или
«=1
(со>«) ^ то Vu е Л0.
Все соотношения (7)-(9) получены.
При некоторых дополнительных ограничениях на множества А0, А,,..., Лт теорема 7
обратима. А именно, верна
Теорема 8. Пусть А0, А,,..., А т — непустые выпуклые множества изЕп, пусть все
эти множества, кроме, быть может, одного, открыты. Тогда для того чтобы А 0Л Л, П...
... Г)Ат=0, необходимо и достаточно, чтобы существовали векторы eg, с,,..., с еЕп,
не все равные нулю, и числа 7pi 7i> • • •> 7m> для которых выполнены соотношения (7)-(9).
Доказательство. Необходимость доказана в теореме 7. Достаточность докажем,
рассуждая от противного. Допустим, что условия (7)-(9) выполнены, но тем не менее существу-
§ 5. ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
195
т
ет точка v е f| А{. Поскольку не все с{ равны нулю, то из (8) вытекает существование
< = о
по крайней мере двух векторов citc-, г ^j, отличных от нуля. По условию все множества
А0, Л],..., Ат, кроме, быть может, одного, открыты. Поэтому можем считать с; ^ О, А( —
открытое множество, т. е. А{ =int А(.
Согласно условию (7) (с,., и) ^ 7« ПРИ всех и S А{. В силу теоремы 4 тогда (с{, и) > 7,- для
т
всех и е Л; =int At. В частности, для точки и£ f| А}- С Л{ также имеем (с;, и) ^7t-- Кроме
j = о
того, для всех остальных номеров j ф. г также v е А ■ ив силу (7) (с., и) > 7,- • Сложим все эти
неравенства. С учетом равенства (9) получим (eg, и)+(с|, v)+.. .+{ст, ■u)>7o+7i+- • -+7m=0,
т. е. ((¾ + С] + ... + ст, v) > 0. Однако это невозможно в силу равенства (8). Полученное
т
противоречие показывает, что f| Л;=0. П
<=о
Приведенное выше доказательство теоремы 7 принадлежит В. И. Плотникову. Оно
привлекает своей простотой и тем, что позволяет убедиться в справедливости теоремы 7 и в
бесконечномерных гильбертовых (и более общих) пространствах — ее доказательство при этом
остается неизменным, нужно лишь уточнить ссылки на соответствующие теоремы отделимости
в бесконечномерных пространствах.
4. Переформулируем теоремы 7, 8 для случая, когда А0, А,,..., Ат являются выпуклыми
конусами в Еп. Напомним
Определение 4. Конусом (с вершиной в нуле) называется множество К, содержащее
вместе с любой своей точкой и и точки Хи при всех Л > 0. Если множество К выпукло, то К
называют выпуклым конусом, если К замкнуто — замкнутым конусом, если К открыто —
открытым конусом.
Рассмотрим множество
К* = {сеЕп: {с,и)>0 \/иеК}. (14)
Это множество всегда непусто, так как 0 е К*. Далее, если с е К*, то для Лс при любом Л > 0
имеем (Лс, и) = Л(с, и) ^ 0 для всех и е К, т. е. Лс е К*. Следовательно, К* —конус.
Определение 5. Конус К*, определенный посредством (14), называется
двойственным (сопряженным) конусом к конусу К (рис. 4.17).
Например, если К = (и € Еп: <а,и >= 0} —
гиперплоскость, то К* = {с е Еп: с = Ла, Л е Е}; если
К = {и е Еп: {а, и) < 0} — замкнутое полупространство
или К = {и еЕп: (а, и) < 0} —открытое
полупространство, то К* = {сеЕп: с = -Ла, Л JtO}; если К = Е*, то
К* = {0}; если К = {0}, то К* =Еп; если К = {и е Еп:
и > 0}, то К* = {с б £п: с ^ 0}.
С помощью двойственных конусов удобно
переформулировать теорему 7 для случая, когда множества
А0, A j,..., Ат являются конусами. рис 4 17
Теорема 9. Пусть К0, Кх,..., Кт — непустые
выпуклые конусы из Еп (с вершиной в нуле), пусть К0 П А", П ... П Кт — 0. Тогда необходимо
существуют векторы eg, с,,..., ст, не все равные нулю, с{ е К*, г = 0,..., т, и такие, что
^ + с,+... + ст=0. (15)
Доказательство. Согласно теореме 7 существуют векторы eg, с,,..., ст, не все
равные нулю, и числа 7о> 7i> • • •> 7m> удовлетворяющие условиям (7)-(9). Воспользуемся тем, что
рассматриваемые множества К0, Klt..., Кт являются именно конусами, и покажем, что тогда
70 = 7] = • • • = 7т = 0. В самом деле, если (сг-, и) ^ у{ при всех и е Kt, то (с{, Хи) ^ у{ или
(сг- ,u)^ji/X для любых Л > 0 и и е if;. Отсюда при Л -> +оо получим (сг-, u) ^ 0 при всех
neifj.T.e.c.e А*, 1=0,..., т.
Кроме того, если иеК{, то, взяв в неравенстве {с{,и) ^0 вместо и точку Ли при малых
Л >0, получим сколь угодно малые значения функции (c.,ii) на К{ и придем к равенству
inf (с, и) = 0. Согласно (12) это означает, что все величины -у{, г = 1,..., т, участвующие
и е К.
в неравенствах (7), равны нулю. Из (13) тогда имеем 7о = 0, Таким образом, если в теореме 7
множества А0, А,,..., Ат являются выпуклыми конусами, то условие (9) выполняется
тривиально, так как все "/( = 0, г = 0,..., т, условия (7) означают, что с{ еК*, г = 0,. . ., т, а
из (8) следует (15). D
196
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
При некоторых дополнительных ограничениях на конусы K0,Ki,...,Km теорема 9
обратима. А именно верна
Теорема 10. Пусть K0,Kit..., Кт — непустые выпуклые конусы из Е" (с вершиной
в нуле), пусть все эти конусы, кроме, быть может, одного, открыты. Тогда для того
чтобы К0 П К1 П ... П Кт = 0, необходимо и достаточно, чтобы существовали векторы
cq, с,, ..., ст, не все равные нулю, с{ е-ЙГ*, г =0,..., m и удовлетворяющие равенству (15).
Доказательство. Необходимость доказана в теореме 9. Достаточность вытекает из
теоремы 8, если заметить, что условие с{ е К% равносильно неравенству (с,., и) ~£$ Уи е К{,
то отсюда и из (15) следуют условия (7)-(9) при 70 = 7i = • • • = 7т = 0. П
Приведенные в этом параграфе теоремы отделимости и их различные обобщения играют
важную роль в выпуклом анализе, в теории и методах математического программирования,
оптимального управления, в теории уравнений и неравенств и т. д. (см., например, [48-50;
54; 83; 192; 225; 278; 279; 613; 617; 752]).
Упражнения
1. Пусть А и В — выпуклые множества, не имеющие общих внутренних точек. Можно
ли утверждать, что А и В отделимы? Рассмотреть пример А — {и = (х, у): 2/ = 0, \х\ < 1},
В = {и = (х,у):х = 0, \у\^1}вЕ2.
2. Пусть X —выпуклое множество из Еп, int X = 0. Доказать, что любая гиперплоскость,
опорная к X и проходящая через точку j/eriX, содержит X, т. е. не является собственно
опорной.
3. Пусть А —выпуклое множество из.Еп, причем .Anint Е™ = 0. Доказать, что существует
такой вектор с = (с1(..., сп)ф 0, q ^0,..., cn ^0, что <с, а>^0 при всех ае А.
4. Пусть А —выпуклое множество из Еп, М — аффинное или многогранное множество
из Еп. Для того чтобы А и М были собственно отделимы и разделяющая гиперплоскость не
содержала А, необходимо и достаточно, чтобы М П ri А = 0. Доказать.
5. Пусть р(А,В)~ inf inf |а — 6| — расстояние между множествами А и В. Доказать,
а 6 А Ь 6 В
что два непустых выпуклых множества А, В из Еп сильно отделимы тогда и только тогда,
когда р(А, В) >0.
6. Доказать, что всякое выпуклое замкнутое ограниченное множество из Еп имеет хотя
бы одну угловую точку (см. определение 3.2.1).
7. Пусть X — выпуклое замкнутое множество из Е". Доказать, что X имеет хотя бы одну
угловую точку тогда и только тогда, когда X не содержит прямых.
8. Доказать, что выпуклое замкнутое ограниченное множество А из Еп является выпуклой
оболочкой своих угловых точек. Показать, что без требования ограниченности множества А
это утверждение неверно. Рассмотреть пример А = {а= (х, у) е Е2; у ^ \х\}.
т т
9. Если А1,...,Ат — выпуклые множества из Еп, причем f| ri А{ ф 0, то (~| Ai =
i = 1 i = 1
= П Аг; ri( П А{) = П WA{); afff П А Л = П (айЛ,). Доказать.
10. Пусть К — произвольный конус из Еп. Доказать, что тогда конус К* будет замкнутым
и выпуклым.
U. Доказать, что если К — выпуклый конус, то конусы К, ri К также выпуклы и К* =
= (К)* = (пК)*.
12. Доказать, что если К — замкнутый выпуклый конус, то (К*)* = К,
13. Пусть К — выпуклый конус. Доказать, что для ограниченности снизу линейной функции
(с, и) на К необходимо и достаточно, чтобы с е К*.
14. Пусть К — выпуклый конус, int К ф 0. Тогда (с, и) > 0 для всех и е int К при любом
выборе с е А"* (сфО). Доказать.
15. Доказать, что если К,,..., Кт выпуклые конусы, то К = К1 + ... + К —выпуклый
конус, причем К = со(А", U К2 U ... U Кт). Можно ли утверждать, что если я,,..,, Кт —
выпуклые замкнутые конусы, то К — выпуклый замкнутый конус? (см. упражнение 1.14, в)).
§ 5. ОТДЕЛИМОСТЬ ВЫПУКЛЫХ МНОЖЕСТВ
197
16. Доказать, что (К{ + ... + Кт)* = К* П ... П К^, где К{,..., Кт — конусы из Е п.
17. Пусть К{, К2 — выпуклые замкнутые конусы. Доказать, что (К{ Г)К2)* = К* + К2*.
18. Пусть К0,К{,..., Кт — выпуклые конусы, пусть К0 П int К{ П ... П int Кт ф 0. Тогда
( П КЛ = Щ + К* + ... + К*т. Доказать.
ч« = о ' / т \*
19. Пусть К0, К, Кт — выпуклые конусы. Тогда либо ( f| К,) =Kq+K? + . . , + К* ,
4=0 '
либо существуют не все равные нулю векторы ci е К*, i — 0 т, такие, что (¾ + с, + ...
... + ст — 0. Доказать.
20. Для того чтобы выпуклые конусы К0, К{ были неотделимы, необходимо и достаточно,
чтобы 0 е int (К0 — Kl). Доказать.
21. Доказать, что два выпуклых конуса K0,Ki неотделимы тогда и только тогда, когда
одновременно выполнены два условия: ri К0 Пп^ф 0, Lin К0 + Lin А", = Е п.
22. Для того, чтобы два непустых выпуклых множества А, В из Еп были сильно отделимы,
необходимо и достаточно, чтобы ОфА-В. Доказать.
23. Доказать, что два непересекающихся многогранных множества сильно отделимы.
24. Множество А* = {с е Еп: (с, и) 4 1 Vu е А} называется полярой множества А. Найти
поляры множеств А, если А = {0}; А = [а,Ь]сЕ1ш, А ={ие Еп: u = te, 0 < t <оо, е ^0};
А = {ие .Е": (с, u) :¾ 7}; А — шар; А — конус с вершиной в нуле. Выяснить связь между
полярой конуса и двойственным конусом.
§ 6. Субградиент. Субдифференциал
1. Для выпуклых дифференцируемых функций на выпуклом множестве
выше было доказано неравенство (см. теорему 2.2)
f(u)>f(v)+(f(v),u-v) VnGX (1)
К сожалению, выпуклая функция может не быть дифференцируемой даже
во внутренних точках множества, и в этом случае полезное во многих
случаях неравенство (1) не будет иметь смысла. Тем не менее, оказывается,
для выпуклых функций это неравенство можно сохранить, если
надлежащим образом обобщить понятие градиента.
Определение 1. Пусть функция f(x) определена на множестве X
из Еп. Вектор c = c(v)eEn называется субградиентом функции f(x) в
точке v £ X, если
f(u)Zf(v) + (c(v),u-v) VueX (2)
Множество всех субградиентов функции
f(x) точке v называют
субдифференциалом этой функции в точке v и
обозначают через df(v).
Неравенство (2) имеет простой
геометрический смысл и означает, что график
функции7=/(,и),иеХв пространстве
переменных (и, 7) лежит не ниже графика
линейной функции "f=f(v)+(c(v), u—v),
и е X, причем в точке u=v оба графика пересекаются (рис. 4.18).
Для гладких выпуклых функций, как показывает неравенство (1),
субдифференциал непуст и градиенты этих функций являются их субградиен-
71
О
V7 = f(u)
^f7=f(v)+{c,u-v)
и
Рис. 4.18
198
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
тами. Во внутренних точках множества гладкая функция, оказывается,
других суб градиентов, кроме градиента, иметь не может. В самом деле, .пусть
v е int X, ф) е df(v). Поскольку /<и)еС<Х), то /(«) = f(v) + (f'(v), и -
- v) -f( а(| и— г>|), use X. Отсюда и из (2) следует, что '(f'(v)-c(vj), u — v)^
^ o;(|u-г>[), и£ X. Поскольку «€ int X, то и = г> - e(f'{v) — с(г>)) G X >при
всех е,'0< б < б0. Надставив эту точку в предыдущее неравенство получим
-е|/'(г>)-с(г>)12^ о(е), 0<е<е0. Деля на е>0 и устремляя е^»+0, отсюда
будем иметь — |/'t(v) — с(г>)|2 ^ 0, т. е. с(г>) = /'(«).
Тем самым показано,, что для гладкой выпуклой функции df(v) = {f'(v)}
при всех v G int X. 'Существуют функции, которые недифференцируемы в
точке, но тем те менее субдифференциал в этой точке непуст.
Пример 1. Функция /(u) = \g(u)\, и.еХ в точке v, где д(у) = 0, всегда
имеет субградиент c'(v) =-0, так как \д(и)\ - \g(v)\ = \g(u)\ > 0 = (0, u ~ v)
для всех и е X. 'В то же время в точках v, где g(v) ф\0, эта функция может
быть недифференцируемои и не имеющей субградиента.
Пример ,2. Пусть f(u) = \u\, иеЕп. В точке v = 0 эта функция
недифференцируема, но для нее верно соотношение
/(«') - 1'Щ = |«| ^ (с, « -0) = (с, и), и G Е\
для всех с, \с\ < 1. Это значит, что 9(|u|) = df(0) = {c е Еп: |с|>1} —
U а= 0
единичный шар с центром в нуле. Если юф-0, то 9/(г>) = {г>/|г>| = /'(г>)}.
Заметим, что ъ примере 2 функция /(и) = \и\ выпукла на Е'п.
Оказывается, если совсем отказаться от выпуклости функции, то даже гладкая
функция может :не иметь субградиента ни в одной точке. Например, для
функции f(u) = u3 на Е{ субдифференциал пуст во всех точках. В то же
время эта функция /(и) = и3 на множестве X = {и ЕЕ[: и ^ 0} выпукла и
во всех точках v&:X имеет на X непустой субдифференциал. Ниже увидим,
что это не случайно.
2. Следующая теорема показывает, что понятия субградиента и субдифференциала
являются естественными для выпуклых функций.
Теорема 1. Пусть X открытое выпуклое множество на Еп (например, возможно,
X ~Еп). Тогда для того чтобы функция f(x), определенная на X, имела непустой
субдифференциал вО'.всех точках X, необходимо и достаточно, чтобы f(x) была выпукла
на множестве X.
Доказательство. Необходимость. Пусть для некоторой функции f(x)
субдифференциал df(u)^0 при всех иеХ. Покажем, что f(x) выпукла на X, Возьмем произвольные
и, v е X, а е [0, 1 ] и положим иа = аи + (1 - a)v. Пусть с = с(иа) е df(ua). Тогда
.•/.И) -J(4a) >(с,и- иа), f(v) - f(ua)> (с, v - иа).
Умножим первое из этих неравенств на а, второе на 1 — а и сложим. Получим af(u) +
+ (1- a)f(v) - f(ua) ^ (с, иа - иа) = 0 при всех u,veX, а е [0, 1]. Выпуклость f(x) на X
доказана.
Достаточность. Пусть f(x) выпукла на открытом выпуклом множестве X, Пусть v —
произвольная точка на X. Покажем, что df(v)^0. Возьмем некоторый единичный вектор е.
Поскольку X —открытое множество, то v+teeX при всех t, 0<i ^i0, i0>0. По теореме 2.14
существует производная df(v)/de по направлению е.
В пространстве Еп+Л переменных (и, 7) введем два множества
Л = {Кт)еВ»+': иеХ, -y>f(u)},
В = {(«, 7) е Sn+': и = « + te, 7 = f(v) + tЩ&, 0< t <: t0}.
Нетрудно показать, что множество А выпукло —это делается так же, как доказывалась
выпуклость надграфика, выпуклой функции в теореме 2.9 (кстати, в данном случае A = int (epi /))
§ 61 субградиент, субдифференциал;
199
Множество-В является отрезком прямой Bi_En+1 и тоже;выпукло; Покажем1, что-множества
А и В не имеют общих точек.
В самом деле, пусть (и, 7) е А. Имеются две возможности: 1) и фь;+ te при всех t, 0 ^ t :¾
^ i0 — тогда заведомо (и, у)ф В; 2) при некотором t, 0 ^ t :¾ i0, оказалось, что и = и + ie —
тогда* е: учетом неравенства:, (1.8.4) и, 7 > f(u))=-ff^v:+-te) имеем, 7 - Дг>)>>-,//(г> Чт te)'- fj(v)>^
^ tdf;'(vf/de, т., е. 7 > /(«) + Ы%'(-у)</Яё, и снова (и, 7) $ #'..
Итак, множества АиВ выпуклы, А О.В = 0., По. теореме 5.2 тогда существует
гиперплоскость с нормальным вектором (d, v) ^0, отделяющая! А и В, т. е.
(й;,и.) + ^у^(й,« + *е) + 1/(/(«)+*^И); (3)
при всех i>'f'{u), ueX, O^i ^ t0. В частности,, при u = u, t =-0>иаз (3)) имеем'1/(7—/(и))5>0
для.всех,7 >•/(>«)' Отсюда следует, что v ^ 0.
ДЬпустим, что ь> = 0s Тогда из (3)' имеем {d, и) ^ (d; v-V- te) для всех и е X, 0 $S t* ^.¾.
П0ЛОЖИМ1 здесь u = v + ed, t ==0,— так можно делать, ибо v+ ed е X при всех е, 0 < |е|:< е0
в силу открытости X. Получим (d, v + ed) ^ (d, v), или e|d|2 ^ 0 при всех е, 0 < |е| :¾.¾
что возможно только при d == 0. Однако (d, ь>)^0 по построению. Полученное противоречие
показывает, что ь> == 0 не может быть.
Итак, v > 0. Поделим (3) на v > 0. Обозначая с = —d/гл и устремляя 7 —» /(м);+ 0, из. (3)
получаем
/(и) - /(„) + t (с, е) ^ (с, и - „) + i 4£М (4)
при всех u е X и всех 0)< i ^ i0, Полагая здесь t = 0, будем иметь
/(и) -/(«) Js (с, и --и) VueX
Это означает, что с 6 dfi(v), т. е. &У(и) ^ 0. П
В следующей теореме изучаются некоторые свойства субдифференциала выпуклой функции.
Т е о р е'М.а 2. Пусть X — открытое выпуклое множество изЕп' (например, X = Вп ),
f(x) — выпуклая функция на X. Тогда субдифференциал df;(v))npu всех v еХ является
непустым выпуклым, замкнутым и ограниченным множеством.
До к а зат е л ь с т во. Непустота субдифференциала доказана в теореме 1. Покажем:вы-
пуклость df(v)..Пусть с,, (¾ е df(v), т. е.
1(и)-1{у)>{с^,и~у), f(u)-f(v)Z(c2,u-v)i иеХ.
Возьмем а е[0, 1]; Умножая первое неравенство на а, второе на 1 — а и, складывая, получаем
f(u) — f(v) ^ (ас, + (1 — (2)¾. u — v) при всех ие X. Это значит, чтот0:0,-,+ (4 — ^)¾ S S/(u)
для любых а е [0, 1]. Выпуклость df(v) доказана.
Пусть с — предельная точка множества df(v), пусть {cfc} е 9/(«)и^ —> с при fc —»00. Из
ck €.df(v) следует, что f(u) — f(v)~£ (ck,u — v) VueX. При k —»00 отсюда получим с edf(v).
Замкнутость 9/(и) доказана.
Покажем ограниченность df(v). Возьмем любой вектор cedf(v), Поскольку X —открытое
множество, то S(v, е) = {и е J3 . \и — v\ ¢. е} с X при достаточно малом е > 0. Далее, в силу
теорем 2.15 и 2.1.4 sup f (и) = F*(S)< 00. Положим в неравенстве(2) u = v + ec/\c\e S(v, е).
S(v, е)
Получим \с\ < (f(v + ес/\с\) - f(v))/e < (f*(S) - f(v))/e < 00 при всех>:с.е df(v). D
3. Теоремы 1, 2 не дают конструктивного описания субдифференциала'выпуклой функции.
Такое описание удается получить лишь в немногих случаях.
Пример 3. Пусть f(u) = max и', и — (и{ ип)еЕп, / = {1 п}. Согласно теоре-
i el
ме 2.7 функция f(u) выпукла на Еп. Покажем, что
Bf(v) = {с = (с, cn): с>0, iel(v), с, = 0, < ^/(«); с;+ ... + сп = 1}, (5)
где Ди) = {i е /: max и3 = v'}. Множество, определяемое правой частью формулы (5), обо-
5е7 ....
значим через A(v). Пусть се A(v). Умножим неравенство f(u) — f(v)r= max и3 — vl ^ u* — vl,
верное при всех г е /(и), иеЕп нас;>0и сложим по всем i е /(и). С учетом равенств сг =0
при i ¢ I(v), с, + ... + cn = 1 получим /(и) - /(и) ^ (с, и - и) Vu е Еп, т. е. с е 9/(и). Это
значит, что A(v) С df(v).
Докажем включение df(v) CA(v). Пусть с е 9/(u), т. е.
/(и)-/(«) = max u'-max «'^ (с, u-v) УиеД"". (6)
200
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Возьмем в (6) и = и± = (и1 ± 1 vn ± 1). Тогда f(u±) - f(v) = ±1 и из (6) получим
п п
±1 ^ (с, и± — v) = ± J^ сг> чт0 возможно лишь при J^ с{ = 1. Далее, в (6) возьмем u£ =
.* = ' . ' = '.
= (и' ип), где u° = «' — е при некотором г el, и3 =v3 при j^i, е >0. Тогда /(u£) ^f(v)
и из (6) получим 0 ^ (с, и£ — и) = с{(—е), так что с{ ^ 0, i = 1 п.
Далее, пусть г £I(v). Тогда и° </(■") и можно выбрать е>0так, что v' + e <f(v). Положим
и£ = (u1,..-., un), где и' = vl + е, и3 — v3 при j ^ г. Тогда /(и) = f(u£), и из (6) получим
О ^ (с, и£ — и) = ес{, т. е. сг- ^ 0, г ф I(v). Сравнивая это неравенство с уже доказанным с; ^ О,
получаем с{ = О, г ^I(v). Это значит, что ceA(v), так что df(v)CA(v). Равенство (5)
установлено.
4, Установим связь между производными по направлению и субдифференциалом выпуклой
функции.
Теорема 3. Пусть X — открытое выпуклое множество из Еп, f(x) — выпуклая
функция на X. Тогда во всех, точках »еХ производная функции f(x) по любому
направлению е, |е| = 1, существует, причем
"е се of(v)
Доказательство. Существование производной df(v)/de установлено в теореме 2.14.
Докажем формулу (7). Из (2) имеем (f(v + te) - f(v))/t ^ (с, е) при всех с е df(v) и всех
достаточно малых t >0. Отсюда при t —»+0 получим df(v)/de ^ (с, е) для любого с е df(v),
так что df(v)/de > sup (с, е). С другой стороны, при доказательстве теоремыТ был построен
с е а/(и)
специальный субградиент с, для которого выполняется неравенство (4). Полагая в (4) и = v,
будем иметь df(v)/de ^ (с, е), с е &Y(i>). Сравнивая это неравенство с предыдущим, приходим
к формуле (7). Попутно показали, что максимум в правой части (7) достигается именно на
том субградиенте, который был построен в теореме 1. О
Формула (7) обобщает известную формулу df(v)/de = (f'(v), е) для гладких функций.
5. С помощью субдифференциала можно сформулировать критерий оптимальности,
обобщающий теорему 2.3 на случай негладких выпуклых функций.
Теорема 4. Пусть f(x) — выпуклая функция на открытом выпуклом множестве W
из Еп, X —выпуклое подмножество множества W. Тогда для того чтобы функция f(x)
достигала своей нижней грани на множестве X в точке uteX, необходимо и достаточно,
чтобы существовал субградиент ct — c(ut) е df(ut) такой, что
(с„и-щ)>0 УиеХ. (8)
Если ut е int X, то в (8) ct = 0.
Необходимость. Пусть %eXt = {иеХ: f(u) = inif(u) = /, >-оо}. Так как f(x)
выпукла на открытом выпуклом множестве W, то по теореме 2.14 существует производная
\ * по всем направлениям е = (и — %)\и — uj_1, иеХ, u^ut. Согласно теореме 2.12
у1*' ^0. Отсюда и из формулы (7) следует: —4-^ = max (с, е) ^0. Возьмем Vcte df(ut),
ае ае с ^ df(ut)
для которого max (с, е) = (с, е). Тогда (ct, е) = {ct, и - %)\и - ut\~l > 0 Уи е X, u^ut,
ce8f(uj
откуда вытекает неравенство (8).
Если ut е int X, то и — ut + ect е X при всех е, 0 < |е| < е0, и из (8) получим (ctl ect) =
= e|ct|2 >0, 0 < |е| < Bq. Это возможно лишь при ct =0.
Достаточность. Пусть для некоторой точки uteX выполнено неравенство (8) при
каком-либо ct е 9/(¾). По определению субградиента тогда f(u) — f(ut) ^ (ct,u-ut) ^ 0 при
всех иеХ,т,е,«,£ Xt. D
Замечание 1. Вариационное неравенство (8) можно записать в эквивалентном виде:
Ч.^лгК-"0») Va>0.
Доказательство этого равенства проводится совершенно также, как и теоремы 4.4.4, и
предоставляется читателю.
Следующие примеры показывают, что субградиент ct из (8) в общем случае определяется
неоднозначно.
§ 6. СУБГРАДИЕНТ. СУБДИФФЕРЕНЦИАЛ
201
Пример 4. Пусть f(u) = \u\, ueW = El. Если Х = Е\ то Xt = {0}, 9/(0) = [-1,1]
и неравенство (8) выполняется лишь при ct = 0. Если X ={и£ Е[: и ^ 0}, то1„ = {0} и (8)
выполняется для всех ct £ [0, 1] с 9/(0).
Пример 5. Пусть/(и) = тах{и;0}, и£ W = E[. Если X = JS>, то Xt = {0),9/(0) = [0,1]
и (8) имеет место лишь для с„ = 0. Если Х = {ией': и ^ 0}, то по-прежнему Xt = {0}, но
неравенство (8) здесь выполняется для всех ct £ 9/(0) = [0,1].
6. Определение 2. Пусть Еп, Ет —евклидовы пространства, W с Еп, ЩЕт) —
множество всех непустых множеств из Ет. Говорят, что на W задано многозначное
отображение F: W —>П(Ет), если каждой точке ueW поставлено в соответствие некоторое
множество F(u) с ЩЕт).
Определение 3. Многозначное отображение, которое каждой точке и из
открытого выпуклого множества W с Еп ставит в соответствие субдифференциал 9/(и) некоторой
выпуклой на W функции f(u), называется субдифференциальным отображением и
обозначается через 9/ (здесь т = п).
Субдифференциальное отображение обладает рядом замечательных свойств [264; 604; 605;
617; 670]; на некоторых из них мы здесь кратко остановимся.
Определение 4. Пусть W — множество из Еп. Многозначное отображение F:
W -*ЩЕт) называется:
1) компактным, если для любого компактного множества U С W множество F(U) =
= [J F(u) компактно;
2) монотонным, если (с(и) — c(v), и — v) ^ 0 при всех и, v £ W, с(и) £ F(u), c(v) £ F(v)
(здесь подразумевается, что п = т);
3) выпуклозначным, если F(u)—выпуклое множество при каждом ue W;
4) замкнутым (полунепрерывным сверху) в точке v £ W, если из того, что {vk} — >v,
vkeW,K {ck}->c, ck eF(vk), k = 1,2,... следует с e F(v).
Теорема 5. Пусть f(x)—выпуклая функция на открытом выпуклом
множестве W из Еп. Тогда субдифференциальное отображение 9/: W —>ЩЕп) выпуклозначно,
монотонно, замкнуто, компактно.
Доказательство. Выпуклозначность отображений 9/ следует из теоремы 2. Возьмем
произвольные и, v е W, с(и) еdf(u), c(v)еdf(v). Тогда согласно (2) f(u)-f(v)^- (c(v), и—'ь),
f(v) — f(u) ^ (с(и), v - и). Сложив эти два неравенства, получим (с(и) — c(v), и — v) ^ 0.
Монотонность 9/ установлена. Далее, пусть v е W, {vk} —»v, vke W, пусть {ck} -+ с, ck e
edf(vk). Это значит, что f(u)-f{vu)^{ck,u-vk) при всех и е W. Поскольку функция f(u)
непрерывна на W (см. теорему 2.15), то, переходя к пределу в этом неравенстве при к -+оо,
приходим к неравенству (2). Это значит, что с е9/(и). Замкнутость доказана.
Наконец, возьмем произвольное ограниченное замкнутое множество U с W. Поскольку
W — открытое множество, то все точки U являются внутренними для W и найдется такое
число S >0, что ограниченное замкнутое множество Us = {и е Еп: \и- v\ ^ S, v е U},
представляющее собой й-раздутие множества U, принадлежит W. В самом деле, если W = En, то
ЩсЕп при любом *>0. Если же WфЕп, то граница Гр W выпуклого множества непуста и
p{v,Tp W)= inf |ii-w|>0 при всех v е U. В силу леммы 2.1.2 функция p(v,Tp W) непре-
ш е Гр W
рывна на компактном множестве U и согласно теореме 2.1.1 найдется такая точка vt е U, что
inf p(v, Гр W) = p(vt, Гр W) = 2(5 > 0. Это значит, что Us С W. Функция f(u) непрерывна
v е и
на компактном множестве Us, поэтому sup f(u) = ft < оо (теорема 2.1.4).
и.
Возьмем любые v е U, се df(v). В неравенстве (2) положим и — v + 6с/\с\ С Us с W.
Получим \с\ ^ [f(v + 6с/\с\) - f(v)]/8 < 2/^/(5 = М < оо для всех с £ df(v), veU. Таким
образом, sup sup |с|= sup |с| ^ М < оо, т. е. множество df(U) ограничено. Докажем
ве V сеа/(в) cedf(U)
замкнутость df(U). Пусть {сЛ-+ с, с^. edf(U). Это значит, что существует такая точка vk eU,
что с^. £9/(¾). Поскольку и—компактное множество, то без ограничения общности считаем,
что {vk} -+ v с U. В силу замкнутости отображения 9/ тогда с £ 9/(и) С 9/( J7). Следовательно,
9/(0") — замкнутое множество. Компактность отображения 9/ установлена. □
Опираясь на теорему 5, можем уточнить свойства непрерывности и дифференцируемости
выпуклых функций на открытом множестве, в частности, обобщить теорему 1.8.3 на
многомерный случай.
Теорема 6. Пусть f(x) —выпуклая функция на открытом выпуклом множестве
W из Е". Тогда на любом компактном множестве G с W функция /(ж) удовлетворяет
202
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
условию Липшица, т. е. существует такая постоянная L — LUG) ^0, что \f(u) — f{u)\ <
^L\u-v\, u,veG.
Доказательство. Возьмем U — со G — это выпуклая оболочка компактного
множества G. В силу теоремы L8 U —выпуклое компактное множество, U с W. Тогда f(u) — f(v) ^
> (c(v), и — о) ^ —L \и — v\, u,v е U, где L — sup |с| < со в силу теоремы 5. Поменяв здесь
BIW)
и, v местами, имеем f(v) —f(u)> —L\и — v\, u,v el/. Отсюда следует утверждение теоремы
(см. упражнение 2.29). П
Теорема 7. Если функция f(x) выпукла и дифференцируема в каждой точке
открытого выпуклого множества W С Е", то ее градиент f'(x) непрерывен на W.
Доказательство. В начале параграфа мы установили, что субградиент выпуклой
дифференцируемой функции совпадает с градиентом, так что df(u) — {/'(«)} Уи € W.
Возьмем произвольную точку «6W и последовательность {vk}&W, {vk}—*.v. Множество
U = {и = vk, к = 1, 2,...} U {v} компактно и U с W. Тогда в силу теоремы 5 множество
dF(U) = (¾ = f'(vk), As = 1,2,...} компактно. Пусть с — произвольная предельная точка
множества dF(U). Тогда существует подпоследовательность ск —f'(vk )-+ с Из
замкнутости субдифференциального отображения следует, что с е df(v) = {f'(v)}, т. е. c—f'(v). Это
значит, что последовательность {f'(vk)} имеет единственную предельную точку,
совпадающую с f'(v). Отсюда и из произвольности точки v и последовательности {vk}—>v следует
непрерывность градиента f'(x) на W. □
Для получения интересных экстремальных свойств субдифференциального отображения
нам понадобится
Лемма 1. Пусть W —открытое множество из Е", многозначные отображения А
и В: W —>ЩЕп) таковы, что А замкнуто и компактно, В монотонно, причем А(и)Г)
П В(и) ф 0 при всех и е W. Тогда со В(и) С со А (и) Уи е W.
Доказательство. Зафиксируем любые ueW и ееЕ", |е|=1. Поскольку W —
открытое множество, то S = {г> е Е : |г> - и\ ^ е$} С W при некотором е$ > 0. Возьмем
последовательность {е^.} —» 0, 0 < ek < Sq. Тогда vk — и + еке С S С W, {vk} —> и. По условию
существуют ак е A(vk)nB(vk). В силу монотонности В для всех Ь еВ(л) имеем {ak — b,vk-
— и) — {ак — Ъ,еке)~2-Ъ или (а^ — Ь, е) >0. Поскольку отображение Л компактно, то множество
A(S) является компактным. Поэтому, учитывая включение ак €.A(vk)cA(S), можем считать,
что {ак} —» oq. В силу замкнутости отображения А тогда (¾ е Л (и). Поэтому, переходя к
пределу в неравенстве (а^. — Ь, е) ^ 0, получаем (oq — b, е) ^ 0, или (е, Ь) ^ (е, Oq) < sup (е, а)
... aeA(U)
при всех b е В(и). Отсюда sup (е, b) ^ , sup (е, а), и требуемое утверждение следует из
теоремы 5.6. □ b<=B(U) a<=A(U)
Теорема 8. Пусть f(x) — выпуклая функция на открытом выпуклом множестве
W из Е", пусть F: W —»ЩЕ") — какое-либо многозначное отображение. Тогда:
а) если F монотонно, df(u) С F(u) при всех и е W, то df(u) = F(u) Уи е W, т. е.
субдифференциальное отображение максимально в классе монотонных отображений;
б) если F замкнуто, выпуклозначно и F(u) С df(u) при всех и е W, то df(u) = F(u),
т. е. субдифференциальное отображение минимально в классе замкнутых выпуклознач-
ных отображений.
Док аз ательство. В случае а), пользуясь леммой 1 при А(и) = df(u), В (и) = F(u),
получаем F (и) С со F (и) С со df (и) = df(u), так что df(u) — F(u) У и е W. В случае б) в лемме
1 возьмем А(и) — F(u), B(u) = bf(u). Нужно проверить компактность отображения F. Пусть
U —какой-либо компакт из W. Из включения F(u) С df(u) Уи е W следует F(U) С df(U).
В силу теоремы 5 множество df(U) компактно. Это значит, что его подмножество F(U)
ограничено.
Далее, пусть {ск} —» с, ск е F(U). Тогда найдутся такиеточки ик е U, что ск е F(uk),
к = 1, 2,... В силу компактности U можем считать, что {ик} —»и е U. Из замкнутости
отображения F следует, что с е F(u) с -F(E0, т- е- Р(Щ замкнуто. Компактность F установлена.
В частности, взяв здесь одноточечный компакт U = {и}, заключаем, что F(u) —
компактное, т. е, ограниченное и замкнутое множество при каждом и е W. Отсюда и из теоремы 1.6
с учетом выпуклости F(u) имеем равенство со F(u) = F(u). Из леммы 1 теперь получаем
со df(u) = df(u) С со F(u) - F(u) Уи е U. Отсюда и из включения F(u) С df(u) Уи е W
следует утверждение б) теоремы. □
7. Субдифференциал для выпуклых функций играет роль, аналогичную той, какую
играет градиент для дифференцируемых функций. Как для работы с градиентами полезно иметь
некоторый набор правил дифференцирования, так и для работы с субдифференциалами нуж-
§ 6. СУБГРАДИЕНТ. СУБДИФФЕРЕНЦИАЛ
203
но иметь некоторые правила субдифференцирования. Предлагаем читателю самостоятельно
доказать следующие правила субдифференцирования 1—4:
1. Если д(и) = f(u + «о), то 8д(и) = df(u + iu).
2. Если giu) = Xf(u), А > 0, то 8д(и) = Xdf(u).
3. Если д(и) — f(Xu), то dg(u) = Xdf(Xu).
4. Если функция /(и) выпукла на Е", а А —матрица порядков п х и, Ь 6 25", то функция
g{n) = f(Au + b), и&Еп,
выпукла на Е", причем
dg(u) = Ardf(v)\
\v = Аи + 6
5. Справедлива следующая теорема [670; 234], обобщающая известную теорему о
производной сложной функции.
Теорема 9. Пусть f\(u),...,fm(u)— выпуклые функции, определенные на
открытом выпуклом множестве W из Еп, функция <р(х) = <р(хх хт) — выпуклая функция
на открытом выпуклом множестве X из Ет, причем f(u) — (fx(u) fm(u)) S X при
всех ue W, tp(x) монотонно возрастает на X, т. е. ip(x)~^ <р(у) для всех х = (х',..., хт),
2/ = (2/1)..., ут) еХ, х' > уг, i — 1,..., т. Тогда функция Ф(и) = <p(f(u)) выпукла на W и
ее субдифференциал имеет вид
дФ(и)= U {^Pidfi(u)\, ueW. (9)
Для доказательства этой теоремы нам понадобится
Лемма 2. Пусть А,,..., А — выпуклые множества из Еп, Р — выпуклое множе-
, т -.
ство из Е", тогда множество А = (J { Л Pi-^if выпукло.
P=(Pi pJeP i = \
Доказательство. Возьмем произвольные ^,¾ £ А, а 6 (0,1). По определению А
т
существуют такие Pi = (р;1,..., pim) еР С Е£, а.у е Ajt j = 1,..., m, что ct = £ Рц%; * = 1,2.
m 3 = 1
Тогда «С] +(1- 0)¾ = J2 (aP\ja\j + С ~ a)P2ja2j)- ^° условию p.. ^ 0. Обозначим через
I множество всех номеров j = l,,,.,m, для которых рх ■ > 0 или р2 ■ > 0. Тогда ар1 ■ + (1 —
-"Н>0.7а^арь.+^аЦ,е(0,1),уе/.
Положим о" = 7ауa\j +(1- laj)0^} ПРИ ■? е ^• a<j — a\j ПРИ J' ФI• в СИЛУ выпуклости
Aj точки а" принадлежат Ар j =(,...,т. Кроме того, ра = (pf,.. -,р^) = <*Р] + (1 -
— а)Р2 £ i3 из-за выпуклости Р, причем здесь р" = 0 при j ^ /. Тогда аС|+(1 — 0:)¾ =
m
= E(«Piy«»iy+(l-a)ny«H?,-)= £(аРЬ'+(1-аН0(7а^ь-+(1-7ау)^)=£ Р>"=Е Р°<»°.
зеI jel je I j = 1
где a" ei,, j = 1,..., m, p" e P. Значит, acx +(1- 01)¾ £ Л при всех a e (0, 1), т. е. A —
выпуклое множество. □
Доказательство теоремы 9. Из выпуклости функций /,-(«■), <р(х) и монотонности
<р(ж) следует выпуклость сложной функции Ф(и) = <p(f(u)) на открытом выпуклом множестве
W — это доказывается так же, как и теорема 2.8. Согласно теореме 2 тогда субдифференциал
дФ(и) при каждом и е W представляет собой непустое выпуклое компактное множество.
Докажем формулу (11). Обозначим F(u) = [j < £ Р{д/{(и) I. По теореме 2 субдиф-
Ревр(/(«))1<=1 J
ференциалы dft(u), dtp(x) также непусты, выпуклы, компактны и поэтому F(u)^0 Уи е W.
Отметим, что #^(x)e25J™ при всех хеХ. В самом деле, возьмем любые 2: = (2:1...., жт) еХ,
р = (Р],..., р ) £ с?<р(ж). Поскольку множество X открыто, то при достаточно малом е > 0
точка у~(г/1,..., ут), где у1 —х1 — е, у^ —х3 при j фг, принадлежит X. С учетом монотонности
tp(x) тогда 0 ^ tp(y) - <р(ж) ^ {р,у-х)~ р{(-е), так что р,- ^ 0, г = 1,..., т. Следовательно,
9<р(ж) е 25J™. По лемме 2 тогда множество F(u) выпукло при каждом и е W.
Покажем, что F=F(u), к&к многозначное отображение W—>ЩЕ"), замкнуто. Пусть
и е W, {ик}^и, {ск}^> с, cfc е ^(¾). Тогда найдутся pfc е d<p(f(uk)), с,к е 9/f(ufc) такие,
m
что с^=£ Pikcik- Поскольку сходящаяся последовательность {ик} ограничена, то найдется
204
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
компактное множество GcW, содержащее все точки и, и,, «2,... Аналогично, поскольку в
силу непрерывности выпуклых функций fi(u) последовательность {xf=f(uu)}-*f(u) е J, то
существует компактное множество Y с X, содержащее все точки f(u), /(и,), /(¾)....
(можно взять y = /(G) = /,(G)x.. . x/m(G)). По теореме 5 множества df^G), d<p(Y) компактны.
Поскольку cik с9/;(%)сй/(((3), рк ^9<P(f(uk))^d<f(Y), к — 1, 2,.. „ то не теряя общности
можем считать, что {сй}—>cs., {рк}—*р. Из замкнутости отображений df{(u), dip(x) имеем
771 771
ci еЭД(и), p£dtp(f(u)). Переходя к пределу в равенстве ck=J2 Pikcik> получаем с = £ Picv
т. е. с е F(u). Это значит, что отображение F замкнуто. «= 1 г = \
т
Возьмем любые и е W и с е F(u). Тогда с=]Г) Pici ПРИ некоторых с( е df^u), р=(рх,...
> = 1
..., рт) £ dip(f(u)). Учитывая определение субградиента и неотрицательность pt, получим
ФН - Ф(и) = <p(f(v)) - <p(f(u)) > {р, f(v) - f(u)) =
т mm
= Е Pi(fi(v)-fi(u))> Е Pi(ci.«-'u> = (E Pici.«-u) = (c.^-u) Vuew.
;=i ¢=i «=i
Это значит, что с е 9Ф(и) и, следовательно, ^(и) С дФ(и) при всех u е W. Отсюда, пользуясь
утверждением б) теоремы 8, заключаем, что дЩи) = F(u) Уи е W. Формула (9) доказана. □
С помощью теоремы 9 можно получить более сложные правила субдифференцирования,
дополняющие приведенные выше правила 1-4. Ниже при ссылках на формулу (9)
предполагается, что выполнены условия теоремы 9.
6. Если tp(x) —дифференцируемая функция, то д<р(х) = {<р'(х)} = {(dip/dx1,..., д<р/дхт)},
dtp(f(u)) = {tp(f(u))}, и из формулы (9) имеем
М?Ы= Е М1}?)}g/<("), «Ж
В частности, если Д.(и) дифференцируема и dft{u) = {//(и)}, отсюда получаем классическое
правило дифференцирования сложной функции.
771
7. Если <р(х) = X) агж'> а« 3* °> т0 д<Р(х) = {(а1> • • ■> "тт.)} е -^-Г и Для Функции Щи) =
т i = \ т
= Е aifi(u)' и е W, из (11) имеем 0Ф(и) = £ "idfi(u) Vu е W-
i=l i=l
8. Если <р(ж) = max x\ то согласно формуле (5) cfy(x) = {p = (p],..., рт): р( ^0, г еЦх);
\ ^ г ^ т
р. =0, i<£I(x), р, +... + рт = 1}, где J(x) = {i: 1 < г < m, max х3' = х'}, xeJSm. Отсюда
и из (9) для функции Ф(и) = max /f(и) имеем Kj^m
I ^ г ^ 77i
9Ф(п)={с:с= £ Р.-^.^е «/,(«), р,>0, •€/(/(«)), Е Pi = l} =
= со( U 0/»), I(/(«)) = {f:l<i<m,m,B /,(«) = /((«)}. «е W. (10)
9. Если <р(х) = тах{0;х}, xeiS1, то согласно (10) cfy(0) = {c: c = Pi -O+pg-l =¾. Р]+р,'=1,
р. ^ 0, рз > 0} = [0,1], dtp(x) = {1} при х > 0, fy>(x = {0} при ж < 0, и для функции Ф(и) =
= max{0;/(u)}, ueW т (9) имеем дФ(и) = pdf(и), 0<р<1, при f(u) = 0, дФ(и) = д/(и)
при /(и) > 0, 9Ф(и) = 0 при }(и) < 0.
10. Если <р(х) = (тах{0;х})р, р> 1, иеВ1, то dtp(x) = {<р'(х) = р(тах{0; х})р~ '} и для
функции Ф(и) = (тах{0; /(u)))p, u е W, имеем
аФ(и) = р(тах{0;/(и)})р-19/(и), u е W, р>1.
11. Приведем еще одну теорему, в которой дается обобщение формулы (10).
Теорема 10. Пусть А —компактное множество из Ет, W —открытое выпуклое
множество из Е", функция G(u,a) определена на W х А, полунепрерывна сверху по а
при каждом и eW, выпукла по переменной и е W при каждом аеА. Тогда функция
Ф(и) = maxG(u, а) выпукла на W и ее субдифференциал имеет вид
дФ(и) = со ( U dG(u,a)), Я(и) = {а:аеА,0(и,а)=Ф(и)}, u<=W. (11)
§ 6. СУБГРАДИЕНТ. СУБДИФФЕРЕНЦИАЛ
205
Доказательство может быть проведено по той же схеме, как и теорема 9, и представляется
читателю.
12. Если А —выпуклое замкнутое ограниченное множество из Еп, то функция Ф(и) —
— тах(а, и), и е Е", выпукла на Еп, причем, как следует из (11) при G(u, а) = (а, и), имеем
аеА
дФ(и) — {а: аеЛ, (а, и)—Ф(и)}.
Более подробно о перечисленных и других правилах субдифференцирования, о различных
свойствах субдифференциала, о различных обобщениях понятий субградиента и
субдифференциала, о применении этих понятий для исследования и приближенного решения экстремальных
задач см., например [234; 251; 263; 264; 302; 314; 358; 434; 495; 499; 502; 542; 543; 604; 605;
613; 617; 670; 720; 795; 814].
Упражнения
1. Найти субдифференциалы функций;
a)f(u) = \u-l\,ueEl;
б) f(u) = \u-l\ + \u + l\, и&Ех;
в) f(u) = \х + у\ + \х-у\,и = (х, у) е Е2;
г) f(u) = max{u2,u + 2}, иеЕ1;
д)/(и) = тах{М;[и-1|}, иеЕ1;
e)f(u)=:\{a,u)-b\,ueEn;
2. Пусть функции fx(u),...,fm(u), и^Е", непрерывно дифференцируемы в некоторой
окрестности точки v. Доказать, что тогда функция f(u) = max /,-(«) в точке v имеет
производные по любому направлению е, |е| = 1, причем l^t^m
№ = .max </,'(«), в), /(«) = {<: U^m, /,(«) = /(«)}■
Установить связь между этой формулой и формулами (7), (10).
3. Найти субдифференциалы функций f(u)= max \t2 + xt + y\, f(u) = max \xt2 + yt\,
f(u)- max \x+ty\, u = (x, y)eE2. |г|<1 |г|^'
4. Пусть" Л —замкнутое ограниченное множество из Ет, функция д(и, а) непрерывна
по совокупности переменных (и, а) на Еп х А вместе с производной дд(и, а)/ди. Доказать,
что тогда функция f (и) = max д(и, а) во всех точках v еЕ" имеет производную по любому
ае А
направлению е, |е| = 1, причем
№= max <^М,е), A0(v) = {а: аеА, g(v,a) = f(v)}.
"е aeA0(v) ии
Установить связь между этой формулой и формулами (7), (11).
5. Пусть f(u) — выпуклая функция одной переменной на отрезке [а, 6]. Доказать, что
df(u) = [f'(u - 0), f'(u + 0)] при всех и е (а, 6), где f'(u - 0), f'(u + 0) — левая и правая
производные в точке и. Показать, что в точках и — а или и=Ь субдифференциал может быть
пустым (рассмотреть пример f(u) = -у 1 - и2, \и\ < 1).
6. Пусть f(u) — выпуклая функция на выпуклом множестве X из Еп. Доказать, что при
всех и е ri X множество df(u) непусто, выпукло, компактно, причем '} ' = max (с, е) для
всех ее Lin X. т deS/<">
7. Пусть X —выпуклое множество, функция f(x) выпукла на X. Доказать, что df(x)n
П Lin X ф 0 при Уж е ri X, т. е. субградиент всегда можно выбрать в Lin X.
8. Пусть функция f(u) определена на открытом выпуклом множестве W С Еп и такова,
что функция Ф(и)= \f(u)\ выпукла на W. Описать множество дФ(и), и£ W.
9. Описать субдифференциалы функций р(и, X), 6(с, X), ц(и, X) из упражнений 18-20 к
§4.2.
10. Пусть f(u) — выпуклая функция на открытом выпуклом множестве W из Еп, пусть
субдифференциал df(u) в некоторой точке и е W состоит из единственного элемента с.
Доказать, что f(u) дифференцируема в точке и, причем f'(u) = c.
206
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
11. Пусть /(и), G(u) — выпуклые функции на открытом выпуклом множестве W из 25",
причем df(u) = 8G(u) при всех и е W. Доказать, что тогда /(u) = G(u) + const, и е W.
12. Пусть функция /(и) выпукла на открытом выпуклом множестве W из 25™. Доказать,
что для того чтобы f(u) шла сильно выпуклой на W, необходимо и достаточно, чтобы для
каждой точки v £W существовал субградиент c(v) е df(v) такой, что
f(u)- f(v)^(c(v),u- v) + kx\u -v\2 VueW, z = const>0.
13. Пусть функция f(u) сильно выпукла на открытом выпуклом множестве W из 25™ с
постоянной сильной выпуклости и. Доказать:
а) (с(и) — c(v), и — v) > х\и - v\2 для всех Vu, v £W, c(u) e df(u), c(v) g df(v);
б) df(u) П df(v) = 0 для всех и, v e W, u^v;
в) для любой точки v^W справедливо неравенство |u—v\ ^ -% min \с\ для всех иеМ(«)=
= {« е W:/(и) ^/(«)}. с60/(,,)
Опираясь на это утверждение, доказать теорему 3.1 для любого выпуклого замкнутого
множества X CW.
14. Пусть функция /(и) выпукла на открытом выпуклом множестве W С Еп и сильно
выпукла на выпуклом замкнутом подмножестве X с W. Доказать, что тогда
где ut —точка минимума /(и) на X, Д = /(¾).
15. Пусть функция /(и) сильно выпукла на Еп. Доказать, что для любого с е В" существует
такая единственная точка «(с) е В", что с е df(u(c)).
Указание: рассмотреть точку минимума функции д(и) = /(и) — (с, и) на В".
16. Доказать, что оператор проектирования на выпуклое замкнутое множество является
монотонным, замкнутым, компактным отображением. Указание: воспользоваться
теоремами 4.4.2, 4.4.3, неравенством (4.4.4).
§ 7. Равномерно выпуклые функции
1. Рассмотренный в § 3 класс сильно выпуклых функций обладает
замечательным свойством — для функций этого класса имеет место теорема 3.1.
Однако этот подкласс выпуклых функций недостаточно широк и не
содержит, например, такую выпуклую функцию, как f(x) = х4, хе Е1, которая,
между прочим, достигает своей нижней грани на любом выпуклом
замкнутом множестве из Ех, причем в единственной точке. Хотелось бы выделить
такой подкласс выпуклых функций, для которого была бы верна теорема
типа теоремы 3.1 и который был бы шире класса сильно выпуклых функций.
Оказывается, таким классом является класс равномерно выпуклых
функций.
Определение 1.Функцию f(x), определенную на выпуклом
множестве X, называют равномерно выпуклой на X, если существует
неотрицательная функция S(t), определенная при всех t, 0<t< diam X=sup\u—v\,
5(0)=0, S(t0)>0 при некотором t0, 0<t0<diamX, и такая, что %vSx
f(au + (1- a)v) < af(u) + (1- a)f(v) - a(l -a)8(\u - v\) (1)
при всех u,veX, a e[0, 1]. Функцию 8(t) называют модулем выпуклости
функции f(u) на X, а функцию
u(t) = Inf Inf "/(") + (!-")/(")-/("" +(l'-»M
0<а<1 \u-v\=t,u,veX Qf(l-Qf)
§ 7. РАВНОМЕРНО ВЫПУКЛЫЕ ФУНКЦИИ
207
точным модулем выпуклости f(x) на X. Если равномерно выпуклая
функция имеет модуль выпуклости S(t) > 0 при всех t, 0< t <diamX,
то такую функцию называют строго равномерно выпуклой на X [191].
Очевидно, всякая сильно выпуклая функция является строго равномерно
выпуклой с модулем <$(£) = к«*2. Сумма равномерно выпуклой функции
с модулем S(t) и выпуклой функции будет равномерно выпуклой с
модулем S(t). Если f(x) равномерно выпукла с модулем S(t), то функция
g(x) = cf(x) при любом с = const > 0 также будет равномерно выпуклой с
модулем cS(t). Если /x(i) — точный модуль выпуклости равномерно
выпуклой функции f(x) на X, то любая функция S(t) ^ м(*), 0 < t ^ diam X,
неотрицательная, нетождественно равная нулю, 8(t) = 0, будет модулем
выпуклости функции f(x) на X.
Следующая теорема является обобщением теоремы 3.1.
Теорема 1. Пусть X — выпуклое замкнутое множество из Еп
(например, X =Еп), а функция f(x) равномерно выпукла и
полунепрерывна снизу на X. Тогда:
1) множество Лебега M(v) = {и: иеХ, f(u) < f(v)} выпукло,
замкнуто и ограничено при всех v е X;
2) /, = inf f(u) > -оо, Xt = {и: и е X, /(«) = /.} ф 0;
3) имеет место неравенство
«flu-u.|)</(u)-/К) (2)
при всех и е X, ute Xt;
4) если, кроме того, f(x) строго равномерно выпукла на X, то Xt
состоит из единственной точки ut и всякая минимизирующая
последовательность {ик}: {ик} е X, lim f(uk) = ft, сходится к точке щ.
к —»оо
Для доказательства этой теоремы нам понадобятся следующие две леммы о свойствах
точного модуля выпуклости.
Лемма 1. Пусть fi(t)— точный модуль выпуклости равномерно выпуклой функции
f(x) на выпуклом множестве X. Тогда
/i(ct)>cV(t) (3)
для всех с > 1, t>0,0^ct^diamX.
Доказательство. Сначала рассмотрим случай 1 ^ с < 2. По определению ^(ct) для
любого е >0 существуют точки и^щ^Х и число а, О < а < 1, такие, что |и, - щ\ = ct и
где иа = ащ + (1 — а)щ. Отсюда имеем
e/(«i) + (1 ~ в)/(¾) - /W £ «О - «)/*(<*) + «(1 - а)е. (4)
Можем считать, что 0< а ^ 1/2, так как в противном случае в (4) точки щ и щ можно
поменять ролями. Тогда с учетом 1 ^ с < 2 можем сказать, что 0 < а ^ ас < 1. Кроме того,
1/2< 1/с^ 1, поэтому u3 = (l/c)ul+(l-l/c)w2£X, причем \u3 — u2\ = \ul-w2\/c = t. Заметим
также, что иа = аси^ + (1 — ас)^. Тогда
/(¾) £ (1/с)/(«,) + (1 - 1/0)/(¾) - (1/с)(1 - l/c)/i(ci),
/(uaKac/(«3) + (l -асЩщ)- ac(l-ac)fj,(t).
Умножим первое из этих неравенств на ас и сложим со вторым. Учитывая неравенство (4),
получаем
ас(1/с)(1 - l/c)fi(ct) + ас(1 - ac)n(t) <
^ а/(и,) + («с - 0)/(¾) - (1 - ac)f(u2) - /(u„) =
= a/(«i) + (1 - 0:)/(¾) - /К) «: Qf(l - a)n(ct) + or(l - a)e
208
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
или
а(1 - l/c)n(ct) + ас(1 - ac)n(t) «£ а(1 - a)n(ct) + а(1 - а)е.
Поскольку здесь е > 0 — произвольное число, то можем е устремить к +0. Будем иметь.
ас{\ — ac)ft(t) ^ (а/с)(1 — ac)n(ct) или с2fj,(t) ^. fi(ct).
Неравенство (3) для случая 1 ^ с < 2 доказано. Пусть теперь с ^ 1 — произвольное число,
О ^ ct < diam X. Поскольку lim Vfc = 1, то найдется Ь (1 ^ Ь < 2) такое, что с = Ьп при
П—»00
некотором натуральном п> 1. Учитывая, что по доказанному fj,(bt)^b2n(t), получаем n(ct)=
= fi(bnt) = ц(Ь • Ьп- ' t) > &V(b"~ ' *) > bV(b"-2*) > • • • > b2V(<) = cV(t). П
Лемма 2. Пусть n(t) — точный модуль выпуклости равномерно выпуклой функции
f(x) на выпуклом множестве X. Тогда:
1) n(t) = 0(t2) при t-»+0;
2) ^(t)sO при 0^. t < T = inf{t: ^(t) >0}, ^(t) строго монотонно растет при т <t ^
^ diam л; " '
3) если diam X =оо, mo lim ^(t) = oo.
( —юо
Доказательство. Из определения 1 следует, что n(t0)>0 при некотором <q, 0 < tg <
< diam X. Поэтому 0 ^ т < diam X. Если т > О, то ^(t) = 0 при 0 ^ t < т по определению
т. Пусть r<t <a<diamX. Тогда с помощью неравенства (3) имеем ^.(а) = n((a/t)t) >
^ (a/t)2n(t) > n(t) >0, т. е. n(t) строго монотонна при т< t ^diamX.
Далее, если т > 0, то условие fi(t) = 0(t2) при t —» +0 выполняется тривиально. Поэтому
пусть т = 0. Тогда, фиксируя какое-либо t0, О < L ^ diam X, для всех 0 < t < t0 имеем #(t0) =
= ^((t0/t)t)^(t0/t)2n(t) или /i(t)^/i(io)t2/to= const -t2. Это и означает, что ^(t)= 0(t2)
при t —» +0.
Наконец, пусть diam X = оо. Тогда ^(t) определена при всех t ^ 0. Пусть t ^ t0> т. Тогда
^(*) = ^((</*о)*о)^(*/*о)2^(*о) = const •* • Это значит, что ^(t)—»оо при t —»оо со скоростью
не медленнее, чем t2. П
Заметим, что из неравенства 0^ 5(f) ^/j(t), справедливого для любого модуля выпуклости
равномерно выпуклой функции, и из леммы 2 следует, что условие 6(t) — 0(t2) при t —»
—» +0 является необходимым для того, чтобы некоторая функция 6(t) могла служить модулем
выпуклости для какой-либо равномерно выпуклой функции.
Доказательство теоремы 1. Если множество X ограничено, замкнуто, т. е.
X компактно, то утверждения 1), 2) теоремы следуют из теорем 2.1.1, 2.10, леммы 2.1.1.
Остается рассмотреть случай, когда X — неограниченное множество. Тогда diam X = оо и
точный модуль выпуклости fi(t) функции /(ж) будет определен при всех t >0.
Пусть <q > 0 и ^(<о) > 0. Возьмем произвольную точку «бХи рассмотрим шар
S = S(v, t0) = {и: ие X, \и - v\ ^ tg}.
Из теоремы 2.1.1 следует, что inf f(x) = fg > —оо, так что
/(«)>/в = /(*)-Ч "='/(«)-/я > 0, (5)
при всех и е S. Возьмем произвольную точку и еХ \S, т. е. |u — v\ > t0. Тогда, учитывая
доказанную в лемме 2 строгую монотонность fj,(t) при t > т, имеем
0<а0 = (М<о)М1«-Ч))1/2<1- (6)
При а — а0 из (1) получаем
«оД") 2» /(« + «о(« - «)) - (1 - a0)/(w) + ао(1 - аоИ1" - v\)- (7)
Из (6) и леммы 1 следует ^(^) = ссд^О" — «|) = ао^((^/ао)ао\и ~~ v\) S* Maolu ~ v\) или
М*о) 55 №(ао\и — v\)- В СИЛУ монотонности ^(t) это означает, что cc0|u — v\ ^ t0. Тогда v +
+ cc0(u —«) е S и согласно (5) /(u + cc0(u — v)) ^ f(v) — v. Учитывая эту оценку, из (7) имеем
a0f(u) 3* a0f(v) ~v + а0(1 - а0)ц(\и - «|).
Отсюда, сокращая на а0 > 0 и вспоминая определение (6) величины а0, получаем
§ 7. РАВНОМЕРНО ВЫПУКЛЫЕ ФУНКЦИИ
209
Применяя к последнему слагаемому неравенство аЬ ^ (о +6 )/2, будем иметь
/(«)> /(«) + М1«-Ч)/2-(у/М^) + »/ф^>))2/2 (8)
для всех и е X \5. На самом деле, неравенство (8) имеет место для всех и е X. Действительно,
если ueS, то ^(^-^1)^^(¾). а тогда ^ ^.(Jfi(t0) +h>/Jfi(t0))2/2-ц(\и - v\)/2. Отсюда
и из (5) следует справедливость (8) и для u е S. , ,
Для всех и е M(v) из (8) имеем д(|ц - г>|)/2 - (уМ<о) + v/^ р(Ц))2/2 ^ /(и) - /(и) ^ 0,
т. е. р(|и — г>|) ^ (д/^(*о) + ^/^/^(¾))2 ПРИ любом и е M(v). Поскольку fi(t) —»оо при t —»оо
и только в этом случае, то из последнего неравенства следует ограниченность множества
M(v). Выпуклость M(v) следует из теоремы 2.10, а замкнутость M(v) — из леммы 2.1.1. Из
теоремы 2.1.2 имеем, что L > — оо, Xt 4- ®-
Докажем неравенство (2). Поскольку любой модуль выпуклости 6(t) ^ fj.(t), то
неравенство (2) достаточно доказать для /*(t). Возьмем любую точку ute Xt. Тогда 0 ^ /(ecu + (1 —
-a)i^)-/(ut)<a(/(u)-/(i^))-a(l-a)^(|u--«|) или a(l-Qf)^(|u-i^|K 0(/(14)-/(¾)).
О < о < 1, иеХ. Деля на а > 0 и устремляя а —>+0, отсюда получаем неравенство (2).
Наконец, пусть функция f(x) строго равномерно выпукла на X. Тогда она строго выпукла
на X и согласно теореме 2.1 множество Xt будет состоять из единственной точки ut. Возьмем
произвольную минимизирующую последовательность {ик}. Полагая в (2) и — ик и устремляя
к —»оо, получаем 6(\ик — uj)—»0. Это возможно только при \ик — ut\ —»0, так как f(x) строго
равномерно выпукла.
2. Остановимся на некоторых необходимых, а также достаточных условиях равномерной
выпуклости функции.
Теорема 2. Пусть X — открытое выпуклое множество из Еп, пусть функция f(x)
равномерно выпукла на X с модулем выпуклости 6(t). Тогда необходимо выполняются
неравенства
/(«) 5> /(«) + <с(«), и-«) + 5(|« - «|), (9)
<с(и) — с(г>), « — w) > 2f (|u — «D (10)
при всех c(v) S df(v), c(u) e c>/(u) и всех u,veX.
Доказательство. Поскольку равномерно выпуклая функция является и просто
выпуклой, то из теоремы 6.1 следует, что df(u)^0 при всех uGl. Возьмем произвольные
u,v £ X, c(v) е df(v). Из определения субградиента и из (1) при всех о, 0 < о < 1, имеем
о(ф), u-v)+f(v) ^ f(au+(l-a)v) ^ af(u)+(l-a)f(v)-a(l-a)8(\u-v\)
или (1 — a)S(\u — v\)+ <c(v), u—v>^.f(u)—f(v). Отсюда при о —> +0 получим неравенство (9).
Меняя в (9) переменные и и v ролями, будем иметь
f(v) 3* /(и) + (с(и), v-u) + 6(\и - v\), с(и) е 0/(и).
Складывая это неравенство с (9), приходим к (10). П
Приведем одно достаточное условие равномерной выпуклости функции.
Теорема 3. Пусть X — выпуклое множество, f(x) е С1 (X), и пусть для некоторой
непрерывной неотрицательной функции f(t), 0^ t ^diamX, £(<)= 0(t2) при t —» +0,
f(t)^0, выполняется неравенство
(f'(u)-f'(v),u-v)}>t(\u-v\) (11)
при всех и, v е X. Тогда функция f(x) равномерно выпукла на X с модулем выпуклости
«(t)=i«(rt)/r)dr.
о
Доказательство. Из формулы (2.7) и условия (11) имеем
af(u) + (1- a)f(v) - f(au + (1- a)v) =
= o(l-о) }</'(*,)-/^),^-^^0(1-0)5^,-^)^ =
О О
= о(1-а)$£(т|и-«|)^ = а(1-о)в(|и-«|), u,veX, oS[0,l],
210
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
что и требовалось. П
Доказанная теорема 3 может быть использована для установления равномерной выпуклости
конкретных функций.
Теорема 4. Функция f(x) = \х\р строго равномерно выпукла на Еп при всех р ^2.
Доказательство. Покажем, что
</'(«) ~ /'(«). «-■">>§ min{l; 23-^}|« - «|Р, u,veEn. (12)
Здесь f'(x) = p\x\p~2x. Тогда
</'(«) - /'(«). u-v) = (р\и\Р~2и- p\v\P~2v, u-v) =
= Р[|«Г + М* - <«. «>(|«Г-2 + 1«Г~2)] =
= Р[|Ц|Р + |,Г - И2 + Н22- I" - Н2,(|цГ 2 + ,,,,-2)] =
==§[(1«Г_2-Н,,-2)(Н2-1«12) + 1«-«12(1«1р-2 + Ир-2)]>
^^\u-v\2(\u\"-2 + \v\'>-2), u,veEn. (13)
Покажем, что
1^1^-2 + 1^1^-2^1^-1^1^-2 min{l;23-^>, u,veEn. (14)
Рассмотрим функцию tp(x) = (xa + l)/(x + l)a при 01> а >0. Имеем ip'(x)=a(xa~l -1)(х +
+ 1)-"-'. Если аг>1, то р'(х) #:0, и <^(зз) > ^(1) = 21 а для всех х> 1. Если 0 < а < 1, то
^'(а;) <0 и tp(x) ^ 1/з(оо)= 1 при всех х> 1. Следовательно, ^(ж) ^ Aa = min{l;2' ~а} VO 1,
или
Аа(о; + 1)а^а;а + 1, х>1, а > 0. (15)
Далее имеем | и — и |р ~ 2 ^ (| и | +1 и | )р ~ 2. Без ограничения общности можем считать | и | > | v |.
Тогда с помощью неравенства (15) получим
\и ~ v\"~2 $ |«|"-2(|u|/|«| + l)»~2$ A;l2((\u\/\v\)"-2 + l)\v\"~2,
что равносильно (14). Из (13} и (14) следует неравенство (12). С помощью теоремы 3 отсюда
заключаем, что функция f(x)= \xf при р>2 равномерно выпукла на Еп с модулем S(t) =
= tpmin{U23~P}/2.a
Более тонкие оценки показывают, что функция f(x) = |х|р при р ^ 2 имеет точный модуль
выпуклости fi(t)= tvj2p~2, t >0.
Будет ли функция f(x)=\x\p равномерно выпуклой на Еп при 1 <р <2? Оказывается, не
будет. Чтобы убедиться в этом, достаточно показать, что функция ip(x) = x1' одной переменной
при 1 < р < 2 не будет равномерно выпуклой на полуоси х ^ 0, поскольку функция f(x) = \х\р
вдоль лучей х = te, |е| = 1, ведет себя как функция t31 одной переменной.
Если бы функция tp(x) = xp, 1 <р<2, была равномерно выпуклой при О 1 с некоторым
модулем выпуклости S(t), то согласно теореме 2 необходимо выполнялось бы неравенство (10).
В данном случае неравенство (10) имеет вид
26(t)^tp[(x+t)p-i-x''-1], :00, ОО.
С помощью формулы конечных превращений отсюда имеем
26(t)^t2p(p-l)(x+et)»-2^t2p(p-l)xp-2, а:3*0, ОО.
Зафиксируем здесь произвольное ОО, ах устремим к оо. Получим 6(t)s0 при всех t >0.
Таким образом, функция f(x) = \x\p при 1 <р<2 не является равномерно выпуклой на Еп.
Можно, однако, показать, что эта функция строго равномерно выпукла на любом выпуклом
ограниченном множестве из Еп [191].
§ 7. РАВНОМЕРНО ВЫПУКЛЫЕ ФУНКЦИИ
211
§ 8. Обоснование правила множителей Лагранжа
Пользуясь теоремами отделимости выпуклых множеств и теорией
неявных функций из классического анализа, мы уже в состоянии дать строгое
обоснование правила множителей Лагранжа, изложенного в § 2.3. Более
того, мы получим необходимые условия экстремума первого порядка для
несколько более общей задачи:
/(i)-> inf, хеХ, (1)
X = {хеХ0: д{(х)^0, г = 1,..., т; д{(х)=0, г =m+l, . . .,з}. (2)
где Х0 — заданное множество из Еп, функции f(x), д{(х), г = 1, ..., а,
определены на Х0. Здесь не исключаются возможности, когда отсутствуют либо
ограничения д{(х) ^0 типа неравенств (m = 0), либо ограничения д{(х) =0
типа равенств (s = т), либо оба вида ограничений (т = s = 0, X = Х0).
Если Х0 = Еп, то получим задачи, рассмотренные в главе 2.
Разумеется, и само множество Х0 в (2) может задаваться ограничениями
типа равенств и неравенств. При выделении множества Х0 обычно
руководствуются тем, чтобы Х0 имело простую структуру, чтобы легко (без
трудоемкой вычислительной работы) можно было проверить включение х Е Х0,
указать какую-либо конкретную точку из Х0, чтобы легко было
проектировать точку на Х0. В задачах линейного программирования (глава 3) роль
Х0 играл неотрицательный ортант £?". Часто множество Х0 представляет
собой параллелепипед
Х0 = {х = (х1,...,хп)еЕп: а^хЧй, г = 1,..., п},
где а{, /3{ —заданные числа, а.^(3{ (возможно, некоторые а,.=оо, /J,.=+oo).
Функция Лагранжа для задачи (1), (2) определяется также, как в главе 2:
С(х, A) = \0f(x) + Xl9l(x) + ... + \sgs(x), (3)
где x = (xl,...,x«)eX0, \=(\0,...,\j€E°+i, A, ^0,..., Am>0.
Теорема 1. Пусть множество X задается условиями (2), где
Х0 — выпуклое множество из Еп, функции f(x), g{(x), i = 1,..., s,
определены на Х0. Пусть xt е X — точка локального минимума в
задаче^), (2), пусть функции f(x), g{(x),..., gm(x) дифференцируемы в
точке xt, а функции gm+i(x),..., gs(x) непрерывно дифференцируемы, в
некоторой окрестности 0(xt, е) П Х0 точки xt. Тогда существуют числа
Л = (Л0,..., Л3) такие, что
Л = (Л0,...,Л1)^0, Ло^О.Л, ^0,..., Лт^0, (4)
(£x{xt,\),x-xt)Z0 УхеХ0, (5)
>Ч9>(Ъ) = 0> i =1,.--, т. (6)
Сразу же заметим, что при Х0 = Еп условие (5) эквивалентно равенству
£x(xt,\) = 0 — это легко доказывается с помощью тех же рассуждений,
использованных в теореме 2.3 в аналогичной ситуации. Отсюда следует, что
при Х0 = Еп теорема 1 превращается в теорему 2.3.2. Поэтому, доказав
теорему 1, мы по_лучим также и доказательство теорем 2.3.1, 2.3.2. Как и
в главе 2, числа А = (А0,..., Ат) из (3)-(6) будем называть множителями
212
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Лагранжа, соответствующими точке xt\ равенства (6) — условиями
дополняющей нежесткости. Будем также придерживаться прежних
определений активных и пассивных ограничений: ограничение д{(х)^.0 активно в
точке xt, если д{(х^ =0, и пассивно в точке xt, если g{(xt) <0.
Из теоремы 1 следует, что точками локального минимума в задаче (1), (2)
могут быть лишь те точки x = v, для которых существуют множители
Лагранжа Л =(А0, ..., As), такие, что пара (v, Х)е En + s + i является решением
системы
(\0f'(v) + Xlgl'(v) + ... + X,g,'(v),x-v)^0 Vx€X0,
x{9i(v) = 0, г = 1,.., m;
vEX0, gi(v)^0L...,gm(v)^0,gm+i(v) = 0,...,gs(v)=0, (8)
_A^0, A0^0, .., Am^0. (9)
Множество всех тех А, для которых пара (v, А) — решение системы (7)-
(9), будем обозначать через Л = Л(ч;). Так как если (v, А) — решение
системы (7)-(9), то пара (v, /хА) при V/x > 0 также решение этой системы.
Следовательно, A(v)— конус, который как и в главе 1, будем называть
конусом Лагранжа. Предлагаем читателю доказать, что A(v) — выпуклый
конус, а конус A(v) U {0} замкнут.
Замечание 1. Если v — точка локального максимума функции f(x)
на множестве (2), то учитывая, что v — точка локального минимума
функции (-f(x)), и применяя к (-f(x)) теорему 1, получим,_что для точки
локального максимума существуют множители Лагранжа А = (А0, .. ., As),
такие, что пара (v, А) удовлетворяет соотношениям (7), (8), а условие (9)
заменяется на _
А^О, А0<0, А.^0, ..., Ат^0. (10)
множество таких А образует выпуклый конус, который также будем
обозначать через A(v) и называть конусом Лагранжа точки локального максимума.
В системах (7)-(9) и (7), (8), (10) условие А фО можно заменить каким-
s
либо условием нормировки, например, |А|2 = J2 А? = 1. Для выявления то-
чек, подозрительных на локальный экстремум (минимум или максимум)
достаточно рассмотреть систему (7), (8) с требованием А, ^ 0, .. , Am ^ О,
3
последовательно полагая в ней А0=1, А0 = —1 и А0 = 0, ]Г) А?=1. При
г = о
обсуждении теоремы 2.3 было замечено, что вариационные неравенства
(Cx(v, А), х — v) ^ 0 Va; е Х0, вообще говоря, могут быть записаны в
виде системы п уравнений. Поэтому можно сказать, что система (7), (8) с
учетом условий нормировки, содержит подсистему из n + s + l уравнений с
n + s + l неизвестными (v, А). Определив решения этой подсистемы и
отобрав из них те, которые удовлетворяют остальным условиям (7)-(9) или (10),
получим множество точек v, подозрительных на локальный экстремум, и
соответствующий множитель А из конуса A(v). Описанный подход к поиску
точек экстремума функции f(x) на множестве (2), как и в главе 2, будем
называть правилом множителей Лагранжа.
Доказательство теоремы 1 проведем, используя методику книги
[670] (гл. 4, § 2). Пусть It = I(xt) = {i: 1 < i < m, ^-(¾) = 0} — множество
номеров активных ограничений в точке xt (возможность It = 0 здесь не
исключается), пусть |7 | — количество номеров /„,. Определим множество А,
§ 8. ОБОСНОВАНИЕ ПРАВИЛА МНОЖИТЕЛЕЙ ЛАГРАНЖА 213
состоящее из точек а = (а0, а{,г е It, am+l,.. ., aa)e Es~m+^ + l, представи-
мыхв виде ao=(f'(xf), x—xt), ai = (g/(xt), x — xt) для i elt и i = m+l, . . ., s
при некотором a;eriX0. Так как пХоф0 (теорема 1.11), то А ф0. Кроме
того, введем множество В = {Ъ = (Ь0, Ь{, г € /„, bm+l, .. ., bs) е J57s~"m+|i>l + 1:
Ь0 < О, Ь{ < О, г е It, Ьт+, = 0,..., Ъа = 0}. Очевидно, В — непустое
выпуклое множество. Нетрудно доказать, что множество А также выпукло. В
самом деле, пусть ^,,^6 .А. По определению множества А тогда
существуют точки ж,, 3¾ е ri Х0, такие, что dj = (¾. = (f'(xt), х. - xt), a{. =
= (9i'(x*)i xj - xt),i elt,i = m + l,..., s), j = 1, 2. Возьмем a e [0, 1] и
положим da =adi+(l-a)d2, ^ = 0:^+(1-0:)¾. Из выпуклости riX0
(теорема 1.11) следует, что х eriX0. Далее, аа01 + (1 - а)а22 = a(f'(xt), х{- xt) +
+ (1- a)(f(xt), х2-х^) = (f'(xt), xa - xt), aa{,+(l - a)ai2 = a(g'(xt), ж, -
- ж,) + (1 - a)(g'(xt), x2-xt) = (g'(xt), xa - xJ Vi € 7, и Уг = m + 1, .. ., a.
Следовательно, dae4 Va 6 [0, 1]. Выпуклость А доказана.
Далее, возьмем несущее подпространство L =Lin Х0 множества Х0
(определение 1.3). Пусть е,,..., е— базис подпространства L1-,
являющегося ортогональным дополнением L до Еп. Тогда L = {h € Еп: (е{, /г) =
= 0, г = 1, ..., р}. Заметим, что если система векторов {дт+\'(х„), ...
. .., gs'(xt), е,,..., ер} линейно зависима, то теорема 1 доказывается просто.
В самом деле, в этом случае существуют числа Am+1, ..., As, a,,..., ар,
такие, что
s р
£ ^,-0/(=0+ £ а<е,.=0, (Am+,,...^,,,0:,,...,0:^)^0. (И)
г = т + 1 г = 1
Тогда среди чисел (Ат+1,..., As) найдутся отличные от нуля числа, так как
в противном случае из (11) следовала бы линейная зависимость векторов
е,,..., е , представляющих базис подпространства Lx. Кроме того, из (11)
следует, что
£ \i(gi'{xt),h) = -£ai(ei)h)=0, VheUnX0.
i =т+ I г =1
Но Lin X0 = affX0—ж+, поэтому полагая в этом равенстве h = x—x^ xeaff Хф
S
имеем: £ ЬЛз/(х*), х~ х*) = 0 УхеХ0С aff Х0. Отсюда следует, что на-
г = та + 1
бор чисел А =(А0=0, А, =0,..., Ат=0, Ат+1, ..., А,), где (Ат + 1,..., А„)^0
взяты из предыдущего равенства, удовлетворяют всем условиям (4)-(6).
Теорему 1 остается доказать для случая, когда система векторов
{gm+i'(xt), ..., gs'(xt), en ..., ер} линейно независима. Покажем, что тогда
введенные выше множества 1 и В не пересекаются. Допустим, что А П
П В ф 0. Тогда найдется точка х е п Х0, такая, что
а0 = (Г(х*),х-х*)<°> ъ = (дЛъ): х~ х*) < °. Уг'е^, ,12,
а{ = (дЛх*), х-х,)=0, V« = m + 1, ..., а.
Обозначим h = х — xt. Линейно независимую систему {gm+['(xt), ...
■ ■ -j gs'(x*)i еи • • -j еЛ дополним до базиса пространства Еп любыми
подходящим образом выбранными векторами ep+l, ..., en_s + m и введем функции
f{(r,t) = gm + i(xt+th + r), i = 1,..., а-m;
fi(r, *)= (ei-s + m. r). i = s-m+\,...,n.
214
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Рассмотрим систему п уравнений
/(r-,*) = (/i(n *),...,/>„ О)=0 (14)
относительно п неизвестных r = (r{,..., гп). Для доказательства
разрешимости системы (14) воспользуемся известной из математического анализа
теоремой о неявных функциях [327; 350; 352; 534]. С этой целью прежде
всего заметим, что /(0,0)=0. Далее, функции /,.(г, t) непрерывно
дифференцируемы в окрестности точки (0,0), причем с учетом (12), (13):
Щ^=9т+1'(^ Щ^=(9т+1Ы^)=0, , = 1,...,,,-т,
^, — ei-s + m) gt —u; «—s га -t- i, .. ., п.
Таким образом, якобиан g/j' ' ' гп\ системы (14) в точке (0,0),
представляющий собой определитель квадратной матрицы •'^ ' со строками
9т+\(х*)> ■ ■ ■> 9s'{xt),e{,..., en_s + m, образующими базис в Еп, отличен от
нуля. Все условия теоремы о неявных функциях выполнены. Согласно этой
теореме существуют непрерывно дифференцируемые функции r = r(t) =
= (^(4),..., rn(i)), определенные при всех t, \t\ < t0, где t0 — достаточно
малое положительное число, и такие, что
г(0) = 0, f(r(t),t) = 0 Vt, \t\^t0.
Дифференцируя последнее тождество по 4, получаем
Отсюда при t =0 с учетом равенства •'^ * =0 будем иметь: ■'у 'г'(0) =
= 0. Однако матрица •* V ^ невырожденная, поэтому r'(0) = 0. Это значит,
что r(t) = r(0) + tr'(0) + o(t) = o(t), т. е. lim r(i)/i =0. Таким образом,
найдена вектор-функция r(t) = (r,(t),..., »"„(*)), для которой
ft(^+*(Jc-a:J+r(t)) = 0, г =m+l,...,s,
(ef,r(t)) = 0, « = l,...,n-a + m, 1*1^*0, lim r(i)/i =0. {lb>
Покажем, что по кривой х = x(t) = xt + t(x - xt) + r(t) можно двигаться,
оставаясь в множестве X при всех t, 0< t < *,, где i, —достаточно малое
число, 0 < i( < min{i0; 1}. В самом деле, равенства (ei; r(t)) = 0, г = 1, ...
...,р, означают, что r(t) е Lin Х0. Кроме того, feril0, lim r(t)/t = О,
поэтому x + r(t)/t € Х0 при всех малых t. Тогда, учитывая выпуклость Х0,
имеем x(t)= t(x + r(t)/t) + (1 - t)xt € X0 Vt, 0< i < *,. Далее, первые
равенства (15) означают, что д{(х^)) = 0, 0<*<*,, Уг = m + 1, ..., s.
Покажем, что д{(х^)) < 0 Vt, 0 < t < *,, и Уг = 1,..., т. Если г е It, то
^(^) = 0, и с учетом (12) имеем
9ЛФ)) = 9<(Ъ) + (ft'(^). *(^~ О + r(t)) + o(t) =
= t[(g/(xt), x~xt) + (9i'(xt), r(t)/t) + o(t)/t] < 0
§ 8. ОБОСНОВАНИЕ ПРАВИЛА МНОЖИТЕЛЕЙ ЛАГРАНЖА 215
при всех малых t > 0. Если г $ /„, 1 < г < т, то ^(¾) < 0 и в силу
непрерывности &(а;) неравенство д{(х^)) = g{(xt + t(x — xt) + r(t)) < 0 также
сохранится при всех малых t > 0. Таким образом, существует достаточно
малое число ti > 0, такое, что x(t) 6 X при всех i, 0^.t^.tl. Беря при
необходимости tl еще меньшим, с учетом (12) имеем
f{x(t))-f{x.)=t [(//(¾). ¢-^)+(//(¾). r(t)/t)+^] <0 Vt, 0< t < *,.
Однако 3:(4)-^¾ при t —уОи x(t)eX,0<t <tu и последнее неравенство
противоречит тому, что ж, — точка локального минимума в задаче (1), (2).
Полученное противоречие доказывает, что А Г)В = 0.
Итак, А и В — выпуклые множества, А Л В = 0. По теореме 5.2 тогда
существует гиперплоскость (с, а) = 7 с нормальным вектором с = (А0; \i} i е
€/„; Am + 1,..., As) е i?s~m+,J*1 + 1, с ф0, отделяющая множества А и В, а
также Л Hl={fe = (60;feilie7(;bm+1)...1 bj: Ь0 < 0; Ь{ < 0, i е /,,.Ьт+1 =
= 0,..., bs = 0}. Это значит, что
(с,Ь)=АЛ+£АЛ+ ± Aib^7<(c,a)=A0a0+EAta£+ £ А,а, (16)
i е I i = m + 1 * G Л i = m + 1
при всех аеА, ЬеВ~. Разделив (16) почленно на Ь. <0, где j — 0 или j е I*,
и устремляя затем Ъ.—» — оо при фиксированных остальных Ь,., а, получим
Ау ^ 0 при j = 0 или Vj е I*. Далее полагая в (16) % = {/'(х^^х — ж,),
a. = (g'(z,), х - ¢,), г € I* и г = m + 1,..., а, где ж € ri X, Ь = 0 € В, будем
иметь
X0(f'(xt),x-xt)f£Xi(g'(xt),x-xt) + £ А£ (^(¾). 1-¾) > 0 Wx е ri Х0.
iG/( г = m + 1
Отсюда, доопределив А£ =0 при г ¢/,,, 1 < г < т, получим
<А0/'(^) + £ Л,&'К), я: - ^ > 0 Уж € ri Х0.
Совершая в этом неравенстве предельные переходы с учетом того, что
Х0 С Х0 = ri X, (теорема 1.13), придем к неравенству (5). Справедливость
условий (4), (6) вытекает из определения множества J, и построения
А = (А0,..., As). Теорема 1 доказана. □
Другое доказательство теоремы 1, а также теорем 2.3.1, 2.3.2, не
использующее теоремы отделимости и теорию неявных функций, будет
приведено ниже в § 5.16 с помощью штрафных функций при несколько более
жестких требованиях на дифференциальные свойства функций f(x), д{(х),
% = 1,..., т. Различные доказательства, обобщения и модификации
правила множителей Лагранжа см., например, в [5-7; 14; 15; 24; 34; 44; 106; 209;
225; 233; 234; 278; 279; 286; 297; 314; 347; 358; 366; 386; 434; 465; 502;
587; 602; 604; 605; 613; 617; 660; 670; 673; 683; 724; 759; 816].
Замечание 2. Если в конусе Лагранжа A(v) точки v е X
существуют наборы А =(А0,..., As) с А0 = 0, то в условиях (7)-(9) целевая функция
«исчезает» и эти условия превращаются в некоторую специфическую
характеристику множества (2) в точке v. Как и в главе 2, выделим класс задач
на экстремум функции f(x) на множестве (2), у которых любой элемент А
конуса A(v) имеет координату А0^0.
216
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Определение 1. Точку v множества (2) назовем нормальной
точкой этого множества, если система
S
(T,xi9i'(v),x-v)^0 УхеХ0, A.ft(v) = 0, i = l,...,m, „-
A=(A1,..,Am)^0, A1>,..,Am^0,
относительно переменных А не имеет решения.
Система (17) получена из систем (7)-(9) и (7), (8), (10) при А0 = 0.
Поэтому рассуждениями от противного нетрудно доказать, что в нормальной
точке v множества X все точки А из конуса Лагранжа A(v) имеют
координату А0^0. -_-
По аналогии с § 2.4 можно сформулировать условие Мангасариана —
Фрамовица, гарантирующее нормальность точки v из множества (2). А
именно, пусть в (2) множество Х0 имеет непустую внутренность и v €
€ int Х0, векторы gm+i'(v),..., gs'(v) линейно независимы, и существует
вектор d е Еп, для которого (g/(v), d) = 0, i = т + 1,..., a, {д{ (v), d) <0
Vi 6 I(v), где I(v) множество номеров активных ограничений точки v. При
v € int .^неравенство (Cx(v, А), х — v) ^ 0 Ух е Х0 эквивалентно
равенству Cx(v,X)=0, и доказательство нормальности точки v при выполнении
перечисленных условий проводится также, как в § 2.4.
Если в (2) ограничения типа равенств отсутствуют (m = s), то условие
Мангасариана — Фрамовица можно модифицировать следующим образом:
существует вектор d 6 Еп такой, что
Э*0 >0, что v + t0deX0, (g/(v),d)<0, V« €/(«). (18)
Покажем, что при выполнении условия (18) точка v нормальна.
Допустим противное: пусть условие (18) выполнено, но система (17) при m = s
т
имеет хотя бы одно решение А. В неравенстве (J2 Х{д/(у), х — v) ^ О
т
УхеХ0 положим x = v + t0d. С учетом (18) получим: 0< (J2 А{g{'(v), t0d) =
= to Y^, \-(9i'(v)> d) ^0> что возможно только при А =0. Однако А =0 не
i € I(v)
может быть решением системы (17) при m = s. Полученное противоречие
доказывает, что v — нормальная точка множества (2).
Приведем еще одно достаточное условие нормальности точки v из
множества (2) при т = з. Пусть существует точка хеХ0, для которой д{(х)<0,
г = 1,..., т. Это условие в литературе принято называть условием Слейте-
ра. Если выполнено условие Слейтера и, кроме того Х0 — выпуклое
множество и функции д{(х), г — I, .. .,т, выпуклы на Х0, то, оказывается,
выполняется условие (18). В самом деле, положим d = х — v. Тогда точка
x = v+td еХ0 при t = i0 = l. Кроме того, из выпуклости функций дг(х) на X,
и теоремы 2.2 следует, что 0>gAx) = gi(x)-gi(v)^{g.'{v), x-v) = {gi'(v), d)
Vi 61(v). Как видим, условие (18) выполнено. Следовательно, v —
нормальная точка множества (2) при т = s.
Кратко скажем, что понятие анормальной точки для множеств (2) можно
ввести точно также, как в § 2.4_ (определение 2.4.5); тогда в конусе
Лагранжа A(v) существует точка А с координатой А0 = 0, конус A(v) U {0}
неострый.
§ 8. ОБОСНОВАНИЕ ПРАВИЛА МНОЖИТЕЛЕЙ ЛАГРАНЖА 217
_ Нетрудно привести примеры задач, когда в конусе Лагранжа все наборы
Л имеют координату Л0 = 0.
Пример 1. Задача: f(x) = -x—»inf, ж€ X = {х еХ0: д(х) = х2 < 0},
где Х0 = {хеЕ1: 0^.х^а}, а>0 (возможно, а = +оо). Тогда X ={0} = ^,
/„ = 0, функция Лагранжа С{х, Л) = —Л0я; + Ла;2, хеХ0, А ^0. Система (7)-
(9) имеет вид:
(-X0 + 2\v)(x-v)^0 VxeX0, \v2 = 0, v2^0,
А=(А0,А)^0, Л0^0, A ^0.
Отсюда видно, что v = 0. Тогда первое неравенство этой системы дает:
—Л0я; >0 Уже [0, а], что возможно только при —Л0 ^ 0. С другой
стороны Л0 ^ 0. Следовательно, Л0 = 0, и конус Л(0) = {Л = (0, Л): Л > 0}.
Упражнения
1. С помощью правила множителей Лагранжа исследовать задачи на экстремум, если:
a)f(u) = x2 + y2+z2,X = {u = (x,y,z)eX0, x + y + z=l[^U> I]}, XQ = {u = (x,y, z)eE3:
x^0},vmviX0 = {u = (x,y,z)eE3: х^0,у^ 0}, или X0 = JSj;
6) /(u) = sin(x + j/)-slnx-sinj/, X-{u = (x, y)eX0: х + у^2к}, X0 = {u = (x, у) e E2:
x^O} или X0 = £2.
2. Найти решения задач:
а) f(u) = 2x~2 + 4x5y~2 inf, ue X ={u = (x,y)e E2: х>0,у >0,хАу2 ^ I};
б) /(u) = x + y~lz~i/2->inf, ueX = {u = (x,y,z)eE3: x>0,y>0,z>0,x~ly + x~lz^l}.
3. Найти точки экстремума функции /(и) = |u-а\2, где а=(а1,а2)еЕ2 — заданная точка,
на множествах Х1={ u е.Е|: х2+у2^ 1}, Х;={ие.Е2: 12+{/2^1}Д3={иеВ+: ж2+2/2 = 1}.
Указание: изобразить на плоскости Е2 множества X и линии уровня функции /(и).
§ 9. Теорема Куна — Таккера. Двойственная задача
1. Перейдем к рассмотрению условий оптимальности для задач
выпуклого программирования. Под выпуклым программированием понимается
раздел теории экстремальных задач, в котором изучаются задачи
минимизации [или максимизации] выпуклых [вогнутых] функций на выпуклых
множествах. В частности, задача
f(x)->M, хеХ (1)
X ={хеХ0: д{(х)^0, г = 1,..., т; д{(х) = 0, г =т + 1,..., а}, (2)
исследованная в § 8, превращается в задачу выпуклого программирования,
если Х0 — выпуклое множество, функции f(x), д{(х),..., дт(х) выпуклы на
Х0, а gi(x) = (ai, х)- bit i =m + l,..., s — линейные функции с известными
а{ е Еп, bt. е К (теорема 2.11). Такую задачу кратко принято называть
выпуклой задачей. Ряд характерных свойств выпуклых задач были отмечены
выше (см., например, теоремы 2.1, 2.3, 2.12, 6.4).
Важное место в теории выпуклого программирования занимает теорема
о седловой точке функции Лагранжа, известная в литературе под
названием теоремы Куна — Таккера. Эта теорема дает необходимое и достаточное
условие оптимальности в задаче (1), (2), т. е. условие принадлежности той
218
Гл. 4. ЭЛЕМЕНТЫ; ВЫПУКЛОГО АНАЛИЗА
или иной точки множеству Х„ = {хе X: f(x)i— Ы /(«).= /„}.. Для форму-
лировки теоремы Куна — Таккера введем функцию
L(x,X)^f(x)+tK9iM, №
i = \
называемую в отличие от (8.3) нормальной функцией Лагранжа
задачи (1), (2), где х е Х0, а переменные Х = (А,, , A.s) принадлежат
множеству
Л0 = {А =(1,,.. .,Av)e£': A, ^0,,..., Am ^0}. (4)
Определение 1. Точку (¾ А*)€ Х0,хЛ0 называет седловой точкой
функции Лагранжа (3), если
L,(xt,X)XL(xt,X*)^L(x,X*) VxeX0, А е Л0.. (5)
Прежде чем переходить к выяснению связи между седловой точкой
функции Лагранжа и решением задачи (1), (2)„ дадим другую равносильную! (5);
формулировку определения, седловой точки.
Лемма 1. Для того чтобы точка (xt, А*) е Х0 х Л0, была, седловой
точкой функции Лагранжа, необходимо и достаточно*, чтобы,
выполнялись следующие' условия::
L(л, А*) < L(х, A*), Vic-e Х0,. (6)
^ft(^) = 0, i = l....,m, ъеХ. (7)
Подчеркнем, что в лемме 1 от множеств Х0, и; функций fi^x), д{(&), i =
= 1, ... .,з, не требуется ни< выпуклость, ни какая-либо гладкость—• здесь
важно то, что Х0 ф 0 и функции f(x), gi(x)\ i= 1, ..., s, определены! и
конечны на Х0.
Доказательство. Необходимость.. ИустлЦа^, А*);€^0хА0 —
седловая точка. Тогда условие (6) представляет собой правое-
неравенство (5). Остается получить, условия (7). Дла этого перепишем левое
неравенство (5) с учетом; конкретного вида: (3), функции Лагранжа:
!(<)■+ t A.ft(^) < /(^),+ £, КяЛК) va е А0. (8)
t = 1 »= i
Отсюда имеем
t(K-hMx.).>0 VAeA0. (9),
Покажем, что аз; € X. Возьмем точку А = (A.,.,....., A\s), где А^. = А* + 1 при
некотором j,, I1 ^ j< т, и А,. = А* при всех остальных i = 1, ..., s (i Ф j). Из
определения (4) множества Л0 и из того, что А* € А0, следует,,что выбранная
точка А еЛ0. Из (9) при таком А получим. (-11)^(¾))^0; т. е. ^,(,¾) ^0 при
всех j = 1,..., т.
Далее; пусть А = (А,,—,,AS) — точка' с координатами А^. = A* + gAxt)
при некотором у„ т + 1 < j < s, и Х{ = X* при всех г = 1, ..., s, г ф]. Ясно,
что' А € Л0, Поэтому из (9) имеем —|эд(.аО;'|2:> 0, т. е. g.(xt) = 0 при-всех
ji= т+ 1,..., s. Таким образом, доказано, что xt е X'...
Возьмем точку A = (А,, ..., As) с координатами А^. =0, при некотором; j'<,
l<j^m, и А£ = А* при всех остальных: г ' = 1, , s, ьф j. Такая точка
принадлежит Л0, поатом.у из; (9)' получим 0'< A]gfaj. Но А* > 0, ^-(¾) ^
< 0 при j, = 1, , т, поэтому последнее неравенство возможно лишь при
^*j9j(x*y = ®\ j = 1, • • •, т. Все соотношения (6), (7) получены.
§ 9. ТЕОРЕМА КУНА — ТАКЖЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 219
Достаточность. Пусть для некоторой точки (xt, А*) еХ0х\
выполнены соотношения (6), (7). Покажем, что тогда t(a;+, Л*) — седловая точка.
Из (6) следует правое неравенство (5). Остается доказать левое
неравенство (5). По условию (7) i»el, т. е. &«)< 0, г = 1,..., т, g^xj = О,
г = т + 1,..., s.. Тогда
<А*-А,)^)=0 (10)
при всех г — т + 1,..., s и всех тех г, 1 ^ г ^ т, для которых д{(х^) = 0.
Если g{(xt) <0 при некотором г, 1 < г < т, то из равенства (7) следует,, что
А*=0. Поэтому (A*-Ai)fi(i(^) = -Ai%(ic)>0 для всех А,>0„ l<i<m, для
которых .^(¾) < 0. Складывая иолученные неравенства <с (ГО), будем иметь
S 3 3
£{AJ - Vk(<) ^Оддя всех А еЛ0. Отсюда £ Aift(a:,) < £ A,*ft(a;*) при
i=l i=l i=1
всех А е Л0. Добавляя ,к обеим частям этого неравенства ,f(x), придем к
неравенству (8), представляющему собой левое неравенство (5). П
Если сделать дополнительные предположения о выпуклости и гладкости
задачи (1), (2), то лемму 1 можно переформулировать в следующей так
называемой дифференциальной форме.
Лемма 2. Пусть (1),.(2) представляет собой задачу выпуклого
программирования и -функции ^(х),д{(х),..., дт(х) дифференцируемы, в
точке xtE Х0. Тогда для того чтобы, точка '(ж,, А*) е Х0 х Л0 была сед-
ловой точкой функции .Лагранжа, необходимо и достаточно, чтобы
(£.(¾.У),х-<) = (f,(.xj + ±л;9/(0,х-х.)>о Ухех0, (И)
AI'ftK) = 0, г=1, ,т, xteX. (12)
Дож а з а т ел ь,с*т:в о. При сделанных предположениях функция
Лагранжа (3) выпукла и дифференцируема в точке ,¾ € Х0 при каждом А е А0.
Поэтому условие (6) согласно теореме 2.3 .равносильно условию (11).
Условия (7) и (12) совпадают. □
Теперь выясним, как связаны между собой седловая точка функции
Лагранжа и'решение задачи (1), ,(.2).
Теорема 1. Пусть^х^., А*)<Е X0xAq — седловая точка функции
Лагранжа. Тогда xteXt:, fJt = L(xJt, А*) = f\xt), т. е. xt является решением
задачи (1), (2).
Д о к,а,згая\е лж-с т в о. Из условия (7) имеем ж,е! и L(xt, A*) = /(¾).
Тогда неравенство (6) перепишется в виде
/К) < L(x, A*) = f(x) + ± ^Ых), X е Х0. (13)
г = \
8
В частности, (13) верно и для всех хеХ. Но ]Г) \*д{(х)^0 при же X, так
как тогда д^хр^О и А*>0 при :г=1,..., т и д{(х)~0 при г=т+1, ..., s.
Поэтому из (13) следует, что f{xt)K,L'(,x,,\*)-^.f(x) при всех хеХ, т. ё.
х,-е Х,.П
Заметим, что теорема 1, как и лемма 1, доказаны без какихтлибо
ограничений на функции }(х),;д{(х), г = 1, , s, и на множество Х0; в частности,
никакие предположения -о выпуклости, сделанные выше при формулировке
задачи (1), (2), мы пока не использовали.
2. Возникает воцрос: во всякой ли задаче щида!(Г), (2) функция Лагранжа
имеет седловую точку? Ответ здесь, конечно, отрицательный: если в зада-
220
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
че (1), (2) Xt = 0, то, как следует из теоремы 1, функция Лагранжа такой
задачи не может иметь седловую точку. Более того, даже в выпуклых
задачах с!,^0в общем случае нельзя ожидать, что функция Лагранжа будет
иметь седловую точку.
Пример 1. Рассмотрим задачу из примера 8.1: f(x) = — х —»inf, х е
еХ = {хеХ0: д(х) = х2^0}, где Х0 = {хеЕ1: О^х^а}, 0<а^оо. Здесь
множество Х0 выпукло, функции f(x), д(х) выпуклы на Х0. Множество X
состоит из одной точки х = 0, так что Л = /(0) = 0, ^ = {0}. Функция
Лагранжа
L(x, А) = — х + Хх2, 0^.х^а, X ^ О,
рассматриваемой задачи не имеет седловой точки.
Таким образом, для существования седловой точки на задачу (1), (2),
кроме условий выпуклости, должны быть наложены какие-то дополнительные
ограничения. Начнем с рассмотрения случая, когда в (2) ограничения типа
равенств отсутствуют (т = s), т. е. множество X имеет вид
Х={хеХ0:д{(х)^0, г = 1,...,т}. (14)
Предположим, что выполнено условие Слейтера, т. е. существует точка
хеХ такая, что
9l(x)<0, ...,дт(х)<0. (15)
Напомним, что условием (15) мы уже пользовались в § 8.
Если Х0 — выпуклое множество, функции д{(х) выпуклы на Х0, то
вместо (15) достаточно потребовать для каждого г существования точки х{ 6 X
такой, что <7г(£г) < 0, г = 1,..., т. Тогда в качестве ж из (15) можно взять
т
х = J2 ai^i> о;; > 0, а, + а2 + ... + ат — 1, поскольку же10ив силу нера-
венства (2.2) д3(х) < £ сх^^х^ < а{д^Х].) < 0, j = 1,.. ., т.
i = 1
Не следует думать, что если множество (14) выпукло и имеет внутренние
точки, то условие Слейтера непременно выполняется.
Пример 2. Задача: f(x) = x—»inf, х е X ={х е Е1: д{х) <0}, где
а(х\-( х* ПРИ х<0>
9(х)-\ 0 при х ^0.
Очевидно, функции f(x), д(х) выпуклы (и даже дифференцируемы) на Х0 =
= Е1, так что задача выпукла. Здесь X =£?+, Xt = {0}, ft =0. Как видим, все
точки х > 0 являются внутренними для множества X, но д(х) =0 Va; > О,
и условие (15) заведомо не может выполняться. Убедимся, что функция
Лагранжа L(x, X) = х + Хд(х), х е Х0 = Е\ X е Л0 = Е^ этой задачи не
имеет седловой точки. Согласно теореме 1 седловыми могут быть лишь
точки вида (xt = О, Л > 0). Однако неравенство L(О, Л) = 0 = ft ^ L(х, А)
не может выполняться при всех х 6 £? ни при каком Л > 0. В самом деле,
если Л = 0, то L (х, X) = х < 0 Va; < 0; если Л > 0, то L (х, X) = х + X х2 < О
при всех х, —X < х < 0.
Теорема 2 (Кун — Таккер). Пусть множество Х0 выпукло, функции
f(x), gt(x), г = 1, т, выпуклы, на Х0 и выполнено условие (15). Пусть
множество Xt точек минимума функции f(x) на множестве (14) непусто.
Тогда для каждой точки xt е Xt необходимо существуют множители
Лагранжа А* = (А*,..., А^)еЛ0 = {Л еЕт: A, ^0,..., Am ^0} такие, что
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 221
пара (xt, А*) образует седловую точку функции Лагранжа на
множестве Х0 х Л0.
Доказательство. В пространстве Ет+Х переменных a = (oQ, a,, ...
.. ., ат) введем множества
А={а=(оо, а,,..., ат) е Em+l: a0^f(x),al > gx{x), ..., ат ^ gm(x), хеХ0},
B={b=(b0,bi,...,bm)eEm+i: b0<ft,bl<0,...,bm<0}.
Покажем, что А и В не имеют общих точек. В самом деле, пусть а 6 А.
Тогда найдется точка х е Х0 такая, что % ^ f(x), а{ ^ д{(х), ..., ат ^ дт(х).
Возможно, что х е X. Тогда <% ^ f(x) ^ /„ и заведомо афв. Если же же
е!0\1, то найдется номер г, 1 < г < т, такой, что д{(х) > 0. Тогда а{ >
> дАх) > 0 и снова афВ. Итак, АГ\В =0.
Далее, нетрудно видеть, что А и J3 — выпуклые множества. Покажем,
например, что А выпукло. Пусть а, с —две произвольные точки из А, Тогда
существуют точки и, v е Х0 такие, что % ^ /(u), с0 ^ f(v), а{ ^ д((и), с{ >
^ g(v), г — 1, ..., т. Возьмем произвольное a б [0, 1] и положим aa = сга +
+ (1 — а)с, иа = а« + (1 — «)■(;. Из выпуклости Х0 следует ua е Х0. Далее,
из выпуклости функции f(u), gt(u) имеем
f(ua)^ af(u) + (l - a)/(v)^aa0 + (l-Q!)ci„
д{(иа)^ ag{(u) + (1 - a)g{(v) ¢. aat + (1 -a)c;, г = 1,..., m.
Это означает, что аоеА. Выпуклость А доказана. Аналогично доказывается
выпуклость В.
В силу теоремы 5.2 тогда существует гиперплоскость (с, a)=j с
нормальным вектором c=(Aq, А*,..., Ут)фО, отделяющая А и В, а также А и
В={Ъ=(Ъ0, Ь„ ..., 6J е Sm+1: Ь0 < Л. Ь, ^ 0,..., Ьт < 0}. Это значит, что
171 _HL ——
(с,Ь) = Еа;^7^(с,1) = Е^ VaeA, beJ3. (16)
Заметим, что 2/ = (/,,,0, ..., 0)е А Г\В. В самом деле, возьмем какую-либо
точку xt е Xt. Тогда /(¾) = /*> ^(¾) =% 0, г = 1,..., т, что означает у е А.
Включение у е В очевидно. Тогда по теореме 5.2 величина j из (16) равна
7 = (с, у) — Ад/,,, и (16) можно переписать в виде
т та
A^o+£Atb.^A*/^Aoao+£Ata. УаеА, be В. (17)
i=l i=l
Возьмем точку Ь = (/„ — 1, 0,..., 0)6 J3. Из левого неравенства (17) получим
Ао(Л- 1) < А*/„ откуда А* >0. Далее, беря Ь =(/„ 0,..., О, -1, 0,..., 0), из
левого неравенства (17) имеем Ад/* — А* < Ад/,, т. е. А*^0, г' = 1,...,т.
Таким образом, показано, что А* = (А*,..., А^) > 0, Ад ^ 0.
Далее, возьмем произвольную точку :¾ 6 Л«. Тогда а~ (f(xt) = /,, 0,...
..., О, gi(xt), 0,.. .,0) е А П В. Подставляя эту точку в левое и правое
неравенства (17), получаем Ag/, + У>9ЛХ*) < Ад/, < A*/, + A?0.(a:J, откуда
А*5г(я;*)<0<А*5;(^) или А^»(я;,) = 0, г = 1,..., т. Равенства (7) доказаны.
Покажем, что Ад >0. В самом деле, в (17) подставим а = (/(ж), д{(х),...
m
..., gm(x)eA, где х взято из (15). Получим \*Jt < Ад7(ж) + £) А*&(ж). До-
i=0
пустим, что Ад =0. Тогда А* фО и из предыдущего неравенства при Ад =0 с
222
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
учетом условия (15) имеем 0< ^Л*^(я;)<0. Полученное противоречие по-
казывает, что AjJ >0. Неравенства (17) сохраняют силу, если (17) разделить
на Aq > 0. Поэтому в (17) можем считать Aq = 1.
Наконец, возьмем произвольную точку х 6 Х0. Тогда а = (f(x), д^х), ...
..., дт(х))е А. Подставим эту точку в правое неравенство (17). С учетом
т
того, что Aq = 1, получим /„ < f(x)+ J] K9i{x) = L(x, А*), х е Х0. Но в
силу (7) /t = L(a;t, А*) при любом выборе ж, е I,. Отсюда и из
предыдущего неравенства следует условие (6). Согласно лемме 1 тогда (xt, У) —
седловая точка. Теорема 2 доказана. □
Другую форму теоремы 2 читатель найдет в § 5.5.
3. Приведенные выше примеры 1, 2 показывают, что без дополнительных
условий вида (15) теорема 2, вообще говоря, неверна. Однако, если (2) —
многогранное множество (пример 1.6), то, оказывается, существование сед-
ловой точки функции Лагранжа выпуклой задачи (1), (2) можно доказать
без каких-либо дополнительных условий. Это мы уже показали для общей
задачи линейного программирования — см. теорему 3.5.5. Теперь
рассмотрим более общий случай, не предполагая линейности целевой функции.
Будем пользоваться следующим представлением многогранного множества
X ={хеЕп: хеХ0, д.(х) = (а{,х)- Ъ{ < О, г' = 1,...,т;
9г(х) = (а{,х)-Ъ{=0, i=m+l,...,s}, (18)
где Х0, в свою очередь, является многогранным множеством и задается в
виде:
Х0 = {хеЕп: (й.,а;)^г4, г = 1,...,р; (й.,а;) = г0 i=p + 1,..., q},
а{, d{ е Еп —заданные векторы, Ъ{, г{ —заданные числа. В частности, здесь
возможно Х0 = Еп, Х0 = Е", X0 = {x = (xl,..., хп): xi >0, г е/}, 7—
некоторое подмножество номеров {1,..., п}; Х0 = {х = (х1,.. .,хп): а. < х1 <
< Д, г = 1,..., п), av Д —заданные величины, а; < Д, причем некоторые
a.i = —оо, или Д. = +оо.
Для многогранного множества несложно дать полное описание всех
возможных направлений в любой его точке (определение 2.3).
Лемма 3. Множество возможных направлений множества (18) в
любой его точке xt совпадает с конусом:
K=K(xt)={e е Еп: ефО, (а{, е) ^ 0, г е Ц, (а,, е)=0, г=ш + 1,..., s,
(d{,e)^0, г<=Ц, (d{,e)=0, i =р + 1,. .., а}, (19)
где I* = {г: 1 < г < m, (a{, xt) = bj, Ц = {г: К^й (dt, х.) = г,}. .
Доказательство. Пусть е = (е1,..., е") ф 0 — произвольное
возможное направление множества (18) в точке х%. Согласно определению 2.3
тогда существует такое число t0 > О, что x = xt + tee X или
(а{, xt + te) < Ъ., г = 1,..., т; (а{, xt+te)=b{, г'=т+1,..., а;
(di,xt+te)^ri, i = l,...,p; (d.,xt+te) = ri, i=p+l,...,q; ( '
при всех t, 0 < t < i0. С учетом того, что ж,еХи определения множеств
Ц, Ц активных индексов точки ж, из (20), сразу получаем ее К. Верно и
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 223
обратное: если е б К, то е — возможное направление в точке xt. В самом
деле, пусть ее К. Тогда для г е I* имеем (at, xt + te) = bt + t(at, e)^.bi при
всех t ^ 0, а если г ¢. 7,*, 1 < i < m, то (a;, xt) < Ьг- и найдется такое t0 > 0, что
(а;, ж^+ te) < Ь, при 0:¾ t ^. t0. Если m + 1 <г < s, то (аг., a;t+te) = 6^ при всех
*. Аналогично, взяв при необходимости *0 > 0 еще меньшим, убедимся, что
выполняются и остальные соотношения (18), так что x.t + te е X, 0< t ^ t0.
Лемма 3 доказана. □
Теорема 3. Пусть множество решений Xt задачи (1), (18)
непусто. Пусть f(x) выпукла на Х0 и дифференцируема в точке xt е Xt.
Тогда существуют множители Лагранжа A* = (A*,..., А*) е Aq = {А =
= (А,,..., \s)eE": A, ^0,..., Ат>0}, такие, что пара(х*, А*) образует
седловую точку функции Лагранжа задачи (1), (18).
Доказательство. Согласно теореме 2.3 для того, чтобы i, е 1(,
необходимо и достаточно выполнения неравенства
(f'(xt),x-xt)>0 УхеХ. (21)
Возьмем любое е е К. Тогда по лемме 3 х = xt + te е X, 0 < t ^ t0, t0>0.
Подставим такую точку х в (21). Получим: (f'(xt), e)t >0 или (f'(xj, е) ,^0
при всех е е К. По теореме Фаркаша 3.5.8 тогда найдутся числа \\ > О,
i е I*, K+i>- ■ •. А»> Мг* > 0. * е 4*, /х;+п • • -, К такие, что
/'0О = -£А<Ч- £ а,ч-е^Ч- £ /*<Ч (22)
Если доопределим А! = 0 при г е {1,..., ш} \ Ц, то получим точку А* =
= (А*,.. ., А*)бЛ0. Отсюда, учитывая определение множества 7,* и условие
х,еХ,СХ, имеем
\:((ъ,х.)-Ъ{) = \Шх.) = 0, i = 1,...,з, (23)
а равенство (22) можем переписать в виде
/'(=>) + £ AJa, = - Е ЛЧ ~ £ ЛЧ- (24)
г = 1 г € /2" « = J) + 1
Функция Лагранжа в рассматриваемой задаче (1), (18) такая:
L{x,\) = f{x)+rt\i{{ai,x)-bi), хеХ0, АеЛ0,
г = 1
Тогда, используя неравенство f(x) — f(xt) ^ (f'(xj, х — xt), х е X
(теорема 2.2), определение множества Ц, условие /z* ^0, г е Ц, и равенство (24),
для каждого х е Х0 получаем
L(x,\*)-L(xt,y) = f(x)-f(xt)+±\*(ai,x-xi)>
Z (/4¾) + £ AJa,, я: - ^) = - £/*М, я: - ^> -
- £ мЖ, г - =0 = - Е мЖ, »> - п) > о,
г = р + 1 г € Ц
или
L(a;t,A*)<L(a;,A*) Vz € XQ.
224
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Отсюда и из (23) с помощью леммы 1 заключаем, что (xt, А*)— седловая
точка функции Лагранжа. Теорема 3 доказана. □
Замечание 1. Если f(x) = (с, х), то из теоремы 3 вытекает
теорема 3.5.5 для задач линейного программирования. Однако принятая здесь
схема изложения не позволяет считать теорему 3.5.5 следствием теоремы
3, так как при доказательстве теоремы 3 была существенно
использована теорема Фаркаша 3.5.8, которая в свою очередь (как, впрочем, и сама
теорема 3.5.5) получена как следствие доказанных в § 3.5 утверждений.
Замечание 2. Условие дифференцируемости функции f(x) в точке
i,eItB теореме 3 можно заменить условием непустоты субдифференциала
df(xt), считая, например, функцию f(x) выпуклой на открытом выпуклом
множестве W, X0cW (теорема 6.1). Доказательство теоремы 3 в этом
случае полностью сохраняет силу, если в нем вектор f'(xt) заменить на
субградиент ct е df(xt), взятый из условия (6.8), а ссылки на теоремы 2.3,
2.2 заменить соответственно ссылками на теорему 6.4 и определение 6.1
субградиента.
Для иллюстрации теоремы 3 рассмотрим задачу определения проекции
точки на множество (18) при Х0 = Еп, т = 0.
Пример 3. Задача: f(x) = ^\x-z\2—»inf, хе X = {х е Еп: Ах = Ь},
где А — матрица размера т х п, be Ет, z — произвольная точка из Еп.
Согласно теореме 4.1 эта задача имеет и притом единственное решение
xt =Vx(z) Vz е Еп. Функция Лагранжа этой задачи L(x, А) — -Лх — z\2 +
+ (А, Ах — b) = ^\x — z\2 + (х, АТ\) — (Ь, А). По теореме 3 функция L(x, А)
имеет седловую точку (xt,\*)eEn х Em и условия (6), (7) приводят к
системе
Lx(xt,\) = (xt-z) + AT\=0, Ах. = Ъ.
Отсюда для проекции xt =Vx{z) точки z на множество X получаем
представление xt — z — АТХ, где Л —произвольное решение системы линейных
алгебраических уравнений ААТ\ =Az — Ъ. Если квадратная матрица ААТ
невырожденная, то получаем уже известную нам формулу для проекции из
примера 4.3.
4. Наконец, приведем еще один вариант теоремы Куна — Таккера.
Теорема 4. Пусть в задаче (1), (2) Х0—многогранное множество
из Еп, функции f(x), g{(x), i = 1,..., т, выпуклы на открытом
выпуклом множестве W, содержащем Х0, gt(x) = (а{, х) — Ъ1, i = т + 1,..., s;
существует точка х е X такая, что д{(х) < 0, i = 1,..., т;
множество Xt решений задачи (1),(2) непусто. Тогда для каждой точки xte
€ Xt существуют множители Лагранжа А*=(А*,...,А^)еЛ0 = {Ле#а:
А, ^ 0,..., Ат > 0} такие, что пара (xt, А*) образует седловую точку
функции Лагранжа (3).
Доказательство проведем, пользуясь приемом, изложенным
в [239]. Заметим, что каждая точка xt е Xt является решением задачи
f(x) -► inf, х е X = {х е Г0: gi(x) < 0, г = 1,..., т},
где Т0 = {хеХ0: д{(х)=0, г = т+1,..., s}. Согласно теореме 2 в этой задаче
функция Лагранжа Lx{x, u) = f(x)+ ^«fft(4 х еТ0, и = (u',..., um) ^0
имеет седловую точку (xt, и*), т. е. » = '
Ь 1(¾. «*)< £-,(!,«*) Уя;еГ0; u*g{(xt) = 0, г = 1,..., т; и* ^ 0.
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 225
Отсюда следует, что xt является решением задачи
Lx{x, и*)—»inf, х е Г0.
5
Функция Лагранжа L2(x, v) = Lx{x, и*)+ Е vi9i(x), х е Х0, v е Es~m,
г = т+ 1
последней задачи в силу теоремы 3 и замечания 2 к ней имеет седловую
точку (xt, v*), что, согласно лемме 1, означает:
L2(xt,v*)^L2(x,v*) Vx€X0; v?gi(xt)=0, i=m+l,...,s.
Положим Л = (и, v), У = (и*, v*). Функция Лагранжа задачи (1), (2) тогда
8 8
представима в виде L(x, \) = f(x)+ Е \igi{x)~Lx{x,u) + E vi9i(x)>
г = 1 г = m + 1
x E XQl А E Л0. Из предыдущих рассуждений следует, что
5
Цх.,:\*) = 1ц(х„и*)+ Е v;gifa) = L2{xt,v*)^L2{x,vt) =
г = т+ 1
= L ,(!,«*)+ Е v*gi(x) = L(x,V) УхеХ0,
г = тп+ 1
«*&Ю = 0, г = 1,...,т; ь*д^) =0, г' = т + 1,..., a; i,el
Отсюда и из леммы 1 вытекает утверждение теоремы 4. □
Пример 4. Пусть Х0 = {и = (ж, у)еЕ2: ж > 0, у ^0) = ^, /(и) =
= —^/ху, д{и) = х, X = {иеХ0: д(и)^ 0}. Здесь Xj выпукло, /(и), <7(и)
выпуклы на X, /»=0, Х„ = X = {и„ = (0, у), у ^0}. Функция Лагранжа
L(u, А) =—л/ху+\х, х^0, у^0, А >0, не имеет седловой точки. Нарушены
условия теоремы 4: f(u) выпукла лишь на Х0, требуемой точки х нет.
Теоремы 2, 3, 4 дают достаточные условия существования седловой точки
в задачах выпуклого программирования. Однако существуют и невыпуклые
задачи, в которых функция Лагранжа имеет седловую точку.
Пример 5. Пусть Х0 = {и е Ех: и < 1}, f(u) — и3, д(и) = -и3 — 1,
X ={и: иеХ0, д(и)^0}. Здесь Х0 выпукло, но функции f(u), д(и) не
являются выпуклыми на Х0. Множество X представляет собой отрезок — 1 < и <
^ 1, так что /„ = —1, «* = — 1. Функция Лагранжа L(u, \) = и3 + А(—и3 — 1)
имеет единственную седловую точку (^ = -1, А* = 1) на множестве Х0 хА^,
Л0 = {Ае£;1: А ^0}.
5. С помощью функции Лагранжа L(x, А), хе Х0, А еЛ0, задачу (1), (2)
можно переформулировать следующим образом. Введем функцию
v{x)= sup L(x, А), хеХ0. (25)
АбЛ0
Вычислим верхнюю грань в правой части этой формулы. Если хеХ, то
s
Е А; <7;(а;) < 0 VA е Лф, причем равенство здесь реализуется при А =0 е Лф.
i = l
Если же 2¾ е Х0 \ X, то найдется номер г такой, что либо 1 < г < m и
5г(ж) > 0, либо m + l^z^s и <7;(а;) 7^0, так что подходящим выбором А б
S
бЛ0 сумму Е ^i9i(x) можно сделать сколь угодно большой. Следовательно,
i = l
функция (25) равна
^\ +оо УхеХ0\Х.
226
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Отсюда ясно, что inf v(x) = inf f(x) = ft, и задачу (1), (2) можно перепи-
х е Х0 ieX
сать в равносильном виде
v(a:)-Mnf, хеХ0. (26)
Как и выше, в задаче (1), (2) будем предполагать, что /„ > —оо, Xt Ф
■ф<2). Тогда задача (26) будет иметь то же множество решений Xt с,тем же
минимальным значением ft > —оо, т. е.
ird v(x) = vt = ft>-oo, Xt = {x:xeXo,u(x) = K = ft}^0. (27)
X £ X0
Читатель, конечно, заметил, что переменные (х, А) е Х0 х Л0 в
определении 1 седловой точки входят симметрично и, надо полагать, его уже озарила
мысль о том, что переменные Л в неравенствах (5), по-видимому,
относятся к какой-то неизвестной экстремальной задаче, а точка Л* является ее
решением. Действительно, это так и есть. Более того, переход от исходной
задачи (1), (2) к задаче (26), осуществленный с помощью функции Ла-
гранжа, наводит на симметричные действия по поиску формулировки этой
таинственной задачи. А именно, по аналогии с (25) введем функцию
V>(A)= inf L(x,X), АеЛ0, (28)
хел0
и рассмотрим задачу
ф(Х) -у sup, ЛеЛ0. (29)
Задачу (29) называют двойственной задачей к задаче (26) или к исходной
основной задаче (1), (2), а переменные Л = (Л,,..., Xs) называют
двойственными переменными в отличие от исходных, основных переменных
х — (ж1,..., хп).
При формулировке задач вида (1), (2) мы обычно подразумеваем, что
функции f(x), gt{x), i = 1,..., а, принимают конечные значения во всех
точках множества Х0. Поэтому ^(Л) < +оо при любых Л е Л0. Но
формула (28) не исключает возможность появления значений ф(Х) = —оо при
некоторых Л б Л0. Имея в виду это обстоятельство, задачу (29) нетрудно
записать в привычной форме
V>(A)^sup, XeA = {XeEs: ХеА0, ф(Х)>-оо}, (30)
используя лишь конечные значения функции ф(Х). Обозначим
supV(A)=supV>(A)=V*, Я={ХеА0:ф(Х)=ф*}={ХеА:ф(Х)=ф*}. (31)
А е Л0 А е Л
Важно заметить, что двойственная задача (29) или (30) равносильна
задаче выпуклого программирования независимо от того, является ли исходная
задача (1), (2) выпуклой или нет. В самом деле, функция (—L(x, А))
линейна и, следовательно, выпукла по А на выпуклом множестве Л0, и по
теореме 2.7 функция (-ф(Х)) = sup(-L(a;, А)) выпукла на Л0. Иначе говоря,
х £ Х0
функция V>(A) вогнута на Л0, т. е. ф(аХ1+(1-а)Х2)^аф(Х1)+(1-а)ф(Х2)
Уа е [0, 1] VAj, А2 б Л0. Отсюда видно, что если А,, А, е Л0 и ^(А,) > —оо,
ф(Х2) > -оо, то и ф(аХх + (1 - а)А2) > -оо Уа е [0, 1]. Это значит, что
множество Л в (30) также выпукло. Следовательно, задачи (29), (30),
записанные в равносильном виде
-V'(A)^sup, АеЛ0 или АеЛ, (32)
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 227
представляют собой задачи выпуклого программирования. Благодаря этому
обстоятельству исследовать двойственную задачу нередко бывает проще,
чем исходную. Возникает вопрос, зачем это делать? Какую информацию мы
можем получить об исходной задаче (1), (2), изучая двойственную задачу?
Оказывается, задачи (26) и (29) и, следовательно, задачи (1), (2) и (30)
тесно связаны между собой и параллельное изучение этих задач зачастую
бывает плодотворным, позволяет полнее изучить каждую из них, наметить
новые подходы к их решению.
Прежде всего можно отметить неравенства:
ф(\)^ф*^Ъ^»(х) УхеХ0, УЛеЛо- (33)
В самом деле, из (25), (28) имеем ф(\)= inf L(x, А) < L(x, A) VA е Л0,
хеХ0
\/х е Х0, поэтому ф* = sup ф(\) < sup L(x, A) = v{x) Ух е Х0. Переходя
А е Л0 А е Л0
к нижней грани по х е Х0 в этом неравенстве, получаем ф* </„, откуда
следуют неравенства (33).
Интересно выяснить, когда ф* = /„, и обе задачи (26) и (29) имеют
решение, т. е.
Х^0, Л*^0, /, = V*- (34)
Оказывается, соотношения (34) тесно связаны с седловой точкой функции
Лагранжа.
Теорема 5. Для того чтобы, имели место соотношения (34),
необходимо и достаточно, чтобы, функция L(x, А), хеХ0, А еЛ0, имела
седловую точку на Х* хЛ0 в смысле определения 1. Множество седловых
точек функции L(x,\) на X, х Л0 совпадает с множеством Xt х Л*.
Доказательство. Не обходимость. Пусть выполнены
соотношения (34). Возьмем произвольные xt 6 X, и Л* 6 К и покажем, что
(xt, У)— седловая точка. Имеем
ф* = ф{У) = inf L(и, У) < L(¾. Л*) < sup L(xt, A) = v(x.) = /,.
ue*o АеЛ0
По условию ф* = /,. Поэтому предыдущие неравенства превращаются в
равенства:
L(xt,\*)= inf L(u, A*)=supL(a^A) = /,.
ue*o АеЛ0
Отсюда имеем неравенства (5), т. е. (xt, А*)— седловая точка. Тем самым
показано, что X х Л* принадлежит множеству седловых точек функции
L(x, А) на Х0 х Л0.
Достаточность. Пусть (ж,, У) е Х0 х \ — седловая точка функции
L(x, А) на Х0хА0. Согласно (5) это значит, что L(xt, \)^L(xt, У), А еЛо.
Отсюда имеем
sup L(xt, A) = u{xt) = L(xt, У).
АеЛ0
Кроме того, L (xt, У) < L (х, У), х е Х0, так что
£К,А> Ч Ь(и,У) = ф(У),
«",
откуда и из неравенств (33) следует
L(xt, А*) = ф(У) < ф*< /,< и(х,) = L (¾. Л*),
228
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
т. е. ф(Х*) = ф* = ft = v(xt). Это значит, что ф* = ft, А*еЛ*, ж, е 14, Тем
самым установлено, что множество седловых точек функции L(x, А) на
Х0 х Л0 принадлежит множеству Xt х А. Теорема 5 доказана. □
Следствие 1. Следующие четыре утверждения равносильны:
1) (xt, А*) € Х0 х А0 — седловая точка функции L(x,\) на Х0 х Л0;
2) выполняются соотношения (34);
3) существуют точки xt е Х0, А* е Л0 такие, что
и(х,) = ф(У);
4) справедливо равенство
max inf L(u, Л)= min sup L(u, A)
АеЛ0и<=Х0 ие*оАеЛ0
(напоминаем, что когда пишут max или min, то достижение
соответствующей верхней или нижней грани предполагается).
Следствие 2. Если (xt, А*) и (at, b*) е Х0 х А0 — седловые точки
функции L(x, А) на X, х Л0, mo (xt, b*), (at, А*) также являются седло-
выми точками этой функции на Х0 х Л0, причем
L(xt,b*) = L(at,\*) = L(xt,\*) = L(at,b*) = ft = i;\
Отсюда и из теоремы 1 вытекает, что в теоремах 2, 3, 4 можно выбрать
одни и те же множители Лагранжа Л* для всех xt е Xt сразу.
Полезно заметить, что в доказательстве теоремы 5 нигде не использовано
то, что L(x, А) является функцией Лагранжа какой-либо задачи вида (П,
(2), а множества Х0, А0 выпуклы—там были важны лишь функции (25),
(28), задачи (26), (29) и множества Xt, К из (27), (31), которые могут
быть введены для любой функции L(x,X) на любых множествах Х0, Aq.
Это значит, что теорема 5 и следствие 1, 2 к ней верны для произвольных
функций L(x, X) и множеств Х0, Л0.
В приводимых ниже примерах иллюстрируются различные свойства
двойственной задачи.
Пример 6. Задача: f(x) = — х—»inf, х е X = {х е El: х^О, д(х) =
= х2 < 0}. Здесь ft = 0, Xt = X = {0}. Задача выпуклая. В примере 1 было
замечено, что функция Лагранжа L (х, X) = — х + Xх2, х б Х0 = {х ^0}, Л б
еЛо = {Л >0} не имеет седловой точки. Функция ф(Х) = inf L(x, X) = —jr-
при Л >0 и ф(0) = —оо. Двойственная задача (30) имеет вид: ф(Х) = — 4Т"—>
—»sup, Л еЛ = {Л >0}. Множество Л — открытое, ф*—Р=0, но Л* = 0, т. е.
двойственная задача не имеет решения. Множество X не имеет внутренних
точек.
Пример 7. В задаче из примера 2 функция ф(Х)= inf L(x, А) =—jr-
при Л > 0, ф(0) = —оо. Как видим, двойственная задача здесь полностью
совпадает с такой же задачей из примера 6, хотя исходные задачи разные.
Здесь int Х^0, </>*=/* =0, Xt = {O},A*=0.
Пример 8. Рассмотрим задачу из примера 4. Здесь L (и, X) = — фсу +
+ Хх, и е Х0 = Е2, X еАо = Е* Функция V>(A) = —оо при всех Л е Л0, так
что в двойственной задаче (30) множество Л = 0.
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 229
Пример 9. Задача: f(x) = e~x—*'ml, хеХ={хеЕ1, д(х) = хе~х =0}.
Множество X состоит из единственной точки я; = 0, так что ft =/(0) = 1,
Xt = {0}. Здесь функция Лагранжа L(х, А) = е~х + Лхе~х, х е Х0 = Е', Л е
еЛ0 = £;1;'!/'(А) = -ооприЛ>0, ф(Х) = 0приХ=0, ф(Х) = Х ехр(-1 + |-)
при Л <0. Множество Л = {А ^0} замкнуто, функция ф(Х) непрерывна на
Л, ф*=0, Л* = {0}. Таким образом, здесь Xt^0, Кф<2), но ф* < ft. Согласно
теореме 5 функция L(x, А) не имеет седловой точки.
Не следует думать, что если (х , А*) 6 Х0 х Л0 — седловая точка функции
L(x, А), то и точки (а, Ь)е Х0 хА0, для которых L(a, b) = L(xt, А*), также
будут седловыми точками. В общем случае можно лишь утверждать, что
XtCX(\*) = {xeX0:L(x,\*) = L(xt,\*)},
AQA(xt) = {XeA0:L(xt,X) = L(xt,X*)} (35)
где множества Xt, А взяты из (27), (31).
Пример 10. Функция L(x, Х) = Хх, хе Х0 = Е\ X еА0 = Е1, имеет
единственную седловую точку (xt=0, А*=0), L(0, 0)=0. Здесь Х(Х*) =
= El, A(xt) = Ei, и, как видим, включения (35) являются строгими. Далее,
функции и(х), ф(Х) из (25), (28) соответственно равны i^(a;) = +oo при
х^О, ^(0) = 0, и ф(Х) = — оо при A ^0, V(0) = 0, так что оба множества
X = Xt = {0}, Л = Л* = {0} являются одноточечными.
6. Напоминаем, что в главе 3 мы уже рассматривали двойственную
задачу для задачи линейного программирования, причем двойственная задача
была введена по определению, без объяснения, откуда она появилась.
Убедимся, что введенная в § 3.5 двойственная задача является частным случаем
задачи (30).
Рассмотрим общую задачу линейного программирования:
/(1) = (0,,1,) + (¾.¾)^ хеХ, (36)
X ={х = (хи :%)€#"' хЕ^: ж, ^0,
Аихх + А12х2-Ъ1 <0, А,,ж, + А,2Ж2- Ь2=0}, (37)
где с, е #"\ (¾ е Е^, Ь, е Е™*, Ъ2 е Е™* — заданные векторы, матрицы Ац
также заданы и имеют размерность т{ х п-, г, j — 1, 2. Функция Лагранжа
этой задачи:
Ь(х,Х) = (с{, xl) + (c2, x2) + (Xl,Anxl + А12х2- Ь,) +
+ \Х2, -^21^1 + -^-22¾ ~~ "2/ = \Cl! XU + (¾) 3¾) +
+ £Af(A„a:, + 4,^- Ь,); + EAj(A21^ + А^х,- Ъ2)\
х = (хиаъ)еХ0 = Е? хЕ"*, X = (А,, А2) е А0 = Е^ хЕ™*.
Отсюда нетрудно видеть, что функция и(х) = sup L(x, А), а; б Х0, опреде-
АеЛ0
ляемая согласно (25), в случае задачи (36), (37) имеет вид:
vlx\~{ <ci'a;i > + <Сг,^> при хеХ,
У \ +оо при хеХ0\Х. { '
230
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
Для вычисления функции ф(Х), определяемой по формуле (28), удобнее
представить функцию Лагранжа L(x, А) в следующем виде
L(x,X)=(-bi,\i)+(-b2,\2)+(xi,AJi\i+A^X2+ci)+(x2,AJ2\i+A^\2+c2) =
= -(b,, X,) - (b2, Х2) + J^xUA^X^ А2Т1Х2 + с,У +
1¾ i = l
+ £ xi(AJ2X{ + AJ2X2 + cj)', x e X0, Xe A0.
J' = l
Отсюда следует, что
V>(A) = f-<b"Al>"<b2'A2> ПРИ Ле^\Л (39)
v \ -оо при Л еЛ0\Л, v
где Л = {А =(Х,,Х2)еЕ^ хЛ Л, > 0, A/, A, + AJA2 + c, > 0, А^А, +
+ AI2A2-(-Cg = 0}. Из полученных выражений (38), (39) для функций v{x),
'ф(Х) следует, что задача (26): v(x)—>mi, х е X,, равносильна исходной
задаче (36), (37), а двойственная к ней задача (29): ф(Х)—»sup, А е Л0,
или (30) равносильна задаче
^(A) = -(b1,A1)-(b2,A2)^sup (или (-V(A))->inf), А еЛ. (40)
Как видим, именно задача (40) в § 3.5 была по определению названа
двойственной к (36), (37) задачей. Сравнивая утверждения, доказанные в этом
параграфе, с теоремами из § 3.5, можем сделать вывод, что развитые здесь
элементы теории двойственности являются прямым обобщением теории,
изложенной в § 3.5, на случай нелинейных задач. Можно также заметить, что
не все утверждения, справедливые для задач линейного программирования,
допускают обобщения на нелинейные выпуклые задачи. Так, например,
нельзя утверждать, что задача, двойственная к двойственной задаче (29), в
нелинейных задачах также может быть приведена к виду, совпадающему
с исходной задачей (1), (2). Для невыпуклых задач это очевидно, так как
двойственная задача всегда равносильна задаче выпуклого
программирования (32), и потому задача двойственная к двойственной, могла бы совпасть
с исходной лишь тогда, если бы она была выпуклой. Однако требование
выпуклости задачи здесь также не спасает положение, что видно из
примеров 6, 7, в которых двойственные задачи совпадают, а двойственная к
последней не может совпасть с исходной задачей, так как исходные задачи
в этих примерах разные. Ничего не меняет здесь и требование
существования седловой точки функции Лагранжа, о чем свидетельствует следующий
пример.
Пример И. Задача: f(x) = \x\2^inf, хеХ = {хеЕп: д(х) = \х\2-
-К0}. Здесь Х0 = Еп, /.=0, xt =0, Л0 = {А е Е1: X >0}. Функция
Лагранжа L(x, А) = |ж|2 + А(|:е|2- 1) = (1 +A^|af- А, хеХ0, X еЛ0.Ясно, что
ф(Х)= inf L(x, А) = — А при всех А е Л0. Таким образом, двойственная
задача имеет вид ф(Х) = -Х —>sup, А еЛ = Л0. Эта задача линейного
программирования. Двойственная к ней задача также будет задачей линейного
программирования и не может совпасть с исходной. Остается заметить,
рассматриваемая задача выпукла, и функция Лагранжа в ней имеет седловую
точку (^=0, А*=0).
Заметим, что теорема 3.5.2 об одновременной разрешимости исходной и
двойственной задач также специфична для задач линейного
программирования и не может быть обобщена на нелинейные задачи даже при условии
их выпуклости — см. примеры 6~8.
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 231
7. Кратко остановимся еще на одном интересном классе задач,
называемых задачами геометрического программирования, в которых переход к
двойственной задаче весьма плодотворен. Речь идет о задачах минимизации
следующего вида:
9{х) = Ё сгяГ" • • • хг" -»• Inf; х е X = int El, (40)
4 = 1
где ci >0, а.. — заданные числа, int Е1 = {х = (хи .. ., хГ): хх > О,..., хг >0}.
Функция д(х) из (40) называется позиномом.
Для исследования задачи (40) удобнее перейти к новым переменным и =
= (и,, ...,иг + п) по формулам
Г
щ=\пх{, г' = 1,..., г; ч+г-^Еа^,ч ^=- In с;, г'=1,...,п,
j' = i .
(41)
и переписать ее в эквивалентном виде:
/(«)=!: е«--.Inf;
и € U = |« е Яг + ": Е <*<,•«,■ - 4 + 4 - k =0, г = 1,..., п).
Отметим, что функция /(и) выпукла на Ет + п, U — многогранное
множество, и поэтому к задаче (42) применима теорема 3. Составим функцию
Лагранжа (3) для этой задачи:
п п / г \
L(u,\)=Y, е"г+, + Е АДЕ aiiui-ur + i-bi) =
4=1 4=1 \/=1 '
= Е (еи--А;иг+,-Ал)+Ё(Ё <*<,*<)«„ « е ^-+-=¾ л е£*=Л0.
j = l\ = l
С помощью классического метода (§ 1.2) нетрудно показать, что нижняя
грань функции p(z) = ez — \iz — \ibi переменной z на числовой оси равна
<pt — Л^ — \i In Л4 — \ibl, причем при А4 > 0 она достигается в точке zt =
= — In \t; функция \t In \t при \{ =0 здесь считается доопределенной по
непрерывности нулем. Отсюда, опираясь на линейность функции Ь(и, А)
по переменным и,,..., иг, получаем
•0(A) = inf Z,(u, А) =
£(А4-А,1пА4-АД), АеЯ;, Ё%А,=0, i = l,..„ г,
4=1 4=1
—оо при других А.
Поэтому двойственная задача (30) здесь будет иметь вид
^(А)=Е(А4-А>А,-АЛ)^зир; А е Л,
Л = { А = (Л*,?!.., A J е El: Ё %А, = 0, j = 1,..., г}.
(43)
Если здесь верхняя грань достигается в точке А*^0, то задачу (43) можно
записать в более простой форме. А именно, учитывая, что любую точку А =
232
Гл. 4. ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА
= (Аи ..., \п) фО можно представить в виде А = аи, где а = J2 \t, v =
4 = 1
= (vu ..., vn), iA = XJa, ux + .. . + un = \, задачу (43) перепишем сначала в
терминах переменных (а, и):
■фх{а, и) = ф{аи)= J2'a(v{ - v{ In av{ - vibi) =
i = 1 n
= a
sup;
l-lna + E^nq-iAln^)
L 4 = 1 J
(d.vleApk^oO^eB;, X>*=1, E %^=0, j = 1,..., Л.
*■ 4 = 1 4 = 1 '
Далее, пользуясь классическим методом (§ 1.2), убеждаемся, что точ-
ка a*= 11(¾-) >0 (здесь принято 0°=1) доставляет функции гр{(а, и)
максимальное значение по a > 0 при фиксированном v 6 Д£, причем
^,(«*^)=п(Й-
Тогда двойственная задача (43) перепишется в следующем виде:
VbH= ^, ;;',cj,^sup= ^еЛ2- (44)
л2
= ^ = (^,,...,^)6^: Е ^ = 1> Е ay^ =0, j = l,...,r J. Если i/* =
>■ 4 = 1 4=1 J
= (v*, ..., и*) € int Д^ — решение задачи (44), то, полагая A* = а* и*, где
п I с. \ "''
a* = YI ( "4 ) > ur+t * = К> г = 1,..., п, из системы линейных алгебраиче-
ских уравнений (41) можно получить uu,...,urt, откуда имеем решение
xit — е *,..., а; еи") исходной задачи (40). Задача (44) часто бывает
проще задачи (40). Переход к двойственной задаче особенно эффективным
оказывается тогда, когда множество Л2 в задаче (44) состоит из
единственной точки и*, которая и будет решением этой задачи.
Аналогично может быть' исследована и более общая задача
геометрического программирования
g0(x)^ini; х е X = {х е int Ет+: gi(x) ^1,..., gm(x) ^ 1},
где д0(х),. .., дт(г) — позиномы. Подробнее о геометрическом
программировании, его приложениях см., например, в [204; 260; 541].
Читателей, желающих подробнее ознакомиться с красивой и богатой
результатами теорией двойственности, с различными ее приложениями,
отсылаем к [6; 7; 14; 40; 44; 49; 52; 83; 84; 209; 225; 233; 234; 278; 297; 314;
358; 366; 373; 434; 465; 584; 604; 605; 613; 617; 670; 683; 687].
Заметим также, что в последнее время растет интерес к задачам, в
которых нарушены соотношения двойственности (34), такие задачи
возникают при исследовании объектов, описываемых противоречивыми системами
ограничений, и имеют интересные приложения [297; 298; 644].
§ 9. ТЕОРЕМА КУНА — ТАККЕРА. ДВОЙСТВЕННАЯ ЗАДАЧА 233
Упражнения
1. Сформулировать аналоги теорем Куна —Таккера для задачи максимизации: д(х) —> sup,
igl, где множество X определено посредством (2), Указание: рассмотреть задачу:
f(x) = — д(х) —*inf, igl, и воспользоваться теоремами 2-4.
2. С помощью теорем Куна — Таккера исследовать задачу: f(x) = Yj \х% ~ ai I ~* 'п^ х€.Х,
4 = 1
где X ={х€Еп: \х\ ¢, 1} или X ={х£Еп: х1 + .. . + х" = 0}, или X = J3£; а,,..., а„ —
заданные числа.
3. Применить теорему Куна —■ Таккера к задаче квадратичного программирования: /(х) =
= (xl)2 + ... + n(xn)2^>ini, хеХ, где X = {ж е Еп: х1 + ... + х" = 1}, или X = {i6E":
ж1 + ... + хп ^ 1}, или X = {ж е В": — 1 ^ ж1 + ... + хп ^ 1}, или X является пересечением
предыдущих множеств с Е?.
4. Решить задачи геометрического программирования:
а) д(х) = С[ х"> + cgx-^ —»inf при х > О, где с4 > 0, а{ > 0 — заданные числа;
б) fl(x, 2/) = x"12/ + 2x22/ + 3x_12/_2-»inf при х > 0, j/>0;
в) й(ж, 2/, z) = 4ж 2/""' гГ' + ху + Axz + 2j/z —»inf при х > О, J/ > 0, z > 0;
г) д(я, 2/) = 1/ —> inf при х >0, j/>0, х4у~4 +x-1j/1'2 ^ 1;
д) й(х, у, z) = x + y~lz~1*2 -+inl при х >0, j/>0, z >0, x~'2/ + x~'z^ 1.
5. Найти решение задачи: f(u) = -x — у—s- inf, u = (x, t/)eJ = {n eB2: g(u) = x2+y2 — 2^0}
и двойственной к ней задачи. Убедиться, что здесь множество Л из (30) выпукло и открыто.
6. Показать, что двойственная задача к задаче из примера 5 является задачей линейного
программирования, и решить ее.
7. Доказать, что выпуклая квадратичная функции /(ж) = п(Сх, х) + (с, х) либо достигает
своей нижней грани на Еп, либо не ограничена снизу [84].
8. Пусть U0—■ выпуклое множество из Еп, функции дх(и), .. ,,дт(и) выпуклы на UQ,
д{(и) = (а{,и) — bt, г = т + 1,..., s. Доказать, что если система неравенств д{(и) < 0, г =
= 1,..., т, gi(u) = 0, г = т + 1,..., s, не имеет решения на U0, то существуют числа Л s ^О,
..., Ат>0, А т+ [,..., А„ такие, что Xigi(u) + ...+ Xsgs(u) ^0 при всех и е UQ,
Указание: построить множества, аналогичные множествам Л и В из доказательства
теоремы 2, и применить к ним теорему отделимости 5.2.
9. Пользуясь теоремой Фаркаша, доказать, что для несовместности системы линейных
неравенств {е{, х) $; fii, г =0,..., т, необходимо и достаточно, чтобы существовали такие числа
А0>0, А1^0,..„Ат>0, что A0e0+A1e1+...+Amem=0, A0/i0+A1^1+...+Am/im<0[752].
10. Доказать, что два непустых многогранных множества А = {х е J5": {е{, х) ^ р{, г =
= 0,..., к} и B = {i6 Еп: (е{, х) < ц{, г = к + 1,..., т}, не имеющие общих точек, сильно
отделимы. к к
Указание: рассмотреть гиперплоскость (с, х) = 7, где с = ]С Агер 7 = X) А{ ^, числа
А0,..., Ат взяты из упражнения 9. »=о г = о
11. Доказать, что если система линейных неравенств (вц, х) < 0, (е,, х) ^ 0,..., (ет, х) ^ О
несовместна, то существуют такие числа А, >0...., А_ >0, что еп = -А,е, — ... - a"L em.
к а з а н и е: воспользоваться теоремой Фаркаша.
12. Пусть система (е0, х) </ip, (е0 х) ^ ц{, г = 1 т, несовместна, а подсистема (е{, х)<
< fi{, ! = 1,,,„т, совместна. Доказать, что тогда существуют числа А[ > 0,..., Am ^ 0 такие,
что e0 = -A,eI -,..-Amem, ^0 +А,^, + ... +Am^m ^0 [54; 670].
Указание: в пространстве переменных (х, t) е В " +' рассмотреть систему (¾, х)—tjUg <
< 0, (ег, x) — tiii < 0, i=l,..., т, (0, x)-t ^ 0 и воспользоваться утверждением из
упражнения 11.
13. Рассмотрите задачу (1),(2) при Х0={хеВ1: х^О},/(х) = х, Х = {х^0: а(х)=х2<0} и
убедитесь, что функция Лагранжа L (х, A) = х+Ах2, х ^0, А ^ 0, этой задачи имеет бесконечно
много седловых точек (ср. с примером 1). Сформулируйте двойственную задачу.
ГЛАВА 5
Методы минимизации функций многих переменных
Выше в гл. 3 был рассмотрен симплекс-метод для решения задач линейного
программирования. Перейдем к изложению других методов минимизации функций конечного числа
переменных, не предполагая линейности рассматриваемых задач.
К настоящему времени разработано и исследовано большое число методов минимизации
функций многих переменных. Мы ниже остановимся на некоторых наиболее известных и
часто используемых на практике методах минимизации, будет дано краткое описание каждого
из рассматриваемых методов, исследованы вопросы сходимости, обсуждены некоторые
вычислительные аспекты этих методов. При этом мы ограничимся рассмотрением лишь одного-двух
основных вариантов излагаемых методов, чтобы ознакомить читателя с основами этих
методов, полагая, что знание основ методов облегчит читателю изучение литературы, позволит ему
без особого труда понять суть того или иного метода и выбрать подходящий вариант метода
или самому разработать более удобные его модификации, лучше приспособленные для
решения интересующего читателя класса задач. В конце главы будут высказаны некоторые общие
замечания по методам минимизации.
Из обширной литературы, посвященной методам минимизации функций конечного числа
переменных и их приложениям, мы можем здесь упомянуть лишь весьма незначительную ее
часть [1; 13; 16; 18-20; 24-30; 32; 33; 52; 53; 56; 61; 62; 66; 70; 71; 73; 74; 76-78; 83-85;
89-92; 94; 102; 109; 116; 117; 128; 131; 134; 135; 140; 143; 148; 154; 161; 179; 183; 184; 194;
203-205; 214; 216; 218; 222; 226; 227; 231; 232; 234; 243; 250-252; 255-257; 259-266; 272;
273; 281; 286; 292; 294-299; 301; 302; 304-309; 314; 316-320; 326; 330; 341-345; 347; 356;
358; 361; 368-370; 372-375; 377; 386-388; 390; 396; 398; 401; 410; 422; 423; 426; 437; 442;
447; 448; 465; 466; 470; 471; 481; 491; 493-495; 499; 506; 511; 516-518; 520; 521; 523; 525;
527; 539; 541; 542; 548-550; 561-566; 572; 580-582; 586; 590; 591; 601; 603; 606; 608; 610;
612-614; 620; 623; 624; 635; 639; 652; 657; 661; 662; 670; 671; 675; 676; 678; 681; 684; 686-688;
695; 697; 704; 709-711; 713; 718-721; 725; 732; 737; 738; 742; 743-747; 750-752; 759; 760;
765; 769; 774-777; 786; 792; 793; 795; 799; 803; 807; 811; 813; 818].
§ 1. Градиентный метод
1. Будем рассматривать задачу
/(a;)^inf; хеХ=Еп, (1)
предполагая, что функция f(x) непрерывно дифференцируема на Еп, т. е.
f(x)e С1(Еп). Согласно определению 2.2.1 дифференцируемой функции
f(x + h)- f{x) = (f'{x), h) + o(h; x), (2)
где lim o(h; х)\Щ~1 =0. Если f'(x)^0, то при достаточно малых \h\ глав-
§ 1. ГРАДИЕНТНЫЙ МЕТОД
235
ная часть приращения (2) будет определяться величиной (f'(x), К). В силу
неравенства Коши — Буняковского
-\Пх)\-Щ^(Г(х),Н)^\Г(х)\-\Н\,
причем, если /'(х)фО, то правое неравенство превращается в равенство
только при h = af'(x), а левое неравенство — только при h = —af'(x), где
a = const ^0. Отсюда ясно, что при /'(х)ф0 направление наибыстрейшего
возрастания функции f(x) в точке х совпадает с направлением градиента
f'(x), а направление наибыстрейшего убывания — с направлением
антиградиента (-f'(x)).
Это замечательное свойство градиента лежит в основе ряда
итерационных методов минимизации функций. Одним из таких методов является
градиентный метод, к описанию которого мы переходим. Этот метод, как и
все итерационные методы, предполагает выбор начального приближения —
некоторой точки 2¾. Общих правил выбора точки х0 в градиентном методе,
как, впрочем, и в других методах, к сожалению, нет. В тех случаях, когда
из геометрических, физических или каких-либо других соображений может
быть получена априорная информация об области расположения точки (или
точек) минимума, то начальное приближение Xq стараются выбрать
поближе к этой области.
Будем считать, что некоторая начальная точка 2¾ уже выбрана. Тогда
градиентный метод заключается в построении последовательности {хк} по
правилу
4 + i = xk-akf'(xk)i a*>°i *=0, 1,... (3)
Число ак из (3) часто называют длиной шага или просто шагом
градиентного метода. Если Р(хк)ф0, то шаг ак >0 можно выбрать так, чтобы
f(xk + l) <f(xk). В самом деле, из равенства (2) имеем
f(xk + l) - /(¾) = ak[-\f'(xk)\2 + о(ак)а^] < 0
при всех достаточно малых ак > 0. Если f'(xk) = 0, то хк —стационарная
точка. В этом случае процесс (3) прекращается, и при необходимости
проводится дополнительное исследование поведения функции в окрестности
точки хк для выяснения того, достигается ли в точке хк минимум функции
f(x) или не достигается. В частности, если f(x) — выпуклая функция, то
согласно теореме 4.2.3 в стационарной точке всегда достигается минимум.
Существуют различные способы выбора величины ак в методе (3). В
зависимости от способа выбора ак можно получить различные варианты
градиентного метода. Укажем несколько наиболее употребительных на практике
способов выбора ак.
1) На луче x = xk — af(xky а ^0, направленном по антиградиенту, введем
функцию одной переменной
ft(a) = /(a*-a/'(a*)), "^0,
и определим ак из условий
9к(ак)= М &(«) = &♦> ак>°- (4)
Метод (3), (4) принято называть методом скорейшего спуска. При $'(хк)ф
ф0 согласно формуле (2.6.1) имеем gk'(0) = -\f'(xk)\2 <0, поэтому нижняя
236 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
грань в (4) может достигаться только при ак > 0, Приведем пример, когда
величина ак, определяемая условием (4), существует и может быть
выписана в явном виде.
Пример 1. Пусть дана квадратичная функция
f(x)=12(Ax,x)-(b,x), (5)
где А — симметричная положительно определенная матрица порядка пхп,
Ъ — вектор из Еп. Выше было доказано, что эта функция сильно выпукла
и ее производные вычисляются по формулам
f>(x) = Ax-b; f"(x) = A.
Поэтому метод (3) в данном случае будет выглядеть так:
Ч + i = хк ~аЛАхк - ь). А: =0,1,...
Таким образом, градиентный метод для функции (5) представляет собой
хорошо известный итерационный метод решения системы линейных
алгебраических уравнений Ах= Ъ. Определим ак из условий (4). Пользуясь
формулой (4.2.10), имеем
&(«) = /(¾) - <*\Г(Ч)\2 + (a2/2)(Af(xk), f'(xk)), а > 0.
При /4¾) ^0 условие дк'{а) = -\f'(xk)\2 + a(Af(xk), f'(xk)) = 0 дает
п 1/'Ы!2 _ \A*k-bf
ак ~ (Af\xk), f(xk)) - (А(Ахк - Ь), Ахк - Ь) * и"
Поскольку функция gk(ot) выпукла, то в найденной точке ак эта функция
достигает своей нижней грани при а ^ 0. Метод скорейшего спуска для
функции (5) описан.
Однако точное определение величины ак из условий (4) не всегда
возможно. Кроме того, нижняя грань в (4) при некоторых к может и не
достигаться. Поэтому на практике ограничиваются нахождением величины ак,
приближенно удовлетворяющей условиям (4). Здесь возможен, например,
выбор ак из условий
оо
9к* < 9к(ак) < 9к* +Sk, 8к>0, J2 6к = 8 < оо, (6)
к =0
или из условий
а^&ККа-А.ЫОНА^, о<л<л^1. (7)
Величины 8к, Хк из (6), (7) характеризуют погрешность выполнения
условия (4): чем ближе 8к к нулю или \к к единице, тем точнее выполняется
условие (4). При поиске ак из условий (6), (7) можно пользоваться
различными методами минимизации функций одной переменной (например,
методами гл. 1).
Следует также заметить, что антиградиент (-/4¾)) указывает
направление быстрейшего спуска лишь в достаточно малой окрестности точки хк.
Это означает, что если функция f(x) меняется быстро, то в следующей
точке хк + 1 направление антиградиента (-f'(xk + l)) может сильно отличаться
§ 1. ГРАДИЕНТНЫЙ МЕТОД
237
от направления (—f'(xk)). Поэтому слишком точное определение величины
ак из условий (4) не всегда целесообразно.
2) На практике нередко довольствуются нахождением какого-либо ак > О,
обеспечивающего условие монотонности: f(xk + i) < f(xk). С этой целью
задаются какой-либо постоянной а > 0 и в методе (3) на каждой итерации
берут ак = а. При этом для каждого к >0 проверяют условие монотонности,
и в случае его нарушения ак = а дробят до тех пор, пока не
восстановится монотонность метода. Время от времени полезно менять а, пробовать
увеличить а с сохранением условия монотонности.
3) Если функция f(x)eC1'l(En), т. е. f(x)eCl(En), и градиент f'(x)
удовлетворяет условию
\f'(u)-f(v)\^L\u-v\, u,veE\
причем константа L известна, то в (3) в качестве ак может быть взято
любое число, удовлетворяющее условиям
0<e^ak^2/(L +2е), (8)
где е0, е — положительные числа, являющиеся параметрами метода. В
частности, при е = L/2, е0 = 1/L получим метод (3) с постоянным шагом
ak = l/L. Отсюда ясно, что если константа L большая или получена с
помощью слишком грубых оценок, то шаг ак в (3) будет маленьким. Метод (3),
(8) подробнее рассмотрим в следующем параграфе.
4) Возможен выбор ак из условия [94; 374; 603]:
/Ю- /(¾ -^/'K))^"J№)|2, е>0- (9)
Для удовлетворения условия (9) сначала обычно берут некоторое число
ак = а >0 (одно и то же на всех итерациях; например, ак = 1), а затем при
необходимости дробят его, т. е. изменяют по закону ак = \{а, г = О, 1...,
О < Л < 1, до тех пор, пока впервые не выполнится условие (9). Такой способ
определения ак в литературе часто называют выбором шага по Армихо [94].
5) Возможно априорное задание величин ак из условий
оо оо
ак>0, fc=0, 1,...; Еа* = 0°. Е«!<оо. (10)
Например, в качестве ак можно взять ак = с(к + 1)~а, где с = const > 0, а
число а таково, что 1/2 < а ^ 1. В частности, если а = 1, с = 1, то получим
ак = (к + 1)~', к =0, 1,... Такой выбор {ак} в (3) очень прост для
реализации, но не гарантирует выполнения условия монотонности f(xk + l) < f(xk)
и, вообще говоря, сходится медленно. Более подробно о методе (3), (10)
см. ниже в § 3.
6) В тех случаях, когда заранее известна величина /„ = inf (х) > —оо, в (3)
можно принять
а* = (/Ю-Л)1/'(**)|-2
— это абсцисса точки пересечения прямой / = /„ с касательной к кривой
/ = 9к(а) = f(xk - "У(¾)) в точке (0, дк(0)).
Допустим, что какой-либо способ выбора ак в (3) (например, один из
перечисленных выше способов) уже выбран. Тогда на практике итерации (3)
238 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
продолжают до тех пор, пока не выполнится некоторый критерий окончания
счета. Здесь часто используются следующие критерии:
K-Zt + il^e. или l/W-/fe + i)KE. или 1/'(^Ж^
ИЛИ 1/(ГУ+'!-У <Е,ИЛИ 1/(^)- /(^ + i)l + 1¾ - a,fc + 1K е:,
где е >0 — заданное число. Иногда заранее задают число итераций;
возможны различные сочетания этих и других критериев. Разумеется, к этим
критериям окончания счета надо относиться критически, поскольку они могут
выполняться и вдали от искомой точки минимума. К сожалению, надежных
критериев окончания счета, которые гарантировали бы получение решения
задачи (1) с требуемой точностью, и применимых к широкому классу задач,
пока нет. Сделанное замечание о критериях окончания счета относится и к
другим излагаемым ниже методам.
В теоретических вопросах, когда исследуется сходимость метода,
предполагается, что процесс (3) продолжается неограниченно и приводит к
последовательности {хк}. Здесь возникают вопросы, будет ли полученная
последовательность {хк} минимизирующей для задачи (1), будет ли она сходиться
к множеству точек минимума
Xt = {xeE\f(x) = l = mff(x)}
или, иначе говоря, выполняются ли соотношения
lim f(xk) = l, 1\тр(хк,Х,) = 0. (11)
к ~юо к —юо
Для положительного ответа на эти вопросы на функцию f(x), кроме
условия f(x)e С"(Еп), приходится накладывать дополнительные более жесткие
ограничения.
2. Подробнее рассмотрим эти вопросы для метода скорейшего спуска,
когда в (3) величина ак выбирается из условия (6).
Теорема 1. Пусть ft = Inf f(x) > -оо, f(x) е С1' 1(Еп). Тогда
последовательность {хк}, полученная методом (3), (6), при произвольном
начальном приближении ^ такова, что lim f'(xk) = 0. Если при этом
к->оо
множество М0(хо) = {хе Еп: f(x) < /(¾) + 8}, где S взято из (6),
ограничено, то lim p(xk)St) = 0, где S^ = {xeMs(x0): f'(x) = 0}—множество
к —юо
стационарных точек функции f(x) на М{(^.
Доказательство. Если при некотором k ^0 окажется, что f'(xk) =
-0, то из (3), (6) формально получаем хк — хк + х—... и утверждения
теоремы становятся тривиальными. Поэтому будем считать, что f'(xk)^0 при
всех к =0, 1,... Так как f(xk+l)=gk(ak)^ inf gk(a)+8k^f(xk-af'(xk))+Sk
при всех а^О, то из неравенства (2.6.7) при у=хк, x=xk-af'(xk) имеем
/(¾) - /(¾+ i) ^ /(¾) - /(¾ - «/'(**)) -8^
> а|/'К)|2 - La2|№)l72 -6k>a(l- aL/2)\f'(xk)\2 - 6к
при всех а ^ 0 и к =0, 1,... Следовательно,
/(¾) - /К + .) > max а(1 - aL/2)\f'(xk)\2 - 8к =
= (1/(2Ь))\Г(хк)\*-6к1 fc=0,l,... (12)
§ 1. ГРАДИЕНТНЫЙ МЕТОД
239
Отсюда получаем
/K+iK/Ы + а*. * =о,1,... (13)
Так как /(¾) > /„ > —оо, к =0, 1,..., то из леммы 2.6.2 и (13) следует
существование предела lim f(xk)^ft. Тогда \im (f(xk) — f(xk + i)) = О и
/: —> оо к —> оо
из (12) будем иметь lim /'(a;t) = 0.
к —юо
Наконец, пусть множество М{(^) ограничено. Суммируя
неравенства (13) по А; от 0 до т — 1, получим
т— 1
/(zj < /(¾) +ЕМ /(¾) + 4 т = 1, 2,...,
к = 0
т. е. (¾} 6 М6{х0). По теореме Больцано — Вейерштрасса
ограниченная последовательность {хк} имеет хотя бы одну предельную точку.
Пусть xt — произвольная предельная точка {хк} и {хк } —» xt.
Пользуясь непрерывностью f'(x), отсюда имеем lim f'(xk ) = f'(x^) — 0, т. е.
т~юо т
xt€St. Так как расстояние р(х, 5„) непрерывно (см. лемму 2.1.2), то
lim р(хк , St) = p{xt, St) = 0. Отсюда следует, что числовая последователь-
т~юо т
ность {р(хк, St)} имеет единственную предельную точку, равную нулю, т. е.
lim р(хк, St) = 0. Теорема 1 доказана. □
к —> оо
Теорема 2. Пусть выполнены, все условия теоремы, 1 и, кроме
того, функция f(x) выпукла на Еп. Тогда, для последовательности
{хк}, определяемой условиями (3), (6), имеют место соотношения (11).
Если, кроме того, в (6) {Sk} = 0(к~2), то справедлива оценка
О^/Ю-Л^ц,*:-1, со = const >0. (14)
Доказательство. Из ограниченности МЛх0), непрерывности f(x),
согласно теореме 2.1.2, имеем /„ > — оо, Х^фю, Х^сМ^х^). Тогда для
любой точки x,el, с помощью неравенства (4.2.4) получаем
о < /(¾) - Л = /(¾) - /(¾) < (/4¾). я* - =0 <
<l/'K)|-k*-a>l^rf|/'K)l. ^=0,1,..., (15)
где d > diam Me (2¾) = sup |u — г?|—диаметр множества Ms(x0). В те-
и, иеМ((:%)
ореме 1 было доказано, что lim f'(xk) = 0. Отсюда и из (15) следует, что
k ~юо
lim f(xk) = ft. Учитывая включение {хк} е Мв(а%), тогда с помощью
теоремы 2.1.2 получаем второе из равенств (11).
Докажем оценку (14). Обозначим ak=f(xk)-ft. Из неравенств (12), (15)
имеем ak-ak + l=f(xk)-f(xk + l)^(l/(2L))\f'(xk)\2-8k^al/(2Ld2)-Sk.
По условию 8к = 0(к-2), т. е. О < 6к < c,fc-2, fc = 1,2,.. ., с, = const > 0.
Полагая A = max{c,; 2Ld2}, получим
ak + i^ak-c?k/A+Ak-2, к = 1,2,...
Отсюда и из леммы 2.6.5 при 10 = {1, 2,...}, I, = 0 следует оценка (14).
Если 6к =0, & =0, 1,..., то оценка (14) вытекает из неравенств (12), (15)
и леммы 2.6.4. Теорема 2 доказана. □
240 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Теорема 3. Пусть f(x) е CUi(En), f(x) сильно выпукла на Еп.
Тогда для последовательности {хк}, получаемой из (3), (6) при любом
начальном приближении Xq, справедливы, соотношения (11)- Если при
этом 8к = 0(к~2), то имеет место оценка (14). Если Sk=0, к =0, 1,...,
то верна более сильная, чем (14), оценка
(К/(¾) - Л < (/(¾) - Л)<Д (16)
к-^|2<(2//х)(/(г0)-/*У% * =0,1,.-., (17)
где xt — точка минимума f(x) на Еп, q = 1 — рь/L, 0< q < 1, /z —
постоянная из теоремы. 4.3.3.
Доказательство. Согласно теореме 4.3.1 множество M6(xq)
ограничено, ft > — оо, Xt состоит из единственной точки xt. Поэтому
равенства (11) и оценка (14) следуют из теорем 1, 2. Докажем оценки (16), (17).
Из (4.3.9) при v = хк, и = xt имеем
ак = /(¾) - /(¾) < (/4¾). хк ~ х*) - *к - z*l72 =¾ \Г(хк)\\ч - х,\ -
- фк - xt\*/2 < sup (\f(xk)\z - *z*/2) = |/'Ю17(2«),
zS»0
ak = f(xk)-f(xt)^\f>(xk)\y(2x), fc=0,l,... (18)
Подставив неравенство (18) в правую часть (12) при 8к =0, получим
ак ~ ак +1 £ §27 ак — 27 аь' — ' ''''
В § 4.3 было установлено, что % = /z < L. Поэтому 0 < q = 1 — {ц/L) <
< 1, и предыдущее неравенство можно переписать в виде 0^. ак + 1^.ак(1 —
— p,/L) = qak. Отсюда имеем ak^qak_l ^q2ak_2^... .^.qka0, что равносильно
оценке (16). Наконец, из неравенства (4.3.3) следует
^1¾ - х*\2 < /(¾) - /(¾) = ак> fc=0, 1,...
Отсюда и из (16) получим оценку (17). Теорема 3 доказана. □
Метод скорейшего спуска имеет простой геометрический смысл:
оказывается, точка хк + 1, определяемая условиями (3), (4), лежит на луче
Lk = {х: х = хк — af'(xk), а ^0} в точке его касания поверхности уровня
Г;с + 1 = {хеЕп: f(x) = f(xk + l)}, а сам луч Lk перпендикулярен к
поверхности уровня Тк = {х е Еп: f(x) = f(xk)} — см. рис. 5.1 и 5.2. В самом деле,
пусть х = x(t), а^. t ^ Ъ —некоторое параметрическое уравнение кривой,
принадлежащей Тк, т. е. f(x( *)) = /(¾) = const, a^.t ^b, причем x(t0) = xk.
Тогда jjrf(x(t)) = (f(x(t)), x(t)) =0, a^t^b. В частности, при t = t0
имеем (f'(xk),x(t0))=0. Это означает, что градиент (или антиградиент)
f'(xk) перпендикулярен к касательному направлению поверхности уровня
Тк в точке хк, или, иначе говоря, луч Lk перпендикулярен к Тк. Далее,
из условия (4) при ак > 0 получаем gk'(ak) = -(f'(xk - akf'(xk)), f'(xk)) =
=-(/4¾+ i), /4¾)) =°- Но вектор f'(xk + i) перпендикулярен к Tk+i в точке
хк + 1, поэтому последнее равенство означает, что направление f'(xk) и,
следовательно, луч Lk являются касательными к поверхности уровня Тк + 1 в
точке хк + 1.
§ 1. ГРАДИЕНТНЫЙ МЕТОД
241
3. Из рис. 5.1 и 5.2 можно понять, что чем ближе поверхность уровня
f(x) = const к сфере, тем лучше сходится метод скорейшего спуска. Это
же явление можно усмотреть и из оценок (16), (17)—чем ближе \ijL к
единице (для функции f(x) — \x\2, у которой поверхностями уровня
являются сферы, как раз имеем рь/L = 1), тем ближе q к нулю и тем лучше
сходимость.
Те же рис. 5.1 и 5.2 показывают, а теоретические исследования и
численные эксперименты подтверждают, что метод скорейшего спуска и другие
Рис. 5.1 Рис. 5.2
варианты градиентного метода медленно сходятся в тех случаях, когда
поверхности уровня функции f(x) сильно вытянуты и функция имеет так
называемый «овражный» характер. Это означает, что небольшое
изменение некоторых переменных приводит к резкому изменению значений
функции— эта группа переменных характеризует «склон оврага», а по
остальным переменным, задающим направление «дна оврага», функция меняется
незначительно (на рис. 5.2 и 5.3 изображены линии уровня «овражной»
Рис. 5.3
функции двух переменных). Если точка лежит на «склоне оврага», то
направление спуска из этой точки будет почти перпендикулярным к
направлению «дна оврага», и в результате приближения {хк}, получаемые
градиентным методом, будут поочередно находиться то на одном, то на другом
«склоне оврага». Если «склоны оврага» достаточно круты, то такие скачки
«со склона на склон» точек хк могут сильно замедлить сходимость
градиентного метода.
242 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Для ускорения сходимости этого метода при поиске минимума
«овражной» функции можно предложить следующий эвристический прием,
называемый овражным методом. Сначала опишем простейший вариант этого
метода. В начале поиска задаются две точки v0, vu из которых производят
спуск с помощью какого-либо варианта градиентного метода, и получают
две точки 2¾. х{ на «дне оврага». Затем полагают
v2 = x{ -(ж, -х0)\х{ -s0|-1/isign(/(a;1)-/(s0)),
где h — положительная постоянная, называемая овражным шагом. Из точки
v2, которая, вообще говоря, находится на «склоне оврага», производят спуск
с помощью градиентного метода и определяют следующую точку 0¾ на «дне
оврага».
Если уже известны точки oOq, хи ..., хк, к > 2, то из точки
Ч + \ = xk~(xk- а*_,)к ~ хк_ ,|-'/i sign [f(xk)-f(xk_l)] (19)
совершают спуск с помощью градиентного метода и находят следующую
точку хк + 1 на «дне оврага» (см. рис. 5.3; спуск из точки vk в точку хк,
состоящий, быть может, из нескольких итерационных шагов градиентного
метода, условно изображен отрезком прямой, соединяющей точки vk, хк,
к=0, 1,...).
Величина овражного шага h подбирается эмпирически с учетом
информации о минимизируемой функции, получаемой в ходе поиска минимума.
От правильного выбора h существенно зависит скорость сходимости
метода. Если шаг h велик, то на крутых поворотах «оврага» точки vk могут
слишком удаляться от «дна оврага» и спуск из точки vk в точку хк, может
потребовать большого объема вычислений. Кроме того, при больших h на
крутых поворотах может произойти выброс точки vk из «оврага», и
правильное направление поиска точки минимума будет потеряно. Если шаг h
слишком мал, то поиск может очень замедлиться и эффект от применения
овражного метода может стать незначительным.
Эффективность овражного метода может существенно возрасти, если
величину овражного шага выбирать переменной, реагирующей на повороты
«оврага» с тем, чтобы: 1) по возможности быстрее проходить
прямолинейные участки на «дне оврага» за счет увеличения овражного шага; 2) на
крутых поворотах «оврага» избежать выброса из «оврага» за счет уменьшения
овражного шага; 3) добиться по возможности меньшего отклонения точек
vk от «дна оврага» и тем самым сократить объем вычислений, требуемый
для градиентного спуска из точки vk в точку хк, к = 0, 1,... Интуитивно
ясно, что для правильной реакции на поворот «оврага» надо учитывать
«кривизну дна оврага», причем информацию о «кривизне» желательно получить,
опираясь на результаты предыдущих итераций овражного метода.
В работе [657] предлагается следующий способ выбора овражного шага:
K + l = hk-c™a*~™a^, fc = 2, 3,..., (20)
где ак —угол между векторами vk-xk_it хк-хк_и определяемый условием
cosak = (vk~xk_i,xk-xk_l)\vk-xk^l\~l\xk-xk_l\-i,
а постоянная с > 1 является параметром алгоритма. Точка vk +,
определяется из (19) при h = hk + l. Разность cos ак - cos ак_1 в равенстве (20)
§ 1. ГРАДИЕНТНЫЙ МЕТОД
243
связана с «кривизной дна оврага» и, кроме того, обладает важным
свойством указывать направление изменения «кривизны». А именно, при
переходе с участков «дна оврага» с малой «кривизной» на участки с
большей «кривизной» будем иметь cos ак — cos ак _, <0 (см. рис. 5.4). Тогда,
в силу (19) имеем hk + l < hk, т. е. овражный шаг уменьшается,
приспосабливаясь к повороту «дна оврага», что в свою очередь приводит к
уменьшению выбросов точки vk + l на
«склоны оврага». При переходе с участков
«дна оврага» с большой «кривизной»
на участки с меньшей «кривизной»,
наоборот, cos ак — cos ак _, > 0,
поэтому овражный шаг увеличится и
появится возможность сравнительно
быстро пройти участки с малой
«кривизной», в частности, прямолинейные
участки на «дне оврага». Если
«кривизна дна оврага» на некоторых
участках остается постоянной, то разность
cos ак — cos ак _, будет близка к
нулю, и поиск минимума на таких
участках будет проводиться с почти
постоянным шагом, сформированным с
учетом величины «кривизны» при выходе
на рассматриваемый участок. Рис. 5.4
Параметр с в равенстве (20)
регулирует «чувствительность» метода к изменению «кривизны дна оврага», и
правильный выбор этого параметра во многом определяет скорость
движения по «оврагу». Некоторые эвристические соображения по поводу выбора
с и другие аспекты применения овражного метода обсуждены в [657].
Выражение (20) для овражного шага удобнее преобразовать так
hk + i = hkCC0S^-C0Sa"^ = /lt_1CC°",1'-C0",1'-> =... = /12СС05^-С05а',
откуда имеем
hk + l = AcC0Sa", A = V-cosa>=const>0, * = 2,3,...
Другой способ ускорения сходимости градиентного метода
заключается в выборе подходящей замены переменных х = д(£) = (^(£)) ■ • •> fln(0)
с тем, чтобы поверхности уровня функции /(</(!)) = G(£) в
пространстве переменных £=(£',...,£") были близки к сферам. Заметим, что
G'(0 = (s'(0)T/'ЫО)> где з'(0 = {&^(О} — матрица, *-я строка
которой представляет собой &'(£) = (ff*'(0> ■■■> &r(0)> а (ff'(0)T —матрица,
полученная из д'(£) транспонированием. В пространстве переменных £
градиентный метод выглядит так:
tk+i = tk-pk(9'(tk))Tf'№k)), &>о, Л=0,1,...
В пространстве исходных переменных х = (ж1, ..., хп) этот подход можно
трактовать как итерационный процесс вида
xk + i = xk-akAkf'(xk)> «fc>0> * =0,1,...,
244 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
— где Ак — некоторая невырожденная матрица порядка п х п,
представляющая собой параметр метода. То, что на этом пути можно добиться
существенного ускорения скорости сходимости итераций,
подтверждается, например, излагаемым ниже методом Ньютона, в котором полагается
Ак = (f"(xk))~l, к = 0, 1, ... О методах минимизации овражных функций и
различных приемах ускорения сходимости итерационных методов см. [74;
84; 89; 222; 442; 525; 550; 586; 603; 657; 721; 738; 769].
4. Исследуем сходимость другого варианта градиентного метода (3), в котором параметр ак
определяется из условия (9) с помощью дробления. А именно, пусть 1<е<2, а > 0 —
фиксированные числа, а г ^ 0 — наименьший номер, для которого выполняется неравенство [374;
603]
/(¾) - /(¾ - 2-'«/'(**)) > 2-* - ' ae\f{xk)\\ (21)
и пусть
«* = «/2*. (22)
Теорема 4. Пусть в задаче (I) /„>—оо, Х^0, функция f(x) выпукла на Еп, f(x)£
е С1''(.Б™). Тогда для последовательности {хк}, определяемой методом (3),(21),(22),
имеют место соотношения (11) и, более того, существует точка ut6 Xt такая, что
4 ~*%' \xk + l-vj<\xk-vt\, P(xk + i,Xt)^p(xk,X,), fc=0,l,..., (23)
причем равенство в (23) возможно лишь при хк = хк \ — ,,. = vt; справедлива оценка
0 < f(xk)-ft < {min{(2-e)/(2L); а^Ще^-ь^к-1 = O(lfk), k = 1, 2 (24)
и если Xt—аффинное множество, то vt=Px (¾). т. е. vt — ближайшая к xq точка ua Xt.
Доказательство. Сначала покажем возможность выбора ак из условий (21), (22).
Пусть j ^ 0 — наименьший номер, для которого
L -2'3а^2-е; (25)
здесь L >0 — константа Липшица для f'(x). Из неравенства (2.6.7) при у = хк, х = хк —
— 2~3af'(xk) с учетом (25) имеем
/(**)-/(** - 2~'«/'(**)) > (/4¾). 2r'af'{xk))-L • 2~V~la2\f'(xk)\2 =
= 2-'" ' а(2 - 2-iaL)\f(xk)f > 2~3~ ' *e\f{xk)\2. (26)
Это значит, что при г — j неравенство (21) выполняется, и, следовательно, минимальный номер
г ^0, при котором справедливо (21), существует и не превышает номера j из (25). Покажем,
что для ак из (21), (22) справедлива оценка
ак >тт{(2-е)/(2Ь);а}, fc=0,l,... (27)
Сначала рассмотрим случай а > (2- e)/(2L), Тогда оказывается, ак > (2 - e)/(2L) при всех
А; =0,1,... В самом деле, для номера j из (25) в этом случае имеем 2~}а ^ (2 - e)/L <
<2~3+ a, j ^ 0. Поэтому с учетом правила выбора номера г, определения ак из (22) и
неравенства г ^ j получим ак = а/21 Js а/23' > (2 - е)/(2£). Пусть теперь а ^ (2 - e)/(2L).
Тогда неравенство (25) и, следовательно, (26) выполняется при У=0. Отсюда и из (21) следует,
что г =0. Согласно (22) тогда ак = а/2°-а, к =0, 1,... Объединяя оба рассмотренных случая,
приходим к оценке (27).
Далее, возьмем любую точку xt е Xt. Из (3), (21), (22) и теоремы 4.2.2 имеем
(S/2)ak\f(xk)\2 ^ f(xk) - f(xk+l)< f(xk) - f(xt) jj (f(xk), xk - xt). (28)
Кроме того, из (3) следует \хк + 1- xj2 = \хк - akf'(xk) - xf = \хк - xt\2 - 2ak(f{xk), xk -
— aij + <xk\f'(xk)\2, Отсюда с учетом оценки (28) получаем
l** + i-^141¾-^lMe-l)«*l/'(**)l2. 1<е<2. (29)
Следовательно,
1** + 1-**|Ч.1**-Яч1Ч...^К-^|2 VxteXt. (30)
§ 1. ГРАДИЕНТНЫЙ МЕТОД
245
Из (30) вытекает существование предела lim 1¾ —a^l2 и ограниченность последовательности
к ~> оо
{хк}, Тогда найдется подпоследовательность {хк }, сходящаяся к некоторой точке vt. Из (27),
(29) следует, что {f'(xk )}-> f'(vt) = 0. По теореме 4.2.3 тогда vt£ Xt. Приняв xt = vt, из (30)
получаем lim \хк —vj— lim \хк — vt\ = 0, т. е. вся последовательность {хк} сходится к
к ~> ОО Ш —* ОО т
точке vt, Отсюда и из (29), (30) следуют неравенства (23). Как видно из (29), равенство в (23)
возможно лишь при f'(xk) = 0. Тогда в силу теоремы 4.2.3 хк = vte Xt, и процесс (3), (21),
(22) на этом заканчивается.
Докажем оценку (24). Обозначим ак = f(xk) - Д. Из (28), (30) при xt = vt имеем
(e/2)ak\f'(xk)\2^ak-ak + i, o*<l/'(**)lk-%l, * =0,1,...
Отсюда с учетом (27) получаем ак-ак , ^ (e/2)min{(2-e)/(2,L); a^xQ-vJ^a2,., к=0, 1,...
Из леммы 2.6.4 тогда следует оценка (24).
Наконец, пусть Xt — аффинное множество. При к -» оо из (30) имеем \vt — xt\2 < \xq — xj
при любом xt е Xt, В частности, в этом неравенстве можно взять xt = vt + a(Vx (¾) — vt) =
= va&Xt, а> 0. Получим 1¾ - va\2 > \vt - va\2 = \(vt - :¾) - (va - ^)12 = \vt - xq\2 + |ua -
- ^|2 - 2(¾ - Xq, va - Xq) = \va - Xq\2 - |^ - ^|2 - la (¾ - Xq, Vx< (¾) - vt) или
1¾ - ^12 > 2a|ч -7^(^)12 + 2a(Vx(x0) - ъ, ч -Р^Ы).
Отсюда с учетом равенства (4.4.2) имеем |и„ —а^Р ^2^1^-¾ (а^)|2 при всех а >0. Разделив
это неравенство на а > 0 и устремив a —» со, получим i^ = Vx (¾). Теорема 4 доказана. □
5. Следуя [525], рассмотрим метод, представляющий собой комбинацию несколько
модифицированного метода (3), (21), (22) и овражного метода.
Возьмем начальные приближения: vQ е Еп, Ь0 = 1, <*_, > 0, положим х_{ = 1¾. Пусть для
некоторого к ^0 уже известны vk е Еп, Ьк^1, ак_{>0, хк_{£ Еп. Определим наименьший
номер г ^ 0, для которого выполняется неравенство
f(vk)-f(vk-2-iak_lf'(vk))>2-i-iak_l\f'(vk)\2. (31)
Далее, положим at = afc _ ,/2«, ** =¾ - а*/^), (32)
bt + . = 2(i + V4b' + 1)- **+i=** +^0¾-**-■>• (33)
Таким образом, в описанном методе (31)-(33) спуск из точки vk на «дно оврага»
осуществляется по формулам (31), (32) с помощью одного шага градиентного метода (3) с правилом
выбора параметра ак, близким к (21), (22). Здесь возможно использование некоторых других
вариантов градиентного метода: по аналогии с (8) в (32) можно взять ак = 1/L. Как видно
из (33), пересчет точки vk осуществляется с помощью овражного метода по формуле, близкой
к (19). Первое из равенств (33) представляет собой правило пересчета длины овражного шага;
величина Ък + , является положительным корнем квадратного уравнения х2 — х — Ьк = 0, так
что
Ь* + 1-Ь* + 1 = Ь*. ^0 = 1. h>°, *=0,1,... (34)
С помощью индукции нетрудно получить оценку
Ьк>к, к = 1,2,.., (35)
Теорема 5. Пусть функция f(x) выпукла на Еп, /(ж) е С1,'(.Б™), f > -оо, X ^0,
последовательность {хк} определена методом (31)-(33). Тогда
0^/(0),)-/^^^1/(2^):^,))-42^(/(^)-/,) +
+ lnU*-<%l2)/(2*2)=0(l/*2), fc = l,2,... (36)
Доказательство. Пусть j ^ О — наименьший номер, для которого
2-^-1 £1/Ь. (37)
Нетрудно видеть, что тогда
/К) - /К - 2~Ч_ i/'K)) > 2-i-xctk_x\f(vkf; (38)
246 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
это неравенство доказывается так же, как (26) при е= 1. Отсюда следует существование
номера г < j, удовлетворяющего неравенству (31). Рассуждая так же, как при доказательстве
оценки (27), из (31), (32), (37), (38) с помощью индукции получаем
ак S5min{l/(2£);ar_,}, к =0,1,... (39)
Обозначим рк = (Ьк - l)(xk[ - хк). Тогда из (33) следует
vk + \=xk-Pk/h + \< Pk = bk + \(xk~vk + \)- (40)
Далее, с учетом (32), (40) имеем
Рк + \ ~xk + i = (bk + i ~l)(xk-xk + i)-xk + i=zbk + i(xk -^ + 1)-^ =
= bk+\(xk'vk + \+ak + \f(vk + \))~xk:=Pk~xk + ak + ibk + if'(vk + \)-
Тогда для любого xt е Xt получаем
\Рк+\-хк+\+х/=\Рк-хк+х*\2+2ак+\Ьк+\ </'K+i )>Pk-xk+x*)+ai+\bl+\\f{vk+\)\2<
или с учетом (40)
\Pk+\~xk+\+xf-\Pk-4+xJ2=2ak+\(f'(4+\)Abk+\Pk-Pk)^Pk-bk+\xk)+bk + \x*)+
+ «2+.b2+.l/'K+,)|2=2afc+1(b,+1-l)(/'K+1),Pt) +
+ 2«*+1 Ьк+1 (f(vk+i), x^vk+,)+a\+x Ь\+х \f'(vk+l)\\ к = 0, 1,... (41)
Заметим, что (31) с учетом (32) можно переписать в виде f(vk)-f(xk) ^ (<xk/2)\f'(vk)\2. Для
к + 1-й итерации это неравенство имеет вид
/К + .)^/К + .) + 5^+.1/'К + .)|2- (42)
Из теоремы 4.2.2 с учетом (42) получаем
(/'K + i),^-^ + i)^/K)-/K + i)^/*-/^+i)-5«fc + il/'K + ,)l2- (43)
Далее, из теоремы 4.2.2 и из (40), (42) следует
(в* + 1/2)1Л«4 + 1)|Ч/К + 1)-/(% + 1) ^/(¾)-(/'K+i). *»-«* + !>-/(** + !) =
= /(¾) - /(¾ +1) - (/'К +1). Pk)lbk +1,
откуда
(/'K + i),Pt>^b* + i[(/K)-/(** + i))-(e* + i/2)|/'K + i)l2]- (44)
Обозначим ак = /(¾)-Д. Подставим оценки (43), (44) в (41). С учетом (32), (34) получим
\Рк + 1~хк + 1 + х*\2-\Рк-хк + х*\2^
^2ak + i(bk+i~l)bk + i(ak-ak + i-(ak + i/2)\f'(vk + l)\2) +
+ 2<*к + 1Ьк + i(~ak + ,-K + ,/2)|/'K + .)|2) + «l + ,bI+.l/'K + ,)|2 =
= 2afc + lb2ffit-2at+lat+l(b2 + bt+l)^2Q:tb2afc-2Q:t + lb2 + lat + l-
Таким образом,
IPm+l -^m+l +а:*|2-|Рт-а:т + а:*|2<2атЬтат-2ат+1Ьт+1ат+1. т = °. ^---
Суммируя эти неравенства по т от 0 до некоторого т = к — 1, получим
IPfc ~ ^fc + ^12 + 2akbkak ^ 2аоЬоЧ + 1Ро ~ ^ + х*|2-
Отсюда с учетом равенств Ьд = 1, р0 = 0, оценок (35), (39), произвольности выбора точки х^
из Xt приходим к оценке (36). Теорема 5 доказана. П
§ 1. ГРАДИЕНТНЫЙ МЕТОД
247
Отметим, что метод (31)-(33) не обеспечивает монотонное убывание функции f(x) на
последовательностях {хк}, {vk}. Сравнение оценок (24) и (36) показывает, что для выпуклых
гладких задач овражный метод имеет более высокую скорость сходимости, чем градиентный
метод (3), (9). В [523] показано, что оценка f(xk) — /„ = 0(\/к2) является неулучшаемой на
этом классе функции среди всех методов, использующих лишь значения f(x), f'(x).
6. Остановимся на непрерывном варианте градиентного метода. В этом
методе вместо итерационного процесса (3), порождающего траекторию
{хк}, которая зависит от дискретного времени к = О, 1,..., за основу
берется система дифференциальных уравнений:
x(t) = ~a(t)f'(x(t)), t>0, (45)
где a(t)>0 заданная функция (параметр метода). Эта система описывает
движение материальной точки, движущейся в силовом поле, задаваемом
антиградиентом (-f'(x)), со скоростью x(t), пропорциональной
антиградиенту в точке x(t). Сразу заметим, что итерационный процесс (3) представляет
собой известный метод ломаных Эйлера для приближенного определения
траектории системы (45), выходящей из точки х(0) = 3¾. По аналогии с
теоремами 1-3 можно надеяться, что при некоторых ограничениях на функцию
f(x), a(t) траектории x(t), i ^0, системы (45) при больших t
притягиваются ко множеству St = {xeEn; f'(xt) = 0} стационарных точек задачи (1)
или, в лучшем случае, ко множеству Xt решений задачи (1). Очевидно,
все точки множеств St, Xt являются точками равновесия (стационарными
решениями) системы (45). Приведем две теоремы о сходимости метода (45).
Теорема 6. Пусть функция f(x) е С1,'(#"), выпукла на Еп,
ft>—oo, Xt^0, а функция a(t) непрерывно дифференцируема при t ^0,
a(t)^ а0>0, «'(*)<О Vi ^0. Тогда траектория x(t) системы (45) с
любым начальным условием х(0) = 3¾ определена при всех t ^ 0 и
существует точка vt е Xt такая, что
lim x(t) = vt, lim x(t) = 0,
t —>+00 t -4+00
Um /И*)) = /К) = Л, Hm /'И*)) =/'(«») = 0.
t ~> +00 (-4+00
Доказательство. При выполнении условий теоремы 0<a0^a(t)^
< а(0) и правая часть (-a(t)f'(x)) дифференциального уравнения (45)
удовлетворяет условию Липшица по х, непрерывна по совокупности
аргументов (t, х). Тогда задача Коши для уравнения (45) с начальным условием
х(0) = 2¾ имеет решение х = x(t), определенное при всех t ^ 0 (см. ниже
теорему 6.1.1). Возьмем Vxt € Xt и умножим (45) скалярно на x(t) — xt:
(x(t),x(t)-xt)=^\x(t)-xt\2 = -a(t)(f(x(t)),x(t)-xt).
Отсюда с учетом равенства f'(xt) = 0, условия a(t)>0 и теоремы 4.2.4
имеем: ^\x(t)-xt\2 = -2a(t)(f(x(t))- f'(xt), x(t)-xt) ^0 Vt ^0. Таким
образом, функция \x(t) - xt\2 не возрастает при t ^ 0, т. е.
\x(t)-xt\2^\x(r)-xf Vi > т ^ О, Ух^еХ,. (46)
В частности, при т=0: |a;(t)-a;J^|a%—a;J, т. е. траектория x(t) ограничена
равномерно на t ^0. Далее, умножим уравнение (45) скалярно на x(t):
\x(t)\2 = -a(t)(f'(x(t)), x(t)) = -a(t)-§t(f(x(t) - f(xt)), t > 0.
248 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Интегрируя это равенство и преобразуя по частям, получим:
\ \x{r)\2dr = -a(T)(f(x(T)) - f(xt)) "' + \ a'(T)(f(x(T)) - f(xt))dr.
о т=0 о
ТаккакО<о;0<сф)<а;(0), «'(*)< О, f(x(t))-f(xt)^0 Vt > 0, то
\\x(r)\2dr^a(0)(f(x0)~f(xj) Vt>0.
Это значит, что J \х(т)\2с1т < оо. Тогда найдется последовательность {*,-}—►
о
—»+оо, что {x(t{)} —»0. Так как |a;(i)| ограничено при t >0, то, пользуясь
теоремой Больцано — Веиерштрасса, можем считать, что х(t{)->«,. Из (45)
при t = t{ —» оо с учетом lim a(t) ^ а0 > 0 получим /'(v») = 0. Отсюда и
£ —> оо
из выпуклости f(x) следует, что ^ 6 Х„. Из (46) при т = t{, xt = vt, имеем:
\x(t) — vt\2 :¾ |ж(*,.) —v^|2 Vt > ^. Переходя к пределу сначала при t —»+оо,
затем г —»оо, отсюда получим lim x(t) = vt. Тогда lim f(x(t)) = f(vt) =
t —> ОО ( -4 ОО
= /*, lim /4^(0) = /4^) = 0, а из (45) следует: lim x(t) = 0. Теорема 6
(-too t —* оо
доказана. D
Для сильно выпуклых функций несложно получить оценку скорости метода (45).
Теорема 7. Пусть функция f(x) е С ,1(Еп) и сильно выпукла на Еп, а функция
оо
a(t), Vt^O, J a(t)dt =+00. Тогда для траектории x(t) системы (45) с любым начальным
о
условием х(0) = а^ справедлива оценка:
\x(t) -zj^-zjexpf-^ J а(т)йт) Vt ^ О, (47)
\ 0 '
где постоянная fj, > 0 взята из теоремы 4.3.3.
Доказательство, Прежде всего заметим, что по теореме 4.3.1 точка минимума :¾
функции /(ж) на В" существует и единственна, а по теореме 4.2.3 /'(а:4) = 0. Положим
!/(<)= 1И<)-ад2, ОО. (48)
Тогда с учетом (45) и теоремы 4.3.3 имеем:
V(t) = (x(t) - xt, x(t)) = -a{t)tf'(x(t)) - f'(xt), x(t) -xt)^
s:-^a:(t)|a;(t)-ag2 = -2^a:(t)V(t), Vt > 0; V(0) = 1¾ ~ *J2/2.
Отсюда следует: -тг ( V(t) exp(2^ J а(т)Лт)) ^ 0 Vt ^ О, Интегрируя это неравенство,
получим dt v v о П
0^ V(t) sC 1/(0) exp(-2^ \ а(т)А-) = 1¾ - zj2 exp(-2^ J a(r)dr) /2,
\ 0 / \ 0 /
что равносильно оценке (47). Теорема 7 доказана. П
Пользуясь терминологией, принятой в теории устойчивости обыкновенных
дифференциальных уравнений [328; 376; 588; 694], можно сказать, что в теореме 7 доказана асимптотическая
устойчивость системы (45) относительно точки равновесия xt этой системы. Для
доказательства этого факта использован второй метод Ляпунова, в качестве функции Ляпунова была взята
функция (48). В связи с этим полезно заметить, что при исследовании многих методов
минимизации явно или неявно используется второй метод Ляпунова или его дискретный аналог; в
качестве функции Ляпунова наряду с (48) часто используются также функции V(t) = /(a;(t)) — Д,
V(t) = |/'(a;(t))|2 и др. Систематическое исследование сходимости методов минимизации с
помощью метода Ляпунова проведено в [77].
Существуют и другие дифференциальные уравнения, траектории которых являются
минимизирующими. Например, так называемый метод тяжелого шарика [74] заключается в
рассмотрении системы дифференциальных уравнений вида:
x(t) + x(t) + a(t)f(x(t)) = 0, t ^ О, a(t)>0. (49)
§ 1. ГРАДИЕНТНЫЙ МЕТОД
249
Оказывается, траектории системы (49) при довольно широких предположениях сходятся к
точке минимума функции f(x) на Еп, причем скорость сходимости, вообще говоря, выше, чем
у траекторий системы (45).
Следует заметить, что непрерывные методы минимизации привлекательны тем, что для
приближенного решения возникающих здесь задач Коши могут быть использованы не только
метод ломаных Эйлера, но и другие известные методы [59; 74; 89; 481], которые, возможно,
будут сходиться быстрее и лучше приспособлены для минимизации овражных функций,
приводящих к так называемым жестким системам дифференциальных уравнений. На этом пути
можно получить различные классы дискретных методов минимизации, которые подчас трудно
обнаружить, оставаясь в рамках привычных представлений, навязанных итеративными
схемами. Перечисленные обстоятельства стимулируют развитие непрерывных методов решения
экстремальных задач (см., например, [25; 26; 28-30; 732]), Непрерывные аналоги некоторых
методов изложены ниже в §§ 2, 6, 11.
7. В заключение отметим, что градиентный метод, вообще говоря, хорошо работает лишь на
первых этапах поиска минимума, когда точки хк из (3) не слишком близки к точке минимума
xt, а вблизи точки xt расстояние \хк — xt\ часто перестает уменьшаться, сходимость метода
ухудшается. Это связано с тем, что в окрестности точки минимума градиент f'(xk) близок
к нулю, главная линейная часть приращения /(хк) — /(xt), на базе которой выбирается
направление спуска в методе (3), становится малой, усиливается влияние квадратичной части
приращения, метод (3) становится слишком чувствительным к неизбежным погрешностям
вычислений. Поэтому вблизи точки минимума при необходимости пользуются более точными и,
вообще говоря, более трудоемкими методами, лучше учитывающими не только линейные, но
и квадратичные части приращения.
Упражнения
1. Описать различные варианты градиентного метода для задачи из примера 2.2,2,
2. Установить сходимость, метода скорейшего спуска для функции (5); описать другие
варианты градиентного метода для этой функции.
3. Рассмотреть метод скорейшего спуска и другие варианты градиентного метода для задачи
минимизации функции f(x) = \Ах - Ь\2, х е Еп, где А —матрица порядка т х п, b е Еп;
исследовать их сходимость.
4. Рассмотреть метод скорейшего спуска для минимизации функций f(u) = х■ + ay , и =
= (х, у) е .Б2, и f(u) = x2 + y+az2, и = (х, у, z) €Е3, при различном начальном приближении
■Uq, считая коэффициент а намного больше единицы.
5. Доказать теоремы 1, 2 для метода (3), (7).
§ 2. Метод проекции градиента
1. Будем рассматривать задачу
/(i)-»inf; хеХСЕп, (1)
где множество X необязательно совпадает со всем пространством Еп, а
функция /(ж)еС'(1). Непосредственное применение описанного выше
градиентного метода в случае X Ф Еп может привести к затруднениям,
так как точка хк + 1 из (1.3) при каком-то к может не принадлежать X.
Однако эту трудность можно преодолеть, если полученную с помощью
формулы (1.3) точку хк — akf'(xk) при каждом к проектировать на множество
X (см. определение 4.4.1). В результате мы придем к так называемому
методу проекции градиента.
А именно, пусть 2¾ е X — некоторое начальное приближение. Далее
будем строить последовательность {хк} по правилу
хк + 1=1>х(хк-акГ(хк)), к=0,1,..., (2)
250 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
где ак — положительная величина. Если X — выпуклое замкнутое
множество и способ выбора {ак} в (2) задан, то в силу теоремы 4.4.1
последовательность {хк} будет однозначно определяться условием (2). В частности,
при X = Еп метод (2) превратится в градиентный метод.
Если в (2) на некоторой итерации оказалось xk + l = хк (например, это
случится при f'(xk) = 0), то процесс (2) прекращают. В этом случае точка хк
удовлетворяет необходимому условию оптимальности хк =,P^(xk — akf'(xk))
(см. теорему (4.4.3), и для выяснения того, является ли в действительности
хк решением задачи (1) или нет, при необходимости нужно провести
дополнительное исследование поведения функции f(x) в окрестности точки хк.
В частности, если f(x) — выпуклая функция, то такая точка хк является
решением задачи (1).
В зависимости от способа выбора ак в (2) можно получить различные
варианты метода проекции градиента. Укажем несколько наиболее
употребительных на практике способов выбора ак.
1) Введем функцию одной переменной дк(а) = f(Px(xk — af'(xk)), а >0,
и определим ак из условий
St(«*)= inf ft(«) = A*. «t>0- (3)
Очевидно, при X = En метод (2), (3) превратится в метод скорейшего
спуска. Поскольку величину ак из условий (3) удается найти точно лишь в
редких случаях (возможно также, что нижняя грань в (3) не всегда
достигается), то ак на практике определяют приближенно из условий типа (1.6)
или (1.7).
2) Иногда приходится довольствоваться нахождением какого-либо ак >0,
обеспечивающего условие монотонности: f(xk + i)<f(xk). Для этого обычно
выбирают какую-либо постоянную а > 0 и в методе (2) на каждой итерации
берут ак = а, а затем проверяют условие монотонности и при
необходимости дробят величину ак = а, добиваясь выполнения условия монотонности.
3) Если функция f(x) принадлежит Ci,l(X) и константа Липшица L для
градиента }'(х) известна, то в (2) в качестве ак можно взять любое число,
удовлетворяющее условиям
0<£0^ak^2/(L+2e), (4)
где Eq, е — положительные числа, являющиеся параметрами метода.
4) Возможен выбор ак из условия
/(¾)-/(^(¾ - «*/'(**)))> Ф*-^К - «*/'Ю)12> (5)
где е >0 — параметр метода. Для определения такого ак можно взять какое-
либо число ак = а (например, а = 1) и затем дробить его до тех пор, пока
не выполнится условие (5). Если f(x)e Cl,l(X), то нетрудно показать, что
выполнения условия (5) можно добиться за конечное число дроблений.
5) Возможно априорное задание величин ак из условий
оо оо
ак>0, к =0,1,...; Eat = 0°. Е а1 < °°> (6)
fc=0 t=o
например, ак = (к + I)-1, к =0, 1,... Сходимость метода (2), (6) будет
исследована в § 3.
Заметим, что описанные здесь варианты метода (2) при X = Еп переходят
в соответствующие варианты градиентного метода.
§ 2. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА
251
На практике для ускорения сходимости вместо (2) часто пользуются
более общим вариантом метода проекции градиента
^ + 1=^+ Pk(PX(xk ~ <*кГ(Хк)) ~Хк) =
= №^-a4/'W) + (l-AK. O<0k^l,ak>O, (2')
где параметры ак, /Зк могут выбираться различными способами.
Заметим, что в методах (2) или (2') на каждой итерации, кроме выбора
параметров ак, /Зк, нужно еще проектировать точку на множество X или,
иначе говоря, решить задачу минимизации
Фк(х) = \х-(хк-акГ(хк))\2^Ы, хеХ; (7)
здесь возможно использование функции Фк(х) = \х—хк\2+2ak(f'(xk), х—хЛ,
отличающейся от предыдущей функции постоянным слагаемым. Задачу (7)
можно решать приближенно и вместо точки хк + 1еХ ,Фк(хк+1) = 1п{Фк(х) =
= Фк* определить ее приближение zk + i из условий х
гк + 1еХ:Фк(гк + 1)^Фк. + *к2. (8)
Предполагая, что X —выпуклое замкнутое множество, из (8) с помощью
неравенства (4.3.3) имеем \zk + l - xk + lf < Фк(гк+1) - Фк(хк+1) ^ <5| или
zk + ieX: \zk + i-xk + i\^Sk.
Конечно, задачи (7), (8) далеко не всегда просто решаются. Поэтому
методом проекции градиента обычно пользуются лишь в тех случаях, когда
проекция точки на множество легко определяется. Например, когда
множество X представляет собой шар в Еп, параллелепипед, гиперплоскость,
полупространство или положительный ортант (см. примеры 4.4.1-4.4.6),
задача проектирования точки решается просто и в явном виде, и реализация
каждой итерации метода проекции градиента в этом случае не вызывает
особых затруднений. Если же задача проектирования для своего решения
в свою очередь требует применения тех или иных итерационных методов,
то эффективность метода проекции градиента, вообще говоря, значительно
снижается.
2. Остановимся на вопросах сходимости метода (2), (4).
Теорема 1. Пусть X — выпуклое замкнутое множество из Еп,
функция f(x)eCi-i(X), inif(x) = ft>—oo. Тогда для
последовательности {хк}, полученной методом (2), (4) при любом начальном
приближении ooq, имеет место соотношение lim \xki — xk\ — 0. Если при этом мно-
к —i оо
жество М(х0) = {х: хеХ, f(x)^.f(x0)} ограничено, то lim р(хк, 5t)=0,
к ~> оо
где St = {х: х е М(х0), (f'(x), v - х) > 0 при всех v е X}.
Доказательство. Из неравенства (2.6.7) при у = хк, x = xk+i имеем
fM-f(xk+l)^{f4xk),xk-xk+l)-(L/2)\xk-xk + l\\ к =0,1,... (9)
Из (2) и теоремы 4.4.1 следует, что
(хк + \~ К - <*кГ(хк)]> x~xk + i)^Q УхеХ.
Перепишем это неравенство в виде
(f'(xk),x-xk + i)^(xk-xk + ux-xk + i)/oik, к=0, 1,... (10)
252 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Отсюда при х = хк с учетом условия (4) получим
ик+\
(/4¾). хк -xk+l) >\хк-xk+l\2/®k >(L/2+ £)\хк- хк |2
Подставим эту оценку в (9):
f(xk)-f(xk + i)^£\xk-xk + i\2, к=0,1,... (11)
Так как f(xk) > /„ > -оо и последовательность {/(¾)} — убывающая, то
существует конечный предел lim /(¾) ^/, и, следовательно, lim (/(¾) —
к —> оо к ~* оо
- /(¾ ,)) = 0. Отсюда и из (11) сразу получим \im \хк —хк ,\=0.
к-* оо
Пусть теперь множество М(х0) ограничено. Так как согласно (11)
f(xk + l)^f(xk)^•••^f(xo)^ то (¾} £ М(^. По теореме Больцано—
Вейерштрасса ограниченная последовательность (¾} имеет хотя бы
одну предельную точку. Пусть xt — произвольная предельная точка (¾} и
(¾ } —» xt. По доказанному lim \хк { - хк\ = 0, поэтому (¾ } —» xt. Пере-
т к ~> оо m+l
ходя в (10) к пределу при к = кт —»оо, с учетом условий (4) и
непрерывности f'(x) получим (/ (xt), х - xt) ^0 при любом х е X, т. е. ж„ € 5„. По
лемме 2.1.2 расстояние р(х, St) непрерывно по х, поэтому lim р(хк , St) =
m—too т
= p(xt, St) = 0. Отсюда следует, что {р(хк, St)} имеет единственную
предельную точку, равную нулю, т. е. lim р(хк, 5,,) = 0. Теорема 1 доказана. D
к —> оо
Теорема 2. Пусть выполнены все условия теоремы 1 и, кроме
того, функция f(x) выпукла на X. Тогда для последовательности {хк}
из (2), (4) имеем
lim /(¾) = /t, 11т^Дф) = 0, (12)
к ~> оо к —юо
причем справедлива оценка
О^/Ю-Л^О,*-1, C0 = const>0, fc = l,2,... (13)
Доказательство. Из ограниченности M(xq), непрерывности f(x),
согласно теореме 2.1.2, следует /, > —оо, Xt = {х: х е X, f(x) = /Л ф 0,
Xt С M(xq). Возьмем произвольную точку xt 6 Xt. Из неравенства (4.2.4)
тогда имеем
0 < afc = /(¾) - /(¾) =¾ (/4¾). =* - х*) =
= (f'(xk),xk-xk + i)-{f'(xk),x*-xk + i), к =0,1,...
Пользуясь неравенством (10) при х = xt и условием (4) выбора ак, отсюда
получим
0< ак < (f'(xk), хк - хк+1)-(хк - xk + l, xt - хк+1)/ак <
<l^-^ + il(sup \f'(x)\ + D/e0) = Ci\xk-xk + l\, k=0,l,... (14)
мы
Здесь мы учли ограниченность множества M(oOq), поэтому D = sup \и —
-v\ <оо и, кроме того, |/'(а:)| < \f'(x)-f'(x0)\ + \f'(x0)\ < L |ж —^| + |/'(ai,)| <
< LD + 1/4¾)] при любом я; е М^), так что sup \f'(x)\ < оо. Из (11),
мм
(14) следует afc - ak + l ^ eCf2a^ = Аа\, к=0, 1,... Отсюда с помощью
леммы 2.6.4 придем к оценке (13), из которой также следует первое из
равенств (12). Второе равенство (12) является следствием теоремы 2.1.2. D
§ 2. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА
253
Рассмотрим случай сильно выпуклой функции, предполагая, что в
методе (2) величина ак выбирается постоянной.
Теорема 3. Пусть X — выпуклое замкнутое множество, функция
f(x)eCi,i(X) и сильно выпукла на X. Пусть0< a <2pL~2, где
постоянные р, L, р < L, взяты, из (2.6.6), (4.3.12). Тогда последовательность
{хк}, получаемая из (2) при ак = а, к = 0, 1,..., сходится к точке
минимума xt, причем справедлива оценка
\xk~x*\ =¾ К- х*\(я(а))к, fc = 0, 1,..., (15)
где q(a)=(l - 2ра + a2L2)1'2, 0 < q(a) < 1.
Доказательство. Введем отображение
Ax = Px(x-af'(x)),
действующее из X в X. Покажем его сжимаемость при 0 < a <2pL~2. С
помощью теоремы 4.4.2 имеем
\Аи - Av\2 = \Vx(u - «/'(«)) - Vx{v - af'(v))\2 <
< |u - af'(u) -v + af(v)\2 = \u- v\2 + a2\f'(u) - f'(v)\2 -
- 2a(f'(u) - /'(«), u-v)^\u- v\2(l + a2L2- 2pa) = q2(a)\u - v\2,
т. e.
\Au - Av\ < q(a)\u - v\, u, v € X. (16)
Так как 0 < a < 2pL~2, то 0 < q(a) < 1. Это значит, что отображение А —
сжимающее. Заметим также, что замкнутое множество X С Еп
представляет собой полное метрическое пространство с метрикой р(и, v) = \u — v\.
Следовательно, можно пользоваться принципом сжимающих отображений
[393]. Метод (2) при ак = а, записанный в виде xk + l =Ахк, представляет
собой известный процесс поиска неподвижной точки xt сжимающего
отображения А, т. е. точки xt, для которой xt = Axt. Известно [393], что такая
точка xt существует, единственна и lim 1¾ — ж41 = 0. Из (16) следует, что
к —* оо
\хк-хт\^{я{<х))к\хо-хт-к\ Ут^к.
Отсюда при m —»оо получим оценку (15). Так как xt = Vx(xt- af'(xt)),
то из теоремы 4.4.4 следует, что xt — точка минимума функции f(x) на
множестве X. Теорема 3 доказана. D
Заметим, что наименьшее значение q(a) из (15) при 0 < a <2pL~2
достигается при at = pL'2 и равно q(at) = (1 - (p/L )2)1/2.
3. Следуя [24], рассмотрим сходимость метода (2), (4), не требуя, в отличие от теорем 1,
2, ограниченности множества М(х0). Кроме того, будем считать, что вычисление градиента
функции и проектирование на множество на каждой итерации проводятся с погрешностями.
Теорема 4. Пусть X — выпуклое замкнутое множество из Еп, int X ф 0, функция
f(x) выпукла на X, f(x)£ С1, '(.X"), ft > —оо, Xt^0. Пусть вместо точного значения
градиента f(x) и проещииТ> x(x)~V(x) известны их приближения J'k(х) и соответственно
Vk(x) с погрешностью
\f(x)-fk'(x)\^Sk, хех; \V(x)-Vk(x)\^C06k, хеЕп,
C0 = const>0, Sk^0, it =0,1,...; Y, Sk = 6<oo. ^
t = o
254 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Наконец, пусть последовательность {хк} определяется условиями
4 + \=Vk(4-<*kh\4)), <%6*. ^=0,1,..., (18)
где ак выбирается так:
0<е0^ак^Ц\-е)/Ь, к =0,1,..., 0<е<1. (19)
Тогда {хк} сходится к некоторой точке vt eXt.
Доказательство. Наряду с {хк} введем вспомогательную последовательность {vk},
определяемую следующим образом:
vk=V(xk-akf(xk)), *=0,1,...; v0 = ab. (20)
Отсюда и из (18) с помощью теоремы 4.4.2 и условий (17) получаем
\ч +1 - «*1 £ \Рк(ч - «*/*'(**)) - Пч - «*/*'(**))! +
+ \V(xk - akfk'(xk))-V(xk - akf\xk))\ ^ С06к + ak\fk\xk) - f'(xk)\ ^
^C0Sk + (2(l-e)/L)Sk = CiSk, fc=0,l,... (21)
Возьмем произвольную точку xteXt. Согласно теореме 4.2.3 тогда
</'(**),*-^>>0, хеХ (22)
Из (20) и неравенства (4.4.1) получаем
<«*-** + «*/'(**),*-«*> >0 МхеХ. (23)
Положим в (23) х = xt, а (22) умножим на ак >0 и примем x = vk. Сложим получившиеся
неравенства
<«*-*«н**-«*> + «*</Ч**)-/Ч**).^-«*>>0, *=0,1,... . (24)
Преобразуем каждое слагаемое в правой части (24). Прежде всего имеем
Чч -ч<х*-ч) = 1¾ -хА2-1¾ -ч\2-К -х*\2- (25)
Далее, воспользуемся неравенством (4.2.20) при и = хк, v = xt, w = vk; получим
(f\xk)-f'(xt),xt-vk)^(L/4)\xk-vk\2, *=0,1,... (26)
Подставив (25), (26) в (24), получим
1¾ - **|2 - 1¾ - **|2 - (1 - "kL/2)\xk -vk\2> 0.
Отсюда, учитывая условие (19), имеем
К-**|2Ж-**|2 + еК-^|2. it =0,1,... (27)
Далее, воспользуемся леммой 2.6.10при zk=xk, zt = xt, 4iik + i=vk; из (17), (21), (27) получим
lim \xk-xt\= lim \vk-xlt\<oo, lim \vk-xk\ = 0. (28)
к —* 00 k~~*oo k~~*oo
Отсюда следует, что последовательность {хк} ограничена. Тогда существует хотя бы одна
предельная точка vt этой последовательности и подпоследовательность {хк }, сходящаяся к
v.. Из (28) имеем lim vh =«..
Согласно (23) с учетом (19) получаем
(/4¾). я - vk) 3* -(¾ - xfc, х - vk)ak ' > -1¾ - xfc||x - «fc|eo'.
Отсюда при к = кт -» оо будем иметь (/'(«*), х - «„> > 0 при всех ieX. По теореме 4.2.3
тогда и, S Х„. Вспомним, что неравенство (27) было получено для любой точки х е X . В
частности, (27) верно и для xt = vt. Но vt —предельная точка последовательности (¾}. Из
леммы 2.6.10 тогда следует, что {хк} сходится к vt. Теорема 4 доказана. П
§ 2. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА
255
Замечание 1. Если в (17) 8к =0, к =0,1,..., то из (18)-(20) следует, что xk + l = vk,
к = 0, 1,... Тогда из (27) имеем
\Ч-х*\2>\Ч + 1-х*\2 + Фк-Ч + 1\2, *=0, 1 Уя;е.Уф.
Пользуясь произволом в выборе xt eXt, отсюда получаем
\xk~v*\>\xk + i-v*l Р{хк>х*)>Р(хк + 1>х*)< А: =0,1
причем равенство здесь возможно лишь при xk + i = хк, что в силу теоремы 4.4.3 означает
хк eXt. Таким образом, при точной реализации метода (17)-(19) расстояние от точки хк
до множества Xt или до точки vt монотонно убывает. Как мы видели, таким же свойством
обладает градиентный метод (1.3), (1.21), (1.22).
4. Опираясь на неравенства, полученные при доказательстве теоремы 4, можно оценить
скорость сходимости метода (2), (4) для сильно выпуклых функций, причем, в отличие от
теоремы 3, новая оценка оказывается неулучшаемой на классе сильно выпуклых функций,
принадлежащих С1' 1(Х).
Теорема 5. Пусть X —выпуклое замкнутое множество из Еп, int X ф 0, а
функция f(x) сильно выпукла на X и принадлежит С1,1(Х). Пусть последовательность {хк}
построена методом (2) при ак = а, к = 0, 1,..., О < а < 2/L. Тогда
1**-^1 £(«(«))*!<%-*а *=0, 1,-.., (29)
где
1-^а, 0<a<2(i+^)-1,
iof-1, 2(L + fi)'{ $a<2L~\
О < q(a) < 1, постоянные ц, L взяты из (2.6.6), (4.3.12), a xt —точка минимума f(x) на
X. Наименьшее значение q(a) при 0< a <2L~ достигается при a = at = 2(L + fj,)~ и
равно q(at) = (L — ц)(Ь + ц)~1.
Доказательство. Из теоремы 4.3.1 следует, что Д > -оо, Xt состоит из единственной
точки х . Тогда из теоремы 4 имеем lim \xk — х | = 0. Здесь мы предполагаем, что в (17) 6к =0,
к -> оо
к =0, 1,..., поэтому из (18), (20), (21) следует vk = хк + (, к = 0, 1, Учитывая последнее
равенство и условие ак = а, подставим (25) в (24). Получим
К + 1 - х*\2 % \ч~х*\2 - К + 1 -ч\2 + 2«</'Ы -/4¾). x*~xk + i) =
= \хк - xj2 ~\хк-хк + {- a{f'(xk) - f'(xj)? +
+ а2\Г(хк)-Г(х,)\2-2а(Г(хк)-Г(х,),хк-х,), fc =0,1,-.. (30)
Вспомним неравенства (4.3.17), (4.3.18), из которых имеем
1/4¾)-/'0OI2 + £/4¾-^|Ч(ь +/0(/4¾)-/'ОО,хк~хХ *=o,i,.'.. (31)
/4¾-¾^ 1/4^-/4¾)^^¾^. * = o,i,... (32)
Из (30), (31) следует
1¾+ ,-^141¾-^|2+а2|/'Ы-/'Ю12-
-2a(L + »Г{\Г(хк)- f\x,)\2 -2аЬц{Ь + ц)-{\хк-х,\2 =
= a[a - 2(L + /0^11/4¾) - /'OOI2 + [1 - 2<*Ь»(Ь + »)~l]\xk - xf, к = 0,1,... (33)
Рассмотрим два случая:
1) если 0< a <2(£ +^)-1 <^-1, то из (33) и левого неравенства (32) имеем \xk+l — xj2^.
** 1¾ - я*|2И« - 2(i + /0~ V* + 1 - 2aLli{L + ц)~{] = (1 - ац)2\хк - xt\2;
2) если L~i ^2(i+^)_1 ^ a <2i_1, то из (33) и правого неравенства (32) получим \хк + {—
~х*\2 ^ \xk-x*\2[a(.a~2(L +ii)~{)L2+\-2aL^L + ^yi]=(La-\)2\xk-xlt\2. Объединяя оба
случая, имеем |зл + i —я*| ^ l(a)\xk~x*\< А; =0,1,..., откуда следует оценка (29). Из графика
256 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
функции q(a) (рис. 5.5) видно, что функция q(a) достигает минимума при 0 < а < 1L в
точке at = 2(L + ^)-1, причем q(at) = (L — ft)(L + ц). Теорема 5 доказана. П
Приведем пример, показывающий, что оценка (29) неулучшаема на классе сильно выпуклых
функций из С''1 (X).
Пример 1. Пусть и = (х, у)еХ = Е , f(u) = (Lx2 + цу2)12, 0 < ц ^ L. Ясно, что эта
функция сильно выпукла с константой х = ц, принадлежит С • (Е ) с константой L и
достигает минимума на Е2 в точке xt = (О, 0). Процесс (2)
при ак — а, 0 < а < 1L~ , имеет вид
xk + l=xk- aLxk = (1 - aL)xk>
Ук + 1=Ук-аМк = (1-а»)Ук<
fc=0,l,...
3*.
а Положим здесь а = 1{Ь + ц)~1, q = (L - fi)(L + /i)-1.
L+ И L Тогда xk + l=-qxk,yk + l=qyk. Следовательно, \ик + , -
Рис. 5.5 -Xlr\ = q\uk\ = qk + 1|iiol, т. е. оценка (29) неулучшаема.
Заметим, что если в теоремах 1-5, в частности, X = Еп, то мы получим сходимость
соответствующих вариантов градиентного метода (1.3).
5. Опираясь на подходы к непрерывным методам минимизации, развитые
в работе А. С. Антипина [25], можно предложить следующий непрерывный
вариант метода проекции градиента, основанный на системе
дифференциальных уравнений:
x(t) = Vx(x(t)-a(t)f'(x(t)))-x(t), t>0, (34)
где a(t)>0 — заданная функция (параметр метода), X— выпуклое
замкнутое множество из Еп. В частности, если X = Еп, то (34) превращается в
систему (1.45). Согласно теореме 4.4.4 решение xt задачи (1) удовлетворяет
уравнению Vx(xt — a(t)f'(xt)) — xt = 0 при Vt ^0. Это значит, что каждая
точка xt е Х„ является точкой равновесия (стационарным решением)
системы (34). Можно ожидать, что при некоторых ограничениях на функцию
f(x), a(t) траектории x(t) системы (34) при больших i приближаются ко
множеству Х„. Справедлива
Теорема 6 (Антипин). Пусть функция f(x)€ С1, {{Еп), выпукла на
Еп, /* > -оо, Xt^0, а функция a(t) непрерывно дифференцируема при
t ^0, a(t)^a0>0, a'(t)^.0 Vt >0. Тогда траектория x(t) системы (34)
с любым начальным условием х(0) = :¾ е Еп определена при всех t > 0 и
существует точка vt е Х„ такая, что
lim x(t) = vt, lim f(x(t)) = ft, lim x(t) = 0.
t -* +00 (-> +00 t -* +00
Доказательство. При выполнении условий теоремы 0 < а0^ a(t)^.
< а(0), и с учетом свойства сжимаемости оператора проектирования
(теорема 4.4.2) нетрудно доказать, что правая часть Vx(x — a(t)f'(x)) — х
дифференциального уравнения (34) удовлетворяет условию Липшица по х,
непрерывна по совокупности (t, х). Тогда задача Коши для уравнения (34)
с начальным условием 0:(0) = ¾ имеет решение x = x(t), определенное при
всех t >0 (см. ниже теорему 6.1.1). Используя характеристическое
свойство проекции (неравенство (4.4.1)) уравнение (34) можно записать в
эквивалентном виде
((x(t)+x(t))-(x(t)~a(t)f'(x(t))),v-(x(t)+x(t)))^0 VveX, Vt^O. (35)
§ 2. МЕТОД ПРОЕКЦИИ ГРАДИЕНТА
257
Кроме того, в силу теоремы 4.2.3 имеет неравенство
(f>(xt),v-xt)>0 или a(t)(f'(xt),v-xt)>0
VveX, Vi^O, VxteXt. { '
Согласно (34) тогда x(t) + x(t) 6 X Vt > 0 (сама траектория x(t) может
и не принадлежать X при каких-то i > 0). Положим в (35) v = xt, в (36)
v = x(t) + x(t) и сложим получившиеся неравенства. Будем иметь
(x(t) + a(t)(f'(x(t)) - f'(xj), х, - x(t) - x(t)) > 0
или
\x(t)\2 + (x(t), x(t) - x.) + a(t)(f'(x(t)) - fix,)), x(t) - x.) +
+ a(t)(f'(x(t))-f'(xj),x(t))^0 Vi>0, Vx,eX,.
Отсюда с учетом неравенств a(i)>0, (f'(x(t))—f'(xt)), x(t)-xt)^0 Vt ^0
(теорема 4.2.4) имеем:
\4t)\4^\x(t)-xt\4a(t)^(f(x(t))-f(xJ-(f\xJ,x(t)-^)H0 Vt>0.
Интегрируя это неравенство на произвольном отрезке [г, t], i > т > О, и,
преобразуя интеграл от третьего слагаемого по частям, получим
$ \x(s)\4S + ±\x(S)-xt\* ~ +a(8)(f(x(8))-f(x,)-
- (/'(^), x(t)- х,)) S =' - \ a'(s)(f(x(s)) - /(¾) ■
-(f(xt),x(s)-xt))ds^0 Vt>r>0, Vi,€l,.
Отсюда с учетом неравенств cx'(t) < 0, a(t) >0, (f'(xj, x(t) — xj) ^ 0
(теорема 4.2.3), /(a;(t))-/(a;J-(/'(a;J, x(t)-xj}^0 (теорема 4.2.2) имеем
\ \x(s)\4s + l\x(t)- zj2 < \\х{т) - zj2 + a(r)(f(x(r)) - f(xt))
Vt > г > 0, Ух, е Xt.
Из (37) при г = 0 следует
\ \x(s)\4s + ±\x(t) - zj2 ^ slab — ^12 + "(°)(/Ю - /(¾)) Vi > 0.
о
Отсюда заключаем, что траектория x(t) равномерно на t > 0 ограничена.
оо
Кроме того, J \x(s)\2ds < оо, и поэтому найдется последовательность {t{} —»
о
—»+оо, для которой ж(4г.)—»0. Кроме того, пользуясь теоремой Больцано —
Вейерштрасса, можем считать, что последовательность {x(tt)} сходится к
некоторой точке vt. Так как множество X замкнуто, a x(t)+x(t)eX Vt >0,
то lim (x(t.) + 0:(^)) = ¾ е X. Далее, переходя в (34) к пределу при * = ^ —►
г -~* оо
-4оо с учетом непрерывности оператора проектирования (теорема 4.4.2),
lim a (ti) = а (оо) > а0 > 0, получим
г -~> оо
0 = ^(ч-а(оо)/'(«ф))-Ч- (38)
258 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Согласно теореме 4.4.4 это значит, что vt 6 Xt. Полагая в (37) г = t. и
xt = vt, имеем
JN*) - «J2 ^ ъЫЬ) - vj + a(tt)(f(x(tt)) - /К)) Vi > tv
Отсюда, переходя к пределу сначала при t —» +оо, затем t{ —» +оо с учетом
равенства lim 0:(^) = ¾. получим: lim a;(i) = ¾. Тогда lim f(x(t))=-f(vt) =
i —too t -too £-~KX>
= /„. Наконец, из уравнения (34) при t —» +оо с учетом равенства (38)
имеем: lim i(i) = 0. Теорема б доказана. D
(-too
Для сильно выпуклых функций можно доказать следующую оценку скорости сходимости
метода (34) при a(t) = а0 = const [25]:
N^-^KK-zJexpf-jj Ь(т)А-),
4 0 '
где Ь(т) = ^(1-¾ приО<а<г^7г, Ь(т)= а£ (l - ^) при а >-j-1^.
При построении непрерывных методов проекции градиента могут быть использованы
дифференциальные уравнения второго и более высокого порядков. Так, например, для выпуклых
задач (1) в [25] исследована сходимость процесса
/3(t)x(t)+x(t)+x(t)=Vx(x(t)-a(t)f'(x(t)), О О, /3(*)>Д,>0, (39)
и его двухшагового дискретного аналога.
При X = Еп метод (39) превращается в метод тяжелого шарика (1.49). Непрерывный и
дискретный варианты методов более высокого порядка см., например, в [520—521].
Упражнения
1. Вычислить несколько итераций метода проекции градиента при различных способах
выбора ак в (2) для функции
/(u) = (0)-1)2 + (2/+1)2. ,
иеX = El = {и = (х,у)еЕ2: х>0, у>0}.
Рассмотреть начальные приближения 1¾ = (0, 0), 1¾ = (0, 1), 1¾ = (1,0), г^ = (1, 1).
2. Описать одну итерацию метода проекции градиента для функции (1.5), считая, что
множество X представляет собой шар, гиперплоскость, параллелепипед, полупространство или
положительный ортант (см. примеры 4.4.1—4.4.6). Исследовать сходимость метода.
3. Рассмотреть метод проекции градиента для функции f(x) = \Ах — Ь\2, где А — матрица
порядка т х п, be Ет, считая, что множество X имеет вид, описанный в примерах 4.4.1-
4.4.6. Исследовать сходимость.
§ 3. Метод проекции субградиента
1. В рассмотренных выше градиентном методе и методе проекции градиента требовалась
дифференцируемость минимизируемой функции. Однако для выпуклых функций указанные
методы более естественно описать на языке субградиентов (см. § 4.6). А именно, пусть X —
выпуклое замкнутое множество из Еп, функция f(x) выпукла на X и ее субдифференциал
df(x) непуст при всех х е X. Тогда для приближенного решения задачи
/(x)-»lnf; хеХ, (1)
можно предложить следующий итерационный метод:
хк+\='рх(хк-акск)^ ак>°< ck^df(xk)< A: =0,1,..., (2)
где xq — некоторая точка из X, а субградиент ск выбирается из df(xk) произвольным образом.
Если при некотором к окажется, что xk + i = хк, то процесс (2) прекращается, так как в этом
§ 3. МЕТОД ПРОЕКЦИИ СУБГРАДИЕНТА
259
случае хк — решение задачи (1). В самом деле, при хк = Тх(хк — akck) согласно теореме 4.4.1
{хк - (¾ - акск), х — хк) = (ск, х - хк)ак ^ 0 или (ск, х- хк) ~& О при всех х&Х. Отсюда из
теоремы 4.6.4 следует, что хк е Xt.
Согласно замечанию 1 к теореме 4.6.4 точка xt е Xt тогда и только тогда, когда xt =
= Vx(xlt ~ ас*)> а > 0. гДе с* —некоторый элемент субдифференциала df(xtt). Отсюда ясно,
что итерационный процесс (2) представляет собой метод поиска неподвижной точки оператора
Vx(x - ас), с S df(x).
В том случае, когда функция f(x) дифференцируема во всех точках х£ X, метод (2)
превращается в метод проекции градиента, а при X = Еп — в градиентный метод. При выборе
длины шага ак в (2) можно руководствоваться теми же соображениями, которые были
описаны выше в § 1, 2. Мы здесь ограничимся рассмотрением случая, когда ак в (2) выбирается
из условий
оо оо
ак>0, к=0, 1,...; Е «t = °°. E«t<°°- (3)
k = 0 fc=0
Как уже отмечалось в § 1, в качестве ак можно взять ак = С(к + 1)_а, где С = const > О,
1/2 < а ^ 1; например, ак = (к + 1) , к = 0, 1,...
Метод (2), (3) не гарантирует выполнения условия монотонности /(¾) > f(xk + i) на
каждой итерации и сходится, вообще говоря, медленно, но если проекция точки на множестве X
и субградиент ск е df(xk) находятся несложно, то этот метод очень прост для реализации на
ЭВМ. Докажем его сходимость.
Теорема 1. Пусть X —выпуклое замкнутое множество из Еп, функция f(x)
определена и выпукла на некотором открытом выпуклом множестве W, содержащем X
(например, W=En). Пусть Д > —оо, множество Xt точек минимума f(x) на X непусто
и ограничено, и пусть, кроме того,
sup sup |с| = Л<оо. (4)
Тогда последовательность {xk}, определяемая условиями (2), (3), такова, что
lim /(¾) = Л, llm P(xk,Xt) = 0. (5)
Л —* оо h -~*оо
Доказательство. При сделанных предположениях функция f(x) непрерывна на X,
субдифференциалы df(х) непусты, выпуклы, замкнуты и ограничены при всех х&Х (см.
теоремы 4.2.15, 4.6.1, 4.6.2). Из ограниченности множества Xt и теоремы 4.2.17 следует, что
множество М(С) = {хеХ: f(x) ^ С} ограничено при любом С > Д. Множество Xt выпукло
и замкнуто в силу теоремы 4.2.1 и леммы 2.1.1.
Согласно определению 4.4.1 проекции точки на множество и теореме 4.4.2 имеем
Р2(Ч+1, Xt)=\xk+{-Vx(xk+{)\2^ \xk+{-Vx>(xk)\*=\Vx(xk-akck)-Vx{Vx{xk))\^
^ К-ауЛ-^х (xk)\2=p\xktXt)Wk\ck\2-2ak(ck, xk-Vx(xk))
или
2чк(ск,ч-Рх,(ч))^<х1Ы2 + рЧч,х*)~р2(*к + 1,хЛ * = 0,1,... (6)
Суммируя неравенства (6) по & от 0 до некоторого s > 1, с учетом условий (3), (4) получим
s т
£ 2^(^-¾-^(¾))<^2 £ *1 + р2(зъ,**)-р2К + 1-**К
к=0 • к=0
оо
^Л2 Е «! + Р2(^,^) = В<оо, »=1,2,... (7)
Далее, по определению субградиента имеем
О ^/(¾) -/. = /^)-/(^(¾))^¾.¾ -^.(¾)). * = 0,1,... (8)
Из (7), (8) следует, что числовой ряд
оо
£ а-кк^хк-тзх<хк))
к = 0
оо
с неотрицательными членами сходится. Но согласно (3) имеем Е ак — °°- Поэтому
СХОДИЛО
260 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
мость предыдущего ряда возможна лишь при lim (cf.,xl:—'Px (хк))=0. Это значит, что суще-
к —* оо *
ствуют номера кх <Щ,< ... <к <... такие, что
Д^Ч-ч -W>=o. <9>
Тогда из (8) при к = к —»оо получим lim /(¾ ) = Д. Кроме того, из (8), (9) следует, что
^ р —* ОО р
/(¾ K/*+sup(cfc ,¾ -Т>х (хк )) = С<оо,т.е.{хк }еМ(С). Но М(С) ограничено, а {жь } —
р р р р * р р р
минимизирующая последовательность, поэтому из теоремы 2.1.2 имеем lim р(хк , Х^) = 0.
Тем самым показано, что для подпоследовательности {:¾ }, удовлетворяющей условию (9),
справедливы равенства (5). Опираясь на это, покажем, что равенства (5) имеют место для
всей последовательности (хк}. Из (3), (4), (6), (8) получаем, что
Р2(хк + иХ,)^р2(хк1Х,) + а2\ск\2^р2(хк1Х^+а2А2, fc=0, 1,...
Это значит, что числовая последовательность ак =р (¾. Xt), к = 0, 1,..., удовлетворяет
условиям леммы 2.6.2, из которой следует существование предела lim р2(хк,Х1г). Так как под-
к —* оо
последовательность {р (хк , Xt)} сходится к нулю, то этот предел может равняться лишь
нулю. Следовательно, lim р(хк1 Xt) = 0. Покажем, что тогда lim /(¾) = Д. По условию
к —* оо к —*оо
множество Xt ограничено. Тогда последовательность (¾}. сходящаяся к Xt, также
ограничена. Возьмем любую предельную точку xt этой последовательности. Пусть {хк } —» xt.
Так как Xt — замкнутое множество и lim р(хк , Xt) = p(xt, Xt) = 0, то xt е Xt. А тогда
lim /(¾ ) = /(&*) = Д. Это означает, что числовая последовательность {/(¾)} имеет
единственную предельную точку, равную Д, т. е. lim /(¾) = Д. Теорема 1 доказана. П
к —*оо
Замечание 1. В условии теоремы 1 предполагается выполнение условия (4). В том
случае, когда X ограничено, то, как следует из теоремы 4.6.5, условие (4) всегда выполняется.
оо
Заметим также, что в теореме 1 вместо (4) можно потребовать сходимость ряда Е atlctl2-
к = 0
Замечание 2. Описанный выше метод проекции субградиента после некоторой
модификации можно использовать для решения следующей задачи выпуклого программирования:
/(x)-»inf; хеХ = {хвЕп: хвХ0, д{(х)^0, i = l,...,m}. (10)
Заметим, что система неравенств gt(x) ¢.0, i — 1,..., т, равносильна одному неравенству
д(х) ¢. 0, где д(х) = max gt(x), х е X. Кроме того, из выпуклости функций д{(х), г = 1,...
1 ^ г ^ т
..., т, на Х0 следует выпуклость д(х) на Х0 (см. теорему 4.2.7). Поэтому задачу (10) можно
переформулировать в виде эквивалентной задачи
f(x)-*M; хеХ = {хеХ0! д(х)^0}, (11)
также являющейся задачей выпуклого программирования.
Предположим, что субдифференциалы df(x), дд(х) непусты при всех х е Х0. Следуя [766],
рассмотрим метод
4 + 1=^x^4-акск)< А: =0,1,...; а^еХд, (12)
где {ак} выбирается из условий
оо оо
ак>0, fc=0,l,.., £ «1 + 7 = оо, Е«'<°°, 0<7<1, (13)
к=0 t=0
а субградиенты {ск} таковы, что
ck^df(xk) ПРИ 9(ч)^а1" ск^д9(ч) ПРИ 9(4)>al- (14)
Таким образом, метод (12)-(14) работает так: если ограничение g(x) ¢0 при х = хк не
нарушено или нарушено немного, то минимизируем функцию f(x), а если нарушение этого
§ 3. МЕТОД ПРОЕКЦИИ СУБГРАДИЕНТА
261
ограничения велико, то минимизируем функцию д(х). Если функции f(x), д(х)
дифференцируемы на Х0, то в (12), (14) вместо ск нужно брать соответствующие градиенты ] (хк) или
д'(хк). В качестве последовательности {ak}, удовлетворяющей условиям (13), можно взять,
например, ак = С(к + 1)_а, где С = const > 0, а число а таково, что 1/2 < а < (1 + 7)-1- В
частности, при а = 3/5, 7 = 1/2, С = 1 получим ак = (к + 1)~3/,S, к = О, 1, ...
Теорема 2. Пусть Х0 — выпуклое замкнутое множество из Еп, функции f(x), д(х)
определены и выпуклы на некотором открытом выпуклом множестве W, содержащем Х0
(например, W = En). Пусть Д = inf f(x)> —оо, множество Xt точек минимума задачи (11)
непусто, ограничено и, кроме того,
sup sup \с\ = А <оо.
x€X0cs8f(x)U8g(x)
Тогда для последовательности {хк}, определяемой условиями (12)-(14), справедливы
равенства (5).
Доказательство. При выполнении условий теоремы функции f(x), g(x) непрерывны
на Хр, субдифференциалы df(x), дд(х) непусты, выпуклы, замкнуты и ограничены при всех
х£Х0 (см. теоремы 4.2.15, 4.6.1, 4.6.2), а множество Xt выпукло и замкнуто (см. теорему 4.2.1
и лемму 2.1.1). Покажем, что множество
М(С{, С2) = {х е Х0: f(x) s: С,, д(х) ^ С2}
ограничено при всех С{ > inf f(x), С2 > inf д(х). В самом деле, М(Д, 0) = X, ограничено по
-¾ -¾
условию. Тогда по теореме 4.2.17 множество М(С{, 0) = {х: х е Х0, д(х) ^ 0, f(x) ^ С(}
ограничено при всех С( > inf/(.т). Теперь, фиксируя любое С(, по той же теореме 4.2.17 получаем
ха
ограниченность М(С{, С2) при каждом С2 > inf д(х).
ха
Нетрудно видеть, что неравенства (6), (7) сохраняют силу и для метода (12)-(14). Из (7)
имеем
Ё в* + 7вГ<с*,**-РХЫ><В<оо, , = 1,2,... (15)
Отсюда следует существование номеров к{ < Щ, < ■ ■. < кр < ... таких, что
(¾.¾ -Р* (**)><«*?. Р-1,2,... (16)
р р * р р
В самом деле, допустим, что (16) не имеет места. Тогда (ск, хк — Vx (хк)) > а^ при всех
к = О, 1,... Отсюда и из (15) имеем
t <*1 + 1^ t "k(ck,xk-Vx(xk))^B<^, s=l,2,..,
oo
что противоречит расходимости J] aj.+ 7i.
fc = 0
Тем самым показано существование подпоследовательности {хк }, удовлетворяющей
условию (16). Докажем, что
Ит /(0),) = Д, lim ^(^,^) = 0. (17)
р-»оо "р * р-»оо р
Сначала убедимся в том, что
Ч 6^/(¾). р= 1,2,... (18)
р р
Для этого достаточно показать, что д(хк ) ^ а^ , р = 1, 2, ..., и вспомнить условия (14).
Допустим, что д(хк )> ик при некотором р > 1. Учитывая, что тогда ск €дд(хк ) и, кроме того,
Vx (хк ) е Xt с X, т. е' д(Рх (хк )) ^ 0, из (16) имеем
» Р Р
ак < 9{Ч ) ** 9{хк ) ~ 9{VX {хк )) «: (ск ,хк -Vx (хк Ж <*£ .
Р Р Р * Р Р Р * Р Р
Получили противоречивое неравенство. Включения (18) доказаны, и попутно установлено, что
9(¾)¾¾7. Р=1,2,... (19)
262 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Множество номеров {к }, удовлетворяющих условиям (16), представимо в виде
объединения непересекающихся множеств /( = {к : /(¾ ) ^ Д} и I2 = {кр: /(¾ ) < Д}.
Сначала рассмотрим случаи, когда множество /( бесконечно. Из (16), (18) имеем
о ^ f{4) - л=f(\) - /(^,(¾)) *; (¾. \--рх,(\)) $«;. *р б л-
Отсюда следует, что /(¾ ) —» Д при р -»оо, fcp е /,. Тогда /(¾ ) ^ Сх < оо, и, кроме того,
согласно (13), (19) имеем д(хк )^ак ^ sup о^ = С2<оо, т. е. {хк }еМ(С{, С2), к е^.Так
как М(С1, С2) ограничено, то {хк , к el{} имеет хотя бы одну предельную точку. Не умаляя
общности, можем считать, что {хк } —» xt, к е /j. Из замкнутости Х0, неравенства (19) и
непрерывности д(х) следует, что ж^ е X, Но /(¾ ) -» /(¾) = Д при А;р -»оо, fcp е /(, так что
ж,, е Х^. Отсюда и из непрерывности р(х, XJ имеем р(хк , JCJ -»/)(¾. XJ = 0 при fcp -» оо,
Теперь рассмотрим случай, когда множество 12 бесконечно. Если к е /2, то /(¾ ) < Д, а
3(¾ )< сс^ < sup сс^ = С2 в силу (19). Это значит, что {хк } е М(Д, С2), A; S /2. Поскольку
множество М(Д, С2) ограничено, то (¾ , к S/2} имеет предельную точку. Не умаляя
общности, можем считать, что {хк } —» xt, А; е /2. Из (19) и замкнутости Х0 следует, что xtG. X.
Поэтому /(¾) 3* Д. С другой стороны, /(¾ )<Д, А: е/2, такчто lim /(¾ ) = /(а:*)<Д.
р г к е/я,р-*оо р
Следовательно, /(¾) = Д, т. е. i, е 1ф. Отсюда и из непрерывности /j^JCJ получаем
р(\> Х*) -* Р(х*< х*) = ° ПРИ кр -* °°' кР е J2-
Объединяя оба рассмотренных случая, заключаем, что для подпоследовательности (¾ },
р
удовлетворяющей условию (16), справедливы равенства (17). Отсюда, повторив
заключительные рассуждения из доказательства теоремы 1, убеждаемся в справедливости равенств (5) и
для метода (12)-(14). Замечание 1 сохраняет силу и здесь.
На этом закончим рассмотрение методов минимизации негладких выпуклых функций.
Отметим, что негладкие задачи в последние годы интенсивно исследуются, продолжается
разработка различных методов их решения [73; 226; 251; 256; 263-266; 302; 314; 318; 361; 386;
396; 426; 434; 495; 502; 542; 572; 586; 613; 718; 720; 769; 777; 795].
Упражнения
1. Рассмотреть возможность применения метода проекции субградиента к задачам из
упражнений 4.6.1 и 4.6.3.
2. Описать метод (12)-(14) применительно к задаче
/(и) = \х + у\ + \х-у\-* inf, и е X = {и = (х, у) е Е2: и е Х0, д(и) = и2 - 1 < 0},
Х0 = {и = (х, у): х ^ 0, у ^ 0}.,
3. Проверить условия теоремы 2 для задачи
/(u)=|(c,u)|-Infj
иеХ = {ивЕп: и^О, д(и) = \(а, и)\ - 1 ^ 0},
где а,се Еп. Описать метод (12)-(14) применительно к этой задаче.
4. Пользуясь формулой (4.6.10), модифицировать метод (12)-(14) так, чтобы его можно
было применять к задаче (10) непосредственно, не сводя ее к задаче (11).
5. Пусть W — открытое выпуклое множество, f(x) — выпуклая функция на W. Показать,
что вектор ct, удовлетворяющий условиям
К1= Inf. Н>0, c,edf(x),
с eaf(x)
является направлением убывания функции f(x) в точке х.
§ 4. МЕТОД УСЛОВНОГО ГРАДИЕНТА
263
§ 4. Метод условного градиента
1. Этот метод приспособлен для решения задачи
f(x)->\ni; хеХ, (1)
где X — выпуклое замкнутое ограниченное множество из Еп, функция
f(x) б С1(Х). Опишем его. Пусть х^еХ — некоторое начальное
приближение. Если известно к-е приближение хк 6 X, к >0, то приращение функции
f(x) в точке хк можем представить в виде
f(x) ~ /(¾) = (/4¾). х-хк) + о(\х- хк\).
Возьмем главную линейную часть этого приращения
Ш = (ГЫ,Х -¾). (2)
и определим вспомогательное приближение хк из условий
хкеХ, Mfk(x) = fk(xk)=(f'(xk),xk-xk). (3)
Так как множество X замкнуто и ограничено, а линейная функция fk(x)
непрерывна, то точка хк из (3) всегда существует. Если функция fk{x)
достигает своей нижней грани на X более чем в одной точке, то в качестве
точки хк возьмем любую из них.
Заметим, что если
Х={хеЕп: х^О, (аах)^.Ь{, г' = 1,...,т; (а{,х)=Ь\ г=т+1,.. .,s},
то задача (3) превратится в задачу линейного программирования, которая
может быть решена известными методами (например, описанным в гл. 3
симплекс-методом).
Укажем случаи, когда решение задачи (3) будет выписываться в явном
виде. Если
Х = {х = (х{,..., хп): а{^х'^/3{, г = 1,...,п}
п
— n-мерный параллелепипед, то функция fk(x) = Y^fx'(xk)(xi ~ х1) или
J2 fx<(xk)xi< очевидно, достигает своей нижней грани на X в точке хк =
f=i ■• '
= (х[,...,хпк), где
^_/«*. /^(¾) > о,
* lA, /,-(¾) <0;
в случае fx<(xk)=0 здесь возникает неопределенность и в качестве хгк можно
взять любое число из отрезка [а., Д.] (обычно берут х\ = а{, или хгк = f3it
или х\ = (а{ +/3,)/2).
Если
X = {хеЕп: \х- v0\ <г}
— шар радиуса г с центром в точке v0, то с помощью неравенства Ко-
ши — Буняковского (f'(xk), х) = (f'(xk),x - v0) + (f'(xk), v0) ^ -\f'(xk)\r +
+ (f'(xk)> vo)> х е X, получаем, что
xk = Vo-rf(xk)\f>(xk)\-K
264 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Разумеется, так просто получить вспомогательное приближение хк
удается далеко не всегда, и вместо точного решения задачи (3) часто
приходится довольствоваться определением какого-либо приближенного решения. А
именно, будем предполагать, что оно определяется из следующих условий:
£*е.Х; fk(xk)^minfk(x) + ek, et >0, limet=0. (4)
л к —* оо
Допустим, что точка хк, удовлетворяющая условиям (4) (или (3)), уже
найдена. Тогда следующее (к + 1)-е приближение будем искать в виде
^ + 1 = ^ + ^(^-¾). O^o^l. (5)
В силу выпуклости множества X всегда xk + l е X.
Заметим, что при хк = хк (это может случиться, например, когда f'(xk) =
= 0) имеем хк + 1 = хк независимо от способа выбора ак в (5). Если при этом
хк было определено точно из условий (3), то имеем
Л-(^) = Л(^) = 0 = ттД(я;) и (f(xk),x~xk)^0
при всех х € X. Согласно теореме 4.2.3 это означает, что точка хк
удовлетворяет необходимому условию минимума в задаче (1). В этом случае
итерации прекращаются, и для выяснения того, будет ли хк е Xt, при
необходимости проводится дополнительное исследование поведения
функции f(x) в окрестности точки хк. В частности, если f(x) выпукла, то
согласно теореме 4.2.3 имеем хк 6 Xt, т. е. задача (1) решена. Если случай
хк = хк реализовался при определении хк из условия (4), то будем иметь
- £к ^min fk(x) ^ fk(xk) = fk(xk) = 0, и при ек >0 здесь теорему 4.2.3
применять нельзя В этом случае согласно (5) полагаем xk + l = хк и переходим
к проверке условия (4) для номера к + 1 и т. д.
В зависимости от способа выбора величины ак в (5) можно получить
различные варианты описанного метода, часто именуемого в литературе
методом условного градиента. Укажем некоторые наиболее употребительные
способы выбора ак в (5).
1) Величина ак может выбираться из условий
0<at<l, gk(ak)=mingk(a) = gkt, gk(a) = f(xk + a(xk - xk)). (6)
0^ a ^ 1
Для некоторых классов задач можно получить из (6) явное выражение
для ак.
Пример 1. Пусть j
f(x) = ^(Ах, х)- (Ь, х),
где А — симметричная положительно определенная матрица размера пхп,
Ъ € Еп. Тогда f'(xk) = Ахк - Ъ. Пользуясь формулой (4.2.10), имеем
&(«) = /(¾) + ^(/4¾). ==» - хк) + («2/2)(А(^ - хк), хк - хк). (7)
Если (А(хк — хк), хк — хк) =0, то хк = хк и, как было указано выше,
тогда хк е Xt. Поэтому пусть (А(хк - хк), хк - хк) > 0. Тогда функция (7)
представляет собой квадратный трехчлен, достигающий своего
наименьшего значения на числовой оси — оо < а < +оо при
К = -(/4¾). ^ - хк)((А(хк - хк), хк - хк))-К
§ 4. МЕТОД УСЛОВНОГО ГРАДИЕНТА
265
Рассматривая возможные случаи а£ <О, 0 < а.*к < 1, а*к > 1, из условий (6)
тогда получаем
Г 0, а*<0,
"* = { **к, 0<а*<1, (8)
Кстати, если точка хк в (7) найдена из условий (3), то fk(xk) <Л(^)=0
и, следовательно, at ^ 0 — в этом случае формула (8) для ак запишется в
виде ак =min{l; а*к].
Однако точное определение ак из условия (6) возможно далеко не
всегда. Поэтому вместо (6) можно ограничиться определением величины ак из
условий
оо
0<at<l, gk(ak)^gkt + 8k, 8к^0, ^8к=8<оо (9)
или *-0
0<«fc<l, gk(ak)^(l-\k)gk(0) + \kgkt, 0<А<Л,<1.
Здесь могут быть использованы известные методы минимизации функций
одной переменной (например, методы из гл. 1).
2) Если f(x) б Cl'l(X) и константа Липшица L для f'(x) известна, то
возможен выбор ак в (5) из условий
п _( min{l;Pk\fk(xk)\\xk-xk\-2}, fk(xk)<0,
к~\0, /,<*»)> О, (Ш)
где
0<e0<pt<2(l-e)/L, (И)
е0, е — параметры метода, 0 < е0 < 1.
3) Другой способ выбора ак. при fk(xk)>0 полагают «,.=0, а если
fk(xk) < 0, то ак = А"0, где iQ — минимальный номер среди номеров г ^ О,
удовлетворяющих условию ,
^>^\' (¾)^ /
/(¾) - /(¾ + *'(** - хк)) > А*е|Л(хк)|,
ж У ' **' Й'^Х
где А, е — параметры метода, 0 < А; е < 1. /
4) Величины ак в (5) можно априорно задавать из /Ч^)
условий [783] ~
оо
0<ак^1, 11та4=0, Е «t = °°. (12)
например, afc = (fc + I)-1, к = 0, 1, ... Такой выбор
ак очень прост для реализации на ЭВМ, но, вообще
говоря, не гарантирует выполнение условия моно- Рис. 5.6
тонности f(xk + l)<f(xk).
5) Возможны и другие способы выбора ак в (5). Например, можно
задавать ак = 1 и проверять условие монотонности f(xk + l) < f(xk), а затем
при необходимости дробить ак до тех пор, пока не выполнится условие
монотонности.
На рис. 5.6 поясняется геометрический смысл метода (3), (5) в двумерном
случае.
266 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
2. Рассмотрим теперь сходимость метода (4), (5), (9).
Теорема 1. Пусть X — выпуклое замкнутое ограниченное
множество из Еп, функция f(x)e Ci,l(X). Тогда при любом выборе Xq^X для
последовательности {хк}, определяемой условиями (4), (5), (9),
справедливы, равенства
llm(f'(xk),xk-xk)=0, llm p{xk,S.) = 0, (13)
к —too к —too
где 5t = {х: х е X, (f'(x), v — х) ^0 при всех v е X}.
Если, кроме перечисленных условий, f(x) выпукла на X и
£k + Sk<:Cok-2p, C0 = const>0, 1/2<р<1, (14)
то
\imf(xh) = l, \im p(xk,Xt)=0, (15)
к —too k —too
и справедлива оценка
0</Ю-Л<^~Л Л = 1,-2,...; С, = const ^0. (16)
Наконец, если, кроме того, f(x) сильно выпукла на X, то
\xk-x^^(2CJ*)k-f, к = 1,2,... (17)
Доказательство. При сделанных предположениях /„ > — оо, Х^ф 0.
Так как множество X ограничено, то sup \и — v\ ^ d < оо. Из условия (9)
и, «еЛТ
следует f(xk + l) = gk(ak) «С gkt + Sk ^ f(xk + а{хк - хк)) + 6к при всех а,
0< a ¢. 1. Поэтому пользуясь неравенством (2.6.7), имеем
f(xk)-f(xk+ {)+8к > f(xk)-f(xk+a(xk-xk)) > -a(f'(xk), хк-хк)-
-a2L\xk-xk\2/2^
-af'{xk)-a2Ld2/2, 0< а < 1, jfe=0,l,... (18)
Множество N = {0, 1,2,...} разобьем на два множества N+ = {к: ке
e-N. (f'(xk),xk-xk)>0} и N~=N\N+. Так как Мfk(x) ^ fk(xk) = 0,
то из (4) получаем 0 < fk(xk) ^ ек при всех keN+. Поэтому если N+ —
бесконечное множество, то }к(хк)^0 при к -> оо, к £N+.
Теперь пусть keN~, Тогда из (18) имеем
°^-fk(uk)<{f{xk)-f(xk+l)+6k)/a + aLd*/2 (19)
при всех а, 0<а<1, keN~. Далее, из (9) следует, что f(xk + l) ^ f(xk) +
+ 8к, fc=0; 1,... Так как /(¾) ^/ф >-оо, к=0, 1,..., то из леммы 2.6.2
вытекает существование конечного предела lim /(¾) >£. Следовательно,
}™Sf(xk)-f(xk + \))=Q- Если N~ — бесконечное множество, то при к-юо,
к eN~, из (19) имеем
0 < Jim 1Л(^)1 < J™ \fk(xk)\ < aLd2j2
к—too к—too
§ 4. МЕТОД УСЛОВНОГО ГРАДИЕНТА
267
при всех а, 0 < а < 1. Устремляя а —» +0, отсюда получим fk(xk) —»О
при А; —» оо, fee iV~. Объединяя оба случая к G iV+ и fc G iV", приходим
к первому равенству (13). Так как X ограничено и {хк} £ X, то
последовательность {хк} имеет хотя бы одну предельную точку. Пусть xt —
произвольная предельная точка {хк}, пусть {хк } —> xt. Согласно (4)
имеем Л(й*) ~ sk =¾ inf fk(x) < (f(xk)> x - xk) ПРИ всех x^x и fc =0, 1, ...
Отсюда при к = кт —» оо с учетом первого равенства (13) получим, что
(f'(xt), х — ж„) ^ 0 при всех х£Х. Тем самым показано, что любая
предельная точка последовательности (¾} принадлежит 5„. Отсюда следуют
второе равенство (13).
Пусть теперь f(x) выпукла на X и xt — произвольная точка из Xt. Тогда
из теоремы 4.2.2 и условия (4) имеем
0 < % = f(xh) - f(x,) < (f'(xk), хк - xt) =
= -fk(xt)^-minfk(x)^-fk(xk) + ek, к =0,1,... (20)
Отсюда и из первого равенства (13) следует lim /(¾) = Л, т. е. (¾} —
к ~юо
минимизирующая последовательность. Из теоремы 2.1.1 тогда получаем
lim р(хк, XJ = 0. Равенства (15) доказаны. Заметим, что неравенство (20)
к ~юо
может служить полезной апостериорной оценкой при практическом
использовании метода (4), (5), (9).
Остается получить оценку (16). Для этого множество iV = {0, 1,2,...}
разобьем на два множества 70 = {к: keN, ак ^ ек}, 7, = {к: к е N, 0 < ак <
< ек}. Из оценки
0^ak-ek^-fk(xk), kel0, (21)
являющейся следствием неравенства (20), следует, что 70 С N~.
Поэтому (18) можно переписать в виде
ak-ak + l>a\fk{xk)\-a2Ld2/2-8k, 0< а < 1, к G 70. (22)
Так как в силу (13) {|Л(ё*)|} ограничена, то, взяв при необходимости d еще
большим, можем сделать 0 < ак = \fk(xk)\d~2L~i < 1 при всех к = 0, 1, ...
Принимая в (22) а = ак, получим
Ъ-ак + 1> 1/(27, d2)\fk(xk)\2-8k, к е 70.
Отсюда и из (21) с учетом условия (14) имеем
a* + i < а* ~ (¾ - £k)2/(2Ld*)+ 8к ^ ак - a\/(2Ld2) +
+ (ьи?ак)Ь-Ч-2ек + 8к^ак-с?к/А + Ак-2г, к е Iq} (23)
к^0
где A =max{2Ld2; (sup ak)L~ld~2C0; С0}.
к^0
Если к е 7,, то 0 < afc < efc < CqAt2''. Кроме того, из (18) при а —> +0
получим аА - ак + 1 + 8к ^ 0 или ак + 1 ^ ак + 8к ^. ак + С0к~2р для всех к =
= 0, 1, ... Таким образом, последовательность (¾} удовлетворяет условиям
леммы 2.6.5, из которой следует оценка (16).
268 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Наконец, оценка (17) вытекает из неравенства (4.3.3) и оценки (16).
Теорема 1 доказана. □
3. Исследуем сходимость метода (4), (5), (10).
Теорема 2. Пусть X — выпуклое замкнутое ограниченное множество из Еп,
функция f(x) принадлежит С • (X). Тогда при любом xq G X для последовательности {хЛ,
определяемой условиями (4), (5), (10), справедливы равенства (13), Если, кроме того, f(x)
выпукла на X, то имеют место равенства (15), а при sk ^ C0k~2p, С0 = const>0, 0<р ^ 1,
верна оценка (16). Для сильно выпуклой функции справедлива оценка (17).
Доказательство. Так же, как неравенство (18), нетрудно показать, что
f(4)-f(4 + i)>-akfk(4)-^L\xk-xk\2/2, k = 0,l,... (24)
В соответствии с формулой (10), определяющей величину ак рассмотрим три возможных
случая:
1) Если Д(хАК 0, ак = К Pk\fdsk)Wsk ~ хк\~~2> т0 из (24) с Учетом (11) имеем
/(¾) - /(¾ + i) > l/*(**)l - LPk\fk(xk)\/2> e\fk(xk)\. (25)
2) Если fk(xk)^0, ak=pk\fk(xk)\\xk -хк\~2 <1, то из (24) с учетом (11) получаем
КЧ)~ f{4 + x)> Pk\fk{£k)\2\sk- Ч\~2 ~ LP2k\fk(xk)\2\xk- хк\-2 /2 =
= \fk(sk)\2\sk-4\~2PkV-LPk/1)>\fk(£k)\2d-2eQe, d> sup \u-v\. (26)
3) Наконец, если fk{xk) > 0, то согласно (10) и из (24) имеем
/(¾)-/(** + !)> 0, (27)
а из (4) следует
0</*(**KV (28)
Из (25)-(27) вытекает, что последовательность {/(¾)} не возрастает. Так как /(¾) > Д >
> -оо, то существует lim /(¾) > Д и, следовательно, lim (/(¾) - /(¾ , ,)) = 0. Отсюда
и из (25), (26), (28) имеем 0 ^ \fk(xk)\ ^ max{et; const -(/(¾) - /(¾ + !))1/2} -»0 при всех
А; —»оо. Первое из равенств (13) доказано. Второе равенство (13) устанавливается так же, как
в теореме 1.
Пусть теперь функция f(x) выпукла на X. Тогда справедлива цепочка неравенств (20), из
которой следуют равенства (15). Предполагая, что ек ^СЛ~2р, 0<р^. 1, докажем оценку (16).
Предварительно заметим, что 0 ^ ак = /(¾) - / ^ sup f(x) - / = С, < оо, поэтому
х
4^5^¾1¾^¾¾. А: =0,1,... (29)
к >0
Еще раз переберем рассмотренные выше три возможности.
1) Если Цхк) ^0,ak = l^Pk \fk(xk)\\xk - хк |"2, то из (20), (25), (29) имеем ак-ак + 1>
ak + \^ak~sak + «л ^ Ч ~ al(s/C2) + еС0к-2Р. (30)
2) Пусть fk(xk) ^ 0, ак = pk\fk(xk)\\xk - хк\~2 < 1. Здесь, в свою очередь, имеются две
возможности: ак > ек или 0 ^ ак < е^. Если ак > ек, то из (20), (26), 0 ^ ак ^ G, получим
ак ~ак + \ >(ак ~ £кТd~2еое > "id~S)e-2^£t^_2eoe или
ffit + l ^at-4^e/d2) + 2Qe0ed-2C0fc-2^. (31)
Если же 0 ^ ак < ек, то достаточно воспользоваться более простым следствием (26): ак , ^ ак.
Последние два неравенства можно переписать в виде
0^ак^С0к~2Р, ак + 1^ак^ак + С0к-2Р. (32)
3) Наконец, пусть fk(xk) > 0, ак =0. Тогда из (20), (27) получим 0 ^ ак^ ек, ак, , ^ ак,
что снова приведет к неравенствам (32).
§ 4. МЕТОД УСЛОВНОГО ГРАДИЕНТА
269
Из (30)-(32) следует, что последовательность {ак} удовлетворяет условиям леммы 2.6.5,
на которой получаем оценку (16). Теорема 2 доказана. О
4. Наконец, рассмотрим вариант метода условного градиента (4), (5), (12) [783].
Теорема 3. Пусть X —выпуклое замкнутое ограниченное множество из Еп,
функция f{x) е Ci,[(X) и выпукла на X. Тогда при любом х$ е X для последовательности
{хк}, определяемой условиями (4),(5),(12), справедливы равенства (15). Если при этом
ак = (к + 1)~1, ек = С3(к + 1)~1, к = 0, 1,..., то
0^/Ю-Л^С41п(* + 1)/*, it = 1,2,..., (33)
а если ак = (к + 1)~Р, ек~С3(к + 1)-р, к = 0, 1,..., 0 < /3 < 1, то
0^/(я4)-Д<С4*-", * = 1,2,...; (34)
здесь С3, С4 —некоторые положительные постоянные.
Доказательство. Заметим, что неравенства (20), (24) не зависят от способа выбора
ак, 0 < ак ^ 1, в (5), поэтому сохраняют силу и в рассматриваемом случае. Из них имеем
Ч ~ ак + 1 > ак(ак ~ ек) - atLd2/2 или
Ч+\ ^ (1 ~ ак)ак + akLd2/2 + акек> * =0,1,...
Отсюда с учетом свойств последовательностей {ак}, {ек} из (4), (12) заключаем, что {ак}
удовлетворяет условиям леммы 2.6.6. Поэтому lim а^=0или lim /(¾) = Д. Отсюда и из
к —> оо к ~юо
теоремы 2.1.1 получаем равенства (15). Оценки (33), (34) следуют из лемм 2.6.8, 2.6.9.
Упражнения
1. Вычислить несколько итераций метода (3), (5), (6) для функции f(u) = х + ху + у при
и е X = {и = (х, у) е Е2: 0 ^ х < 1, -1 ^ у <0}, выбирая щ = (1, -1), (-1, 0), (1,0) или (0,0).
2. Для функции из примера 1 проверить выполнение условий теорем 1-3 и сформулировать
условия сходимости соответствующих вариантов метода условного градиента.
3. Дать описание различных вариантов метода условного градиента для функции f(x) =
= \Ах — Ь\2, где А —матрица т х п, Ь е Ет, а множество X является шаром или
параллелепипедом. Опираясь на теоремы 1-3, доказать сходимость метода.
§ 5. Метод возможных направлений
1. Продолжим рассмотрение задачи минимизации гладкой функции f(x)
на заданном множестве X С Еп. Напомним, что направление е ф 0
называется возможным в точке х е X, если х + te £ X при всех t, 0 < t ^ t0,
где t0 — положительное число, зависящее от точки х, направления е и от
структуры множества X (см. определение 4.2.3).
Определение 1. Направление е ф 0 назовем возможным,
направлением убывания функции f(x) точке х на множестве X, если е
—возможное направление в точке х и f(x + ае) < f(x) при всех а, 0 < а < (3,
где 0 < /9 ^ tQ.
Метод возможных направлений основан на следующей естественной и
прозрачной идее: на каждой итерации этого метода определяется
возможное направление убывания функции, и по этому направлению
осуществляется спуск с некоторым положительным шагом. Собственно говоря, эта
идея для нас уже не новая — именно на ней были основаны многие
варианты изложенных в § 1, 2, 4 методов. В самом деле, если X = Еп, f'(x) ф0,
270 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
то возможное направление убывания функции легко находится — это
направление антиградиента е — -f'(x). Более трудным был выбор
возможного направления убывания в методах § 2, 4: в методе проекция градиента
(см. формулы (2.2) и (2.2')) для этого нужно было проектировать точку на
исходное множество X, а в методе условного градиента — решать задачу
минимизации линейной функции на множестве X (см. задачу (4.3)).
Понятно, что если задача выбора возможного направления убывания на
каждой итерации слишком сложна и требует решения вспомогательных
задач минимизации, сравнимых по трудности, быть может, с исходной
задачей, то такой метод минимизации будет малоэффективным. Возникает
вопрос: нельзя ли указать простые и достаточно удобные для реализации
на ЭВМ способы выбора возможных направлений убывания? Оказывается,
для достаточно широких классов гладких задач такие способы существуют.
Покажем это на примере следующей задачи:
/(&)-► Inf; хеХ = {хеЕп: д{(х)^0, i ==1,..., т}, (1)
где функции f(x), д^х), г = 1, ..., т, определены на всем пространстве Еп
iAf{x)>9i{x)€C\X).
Чтобы проще было пояснить суть метода возможных направлении для
задачи (1), сначала опишем более простой вариант этого метода. Пусть
Xq G X — некоторое начальное приближение. Пусть известно к-е
приближение хкЕ X, к ^0. Введем множество номеров
4 = {*•' 1 ^ г ^ m, д<(хк) = 0}.
Возможно, что 1к = 0, — это будет означать, что gt(xk) <0 при всех г =
= 1, ..., т, т. е. хк е int X —такая возможность ниже не исключается. В
пространстве переменных
z = (e, а) = (е1,..., е", a)£En + i
рассмотрим вспомогательную задачу
а -> inf, z = (е, a)£Wk = {(е, a): (f'(xk), е) ^ а,
(д/(хк), е) ^ а, г е 1к; |е'| ^ 1, j = 1, ..., п]. (2)
Заметим, что задача (2) является задачей линейного программирования,
причем минимизируемая функция (с, z) = (0, е) + 1 • <т, с = (0, 1) G En+i,
явно не зависит от переменных е = (е1, ..., е"). Далее, ясно, что точка
z = (е = 0, а = 0) = (0, 0) е Wk, так что Wk ф 0 и inf а =, ак < 0 при всех
к =0, 1,... Очевидно, множество Wk замкнуто. Наконец, условия \е3'\ ^ 1,
j = 1, . .., п, называемые условиями нормировки, гарантируют
ограниченность множества Wk. Тогда из теоремы 2.1.1 следует, что задача (2) имеет
хотя бы одно решение. Для получения решения задачи (2) могут быть
использованы известные конечные методы линейного программирования
(например, симплекс-метод, описанный в гл. 3).
Предположим, что задача (2) решена и найдены (ек, ак) EWk такие, что
<Tt = inf а. Выше было замечено, что а,. < 0.
* v„
Сначала рассмотрим случай ак < 0. Оказывается, в этом случае
направление ек, полученное из задачи (2), является возможным направлением
§ 5. МЕТОД ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
271
убывания функции f(x) в точке хк. В самом деле, из условия (ек, ак) Е Wk
следует, что
(/4¾). Ч) < о* <0, (д,'(хк), ек) ^<тк<0, г е 1к.
Отсюда ясно, что ек ф 0. Кроме того, для любого номера i € 1к имеем
gt(xk + аек) = д((хк + аек) - gt(xk) = (д/(хк), ек)а + о(а) «С
< а[стк + о(а)/а] <0 при всех а, 0 < а < а{, а{ > 0.
Если г ¢1,., т. е. д{(хк) < 0, то в силу непрерывности функции gt(x)
неравенство д{(хк + аек) < 0 сохранится при всех а, 0 < а < а{, где at > 0 —
достаточно малое число. Положим а0 = 01111(0:,, ..., ат} > 0. Тогда
д((хк + аек)<0, i = 1, ..., m; 0 < а < а0,
т. е. ек —возможное направление множества X в точке хк.
Далее, взяв при необходимости число а0 > 0 еще меньшим, можно
добиться выполнения неравенства
f(xk + aek)-f(xk) = (f'(xk),ek)a + o(a)^
^ а[ак + о(а)/а] <0 при всех а, 0 < а < а0.
Тем самым показано, что если (ек, ак) — решение задачи (2), причем ак<
<0, то ек — возможное направление убывания функции f(x) в точке хк на
множестве X.
Используя найденное таким образом направление ек, следующее (& + 1)-е
приближение определим так:
xk+i = xk + Oikek, 0<oik^f3k, (3)
где
/Зк = sup{a; хк + tek £ X, 0 < t < а} > 0. (4)
Выбирая ак в (3) различными способами, будем получать различные
варианты метода возможных направлений. Перечислим некоторые способы
выбора ак.
1) Величина ак может выбираться из условий
О <<**<&. дк(ак)= М. fl*(a)=fl**; 9k(a)=f(xk+aek). (5)
Для минимизации функции дк(а) могут быть использованы известные
методы (см., например, гл. 1). Точное решение задачи (5) удается найти лишь
в редких случаях; возможно также, что на некоторых направлениях ек
величина /Зк = оо и нижняя грань функции дк(а) при а > 0 не достигается.
Поэтому вместо (5) на практике целесообразно употреблять такой способ
выбора ак:
оо
0<ак^рк, gk(ak)^gkt + 6k, 8к^0, ^8к = 8<00 (6)
ИЛИ fc=0
/(¾ + akek)^(l- Xk)f(xk) + Xkgkt, 0 < А < Хк^ 1.
2) Если функция f(x) е С1,1(Х) и константа Липшица L для градиента
/'(ж) известна, то в (3) в качестве ак можно принять
ak = mln{Pk;\ak\L-1}.
272 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
3) Возможен выбор величин ак из следующих условий:
f(xk)-f(xk + akek)>eak\^kl 0<ак^^к, 0<е<1/2.
Для определения такого ак сначала можно положить ак = f3k, а затем при
необходимости дробить эту величину.
4) В тех случаях, когда трудно оценить величину /Зк из (4), приходится
довольствоваться нахождением какого-либо ак >0, обеспечивающего
включение хк + акекеХ и условие монотонности f(xk + akek)<f(xk). Для этого
обычно выбирают какую-либо постоянную а > 0, полагают ак = а и
проверяют условие монотонности и принадлежность точки хк + 1 множеству X;
при необходимости дробят величину ак = а, добиваясь выполнения
упомянутых условий.
Один шаг метода возможных направлений для задачи (1) в случае стк <0
описан. Попутно выяснен смысл вспомогательной задачи (2): минимизируя
<т, мы добиваемся того, чтобы направление ек было как можно ближе к
направлению антиградиента (это обеспечивается условием (f'(xk), ек) ^ а)
и в то же время оставалось возможным направлением для множества X в
точке хк (это обеспечивается условиями (д/(х^), ек) < а, г е 1к), причем, чем
меньше а, тем ярче выражены указанные свойства направления ек. Кстати,
если 1к=0, т. е. xkeint X, то ek = -af'(xk), a = ( max \fo(xk)\)-1 >0 —
направление антиградиента. -о.£"
Теперь рассмотрим случай, когда в решении (ек, ак) задачи (2)
координата ак =0. Как видно из (2), это может случиться, например, при f'(xk) = 0
или д/(хк) =0 для некоторого номера г G 1к. При а. —0 уже нельзя
гарантировать, что ек будет возможным направлением убывания. В этом случае
итерационный процесс (2)-(4) прекращается. Оказывается, при ак = 0 в
точке хк выполняются необходимые условия минимума, выраженные в
теореме 4.8.1. Для выпуклой задачи (1) со свойством (4.9.15) условие ак =0
гарантирует, что хк е Xt. А именно справедлива
Теорема 1. Пусть функции f(x), gt(x), i = 1,..., m, определены
на Еп, f(x), g((x)e CX(X), где множество X задано условиями (1), и
пусть задача (1) имеет решение, т. е. /„ > —оо, Х^ф0. Тогда для любой
точки xt е Xt задача
а -► inf; z = (е, а) £ Wt = {(е, a): (f'(xj, е) < а,
(д/(х*),е) < о-, * G Ъ И < 1, J = li • • •, п), (7)
где
K = {i: 1 < г ^ rn, g((xt) =0},
необходимо имеет решение (et, at) с а; = min <т =0. Если, кроме того,
f(x), gt(x) выпуклы на Еп, и выполнено условие Слейтера (4.9.15), то
всякая точка xteX, для которой задача (7) определяет величину о; =
= inf <т = 0, является решением задачи (1).
Доказательство. Необходимость. Пусть xt е Xt. По
теореме 2.3.2 или 4.8.1 тогда существуют множители Лагранжа AJ,..., А^,
неотрицательные и не все равные нулю, такие, что
т
А№.)+Е WOO = 0, А?&.(аО = 0, г = 1,...,т. (8)
§ 5. МЕТОД ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
273
Если г ¢1,,, то из второго равенства (8) следует X*t =0, поэтому первое
равенство (8) можно переписать в виде
AS/'OO+E A<Vte) = 0. (9)
Возьмем любую точку (е, a) G W,. Тогда (/'(ж*), е) ^ <т, (д.'(х,), е) ^ <т, г G /„.
Умножим первое из этих неравенств на Ag ^ О, остальные — на
соответствующие Xf ^ 0 и сложим. С учетом равенства (9) получим
№К) + Е AfV(zt), е) =0 < а(\* + Af + ... + а;).
Следовательно, а ^ 0 V(e, <т) е Wj,, и <т„ = 0.
Достаточность. Пусть теперь/(ж), д{(х) выпуклы на X, выполнено
условие Слеитера (4.9.15), и пусть для некоторой точки х,ЕХ задача (7)
определяет величину a, = inf <т=0. Покажем, что тогда ж,е!,• С эт°й целью
в пространстве i?" + 1 введем конус
K={z=(e,(r)€E"+l: (/'(iJ,e>+(-l)<7<0, <<fc'(aO,e)+(-l)<7<0, tG/J
и вектор d = ( . ]. Из (7) с учетом inf a = a, = 0 имеем
(d,z) = (0,e) + l-a = a^cr, = 0 (10)
для всех z = (е, <т) G К, для которых le5'! < 1, j = 1, ..., п. Однако условие
\е3'\ ^ 1, j = 1, ..., п здесь можно отбросить, и неравенство (1(У) на самом
деле верно для всех z G К. В самом деле, пусть z = (е, а) £ К и \е3'\ > 1 для
некоторого номера j, 1 < j ^ п. Тогда llell = max le3'] > 1. Положим
z = (e,a), ё=е/||е||, ст = (т/||е||.
Ясно, что z£ W„. Следовательно, (d, z) = (d, г)/||е|| = ст = (т/||е|| ^0, так что
(d, z) = a^0. Тем самым показано, что неравенство (10) верно для всех
zeK.
По теореме Фаркаша 3.5.8 тогда существуют неотрицательные числа
Aq, •.., К такие, что
<*=(?)=-^(^)-,5^(^)
или
о = -а;/'ю- Е АГдЛ^). 1 = Ао+ Е а:. (И)
Кроме того, из определения множества /„ следует, что gi(x,) = 0, поэтому
А4*9i(x*) = Qi i €!*• Доопределим Аг* = 0 при всех г ¢1,. В результате с учетом
первого равенства (11) получим
т
AS/'W+EA№,) = 0, \;9{(х.) = 0, г = 1,...,т, (12)
а из второго равенства (11) следует, что A = (Aq, А*, ..., А*) ^0.
Покажем, что Aq>0. Если 1, = 0, то из (11) сразу имеем А0 = 1. Допустим,
что 1,ф@>, но тем не менее Ац = 0. Тогда среди неотрицательных чисел А,*,
274 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
г е 1„ найдется хотя бы одно положительное число. Пусть А* > 0, р £ It.
По условию существует точка х£Х такая, что д{(х) <0 для всех г = 1, ....
..., т. Поскольку J„ ф0, то х ф xt. В силу выпуклости множества X тогда
ах + (1 — ot)xt = xt + cx(xt — xj е X при всех а, 0 ^ а < 1. Это значит,
что направление е = х — xt ф 0 является возможным для множества X в
точке xt. Из выпуклости функций д((х) для всех г е It имеем 0> gt(x) =
т
= ft(z) - ft(a:*) > (зЛ1*). г - О = (ft'K). е)- Поэтому X) К(9г'(^), е) <
< = i
< А*^'^*)) е) < 0. Но с другой стороны, из первого равенства (12) при
т
Ад = 0 получим 53 K(9i'(x*)> е) =0. Полученное противоречие показывает,
что Ад > 0. Разделив первое равенство (12) на Ад > 0 и сделав очевидные
т
переобозначения, придем к равенству /'(£*)+ J2 КдЛх*) = 0- Отсюда и из
»• = 1
второго равенства (12) с помощью леммы 4.9.2 и теоремы 4.9.1 получим,
что xt е Xt. Теорема 1 доказана. □
В невыпуклых задачах условие <т„ =0 не является достаточным для
оптимальности точки xt. Это показывает следующий
Пример 1. Пусть f(u) = х + cos у, и G X = {и = (х, у) G Е2: д(и) =
= -х^ 0}. Возьмем точку щ = (О, 0). Тогда Г{щ) = (1,0), д'{щ) = (-1, 0),
Wt = {(е, а) = (е1, е2, а); е1 ^ а, —е1 ^ а, |е'| ^ 1, |е2| < 1}. Отсюда |е'| < а
при всех (е, а) Е Wt. Это значит, что infer — at — 0, причем нижняя грань
достигается при е„ = (0, 1) или е„ = (0, -1), о; = 0. Но здесь u„ = (0, 0) не
является точкой минимума f(u) на X. Любопытно заметить, что векторы
е„ = (0, 1) или (0,-1) в данном случае являются возможными
направлениями убывания.
2. Описанный выше вариант метода возможных направлений (2)-(4) на
практике применяют редко. Дело и том, что когда в решении (ек, ак)
задачи (2) координата ак < 0 мала по абсолютной величине, направление ек
теоретически являясь возможным направлением убывания в точке хк,
практически может обладать указанными свойствами в весьма слабой форме.
Это означает, что либо (д{'(хк), ек) &<тк ?«0 при некотором г € 1к и
направление ек почти «касается» множества X, не ведет «вглубь» X, а величина
/Зк из (4) может оказаться очень малой, либо (f'(xk), ек)жак «О, т. е. вдоль
ек функция f(x) в точке хк убывает слишком медленно. В результате длина
шага ак в (3) может получиться очень малой даже вдали от стационарной
точки, и сходимость метода может оказаться очень медленной.
Чтобы избежать таких неприятных явлений, можно попытаться
варьировать множество номеров 1к в (2) и осуществлять спуск из точки хк только
в том случае, когда получаемое из (2) направление ек обладает достаточно
ярко выраженными свойствами возможного направления убывания.
Опишем один из таких подходов. Пусть ж,е1, е0> 0— некоторое
начальное приближение. Допустим, что fc-e приближение (хк, ек), хк еХ, е > О,
при каком-то к ^ 0 уже известно. Определим множество номеров
lk = {i:l<i^m,-ek^g{(xk)^0} (13)
и решим вспомогательную задачу (2) при таком 1к. Задача (2) по-прежнему
будет задачей линейного программирования и будет обладать хотя бы одним
решением (ек, ак) с ак = infer ^0. Имеются две возможности:
§ 5. МЕТОД ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
275
l)(7s<-Et,B этом случае считаем, что ек является достаточно хорошим
возможным направлением убывания в точке хк, и полагаем
ьк + \
xk + akek> 0<а4<^, ек + 1=ек, (14)
где (Зк определяется из (4), а выбор ак может быть осуществлен одним из
описанных выше способов.
2) — ек < ак ^ 0. В этом случае считаем, что направление ек не обладает
ясно выраженным свойством возможного направления убывания в точке хк,
полагаем
и снова переходим к рассмотрению задачи (2) с заменой множества 1к на
множество 1к+х = {г: 1 < г ^ т, /, —ек + 1 = —ек/2 ^ д{(хк) < 0}, надеясь на
то, что на более широком множестве (при сужении 1к множество Wk,
вообще говоря, расширяется) удастся найти лучшее возможное направление
убывания и т. д.
Описание одной итерации метода возможных направлений для задачи (1)
закончено. В методе (2), (13)-(15) имеются параметры е0, е,, ..., удачным
выбором которых, вообще говоря, можно улучшить выбор направлений ек
на каждой итерации, ускорить сходимость метода. Кстати, в (15) вместо
деления пополам можно принять иной способ дробления ек, например,
3. Следуя [374], изучим сходимость метода (2), (3), (6), (13)-(15). Предварительно докажем
несколько лемм.
Лемма 1. Пусть f(x), д{(х)еС1,1(Х), г = 1 т, и I —некоторое
фиксированное множество номеров, взятых из {1,2,..., т} (возможности 1 = 0 или I = {1,..., т}
не исключаются). Для каждого х£Х положим ст(х) = min а, где G(x) = {(е, а) = (е ,...
G(x)
...,е",(г)еВ"+|: {f'(x),e)'^<r, (g{'(x), е) ^ <r, г £/; |е'| ^ 1, j = 1 п}. Тогда
\cr(u) — cr(v)\ ^ L т/п\и — v\, u,v£X, (16)
ща для градиентов f'(x), g{'(x), г — 1 т.
1озьмем произвольные точки «,»61. Пусть (е, а)
(f'(v),e)^a, {д/(ь),е)^а, г £ I, \еЦ^1, j = \,...,n.
Тогда
(f'(u), е) = (f'(v), е) + (/'(«) - /'(«). e)^<r + L\u-v\\e\^cr + L\u-v\y/K
и, аналогично,
(д/(и),е)^а+Ь\и-ь\у/п, г е I.
Это значит, что при каждом (е, а) е G(v) точка (е, a + L %/п\и - v\) принадлежит множеству
G(u). Тогда <r(u) = min а<а + Ly/n\u - v\ для любых (е, а) е G(v). Следовательно, а(и) ^
v ' ' G(u)
^ <r(v) + Ly/n\u-v\. Поменяв в этих рассуждениях точки и, v ролями, получим a(v) ^ а(и) +
+ Ly/n\u - v\. Из последних двух неравенств следует неравенство (16). D
Лемма 2. Пусть
f(x), 5,(0;),..., дт(х) е с1- '(*). А> = <тДхт SUPV lei'Hl < °°'
а последовательности {хк}, {ек}, {ак}, {(Зк}, {ек}, {сгк} определены условиями (2), (3), (6),
(13)-(15). Тогда
У ' У рк>Ахтт{ек,\ок\}, fc=0,l,..., (17)
где А{ = тт{1/(ЛоЛ/п); l/(nL)} > О, L —константа Липшица для градиентов f'(x),
9l'(x),--->9m'(a).
где L —константа Липшица для градиентов f(x), g/(x), г — 1 т.
Доказательство. Возьмем произвольные точки «,»61. Пусть (е, а) е G(v), т. е
276 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Доказательство. Если /3¾ = оо, то неравенство (17) верно. Поэтому пусть /3¾ < оо. Из
определения (4) величины /3¾ и замкнутости X следует, что хк + /3¾ ек е X и д{ (хк + /3¾ ек) = О
хотя бы для одного номера г. Зафиксируем один из таких номеров г. Может оказаться, что
9i(xk) <-ек .Тогда ек< -9г(хк) = д{(хк + /Зкек)-д{(хк) = (д.'(хк + в13кек),13кек)^А0рк\ек\^
^ A0Vnf3k, т. е. /3¾ > ek/(A0Vn).
Если же оказалось, что -5к^д{(¾) ^0, то г е 1к и (д/(хк), ек)^ак^.О. Допустим, что сгк <
< 0. Тогда направление ек является возможным в точке хк и заведомо /3¾ > 0. По определению
/3¾ имеем д{(хк + аек) ^ 0 при всех а, 0 < а < /3¾. Кроме того, gf (¾ + /3¾¾) = 0 по выбору
номера г. Тогда 0> ffi(xfc + orefc) - 5,.(¾ + /3¾¾) = (5/(¾ + /3¾ et), ек)(а - /3¾) + о(\а - /3J)
или (д/(хк + /3¾¾). ек) ^ о(\а - /Зк\)(/Зк - а) ' при всех а, 0 < а < /3¾. Отсюда при а -»
-* /9¾ - 0 получим (gt'(x, + /3¾ек),ек)> 0. Тогда \<тк| = -¾ ^ {-д{'(хк),ек)^ (gt'{xk + Ркек)-
- 5/(¾). ек) ^ L/3k\ek\2 ^ £n/3t, т. е. /3¾ ^ \<rk\/(nL). Если 0¾ = 0, то последнее неравенство
также остается верным, так как согласно (4) всегда /3¾ ^ 0. Объединяя обе полученные оценки
для /3¾. приходим к оценке (17). Лемма 2 доказана. О
Лемма 3. Пусть f(x), д{(х) е С1' 1(Х), г = 1,..., т. Пусть, кроме того, в
процессе (2), (3), (6), (13)-(15) на некоторой k-й итерации оказалось ak ^ — ек. Тогда
/(¾) - /(** +1) > А2 min{/3j<rt|; of} - Sk, (18)
аде Л2 = min{l/2; l/(2nL)} > 0.
Доказательство. Из неравенства <rk ^—£к и определения ек,ак следует, что
(f'(xk), ек) ^ 0-¾ ^ —et < 0. Кроме того, et является возможным направлением в точке :¾
и, следовательно, /3¾ > 0. Из (6) и леммы 2.6.1 имеем
/(¾) - /(¾ + 1) > /(¾) - „^nf.,, &(<*) ~ 5fc > /(¾) ~ /(¾ + аек) ~sk>
> ~<*(f(*k), *k) - <*2L \ek\2/2 ~8k> -aak - a2n/2 - Sk (19)
при всех a, 0 ^ a ^ /3¾. Положим здесь a = min{/3t; |ot|/(nL)}.
Может случиться, что a = /3¾ ^ |oft|/(n£). Тогда из (19) получаем
f{xk)-f{xk+l)>a\ak\-a ■ а ■ nL/2~Sk > pk\*k\-pk(\*k\/(nL))(nL/2)-6k=pk\*k\/2-6k.
Если же a = |o-fc|/(n£) < /3¾. то из (19) следует
/(¾) -/(** +1) > «2/("£) - (*!/("£ )2)(*Ь/2) - «t = ^2/(2ni) - 5¾.
Объединяя оба рассмотренных случая, приходим к оценке (18). D
Теорема 2. Пусть функции f(x), g{(x), 1 = 1,..., in определены и выпуклы на
Еп, выполнено условие Слейтера (4.9.15); f(x), дЛх)£С1'1(Х), Аа = max sup |о.'(аз)[ <
1 ^ »' ^ т х
< оо. Пусть задача (1) имеет решение, т. е. Д > —оо, Xt ^ 0, и начальная точка xq&X
такова, что множество Ms(x0) = {x: х£Х, f(x) ^/(3¾) +6} ограничено. Тогда при любом
выборе е0>0 для последовательности {хк}, определяемой условиями (2), (3), (6), (13)-(15),
справедливы равенства
lim /(¾) = Л, lim p^,XJ = 0. (20)
к —> 00 К —> ОО
Доказательство, Сначала установим, что
lim (/(¾) - /(¾ + ,)) = 0. (21)
К —* ОО
Если од. ^-¾. то из (14), (6) имеем f(xk + l) = gk(ak) % £,.(0) + Sk = /(¾) + 5¾. Если же
-¾ < 0¾ ^ 0, то из (15) следует f(xk + l) = /(¾) ^ /(¾) + 5¾. Таким образом,
оо
/(** + iK/(**)+«*. * = 0,1,...; Е ^ = «<оо. (22)
и, кроме того, /(¾) > Д > —оо, А; = 0, 1,...
Согласно лемме 2.6.2 тогда существует lim /(¾) > Д. Отсюда следует равенство (21).
§ 5. МЕТОД ВОЗМОЖНЫХ НАПРАВЛЕНИЙ
277
Далее, покажем, что lim ек =0. Согласно (14), (15) последовательность {е^} получается
дроблением и не возрастает. Допустим, что lim ек = е > 0. Это значит, что в процессе по-
к ~юо
строения {хк} было конечное число дроблений и ек = е > 0 при всех к > Ад. Из (14) тогда
имеем ак ^ —ек = —е, т. е. \ак\ ^ е, к ^ fr0. В этом случае согласно лемме 2 имеем рк ^ А^е,
к > 1%. Поэтому из леммы 3 получим f(xk) - f(xk , ,) ^ А2 гшп{Л[е2; е2} — 6к, к > к0, что
противоречит равенству (21). Итак, показано, что lim ек = 0.
к ~* оо
Пусть к, < к, < ... < кт < ... — номера тех итераций, когда происходит дробление ек.
Согласно (14), (15) тогда — ек ^ ак ^ 0, г =1,2,... Следовательно, lim ак = 0. Тем самым
установлено, что существует хотя бы одна подпоследовательность {ак }, сходящаяся к нулю.
Возьмем произвольную подпоследовательность {ак } —»0. Покажем, что тогда любая
предельная точка соответствующей подпоследовательности {хк } принадлежит множеству Xt.
Из (22) следует, что f(xk + l) ^ /(¾) + 8, к = 0, 1,..., т. е. (¾} е Ms(xq). По условию
множество Ms(xq) ограничено. Поэтому можем считать, что взятая выше подпоследовательность
{хк } сходится к некоторой точке xt. Далее, множество номеров 1к, определяемое
согласно (13), представляет собой подмножество конечного числа номеров {1,2 т}, поэтому
число различных множеств 1к конечно. Это значит, что среди {1к , г— 1, 2,...} найдется хотя
бы одно множество 1к — I, которое повторяется бесконечно много раз. Выбирая при
необходимости подпоследовательности, можем, таким образом, считать, что
{°\}-»°> {хк}->х*> 4r=J> »"=1,2,...
Согласно лемме 1 при G(xk ) = Wk имеем
Кг - а(х*)\ = №(%)- а(х*)\ ^LV^\xK - xt\->0,
т.е. lim а(хк ) = lim о. =0=0(¾). где 0(¾) = inf о, G(xt) = {(e, а)еЕп +': {f'(xj, е)^
Г ~> ОО г Г —* ОО г G(x)
<°"> (9{'(xt),e)^a, г el; \eS\ S? 1, 3 = 1,--.."}•
Рассмотрим задачу (7), соответствующую точке xt = lim хк . Покажем, что Wt С G(xt). По
определению множеств I = Ik ={i:l^i^r, — ек ^5^(¾ )<0}, г= 1, 2,... Отсюда при г-»оо
получим 5^(¾) = 0 для всех г е I. Это значит, что I С It, т. е. в определении множества Wt
число ограничений типа неравенств не меньше, чем число таких ограничений в определении
G(xt), Тем самым установлено, что Wt С G(xt), А тогда, замечая, что одна и та же функция
на более широком множестве имеет меньшую нижнюю грань, получаем at = info^ inf 0 =
= 0(¾) = 0. С другой стороны, (0, 0)eWt, поэтому ot ^ 0. Следовательно, crt = 0 и согласно
теореме 1 имеем xt е Xt.
Выше было доказано существование предела lim /(¾). Теперь можем сказать, чему равен
к —юо
этот предел: lim /(¾) = lim f(xk ) = /(¾) = Д.
K-tOO K-4QO г
Таким образом, построенная последовательность (¾} минимизирует функцию /(ж) на
множестве X. Поскольку {хЛ е Ms(xq) —ограниченное множество, то из теоремы 2.1.2 следует,
что lim р(хк, Xt) = 0. Равенства (20) и, тем самым, теорема 2 доказаны. D
к ~> оо
4. Для задачи
f(x)-> inf; хеХ={хеЕп; д{(х)^.0, i = l т, дг(а:)=(аг,а:)--ог=0, i=m+\ s},
содержащей линейные ограничения типа равенств, метод возможных направлений
описывается так же, как выше, лишь в задаче (2) нужно добавить еще ограничения (а{, е) = О,
г = т + 1 s.
Можно заметить, что описанный в гл. 3 симплекс-метод для решения канонической задачи
линейного программирования по существу является вариантом метода возможных
направлений. Более того, опираясь на идеи метода возможных направлений, можно получить симплекс-
метод непосредственно для основной задачи линейного программирования (без ее сведения к
канонической задаче).
Выше во вспомогательной задаче (2) было принято условие нормировки \е] | ^ 1, j— 1 га.
Возможны и другие условия нормировки, например, |е| ^ 1 или |Bfce|^ 1, где Вк
—специально выбираемая матрица. Заметим, что при такой нормировке задача (2) уже не будет задачей
278 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
линейного программирования. Тем не менее удачный выбор Ih может облегчить выбор
возможного направления убывания, ускорить сходимость метода. О других способах нормировки,
о сходимости различных вариантов метода возможных направлений и других аспектах этого
метода см., например, [319; 326; 374; 774].
Упражнения
1. Сделать несколько итераций метода возможных направлений для задачи минимизации
f(u) — х + у на множестве X = {и = (х, у): д{(и) — х2 — у^0, д2(и) — у—1^.0} при различном
выборе начальной точки v0.
2. Вычислить несколько приближений по методу возможных направлений для задачи из
примера 1 при различном начальном приближении «ц.
§ 6. Проксимальный метод
1. Этот метод используется для решения выпуклых задач минимизации
/(яО-inf, хеХ, (1)
когда X — выпуклое замкнутое множество из Еп, функция f(x) выпукла
на X. В его основе лежит понятие проксимального оператора, который
определяется следующим образом. Фиксируются точка хе Еп и число а >
> 0, определяется функция
<p(z, х, а)= g|z - х\2 + af(z) (2)
переменной z е X, и рассматривается задача минимизации
tp(z, х, а) —»inf, z е X. (3)
Так как функция <p(z, х, а) сильно выпукла на I с постоянной сильной
выпуклости ж = 1, то согласно теореме 4.3.1 задача (3) имеет, притом
единственное решение zt = zt(x, а). Тем самым определен оператор, который
каждой точке х е Еп и числу а > 0 ставит в соответствие решение zt
задачи (3). Этот оператор называется проксимальным, его обозначают
символом рг. Таким образом, pr (х, a) = zt е X — решение задачи (3). Изучим
некоторые свойства проксимального оператора. Из (3) и неравенства (4.3.3)
следует, что
2|« - рг (ж, а)|2 < ip(z, х, а) - р(рг(х, а), х, а)
VzeX, хеЕп, а>0.
Если функция f(x) дифференцируема на X, то <pg(z, x,a) = z-x + af'(z)
и для решения рг(я;, а) задачи (3) по теореме 4.2.3 имеем
(pr (х, а)-х + a/'(pr (х, a)), z - pr (х, a)) ^0 Wise X.
Отсюда, вспоминая характеристическое свойство проекции точки на
множество (неравенство (4.4,1)), обнаруживаем следующую связь между
проксимальным оператором и оператором проектирования:
pr(x,a)='Px(x-af,(pr(x,a))) VxeEn, а>0. (5)
§ 6. ПРОКСИМАЛЬНЫЙ МЕТОД
279
Если функция f(x) не является дифференцируемой, то эту связь можно
выразить с помощью субградиентов. Всюду ниже в этом параграфе мы будем
предполагать, что функция f(x) определена и выпукла на открытом
выпуклом множестве W, содержащем множество X. Тогда при каждом z еХ
субдифференциал df(z) является непустым выпуклым замкнутым
ограниченным множеством (теорема 4.6.2). По правилу 7 субдифференцирования
из § 4.6 для функции (2) имеем
dtp(z,x,a) = z-x + adf(z) VzeX. (6)
Согласно теореме 4.6.4 для решения рг(ж, а) задачи (3) найдется
субградиент C((pr (х, а)) е dtp(pr (х, а), х, а), такой, что
(C[(pr(a;, a))., z - рг(х, а)) > 0 VzeX.
Из формулы (6) следует существование c(pr (х, а))е df(pr(x, а)), для
которого с,(рг (ж, а)) = рг(я;, а) — х + ас(рг(х, а)), и поэтому предыдущее
неравенство можно записать в виде
(рг(а;, а) - х + ac(pr(a;, a)), z - рг(ж, а)) >0 VzeX. (7)
Отсюда вместо формулы (5) получим
pr(x,a) = Vx(x-ac(pr(x,a)) VxeEn, а > 0, (8)
для некоторого субградиента с(рг(ж, а)) е df(pr(x, а)).
С помощью установленной связи (8) между проксимальным оператором
и оператором проектирования нетрудно доказать следующий критерий
оптимальности для задачи (1).
Теорема 1. Для того, чтобы xt е Xt, необходимо и достаточно,
чтобы
xt = pr(xt,a) Va>0.
Доказательство. Необходимость. Пусть xt G Xt. По
теореме 4.6.4 найдется субградиент c(xt) е df(xt) такой, что (c(xt), z— xt) ^0
VzeX. Тогда, как следует из формулы (6) ci(xt) = xt — xt + ac(xj = ac(xt)e
е dtp(xt, xt, а). Умножая на а > 0 предыдущее вариационное неравенство,
получаем: (с, (ж,,), z — xt) ^ 0 VzeX. Согласно теореме 4.6.4 это означает,
что xt — решение задачи (3) при х = xt, т. е. xt = pr (xt, а).
Достаточность. Пусть xt = pr(xt, а). Согласно формуле (8)
найдется c(pr(x,a)) = c(xjedf(pr(xt,a)) = df(xt), что xt =Vx(xt - ac(xt)).
Отсюда и из замечания 1 к теореме 4.6.4 имеем: xt £ Xt. Теорема 1
доказана. □
Теорема 2. Проксимальный оператор рг(х, а) непрерывен по
переменной х равномерно относительно а. > 0 и, более того,
\pr(x,a)-pr(y,a)\^\x-y\ Vx,yeEn, а > 0. (9)
Доказательство. Из неравенства (4) при z = рг(у, а)
имеем: ^\pv(y,a)-pv(x,a)\2^(p(pr(y,a),x,a)-tp(pr(x,a),x,a). Меняя
здесь х и у ролями, получим j|pr (ж, а) — рг(у, а)|2 < <р(рг (х, а), у, а) -
— <р(рг(у, а), у, а). Сложим эти два неравенства: |рг (ее, а) — pr(y, а)|2 ^
^ip(pr(y, а), х, а)-<р(рг(х, а), х, а) + <р(рг(х, а), у, а)-(р(рг(у, а), у, а).
280 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
В правую часть этого неравенства подставим соответствующие значения
функции ip(z, х, а) согласно ее определению (2). После простых
преобразований получим
\pr(x,a)-pr(y,a)\2^(pr(x,a)-pr(y,a),x-y) Ух,увЕп, а>0. (10)
К правой части неравенства (10) применим неравенство Коши — Буняков-
ского: \рг(х, а)-рг(у, а)\2 < |рг (ж, а) - рг (у, а)| ■ \х - у\. Отсюда следует
неравенство (9). П
В следующей теореме приводятся условия, обеспечивающие
непрерывность рг(х, а) по совокупности аргументов (х, а) во всех точках х е Еп,
а > 0.
Теорема 3. Пусть в дополнение к сделанным выше
предположениям функция f(x) удовлетворяет условию Липшица: \f(x)-f(y)\ < L \х-
— у\ Va;, уеХ, пусть хк еЕп, ак>0, к = 1, 2,..., {хк\—>х, {ак}—>■ а >0.
Тогда lim pr(xk, ak) = pr(x, а).
к ~> оо
Доказательство. По неравенству треугольника имеем:
|pr (¾. ак) - рг (х, а)\ < |рг (хк, ак) - pr (х, ак)\ +
+ |рг(ж, ак)-рг(х, а)\, к = 1,2,... (11)
Первое слагаемое в правой части неравенства (11) в силу (9): |pr(a;t, ак) —
— рт (х, ак)\ ^ 1^ — х\—»0 при к —»оо. Докажем, что второе слагаемое также
стремится к нулю. Из неравенства (4) при a = ак, z = рг(ж, а) следует
\\рг (х, а) - рг (х, ак)\2 < ^\рг(х, а) - х\2 - ||рг(ж, ак) - х\2 +
+ ak(f(Pr(x,a))-f(Vr(x,ak))), к = 1,2,...
По условию функция f(x) удовлетворяет условию Липшица, поэтому
\f(pr(x,a))-f(pr(x,ak))\^L\pv(x,a)-pr(x,ak)\. Отсюда и из
предыдущего неравенства для величины ак = |рг (х, а) — рг (х, ак)\ > 0
имеем: а\ — 2akLak - \рг(х, а) - х\2 ^.0, к = 1,2,... Замечая, что левая
часть этого неравенства представляет собой квадратный трехчлен от-
носительно переменной ак, получаем оценку, для ак: 0.^ ак < akL +
+ J\pr(x, а) - х\2 + a|L2<2L sup ak + \pv(x, а)— х\. Тогда последователь-
ность {рг(я;, ак)} также ограничена и согласно теореме Больцано — Вейер-
штрасса имеет хотя бы одну предельную точку w. Выбирая при
необходимости подпоследовательность, можем считать, что {рг (х, ак)} —»w. Тогда
множество Y, состоящее из точек рг (х, ак), к = 1, 2,... и точки w компактно.
В силу компактности субдифференциального отображения (теорема 4.6.5)
тогда компактно и множество |J df(y), которое содержит субградиенты
с(рг (х, ак)), входящие в неравенства (7) при а = ак, к = 1,2, Поэтому
можем считать, что {с(рг(я;, ак))}—»с. Из замкнутости
субдифференциального отображения (теорема 4.6.5) следует, что с edf(w). Теперь мы можем
совершить предельный переход при к —»оо в вариационных неравенствах
(pr(a;, ak)-x + akc(pr(x, ак)), z-pr(x, ак))^0 VzeX, полученных из (7)
при а = ак. Будем иметь (w - х + ас, z - w) > 0 MzeX. Здесь с е df(w) и
согласно формуле (6) имеем с, = w - х + ас е dip(w, х, а). Отсюда и из
предыдущего неравенства, записанного в виде (с,, z — w) ^0 VzeX с помощью
§ 6. ПРОКСИМАЛЬНЫЙ МЕТОД
281
теоремы 4.6.4 получим, что w решение задачи (3), т. е. w = рг(а;, а). Это
значит, что последовательность {рг(ж, ак)} имеет единственную
предельную точку рг(а;, а), т. е. lim рг(ж, ак) = рг(х, а). Тем самым мы доказали,
к ~юо
что второе слагаемое из правой части неравенства (11) также стремится к
нулю. Непрерывность проксимального отображения рг(ж, а) по
совокупности аргументов (х, а) установлена. □
Замечание 1. В силу теоремы 4.6.6 выраженное в теореме 3
требование условия Липшица от функции /(ж) можно заменить условием
ограниченности множества X.
Проксимальный метод заключается в построении последовательности
{хк} по следующему правилу:
xk + i=Pr(xk,ak)> * =0,1,..., (12)
где начальная точка 2¾ и последовательность {ак} >0 предполагаются
заданными. Итерационный процесс (12) основан на известном из анализа
[393] методе поиска неподвижных точек сжимающих операторов и идейно
близок к рассмотренным выше методам проекции градиента и субградиента.
В соответствии с определением проксимального оператора на fc-м шаге
процесса (12) для определения очередного приближения хк + 1 нужно решить
задачу минимизации (3) при х= хк, а = ак:
tp(z,xk,ak) = l\z-xk\2 + akf(z)^mf, z € X, к=0, 1,... (13)
Если функция f(x) дифференцируема на X, то согласно теореме 4.2.3 точка
хк + 1 будет решением задачи (13) тогда и только тогда, когда
(<Pt'(xk + i,xk^k),z-xk + l)=(xk+l-xk+akf'(xk+l),z-xk + l)^0 Ч*еХ-
Отсюда, используя характеристическое свойство проекции
(неравенство (4.4.1)), получаем, что
^ + ,=^(¾-«*/'(»* + .)). * = 0,1,.... (1.4)
Таким образом, для дифференцируемых функций проксимальный метод (12)
равносилен методу проекции градиента в так называемой неявной форме,
когда хк + 1 явно не выражено через предыдущее приближение хк и должно
определяться как решение уравнения (14).
Теорема 4. Пусть X — выпуклое замкнутое множество из Еп,
функция f(x) определена и выпукла на открытом выпуклом
множестве W, содержащем множество X, и полунепрерывна снизу на X,
/. = Inf f(x) > -оо, X, = {х е X: f(x) = /J ф 0, пусть 0 < 7о «S «* < 7i.
к = (Tl, . Тогда последовательность {хк}, определяемая методом (12)
при любом начальном приближении х^еЕ71, сходится к некоторой точ-
До касательство. Применяя неравенство (4.3.3) к задаче (13) имеем
\\z ~ Zfc + il2 =¾ ¥>(*. Ч> otk)-<p(xk + l, xk, ak) =
= \\z-xk\*-\\xk_,x-xk\*+ak{f{z)-f{xk^)) VzeX, fc=0,l,... (15)
282 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Возьмем произвольную точку i, е X, и в (15) положим z = xt. С учетом
неравенства f(xt) — f(xk + i) < 0 получим
\x*-xk+i\2^\x*~xk\2-\xk + \-xk\2<:\x*-xk\2> к =0,1,..., VxteXt. (16)
Отсюда видно, что последовательность {|zfc — xt\2} не возрастает, a (¾}
ограничена. Тогда существует подпоследовательность {хк }, сходящаяся к
некоторой точке vt, причем vteX в силу замкнутости X. Можем считать,
что {ак } —» а^, 0 < 7о ^ аоо ^ 7i • Далее, суммируя неравенство (16), имеем
JV
2_j \Хк + I ~~ Хк\ ^1¾ ^ЪI ~~ \Х* ~ XN+l\ ^ \Х* ~ ^ttl '■" =1j2,...
оо
Это значит, что ряд ]Г) \хк + 1 — хк\2 сходится и, следовательно, lim \хк + 1 —
к=о к-*°°
— хк\ = 0. Тогда подпоследовательность {хк +,} также сходится К vt.
Переходя в (15) к пределу при к = кт —»оо с учетом неравенства Hm/(a:fc + [)^ f(vt),
получим: 0^.aoo(f(z) — f(vt)) VzeX. Это значит, что vteXt. Поскольку
последовательность (1¾ — a;J2} не возрастает при Va;,, 6 Xt, то в частности при
xt = vt мы также получим невозрастающую последовательность (1¾ — vt\2}.
Тогда lim 1¾ - vt\2 = lim 1¾ - vt\2 = 0. Теорема 4 доказана. □
к ~> оо т ~> оо г
Для сильно выпуклых функций /(ж) несложно получить оценку скорости сходимости
метода (12) при ак = а > 0, А; =0, 1,...
Теорема 5. Пусть выполнены условия теоремы 4 и функция f(x) сильно выпукла на
множестве X с постоянной сильной выпуклости и > 0. Пусть последовательность {хк}
определена методом (12) при ак — а > 0, к = 0, 1,... Тогда'
k.-**NK>-4rV, * =0,1,...: 9 = Т+^. (17)
Доказательство. Из теоремы 4.3.1 следует, что при сделанных предположениях
задача (1) имеет, притом единственное, решение ж,,, и
§|*-<ч,|Ч/(*)-/К) V*eX (18)
Кроме того, функция <p(z, ж, а) из (2) сильно выпукла с постоянной сильной выпуклости 1 + сси
и из (13) имеем
1 V* 1г ~ xk +112 ^ У^' gfc' °) ~ ^(¾ +1 ■ gfc' °)' (19)
VzeX, fc = 0,1,...
В неравенстве (18) положим z — xk+i и умножим его на а > 0 и сложим с (19) при z = :¾.
Получим
(J + a^k-^t + ll^jk-^t^-Jl^ + l -^1^51¾-¾^1 *!=0'1'---
Отсюда следует, что |xfc + , -xj2 ^\xk-xt\2q ^\хк__, -xjV^-.. ^\xQ-xt\2qk + ', fc = 0, 1,...
Оценка (17) доказана. D
Отметим, что если функция f(x) дифференцируема на X, то теоремы 4, 5 сохраняют силу
и для метода (14).
2. Опишем непрерывный вариант проксимального метода, следуя [25]. Рассмотрим задачу
<p(z,x,a(t)) = ^\z-3i\2 + a(t)f(z)-*M, z <= X, (20)
где a(t) > 0 Vt ^ О, X — выпуклое замкнутое множество, /(ж) выпукла на X. Тогда
<p(z, ж, a(t)) сильно выпукла с постоянной сильной выпуклости *= 1 и по теореме 4.3.1
задача (20) имеет, притом единственное, решение z = рг(ж, a(t)). Введем систему
дифференциальных уравнений
x(t) = pr(x(t), a(t))-x(t), t>0. (21)
§ 6. ПРОКСИМАЛЬНЫЙ МЕТОД
283
Согласно теореме 1 решение xt задачи (1) удовлетворяет уравнению pr^, a(t)) — xt = 0 при
Vt ^ 0. Это значит, что каждая точка xt е Xt является точкой равновесия (стационарным
решением) системы (21), Можно ожидать, что при некоторых требованиях на функции f(x), a(t)
траектории x(t) системы (21) при больших t приближаются ко множеству Xt. Справедлива
Теорема 6 (Антипин [25]). Пусть множество X и функция f(x) удовлетворяют
условиям теорем 3, 4, функция a(t) непрерывна и 0 < 7о ^ <*(*) ^ 7i Vt > 0. Тогда
траектория x(t) системы (21), выходящая из любой точки х(0) = xq, определена при всех t JjO
и сходится при t -» +оо к некоторой точке vt = ^,(¾) G Xt; кроме того, lim x(t) = 0.
Доказательство. В силу теорем 2, 3 правая часть pr(х, a(t)) — х уравнения (21)
удовлетворяет условию Липшица по i и непрерывна по t, потому все решения
системы (21) определены при всех t >0 (см. ниже теорему 6.1.1). В силу уравнения (21) имеем
pr(x(t), a(t)) = x(t) + x(t) бХипо теореме 6.3.1
\\z - pr(x(t), a(t))\2 =\\z- (x(t) + x(t))\2 ^ 9(z, x(t), a(t))-
- <p(pr(x(t), <*(<)), x(t), <*(<)) = \\z - a:(t)|2 - \\(x(t) + x(t)) - x(t)\2 +
+ a(t)(f(z)-f(x(t) + x(t))) VzeX, t>0. (22)
Полагая в (22) ? = i,e Xt, с учетом неравенств f(xt) — f(x(t)+ x(t)) ^0, a(t)>0 получим:
\x(t) + x(t) - xt\2 = \x(t)\2 + \x(t) -xt\2 + 2{x(t), x(t) - xt) sC \x(t) - xt\2 - \x(t)\2
или
l*(*)|2 + 5^1*(*)-*ч|Ч0 V'>0> Va:*e**- (23)
Интегрируем это неравенство на отрезке [г, t]
t
2 $ \x(s)\2ds + \x(t)-xt\2 ^\x(r)-xf Vt>r>0, Vi.6 1».
T
Это означает, что функция \x(t) — xt\ не возрастает при всех xt е Xt. В частности, при
т = 0 отсюда имеем: \x(t) — xt\2 ^ 1¾ — xt\ , так что траектория {x(t), t ^ 0} ограничена и,
кроме того, \ \x(t)\ dt < со. Отсюда следует существование последовательности {<г} —» +оо
о
такой, что {ж(<г)}-»0, {а:(*г)}-»«*, {«(*<)} -* «ос 0<ТЬ^аоо <Ti- Так как -^-замкнутое
множество, i(t) + x(t) е X, то £(¾) + x(tA -)офбХ. Далее в (22) перейдем к пределу при
t = 1.-»со. Учитывая, что lim /(i(t,.) + o;(tj))> f(vt), получим 0^ 0^(/(2)-/(¾)) VzeX.
г —* оо
Это значит, что i\ е X,,. Тогда функция |a:(t) - «J2 не возрастает. Потому lim \x(t) — vt\2 —
— lim |a;(t,) — uj2 = О, т. e. lim x(t) — vt. Наконец, из неравенства (23) при xt = vt имеем
i-too t —> 00
|ж(*)]2 ^-(i(i), ¢(¢)-^) ^|i(i)||a;(i)-i.H,| или \x(t)\ ^ \x(t) - vt\ Vt > 0. Отсюда следует,
что lim i(t) = 0. Теорема 6 доказана. D
i '■, £ —юо
Для сильно выпуклых функций f(x) можно получить следующую оценку скорости
сходимости метода (21).
Теорема 7. Пусть множество X и функция f(x) удовлетворяют условиям
теорем 3, 4, функция f(x) сильно выпукла с постоянной сильной выпуклости х >0, функция
оо , \
a(t) > 0 непрерывна и [ -.—"'r/ , dr = +00, пусть x(t), t > 0, —любая траектория
системы (21). Тогда о 1 + -«а('Г)я
Н<) - ^| ^ 1^(0) - xt\ ехр(- j t ^¾¾^ dr) Vt>0. (24)
Доказательство. Из теоремы 4.3.1 следует, что задача (1) имеет, притом
единственное, решение xt и
%\z-xt\2$f(z)-f(xt) VzeX (25)
Функция ip(z, х, a>(t)) сильно выпукла на X с постоянной сильной выпуклости 1 + сс(<)и и
из (20), (21) имеем
U\ + a{t)x)\z-{x{t)+x{t))\2 < ¥>(*, x(t),a(t))-ip(x(t)+x(t), x(t),ot(t)), t > 0. (26)
284 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
В (25) положим z = x(t) + x(t), умножим на a(t) > 0 и сложим с (26) при х = xt. Получим
±(l+2a(t)x)(\x(t)\2+\x(t)-xt\2+2(x(t),x(t)-xt)) ^^\x{t)-xt\2-^\x(t)\\ t > О
или
dt
Интегрируя это неравенство на отрезке [0, t], придем к оценке (24). D
Замечание 2. При a(t) = a = const > 0 требование условия Липшица от функции
f(x) в теоремах 6, 7 излишне. Это требование нужно было в теореме 3 при доказательстве
непрерывности рг(о;1 а) по совокупности (х, а), что в свою очередь обеспечивало
непрерывность правой части системы (21) по t и продолжимость траекторий x(t) на всю полуось t ^0.
Однако при a(t) = a правая часть (21) от t не зависит и для продолжимости траектории
достаточно условия (9).
Замечание 3. При доказательстве теорем 4-7 для нас не было существенно, каким
методом решаются вспомогательные задачи (3); (13), (20) для определения значений
проксимального оператора в требуемых точках (х, а). Однако ясно, что проксимальный метод имеет
смысл применять лишь тогда, когда имеется удобный быстро сходящийся метод для решения
упомянутых вспомогательных задач. В этих задачах, в отличие от исходной задачи (1),
минимизируемая функция сильно выпукла благодаря слагаемому „\z — х\2, что обеспечивает их
однозначную разрешимость и, можно надеяться, улучшает сходимость используемых методов
их решения, повышает устойчивость этих методов к погрешностям вычислений. Различные
варианты проксимального метода, вычислительные аспекты этого метода исследованы,
например, в [25; 26; 30; 799; 803; 813].
В следующем параграфе рассматривается метод, который можно истолковать как некоторое
развитие проксимального метода.
Упражнения
1. Реализовать один шаг проксимального метода для задач из упражнений 4.6.1, 4.6.3, 5.2,
5.3 при различных начальных приближениях.
2. Опираясь на теоремы 1-3, доказать, что проксимальный оператор является монотонным,
замкнутым, компактным отображением.
§ 7. Метод линеаризации
Этот метод на каждой итерации использует линейные аппроксимации
минимизируемой функции и функций, задающих ограничения. Опишем его для
задачи
/(aO-lnf, хеХ = {хеХ0: 9i(x) ^0,..., 9т(х)^0}, (1)
предполагая, что Х0 — выпуклое замкнутое множество из Еп и функции
f(x)> 9t(x)t С\Х0). Пусть Xq — начальное приближение, х0е Х0.
Предположим, что к-е приближение хк е Х0 при некотором к >0 уже известно.
Введем функцию
¢,(0:) = ^-^12 + ak(f'(xk),x -хк), ак>0, (2)
и множество /к v /
Wk = {xe Х0: д.(хк) + (gt'(xk), х - хк) ^ 0, г = 1,..., т}. (3)
Пусть Wky=0. В качестве к + 1-го приближения хк + 1 возьмем решение
следующей задачи минимизации:
(^(aO-^inf, xeWk. (4)
§ 7. МЕТОД ЛИНЕАРИЗАЦИИ
285
Поскольку функция (2) сильно выпукла, множество (3) выпукло и замкнуто,
то согласно теореме 4.3.1 задача (4) имеет, притом единственное, решение.
Задачу (4) необязательно решать точно: достаточно найти точку xk+i из
условий
хк + 1ЫГк:Фк(хк + 1)^\тйФк(х) + ек, ек>0. (5)
Если Х0 многогранное множество, то задача (4) представляет собой задачу
квадратичного программирования и может быть решена конечношаговым
методом (см. ниже § 7). Если Wk — ограниченное множество, то для
решения задачи (4) может быть использован, например, метод условного
градиента, который будет сходиться и при ек > 0 позволит определить точку
хк +, из (5) за конечное число шагов. В общем случае задача (5), конечно, не
всегда просто решается. Метод линеаризации (5) обычно используют лишь
в тех случаях, когда определение точки xk + i из (5) не требует большого
объема вычислений. Полезно заметить, что задача (4) равносильна задаче
Мх) = i\x-(xk~ акГ(ч))\2 -»inf, х е Wk,
так как <рк(х) — Фк(х) = al\f'(xk)\2 = const, х € Еп. Это значит, что точное
решение vk задачи (4) представляет собой проекцию точки хк — akf'(xk) на
множество Wk, а точка xk + i из (5) является приближением для vk. Отсюда
следует, что если в (1) ограничения д{(х) ^ 0 отсутствуют (т =0), то X =
= X0=Wk и метод линеаризации превратится в метод проекции градиента.
Теорема 1. Пусть Х0 — выпуклое замкнутое множество из Еп,
int Х0 Ф 0 (в частности, возможно Х0 = Еп); функции f(x), д{{х) е
€ С'(-Хо), выпуклы на Х0 и
max{|/'u)-/'(v)|; max \д('(и)-g/(v)\} ^ L\u - v\ Vu, v e X0;
выполнено условие Слейтера, т. е. существует такая точка хеХ, что
gi(x)<0,...,gm(x)<0; (6)
/„ > -оо, Xt ф 0; числа ак, ек в (2), (5) таковы, что
оо
Ч ^ °. £ 44 < °°. ° < 70 ^ 01 k ^ а, (7)
где а определяется ниже формулой (22). Тогда множество (3) непусто
при всех к ^ 0, последовательность {хк}, определяемая методом (5),
сходится к некоторой точке vt е Xt.
Доказательство. Согласно теореме 4.2.2
9i(xk) + {9i(4)>x-xk)^9i{x) Va;eX0. (8)
Отсюда следует, что если i6l, то х е Wk, так что X с Wk. По условию X ф 0,
поэтому Wk ф 0, к = 0, 1 Таким образом, при каждом к > 0, ек > 0 существует точка хк +,,
удовлетворяющая условиям (5); например, можно взять xk + i =vk, где vk —точное решение
задачи (4). Применяя теорему 4.3.1 к задаче (4) с учетом (5) имеем \хк + 1—ьк\2/2^Фк(хк + 1)-
k + i-^Kv^- (9)
286 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Возьмем произвольную точку xt g Xt, При сделанных предположениях по теореме 4.9,2 и
лемме 4.9.2 найдутся такие числа \\ ^ 0 Aj^ ^ 0, что
m
(/4¾) + Е *:*'(*♦). * - я>> > о V* е х0. (Ю)
• = i
AJa(*«) = o, < = i m, ^6¾. (П)
Подчеркнем, что в силу замечания, сделанного после формулировки следствия 2 к
теореме 4.9.5, числа \\ Х*т в (10), (11) могут быть выбраны одни и те же для всех xt е Xt,
Далее, из условия (6) и неравенств (8) следует
9d4) + (9i(x*)>*-x*)^9i(x)<0, * = 1 гги (12)
Это значит, что множество (3) также удовлетворяет условию Слейтера, и к задаче (4) также
применима теорема 4.9.2, из которой следует, что функция Лагранжа этой задачи 1ц (х, £) =
1 9 т
= 2\X~Xk\ +ak(f'(xk)>x-xk)+ Е Ы9Лхк)+&(хк)>х-хк))'хСХ0> £ = (£l £т)£
г = 1
еЛ0=й™, имеет седловую точку (vk, £к), vk — решение задачи (4), f *= (£lfc £тк) б£™.
В силу леммы 4.9.2
т
(¾ ~хк + в*/(¾) + Е fttft'O**).*-"*) > ° Vo;eX0, (13)
i = l
^(ffiK) + (ffi'K).«fc-^» = 0, i=l m, (14)
3,-(¾) + (3/(¾). «fc~ *fcX°. i = l m, vk£X0. (15)
Возьмем в (10) x= vk, умножим на ak > 0 и сложим с (13) при х = xt. Получим
°^(vk-xk>x*- vk) + ak(f'(x*) - /(¾). ч - ж*> +
m т
+ ¾ Е WOO,"*-^ + Е ««<»/(**). ^-¾). (16)
1 = 1 4 = 1
Преобразуем и оценим каждое слагаемое в левой части (16). Для первого слагаемого имеем
{vk~xk>x*-vk) = ]l\xk-x*\2-^\vk-xk\2-2\x*~vk\2- (17)1
Пользуясь неравенством (4.2.20) при и = хк, w = vk, v = xt, получаем оценку для второго
слагаемого
ck(f'(xt)-f'(xk),vk-xt)^akL\xk-vk\2/4. (18)
Далее из леммы 2.6.1 при f(x) — д{(х), x = vk, 2/ = ¾ с учетом неравенств (15) имеем gi(vk) ^
^9i(.xk) + (9i'(xk)'vk-xk) + L\xk-vk\2/2^L\xk-vk\2/2' l' = l т- Отсюда для третьего
слагаемого из (16) с помощью равенств (11), неравенств (8) при x = vk и А^О получаем
т т
<*к Е b*i(9i'(x*),vk-x*) = ak T,'K(9i(xt) + (9i'(x*)<vk-x*))^
i=l i=l
т „ т
^ck'EK9dvk)^ak\X*\lL\xk-vk\2/2, |А*|, = Е |АЦ. (19)
i=l i=l
Наконец, для четвертого слагаемого из (16) с учетом равенств (14), неравенств (8) при x = xit
включений xte X, £к е Е™ имеем
т т
Е Ы9г'(хк)<х*-Ч)= EKft(ft(*t) + (ft'(*t)^-*t»-
1=1 1=1
т
-£«(»<(**)+ (ft'(**).«*-**»K Е U9dx,)^0. (20)
i = l
Сложим оценки (17)—(20); с помощью (16) получим
0^\\хк~х^ -\\vk-xt\2 ~\\vk-xk\2{\-\bak- L\\\ak). (21)
Выберем ак из условий
§ 7. МЕТОД ЛИНЕАРИЗАЦИИ
287
где 7oi 7 такие малые положительные числа, что 7о ^ 2(1 - 7)/(£(1 +2|А*|,)). Из (21), (22)
тогда имеем
К-?*|2 + 7|«*-**|Ч|**-^|2, it =0,1,... (23)
Из неравенств (7), (9), (23) и леммы 2.6.10 следует существование конечных пределов
lim \xk-xt\ = lim \vk-xt\, lim \xk-vk\ = 0. (24)
к —too k—*oo К-ЮО
Это значит, что последовательность {хк}, {vk} ограничены. Покажем ограниченность
последовательности {£*} из (13)-(15). С помощью (12), (14) из (13) при х = х имеем
< т т
(vk-xk+akf'(xk)>s-vk)>- Е tik(9i (4)^-4)= T,[^ik(-9i(!Bk)-(gil(xk),x-xk))+
i=l i=l
m
+^ik(9i{xk)+{9i{xk)tvk-xk))}^ Y, tik(-9i(x))>tjk. min |ft(x)|, j = l m.
i=_l J l^i^m
Отсюда и из неравенств (22), ограниченности {хк} и {vk} получаем
0 ^ ^ ^ min \д{(х)\^Ук ~Хк + аь?1(.хк)< £~ vk)] ^ const <. °°. 3 = 1 гп.
1 ^ i ^ m
Таким образом, последовательность {£*} ограничена. Отсюда и из (22) следует
ограниченность {£к/<хк}. Перепишем (13), (14) в виде
(jLarjL+f'(4)+Y, ^9i'(xk),x-vk)^0 ЧхеХ0,
к i = l к (25)
T^(9i(xk) + (gi,(xk),vk-xk)) = 0, i = l m.
Выбирая при необходимости подпоследовательности из ограниченных последовательностей
{хк}, {vk}, {£к/ак}, можем считать, что эти последовательности сходятся. С учетом (24)
тогда
lim хк= lim vk=vt, lim §-=^?^0, i = \ m.
к-юо к ~юо к-г+оок
Из замкнутости Х0 следует, что v^ gX0, а из (15) при к —*оо получим <7£(v+) <0, * = 1,..., т.
Следовательно, v^ € X, Далее, из (25) при к —*оо с учетом (22) имеем
т
'</'(«.)+ Е /*iV(«.). *-«.)> О Va:eX0, ^SfK)=0, i = l т. (26)
г = 1
Как следует из леммы 4.9.2 и теоремы 4.9.2, соотношения (26) означают, что vt eXt.
Вспомним, что неравенство (23) было получено при любых xt eXt. В частности, (23) верно и при
xt=vt. Но vt—предельная точка последовательности {хк}. Согласно лемме 2.6.10 тогда
{хк} —> vt. Теорема доказана. П
Замечание 1. Если в (5) ек = 0, то согласно (9) тогда хк + , = vk, к = 0, 1 и
неравенство (23) можно записать в виде
\хк + \-х*\2 + ч\хк + \-хк\2*Ихк-х*\2< к = 0,1 VxteXt.
Пользуясь произволом в выборе xt&Xt, отсюда имеем
\xk~v*\ >\хк + \ ~v*\> Р(хк'Х*)>Р(хк + \>х*)< ^=0,1
причем равенство здесь возможно лишь при хк + , = хк = vt е Xt. Таким образом, при точной
реализации описанного метода линеаризации расстояние от точки хк до множества Xt или до
точки vt монотонно убывает. В то же время можно отметить, что хотя и {/(^))-^/(¼.) =/„,
но {/(¾)} не обязательно монотонно убывает и не обязательно хк е X.
Непрерывные и другие различные варианты метода линеаризации описаны и исследованы,
например, в [24; 27; 29; 286; 304; 603; 606; 670; 738; 774].
288 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Упражнения
1. Доказать, что если в (4) окажется vk = хк при некотором к ^ О, то точка хк удовлетворяет
необходимым условиям оптимальности. Указание: применить теорему 4.8.1 к задаче (4),
затем принять xk=vk,
2. Доказать, что если выполнены условия теоремы 1, ек = О, к = О, 1,..., и в (4) vk = хк при
некотором к ^ 0, то хк е Xt. Указание: положить в (25), (15) vk = хк и воспользоваться
леммой 4.9.2 и теоремой 4.9.2.
3. Рассмотреть метод линеаризации для задачи (1) при Х0 = Е?, т = 0.
4. Описать метод линеаризации для задачи (1) с дополнительными линейными
ограничениями (а,-, х) = Ъг, г = т + 1, ..., s,
§ 8. Квадратичное программирование
1. Рассмотрим задачу
f(x)=^(Cx, х) + (с, z)-Hnf, хеХ, (1)
X = {хе Еп: (а{, х) < Ь\ г = 1,...,т; (а{, х) = Ъ\ г = т + 1,..., s}, (2)
где С — симметричная неотрицательно определенная матрица размера п х
х п, т. е. С ^ 0; с, а, е Еп, Ь{ е К, г = 1,..., s, ^возможности m = 0, или
s = т, или s = т = 0 не исключаются). Задачу (1), (2) принято называть
задачей квадратичного программирования: в ней квадратичная
выпуклая функция минимизируется на многогранном множестве. Такие задачи
возникают в различных приложениях. Задачи определения расстояния от
точки до многогранного множества, проектирования на такое множество
также представляют примеры задачи квадратичного программирования,
когда в (1) С = I — единичная матрица. Задачи вида (1), (2) часто возникают
как вспомогательные при описании различных методов минимизации (см.,
например, § 6). Поэтому важно иметь, достаточно простые методы
решения задачи квадратичного программирования. Оказывается, для задачи (1),
2), как и для задачи линейного программирования, существуют конечные
конечношаговые) методы их решения. Для построения таких методов
сначала нужно выявить некоторые специфические особенности этой задачи. В
частности, здесь полезно рассмотреть двойственную к (1), (2) задачу.
Введем функцию Лагранжа задачи (1), (2):
L(x, \)=\(Сх, х)+(с, х) + (\, Ax-b)=~(Cx, х) + (с+АТ\, х)-(\, Ь),
хеХ0 = Еп, AeA0={A=(A1,...,As)€Es: A1^0,...,Am^0},
где А — матрица размера sxnco строками a,,..., as, Ь = (Ь1, ..., 6s). Если
ft > —оо, Xt ф<2), то согласно теореме 4.9.3 функция L (х, А) имеет седловую
точку (xt, А*), причем в силу леммы 4.9.2
Lx(xt,X*)=Cxt + с + АТУ = 0, (3)
\*{((а{,х,)-Ъ<) = 0, г = 1,...,т, xteXt, УеА0. (4)
Тогда двойственная к (1), (2) задача
ф(\)= inf L(x, A)—>sup, АеЛ0, (5)
§ 8. КВАДРАТИЧНОЕ ПРОГРАММИРОВАНИЕ 289
согласно теореме 4.9.5 также имеет решение, причем
/,=</>*= sup V>(A)=V(A*)=/(zt), xteXt, Х*еК={\еА0:ф(Х)=Г}-
К
При дополнительном предположении положительной определенности
матрицы С, т. е. С> 0, функция ф(Х) может быть выписана явно. В самом
деле, тогда С невырождена и точка минимума х = х(Х) функции L(x, А)
по х е Еп однозначно определяется из системы Сх + с + А^Х = 0, так что
х(Х) = -С-1(с + АтХ). Поэтому
ф(Х) = Ь(х(Х),Х) = -±(с + АтХ,С~1(с + АтХ))-
~ (А, Ь) = 4((АС-ЫТ)А, Л) - (АС-'с + Ь, А) - \{С~'с, с), Л е Л0,
где АС'1АТ ^0. Таким образом, при С>0 двойственная задача (5),
записанная в виде
-V(A)-nnf, АеЛ0, (6)
также является задачей квадратичного программирования вида (1), (2), но
множество Л0 по сравнению с (2) имеет более простую структуру. Зная
какое-либо решение Л* задачи (6), можно записать решение исходной
задачи (1), (2) в виде
xt = -C-l(c + ATX*). (7)
В самом деле, при С > 0 функция f(x) сильно выпукла и согласно
теореме 4.3.1 задача (1), (2) имеет единственное решение xt, которое обязательно
будет решением системы (3), (4), где Л* — решение задачи (6). И
поскольку система (3) при фиксированном Л* однозначно определяет точку xt, то
необходимо приходим к формуле (7).
Особенно проста задача (6) в том случае, когда в исходной задаче (1), (2)
отсутствуют ограничения типа неравенств (т = 0) и множество X имеет
вид
Х = {хеЕп: <а{,х>=Ь% i = l,...,s}. (8)
Тогда Л0 = Е\ и задача (6) запишется в форме
-V>(A)-»Inf, XeEs. (9)
Множество Л* решений задачи (9) в силу теоремы 4.2.3 совпадает со
множеством решений системы
-ф'(Х*) = АС-]АтХ* + АС-1с + Ъ = 0. (10)
В общем случае система (10) может иметь более одного решения. Если
матрица А невырожденная, т. е. векторы а,,..., а3 в (8) линейно независимы,
то из С >0 следует АС~1 Ат >0, и тогда задача (9) и, следовательно,
система (10) будут иметь единственное решение. Таким образом, при 0 0 для
решения задачи (1), (8) достаточно решить две системы линейных
алгебраических уравнений (10), (3). Здесь могут быть использованы известные
методы линейной алгебры [59; 74; 89; 192; 353]. Поскольку для линейных
систем имеется принципиальная возможность получить решение за конечное
число арифметических операций (например, методом исключения Гаусса),
то такая возможность имеется и для задачи (1), (8) при С > 0.
2. Следуя [670], покажем, что исходная задача (1), (2) при С >0 может
быть сведена к решению конечного числа задач вида (1), (8). Здесь важную
роль играет понятие особой точки задачи (1), (2).
290 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Определение 1. Точка v называется особой точкой задачи (1),
(2), если v е X и v является решением задачи
f(x)-y\ni, xeV = {xeEn: (а{,х) = Ь\ i el l> {т+1,..., s}}, (11)
где I — какое-либо подмножество индексов {1,..., т} (возможность 1 = 0
не исключается).
Лемма 1. Пусть в задаче (1), (2) С ^ 0, ft > -оо, Xt ф 0. Тогда
каждое решение xt задачи (1), (2) является особой точкой этой задачи.
Доказательство. Положим I(xt) = {г: 1 < г < т, (а{, xt) = b1} и
рассмотрим задачу (11) с I — I(xt). Заметим, что xt е V. Так как (а{, xj <
< Ъ1 при г ¢. I(xt), 1 :¾ г < т, и функция (а{, х) непрерывна, то существует
такая окрестность S(xt, е) = {х е Еп: \х — xt\ < е}, £ > О, точки xt, что
(а(, х) < Ъ1 при всех г ¢. I(xt), 1 < г < т, и х е S(xt, е). Это значит, что
V CiS(xt, е)с X. Тогда /(х) ^ /(xt) — ft при всех х е V nS(xt, е). Таким
образом, xt — точка локального минимума выпуклой задачи (11) с I = I(xt).
По теореме 4.2.1 тогда xt является точкой глобального минимума функции
f(x) на множестве V. Следовательно, xt — решение задачи (11) с I = I(xt),
так что xt —особая точка задачи (1), (2). D
Теорема 1. Пусть С > 0, множество (2) непусто. Тогда
существует конечный метод решения задачи (1), (2).
Доказательство. Так как множество {1,..., т} имеет конечное
число подмножеств I, а всякая задача (11) при ОО имеет одно решение
(теорема 4.3.1), то и число особых точек задачи (1), (2) конечно. Согласно
лемме 1 для отыскания решения задачи (1), (2) достаточно перебрать все ее
особые точки и найти ту из них, в которой функция (1) принимает меньшее
значение. Так как задача (11) имеет вид (1), (8), то каждая особая точка
может быть найдена за конечное число арифметических операций. Значит,
поиск решения задачи (1), (2) закончится за конечное число шагов. □
3. Установленная в теореме 1 принципиальная возможность получения
решения задачи (1), (2) за конечное число шагов имеет лишь теоретический
интерес. Дело в том, что полный перебор особых точек задачи (1), (2) на
практике требует слишком большого объема вычислений уже при не очень
больших значениях п, s. Опишем один из методов упорядоченного перебора
особых точек задачи (1), (2), более экономичного по сравнению с полным
перебором [670]. При описании этого метода можно выделить три этапа.
На 1-м начальном этапе определяется, будет ли множество (2) непустым,
и, если X -ф0, то находится какая-либо точка v е X. Здесь может быть
использован, например, симплекс-метод, описанный в гл. 3.
2-й этап состоит в переходе от какой-либо точки v е X к особой точке
■ш б X со значением f(w) ^ f(v). Для построения такой точки w можно
воспользоваться следующим итерационным процессом. В качестве
начального приближения берется щ = v. Пусть известно h-e приближение ике X,
f(uk)^.f(v). Определим вспомогательное приближение йк как решение
задачи (11) при
I = I(uk) = {i: 1<г^т, (а{,ик) =-Ъ1}.
Поскольку ик € V, то f(uk) < f(uk) < f(v). Поэтому, если йк е X, то в
качестве требуемой особой точки можем взять w — uk. Допустим, что йк ¢. X.
Тогда (а-, йк) > bj хотя бы для одного j ¢. 1(ик), 1 < j < m, так что
множество индексов 1{ — {j: {а^ йк) > b3', j ф 1{ик), 1 < j < т} ф 0. Положим
+ ак(йк-щ), ак = тт[{У-{avuk))/(as,uk-uk)}. (12)
JeJi
§ 8. КВАДРАТИЧНОЕ ПРОГРАММИРОВАНИЕ
291
Из определения 7, и включения ик е X следует, что
Ы-{а}1ик) = bi-{aj,uk)
^(а,,йк-ик) (bi-{aj,uk)) + {(aj,ak)-bJ)^ ' Jt "
поэтому 0< at < 1. Покажем, что ui + ,'eX. Из выпуклости множества V-и
из ufc 6 V, ufc € V следует, что ик + 1 € V, где V взято из (11) при 7 = 7(¾).
Остается доказать, что (ар uk + i) < W при всех j ¢. 1{ик), 1 < j < m. Если
У € 7,, то с учетом определения (12) величины afc имеем
{apuk + i) = {avuk) + ak{avuk-uk)^b\ jfel,. (13)
Если j £7,U7(ufc), l<j'<m, то (ау, иЛ+1) = аЛ(а;, ufc)+ (1-0^(^, ufc) < bJ'.
Таким образом, показано, что ик + 1 еХ. Далее, поскольку f(uk)^f(uk) <
</(■") и функция f(x) выпукла, то f(uk + l)^aj(uk)+(l-ak)f(uk)^f(v).
Далее, из включения ик + 1 е V, где V взято из (11) при 7 = 7(¾).
следует, что %)C% + 1) = {i: {а0ик + 1) = Ъ*, 1 < г < т}. В тоже время
для тех j0€ 7,, для которых в (12) реализовывается минимальное
значение при определении ак, неравенство (13) превращается в равенство, так
что jQ^I{uk + \), но j0fl(uk). Следовательно, множество 1(ик + 1)
содержит по крайней мере на один элемент больше, чем 7(¾). Таким образом,
следующее приближение uk + i€ X со значением /(¾ + ,)< f(v) построено,
причем множество I(uk + i) существенно шире 7(¾). Однако множества
7(¾) 6 {1,..., т} не могут бесконечно расширяться, и поэтому
описанный процесс закончится на какой-то к-й итерации, когда йк 6 X, причем
w = uk — особая точка задачи (1), (2) со значением /(«;)</(г>). Поскольку
решаемая на каждой итерации задача (11) с 7 = 7(¾) имеет вид (1), (8) и
для ее решения существует конечный метод, то и весь переход от точки v
к точке w осуществим за конечное число шагов.
На 3-м этапе выясняется, не будет ли особая точка w, построенная на
2-м этапе, решением задачи (1), (2), и в том случае, если w ¢. Xt,
осуществляется переход к следующей точке ze X, для которой f(z) < f(w). Для
этих целей достаточно совершить один шаг несколько модифицированного
метода условного градиента, приняв в качестве начальной точку w,
полученную на 2-м этапе. А именно, сначала можно решить следующую задачу
линейного программирования
(/'(и;), е) = (Cw + с, е) -► inf, е е 8 = {е = (е1,..., е") € Еп:
(а4, е) <0, iel(w) = {i: 1 < г < т, (a., w) = b{},
(а4)е) = 0, i = m+1,...,8, -1<е'< 1, j = l,...,n}. (14)
Пусть е = et — решение задачи (14), которое может быть получено,
например, симплекс-методом. Так как е = 0е£, то /? = (/'(«>), et) = m'm(f'(w), е) <
< (f'(w), 0) = 0. Поэтому имеются две возможности: либо /3=0, либо
/3 < 0. Покажем, что в случае /3 = 0 точка w — решение задачи (1), (2).
С этой целью возьмем произвольную точку u е X, иф-w, и положим
е = t(u — w), где t >0 столь мало, что \еЦ = t \uj — wj| < 1, j = 1,..., п. Если
i е I{w), то (a., е) = (а£, u-w)t = ((а., и) - Ь*)* < 0. Если т + 1 < г < а,
то (а<; е) = *((а0 и) — Ъ1) = 0. Следовательно, е = t(u — w) е £.
Поэтому /3=0= (f'(w), ej < (f'(w), е). Пользуясь теоремой 4.2.2 тогда имеем
292 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
f(u) — f(w)^ (f'(w), и — w) = (f'(w), e) t~l > 0 при любом «el, Это
значит, что w е Xt, т. е. задача (1), (2) решена.
Рассмотрим вторую возможность: /3 < 0. Тогда е„ — возможное
направление убывания функции f(u) в точке w. В самом деле, при
достаточно малых а > 0 с учетом того, что е„ — решение задачи (13), имеем
f(w + aet) — f(w)= (f'(w), et)a + o(a) = a((3 + o(a)/a) <0; если i 6 I(w)
или m+1 <г <s, то (a{, w+aet) = bi + a(ai, e„) ^ bl; если г ^I(w), 1 <г :¾ m,
то (a£, w) < b' и (a£, u; + aej < Ь*. Тогда в качестве искомой точки z = X,
f(z)<f(w), можно взять z = w + a0et, где a0>0 — достаточно малое число,
которое может быть найдено за конечное число шагов, например, перебором
чисел а0 = 2"р, р = 0, 1,.... Описание 3-го этапа закончено.
Отправляясь от точки z, полученной на 3-м этапе, можно снова перейти
ко 2-му этапу при v = z, затем к 3-му этапу и т. д. В результате будет
построена последовательность особых точек, на которой функция f(x) строго
убывает. Так как при С > 0 число особых точек конечно, то на каком-то
шаге процесс, состоящий в последовательном применении 2-го и 3-го этапов,
закончится нахождением решения задачи (1), (2). Таким образом,
описанный метод позволяет за конечное число шагов найти решение задачи (1),
(2) при О 0.
Существуют конечные методы решения задачи квадратичного
программирования (1), (2) и при С ^ 0; об этих методах читатель сможет прочесть,
например, в [1; 33; 48; 61; 203; 204; 222; 273; 319; 422; 471; 481; 586; 603;
606; 608; 612; 670; 738; 746; 759]. О задачах кубического программирования
и, в общем случае, полиномиального программирования, когда
минимизируемая функция является многочленом, см. [70; 83; 84; 527].
Упражнения
1. Уточните описание каждого этапа приведенного выше метода для задачи (1), (2) при
С = I — единичная матрица, а также при X = Е" или X = {u = (u' ип)е Еп: а{ ^.и1 ^
^Pit г = 1,...,п}.
2. Примените описанный выше метод к задачам квадратичного программирования из"
упражнения 3 к § 4.9.
3. Пусть X ={и = (х, у) е Е2: -1 ^ х, у ^ 1} или X ={и = (х, у) е Е2\ О^ х, у ^ 1}. Найдите
особые точки задачи минимизации функций /(и) = (х — а) +(у — Ь) , /(и) = (ах + by) на
этих множествах при различных а, Ь.
4. Доказать, что множество точек минимума квадратичной функции f(x) = \Ax — b\2 на Еп
совпадает со множеством решений системы А1Ах = АтЪ (см. пример 4.2.4).
5. Доказать, что квадратичная (или кубическая) функция достигает своей нижней грани на
множестве (2), либо неограничена снизу [84].
§ 9. Метод сопряженных направлений
В описанных выше методах, использующих градиент функции, на каждой
итерации учитывается информация лишь о линейной части приращения
минимизируемой функции в окрестности полученной точки. С помощью этих
методов точку минимума квадратичной функции удается найти лишь за
бесконечное число итераций. Возникает вопрос: нельзя ли придумать метод,
§ 9. МЕТОД СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
293
использующий лишь градиент функции, который позволяет найти точку
минимума квадратичной функции на всем пространстве за конечное число
шагов? Если бы такой метод существовал, то можно было бы ожидать, что он
сходится к точке минимума гладких функций быстрее градиентного
метода, поскольку в окрестности точки минимума гладкая функция достаточно
хорошо аппроксимируется квадратичной функцией.
Оказывается, методы с упомянутыми свойствами существуют. Одним из
таких методов является метод сопряженных направлений. Опишем один
из вариантов этого метода.
1. Сначала рассмотрим квадратичную задачу:
f(x) = ~(Ax,x)-(b,x)^mi; хеХ=Еп, (1)
где А — симметричная положительная матрица, Ъ 6 Еп. Тогда, как было
показано выше, справедливы формулы
Г(х) = Ах-Ъ, f"(x) = A,
и, кроме того, f(x) сильно выпукла на Еп и достигает своей нижней грани
на Еп в единственной точке xt такой, что
f'(xt) = Axt-b=0 или х. = А-1Ъ... (2)
Возьмем произвольную начальную точку oCqEE71 и вычислим рь = Г(хо).
Если /'(zo) = 0, то x0 = xt — задача (1) решена. Поэтому пусть /'(^)^0.
Тогда положим
х\ = ^¾ ~ аоРо> ао -½ ")
где величина а0 определяется условием
g0(a0) = mm g0(a), д0(а) = /(¾ - ад,).'
а ^ О
Таким образом, первая итерация метода сопряженных направлений
совпадает с итерацией метода скорейшего спуска. Заметим, что д0(а)
сильно выпукла, поэтому величина а0 существует и определяется однозначно
(см. ниже формулу (14)). Поскольку д0'(0) = -(/'(а*,), р0) = -\Г(хо)\2 < 0, то
а0> 0. Следовательно,
я/К) = о = -(/4¾ - «о%), Ро) = -№>), Ро) = -(№), /'№ (3)
Можем считать, что Р(х\)ф0, иначе ж, = xt и задача (1) решена.
Так как р0 ф 0, то Ар0 ф 0 и множество
Т{ = {хеЕп; (АРо,х-х1) = 0}
представляет собой гиперплоскость размерности п — 1, проходящую
через точку х{. Важно заметить, что искомая точка xt также принадлежит
Г,. В самом деле, поскольку матрицы А, А~х симметричны, то с учетом
равенств (2), (3) имеем (Ар0, xt — ж,) = (Ар0, A~lb — ж,) = (р0, Ъ - Ахх) =
= — (р0, /'(ж[)) =0. Поэтому дальнейший поиск точки xt имеет смысл
проводить в гиперплоскости Г,. Для этого нужно найти какое-либо направление
рх, параллельное гиперплоскости Г,. Можно искать р{, например, в виде
Р\ = f'(x\) ~ РоРо, А> = const •
294 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Условие параллельности рх гиперплоскости Г, дает равенство (ApQ,px) =
= (Аро, /4¾) - (30Ро) =0, т. е.
0o = (APb,f,(xl))/(A^,pb).
Поскольку Р{х{)ф0, то рх ф0. В самом деле, если бы рх = 0, то f'(xl) = f30p0
и согласно (3) тогда \f'(x1)\2 = (30(p0,f'(xi))==0— противоречие с условием
f'(x\) ф0. Из рх ф0 следует, что Арх фО. Положим
¾ = ¾ —а,р,, а, ^0,
где величину а, будем определять из условия
0,(0:,) = min дх(а), дх{а) = /(ж, - арх).
а >0
С учетом равенств (3) имеем gi'(0) = (f'(xl), -р,> = (/'(^i). -f'(xi)+ /W =
— ~\f'(x\W <0i поэтому a, >0. Тогда
<?,'(«,) =0 = (/'(я:, - a,p,), -p,> = -(/4¾). p,> = 0.
Заметим, что
/'(я:,) - /'(^) = А ж, - Ь - ^¾ + b = a, Ар,.
Тогда в силу (3) и выбора р, получаем
(/4¾). /4¾)) = (/4¾). Ро) = (/4¾) - «1 Ар„ ft> = о.
Отсюда следует равенство
(/4¾). /4¾)) = (/4¾). рх + РоРо) = о-
Таким образом, первые две итерации метода сопряженных направлений для
задачи (1) описаны. Показано, что
(/4¾). %) = №>).№))= о, (Aft)p,) = (Ap,)ft)=o,
(/4¾). p.) = (/4¾). Ро) = (/4¾). /4¾)) = (/4¾). /4¾)) = о.
Кроме того, заметим, что векторы Ар0, Арх линейно независимы. В самом
деле, если ry0Ap0 + 'ylApl =0, то, умножая это равенство скалярно сначала
на Pq, затем на рх, получим 7o = 7i =0- Можем считать, что /'(^^0, иначе
¾ = х, —задача (1) решена.
Теперь у нас есть основание сделать следующее индуктивное
предположение: пусть при некотором fc>2 уже найдены точки Xq, ж,,
х.
4+1
xi - aiPi, г =0, 1,..., & - 1, где
•1 -^к'
ft = /4¾) "Aft-i^O. А = (№).Ад_,)/(Ай_„д_,),
а величины а( > 0 определены из условий
д{(а{) = mm д{(а), gi(a) = f(xi-api), i =0,1,,.., к - U
t>0
пусть
(APi,Pj)=0, гфз, O^i, j<k-l, (4)
(/4¾).¾) =0, (Ki<«Cfc, (5)
(/4¾)./4^))=0, i^A 0<г, j^fc; (6)
§ 9. МЕТОД СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
295
и, кроме того, пусть /'(х{)фО, г = О, 1,..., к, и система векторов
{Ар0, Ари ..., Арк_ ,} линейно независима.
Тогда множество
Тк = {хеЕп: (APi,x-xk + l)=0, i = 0, 1, ..., к - 1}
представляет собой гиперплоскость (аффинное множество — см.
пример 4.1.5) размерности п — к. Поскольку из (5) следует
(Л-Рг, Xk~Xi+l) = (Pi, Ахк ~ Axi+l) = (Pi, f'(Xk) ~ f'(Xi+l))=0
для всех г = 0, 1,..., к — 1, то хк 6 Тк. Замечательно то, что xt 6 Г,., так как
согласно (2), (5)
(Ар{, xt - xi+ ,) = (Ар{, А~1Ъ- xi + l) = (ри b-Axi + i) =
= (Pi,-f'(xi + i))=0, г = 0, 1,..., fc-1.
Поэтому дальнейший поиск точки xt целесообразно продолжать в
гиперплоскости Тк. Для этого нужно найти направление рк, параллельное Тк, т. е.
удовлетворяющее условиям (Ар{,рк) = 0, г =0, 1, ..., к — 1. Будем искать
рк в виде
„ Pk=f'ixk)-PkPk-\- (7)
Заметим, что
f'(xi)-f'(xi+i) = Axi-Axi+l = aiApi, г = 0, 1,..., к - 1. (8)
Из (4), (6), (8) следует
(APi, рк) = (APi, f'(xk) - (Зкрк_ ,) = (APiJ'(xk)) -
-/3k(Api,Pk-i) = (f'(xi)-f'(xi + i)J'(xk))^l=0
для всех г = 0, 1, ..., к — 2 при любом выборе /¾. в (7). Поэтому для
параллельности направления рк гиперплоскости Тк остается
удовлетворить равенству (Арк_1, рк) =0. Отсюда имеем (Арк_и f'{xk) - (Зкрк_х) =
= (Арк_ ,,/4¾)) - РМРк- и Рк- i> =0 или
Рк = (ЛРк-иГ(хк))/(АРк-иРк->)- (9)
Заметим, что рк ф0, ибо в противном случае f'(xk) = (Зкрк_ х, и тогда в
силу (5) имеем \f'(xk)\2 = f3k(f'(xk), рк_ ^ = 0, что противоречит индуктивному
предположению.
Итак, учитывая выбор направления рк и равенства (4), имеем
(APi,Pj)=0, гфь O^t, j^k. (10)
Следующее (к + 1)-е приближение будем искать в виде
xk + i = xk~ акРк, «*>0, (11)
где ак определяется из условия
Л(а*) = тт&(а)| gk(a) = f(xk-apk).t> (12)
Поскольку дк(а) — сильно выпуклая функция, то величина ак существует
и единственна. С учетом предположений индукции и формулы (7) имеем
&'(0) = </'Ю, -Рн) = </'Ю> ~Пхк) + (ЗкРк_ ,) = -|/'(хк)\* < о.
296 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Это значит, что ак >0 и дк'(ак) = 0= (f'(xk + l), -рк) или
</'(^* + i),ft>=0. (13)
Отсюда нетрудно получить явное выражение для ак. В самом деле,
0=(Г(хк + \),Рк) = (Ахк + \-ь>Рк) =
= (Ахк - акАрк - Ъ, рк) = (f'(xk), рк) - ак(Арк, рк).
Так как рк ф0, то (Арк, рк) ^Оииз последнего равенства вытекает
а = (/'(»*). Pt) = (f{*k).f(*k)-PkPk-i) = 1/'Ю12 а4ч
* (АРк<Рк) (АРк<Рк) (АРк<Рк)' У '
Далее, заметим
/'Ц) -f'(xk + i) = Axk ~Ахк + 1 = акАрк.
Отсюда и из (4), (5) имеем
(f'(xk + i),Pi) = (f(4)-^Apk,Pi)=0, *=0, 1,...,¾ -1. (15)
Собрав все равенства (5), (13), (15), получим
№<),*>,> = о, (ку<»ч* + 1- (16)
Из предположения индукции и равенств (16) следует
<№+.)./w> = <m+i),ft+дд-1>=о, »• = 1,. ■., *,
</'(^ + i),/'U)> = </'(^* + i),ft>=0.
Отсюда и из (6) имеем
(№),/'(^)}=0, гфь О^г, j'<fc + l.
Наконец, покажем, что система {Ад,,.. .,^¾} линейно независима. В
самом деле, если ry0Ap0 + ryiApi + .. . + rykApf,=0, то, умножая это равенство
на р. скалярно, с учетом (10) получим j^Apj, р.) =0, j = 0, 1,..., к. Так
как р^фО, то (Ар3-, р-) >0 и последние равенства возможны лишь при т,- =0,
j = 0,l,...,fc.
Тем самым все этапы индукции проведены, следующее (к + 1)-е
приближение хк. , построено. Если/'(a;t+1) = 0, то a;Jc+1=a;t — решение задачи (1)
найдено. Если же f'(xk+i)^0, то согласно индукции процесс можно
продолжать дальше.
Метод сопряженных направлений для задачи (1), заключающийся в
построении последовательности (¾} по правилу (11), где otk,pk
определяются из (7), (9), (12) (или (14)), p0 = f'(x0), описан. Название этого метода
объясняет следующее
Определение 1. Векторы\р0, ри .. '.,рк называются сопряженными
относительно матрицы А или А-ортогональными, если {p{,Pj) = 0 при
всех г ф$, 0< г, j <fc.
Нетрудно' видеть, что для квадратичной задачи (1) метод сопряженных
направлений закончится за конечное число итераций нахождением точки
xt. В самом деле, векторы /'(яь), Г{х\), ■ • ■> f'(xk)> ■ ■ •> получаемые этим ме-
§ 9. МЕТОД СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
297
тодом, образуют ортогональную систему: (/'(^), f'(Xj)) =0, i ф j. Однако в
n-мерном пространстве не может быть более п ненулевых взаимно
ортогональных векторов. Следовательно, найдется номер к, 0< к < п такой, что
f'(xk) = 0- Тогда xk = xt — решение задачи (1).
2. Перейдем к рассмотрению задачи
/(a:)-» inf; хеХ = Еп, (17)
где функция f(x) е С1(Еп), причем в отличие от задачи (1) здесь f(x) не
предполагается квадратичной. Так как формула (9) содержит матрицу А,
характеризующую квадратичную функцию (1), то описанный выше метод
сопряженных направлений (7), (9), (11), (12) не может быть
непосредственно применен для решения задачи (17). Поэтому сначала формулу (9)
приведем к виду, не содержащему матрицу А. С учетом равенств (6), (8)
числитель и знаменатель дроби (9) можно преобразовать так:
(^-1.^-1) = (/4^-1)-/4^).^-1)^1 = (/4^-1).^-1)^1 =
= </4^-i)./4^-i)-A-ift-2>«*ii = l/4^-i)l2«*
Тогда формула (9) запишется в виде
„ ,(/4¾)./4¾.0-/4¾)) ,1Rv
Рк — itl, v.2 ' \L°)
и {хк-\)\
или
А = -1™л- (19)
1/4¾) Г
1/4¾ _,)12
Кроме того, вспоминая, что для функции (1) A = f"(xk), формулу (9) можно
представить еще и в такой форме:
а _</"(**>Р*-1>/'(**» /от
Рк~ (Пч)Рк-иPk-i)- ( '
Для квадратичной функции (1) все три формулы (18)-(20) дают одну и ту
же величину (Зк. Но если функция f(x) отлична от квадратичной, то из этих
формул будут получаться, вообще говоря, различные значения f3k.
В результате, отправляясь от соотношений (7), (11), (12), (18)-(20),
придем к следующему описанию метода сопряженных направлений для
задачи (17). Пусть Xq — некоторое начальное приближение. Будем строить
последовательность {хк} по правилам
хк + \ = хк-<ХкРк> к =0,1,..., (21)
где
ft = /4¾). Рк =f'{Xk)-PkVk-u * = 1,2,..., (22)
величина ак определяется условиями
«*>0, дк(ак) = mm дк(а), дк(а) = /(¾ - арк), (23)
а ■> О
а (Зк в (22) вычисляется по одной из формул (18), (19) или (20). Отметим,
что в варианте (20)-(23) метода сопряженных направлений требуется,
чтобы f(x)e С2(Еп), и поэтому на практике он применяется очень редко и
лишь в тех случаях, когда матрица f"(x) вычисляется достаточно просто.
298 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Так как в задаче (17) квадратичность функции не предполагается, то
нельзя ожидать, что описанный метод сопряженных направлений за конечное
число итераций приведет к точке минимума функции f(x) на Еп. Далее,
точное определение величины ак из условий (23) возможно лишь в редких
случаях, поэтому реализация каждой итерации метода будет
сопровождаться неизбежными погрешностями. Как показывает практика, эти
погрешности, накапливаясь, могут привести к тому, что векторы {рк} перестают
указывать направление убывания функции, и сходимость метода может
нарушиться. Чтобы бороться с этим явлением, метод сопряженных направлений
время от времени обновляют, полагая в (22) (Зк = 0. Обозначим
множество тех номеров к^\, при которых принимается (Зк =0, через 10. Номера
к б 10 называются моментами обновления метода. Если метод
используется без обновления, то Jo = 0. На практике часто берут 10 = {п, 2п, Зп, ...},
где n-размерность рассматриваемого пространства. Возможны и другие
правила выбора моментов обновления. Кстати, если 10 = {1, 2, 3, ...}, то
метод (21)-(23) превратится в метод скорейшего спуска.
Если функция f(x) не является квадратичной, то для описанного метода сопряженных
направлений равенства (5), (6), вообще говоря, не выполняются. Однако, тем не менее, и в
общем случае при любом выборе моментов обновления справедливы равенства
(/4¾+ ,),?>*>= 0, (f'(4),Pk) = \f(*k)\2. *=0,1,... (24)
В самом деле, при к = 0 имеем р0 = /'^)> поэтому (/4¾). Ро) ~ |/'(а^,)|2. Из условий (23) при
&=0в случае а0>0 следует So'(cc0) = (/(¾-«оЯэ)» ~Ро) = ~{f'(xi)iPo)-°- Если же а0 = 0,
то 0:,=¾ и 0^50'(0) = -(/'Ы,№) = -|/'^)|2^0, так что /'(*%) = /'(*i) = 0. (/'Ы> Ро>=°-
Таким образом, равенства (24) при А; =0 верны, Сделаем индуктивное предположение: пусть
для некоторого к ^ 1 имеют место равенства {f'(xk),pk_ ,) = 0, (f(xk_ х),рк_ \)~\f'(xk_ ,)|2,
Тогда из (23) при ак >0 получим gk(oik) = -(f'(xk + ,),^) = 0. Если же ак — О, то хк + , = хк и
0^ft'(0) = -</'(**).Pt> = -</'(*t)./'K)-APt-i> = -|/'(*t)|2 = -|/'(*t + i)|2<0, поэтому
/'K + i) = 0h (f'(xk + l),pk) = 0. Наконец,
(/(¾). Р*> = (/'(**), /4¾) - /¾% - .) = \f(4)?-
Равенства (24) доказаны, Из первого равенства (24) и определения (22) вектора рк следует
|Р* Iй = !/'(**) - /ЗаРл _', |2 = |/'(**)12 + /3* |Р* _ 112, * = 1,2,... (25)
3. Пользуясь соотношениями (24), (25), установим сходимость метода сопряженных
направлений (21)-(23), (18).
Теорема 1. Пусть функция f(x) сильно выпукла на Еп, /(л)еС|р1(Е"), Тогда при
любом, выборе множества 10 моментов обновления и любом начальном приближении xq
последовательность {хк}, определяемая условиями (21)-(23),(18), сходится к точке xt
минимума функции f(x) на Еп, причем справедливы оценки
о^к=/^)-/,^Ч, K-*.Nf<z4. ^=°.1 (26)
„3
где 9 = 1 f- g", 0< q < 1, fj, —постоянная из теоремы 4.3.3, L —константа Лип-
L(n + L ) о
шица для градиента f(x) на Еп.
Доказательство. Из теоремы 4.3.1 следует существование и единственность точки
xt, в которой f(xt) = Д = inf/(a:). Функция gk(a) = f(xk - apk) при ркфО также сильно
выпукла, и условия (23) однозначно определяют величину ак > 0. Будем считать, что рк ^0,
/4¾) Ф 0> ак -> ^ ПРИ всех ^ = О, 11 • • ч ибо в противном случае из (24) при рк — 0 получим
f(xk) =0hij=i, —решение задачи (17).
§ 9, МЕТОД СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
299
В силу выбора ак при всех а ^ 0 имеем f(xk +i) ^ f(xk — арк). Отсюда и из леммы 2.6.1
с учетом второго равенства (24) получим
/(¾) - /(¾ + l) > /(¾) ~ /(¾ - аРк) > a(f'(xk)> Рк) - 9LT-\Pk? =
= *|/'(*,с)|2-^Ы2. «>0, /с =0,1,... (27)
Докажем теперь неравенство
7b|p*|4|/'(**)l2. 7 = ^-4^ + ^2)-1. *=0,1,... (28)
Согласно теореме 4.3.3 имеем ц\хк-хк_ {\2 = ца>1 _ {\рк _ {\2 ^ (f'(xk)-f'(xk _l),xk-xk_l) =
= (f'(xk) ~ f'(xk- i)>Pfc- i)(_Q:*:- l)- Отсюда с учетом равенств (24) получаем
/«»*-1 1р* -114 </'(** _i).p*-i> = 1/4¾ _i)l2.
Тогда из (18) следует
l/J*l^l/'(**)|b|**-**-ill/'(**-i)r4
\f'(4)\^k-l\Pk-l\(^k-l\Pk-l\2rl^L^\f'{xk)\\Pk_lr\
Pk\Pk-l\^L»-l\f(xk)\, fc =0,1,..-
Отсюда и из (25) получим \рк\2 ^\f'(xk)\2(l + L2p~2), что равносильно неравенству (28).
Теперь нетрудно доказать оценки (26). Из (27) с учетом (28) имеем
»*-»t + l>«(1-^)l/'(*t)|2. Va^O, fc=0,l,...
Следовательно,
ak-ak + l>maxa(l-^)\f'(xk)\2=l\f\xk)\2, fc=0,l,...
Но 2цак ^\f'(xk)\2 (см- неравенство (1.18)), поэтому ак-ак+ , ^уцак или <х,.+ , ^(1-7/^)^ =
= qak, к =0,1,... Отсюда следует первая из оценок (26). Вторая оценка (26) вытекает из
первой оценки и неравенства (4.3.3). Остается заметить, что 0 < q < 1, ибо ц ^.L. Теорема
доказана. П
Отметим, что оценки (26) являются довольно грубыми, Более тонкие исследования
показывают, что метод сопряженных направлений на самом деле имеет более высокую скорость
сходимости, чем это следует из оценок (20). В то же время этот метод ненамного сложнее
метода скорейшего спуска. Недостатком метода сопряженных направлений является его
чувствительность к погрешностям при определении величины ак из условия (23) — недостаточно
точное определение ак может привести к ухудшению сходимости метода.
4. В методе (7), (9), (11), (12) направления pq, р1(.. .,рк строятся с помощью процесса
Л-ортогонализации последовательно вычисляемых градиентов f(x0),f(xA,...,f'(xk), и
поэтому этот метод для задачи (1) и полученный на его основе метод (21)-(23) для задачи (17)
в литературе часто называют методом сопряженных градиентов. В общем случае в методе
сопряженных направлений могут быть использованы и другие способы построения векторов
рк, отличные от (22). А именно, пусть направления Ро,р\ рк, удовлетворяющие
условиям (10), уже известны и с их помощью последовательно построены точки х{,. ,.,xk + i по
формулам (21), (23). Следующий вектор рк+1 будем определять из условий {рк+,, Ар{) =0,
г = 0, 1,..., к. В случае квадратичных функций (1) формула (8) остается справедливой при
любом выборе векторов PqiPi Vk в (21). (23), поэтому условие ортогональности вектора
рк + [ к векторам Apq, Ар±,..., Арк здесь приводит к равенствам
(Pk + u4i) = 0, <fc = /'(*<)-/'(*< + i), »-=0,l,...,fe (29)
Условия (29) имеют смысл и для неквадратичных функций, и ими пользуются для определения
рк+ , в общем случае. Обычно вектор рк + , ищут в виде [61; 71; 76; 222; 374; 586; 759]
P* + i=-Hik+1/Wi), Нк + 1=Нк + АНк, (30)
300 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
где матрица ЛЯд. определяется из условий (29). Нетрудно видеть, что перечисленные
условия (29), (30) матрицу АНк определяют неоднозначно и в зависимости от того, как
распорядиться этим произволом, можно получить различные варианты метода сопряженных
направлений. Если на каком-либо шаге Нк =0, то метод (21), (23), (29), (30) обновляют, полагая
Aj. — I — единичная матрица. Приведем один из вариантов этого метода, в котором матрицы
Щ определяются по правилу I
Нк^:=Нк"Ш1дВ^' ^ = ^ + .)-/4¾). Яо = /-
В [603] предлагается и исследуется метод сопряженных направлений, позволяющий за
конечное число итераций найти точку минимума квадратичной функции (1) на множестве,
задаваемом линейными ограничениями типа равенств и неравенств,
Различные варианты метода сопряженных направлений, более тонкие оценки скорости
сходимости читатель может найти в [74; 374; 603].
Упражнения
1. Показать, что точка хк, полученная методом сопряженных направлений для квадратичной
функции (1) при J0 = S3, есть точка минимума этой функции на гиперплоскости, проходящей
через точку xq и натянутой на векторы f(x0),fl(xi),,.., f'(xk_ ,).
2. Описать метод сопряженных направлений для функции f(x) — \Ах — Ь\ , х е Еп, где
А —матрица порядка т х п, b е Ет,
§ 10. Метод Ньютона
До сих пор мы рассматривали методы первого порядка — так называются
методы минимизации, использующие лишь первые производные
минимизируемой функции. В этих методах для определения направления убывания
функции используется лишь линейная часть разложения функции в ряд
Тейлора. Если минимизируемая функция f(x) дважды непрерывно
дифференцируема и производные f'(x), f"(x) вычисляются достаточно просто,
то возможно применение методов минимизации второго порядка, которые
используют квадратичную часть разложения этой функции в ряд Тейлора.
Поскольку квадратичная часть разложения аппроксимирует функцию
гораздо точнее, чем линейная, то естественно ожидать, что методы второго
порядка сходятся быстрее, чем методы первого порядка.
Ниже будет рассмотрен метод Ньютона, имеющий квадратичную скорость
сходимости на классе сильно выпуклых функций. Здесь мы пользуемся
следующей терминологией, принятой в литературе: говорят, что
последовательность {хк} сходится к точке xt с линейной скоростью или со
скоростью геометрической прогрессии (со знаменателем q), если, начиная с
некоторого номера, выполняется неравенство \xk+l — xt\^.q\xk — x^\,0<q<l;
при выполнении неравенства \xk+i — xt\ ^. qk\xh—xt\, где {qk}-*0, говорят о
сверхлинейной скорости сходимости последовательности {хк} к ж+, а
если здесь gfc = C|:Efc-:Ejs~1, т. е. ja;fc+1-a;J^Cja;t-a;]iijs, то говорят о скорости
сходимости порядка s (при s=2 получим квадратичную скорость
сходимости). Для некоторых методов выше была установлена линейная
скорость сходимости на классе сильно выпуклых функций; в тех случаях,
когда 1¾ — ж+| = 0{\/к), скорость сходимости ниже линейной; для метода
сопряженных направлений можно показать сверхлинейную скорость
сходимости [603].
§ 10. МЕТОД НЬЮТОНА
301
1. Опишем метод Ньютона для задачи
/(z)-Mnf; хеХ, (1)
где f(x)e С2(Х), X — выпуклое замкнутое множество из Еп (например,
X = Еп). Пусть Xq 6 X —некоторое начальное приближение. Если
известно к-е приближение хк, то приращение функции f(x)e С2(Х) в точке хк
можно представить в виде
f(x) - f(xk) = (f(xk), х-хк)+ 2(f"(xk)(x.- хк)> х~хк) + о(\х - хк\2).
Возьмем квадратичную часть этого приращения
fk(x) = (f'(xk), х-хк) + \{f"{xk){x - хк), х - хк) (2)
и определим вспомогательное приближение хк из условий
хкеХ, fk(xk) = mifk(x). (3)
л.
Следующее (к + 1)-е приближение будем искать в виде
^ + 1=^ + ^(^-¾). 0<afc<l. (4)
В зависимости от способа выбора величины ак в (4) можно получить
различные варианты метода (2)-(4), называемого методом Ньютона. Укажем
несколько наиболее употребительных способов выбора ак.
1) В (4) можно принять
аь = 1, А: =0,1,... (5)
В этом случае, как следует из (4), хк + 1 = хк, к =0, 1, ..., т. е. условие (3)
сразу определяет следующее (к + 1)-е приближение. Иначе говоря,
Зъ-не-Х, fk(xk + i) = in^fk(x), fc=0, 1,... (6)
Л.
В частности, когда Х = Еп, в точке минимума функции fk(x) ее производная
fk'(x) обращается в нуль, т. е.
1кЬк + 1) = Г(хк) + Г(хк)(хк + 1-хк) = 0. (7)
Это значит, что на каждой итерации метода (2)-(5) или (6) нужно решать
линейную алгебраическую систему уравнений (7) относительно
неизвестной разности хк + 1 — хк. Если матрица этой системы f"(xk) —
невырожденная, то из (7) имеем
хк+1 = хк-(Г(х„))-1Г(хк)г к =0,1,... (8)
Широко известный метод Ньютона для решения системы уравнений
F(x) = {Fi(x),...,Fn(x)}=0, хеЕ",
представляет собой итерационный процесс [74; 89; 550; 635]
^ + 1 = ^-(^(¾))-1^¾). *=0,1,..., (9)
где F'(x) — матрица, г-я строка которой равна F^(х) = (Fix,, ..., Fix„).
Сравнение формул (8) и (9) показывает, что метод (8) решения задачи (1) в
302 Гл, 5, МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
случае X = Еп представляет собой известный метод Ньютона для решения
уравнения /'(а;) = 0, определяющего стационарные точки функции f(x).
Отсюда происходит название метода (2)-(4) и в общем случае.
2) В качестве ак в (4) можно принять ак = А\ где ^ — минимальный
среди г ^ 0 номер, для которых выполняется неравенство [603]
/(¾) - /(¾ + А'(** - Ч)) > еА*|Л(^)|, (10)
где А, £ — параметры метода, 0 < А; е < 1.
3) Возможен выбор ак в (4) из условий [603]
0^ak^l, дк(ак)= mm дк(а), дк(а) = f(xk + а(хк - хк)). (11)
Заметим, что метод (2)-(4) с выбором длины шага ак по правилам (10),
(11) аналогичен соответствующим вариантам метода условного градиента,
где для определения хк использовалась линейная часть приращений, а в
методе Ньютона — квадратичная часть (2).
Если fk(x) из (2) сильно выпукла, а X = Еп или X задается
линейными ограничениями типа равенств или неравенств, то для определения хк
из (3) могут быть использованы методы из § 8, 9. Следует заметить, что
задача (3) в общем случае может оказаться весьма сложной и сравнимой по
объему требуемой для своего решения вычислительной работы с исходной
задачей (1). Метод Ньютона для решения задачи (1) обычно применяют в
тех случаях, когда вычисление производных f'(x), f"(x) не представляет
особых трудностей и вспомогательная задача (3) решается достаточно
просто. Достоинством метода Ньютона является высокая скорость сходимости.
Поэтому, хотя трудоемкость каждой итерации этого метода, вообще
говоря, выше, чем в методах первого порядка, но общий объем вычислительной
работы, необходимой для решения задачи (1) с требуемой точностью, при
применении метода Ньютона может оказаться меньше, чем при применении
других более простых методов.
2. Сначала исследуем сходимость метода Ньютона (2)-(4) с выбором шага
ак из условия (5) при условии X = Еп или, проще говоря, метода (8).
Теорема 1. Пусть функция f(x) сильно выпукла на Еп, f(x)e
е С2(Еп) и, кроме того,
\\f"(x)-f"(y)HL\x-y\, х,уеЕ\ L= const > 0. (12)
Пусть начальное приближение Xq выбрано таким, что
L|/'(^)|<2/x2g, (13)
где \i > 0 — постоянная из теоремы 4.3.4, a q—некоторая константа,
0< q < 1. Тогда последовательность {хк}, определяемая условиями (8),
существует, сходится к точке xt минимума f(x) на Еп, причем
справедлива оценка
K-zJ<2/xL-y\ fc-О, I,--- (14)
Доказательство. Существование и единственность точки xt
установлена в теореме 4.3.1. Согласно теореме 4.3.4
(ЛяК.О^Ж!2. ^й", £е£". (15)
§ 10, МЕТОД НЬЮТОНА
303
Отсюда следует, что система уравнений f"(x)£ = 0 имеет единственное
решение £ = 0 и, следовательно, матрица f"(x) невырожденная при всех
хеЕп. Это значит, что система (7) при каждом к = 0, 1,... имеет, и притом
единственное, решение, т. е. последовательность {хк} однозначно
определяется условиями (8). Кроме того, полагая в (15) £ = (f"(x))-'iz, получим
ИСТО)"'*!2 < <*, (/"(я))"1*) < \z\\{f»{x))-lz\ или \(Г(х))-1г\ < \г\ц-< при
всех 2 6 Еп. Это значит, что
ЦСПоОГ'К/х-1, *£Е\ (16)
Введем числовую последовательность ак = |/'(a;fc)| и покажем, что
ak^2n2L~lq2k, к =0,1,... (17)
При к =0 неравенство (17) следует из условия (13). Пусть (17) справедливо
при некотором к ^0. Из условия (8) и формулы (2.6.5) имеем
m+>)=m)+ $ №*+*(:**+1 -^))(^+. -it)rft=
° i
= П/"(^)-/"(^+*(^+1-^))]^(/"(^)Г7'(^)-
о
Отсюда и из (8), (12), (16) с помощью предположения индукции получим
ак+ 1 < (L/2)\xk+l- хк\ц~1ак «С (Ь/(2ц2))а\ ^
< (Ь/(2ц2))(2ц2/Ь)2(д*)2 = №/Ь)д»*\
Неравенства (17) доказаны. Тогда из теоремы 4.3.3 с учетом равенства
f'(xt)=0 имеем ^\хк - xt\2 ^ (f'(xk) - f'(xt), хк - xt) ^\f'(xk)\\xk - xt\ или
\xk — xt\ ^ ak\i x. Отсюда и из неравенства (17) следует оценка (14).
Теорема 1 доказана. D
Как видно из оценки (14) и как показывает практика, метод Ньютона (8)
сходится очень быстро. Однако у него есть один существенный
недостаток: для его сходимости начальная точка 2¾ должна выбираться достаточно
близкой к искомой точке xt. Это требование в теореме 1 выражено
условием (13), означающим, что 1¾ — xt\ < a0^~i < (2fj,/L)q. Приведем пример,
показывающий, что при отсутствии хорошего начального приближения
метод (8) может расходиться.
Пример 1. Пусть
J\x) ~ \ х2 3
[ Y + 2|a;| - 4<5, М > 8,
где х € Е1, а 6 — сколь угодно малое фиксированное положительное число,
О < S < 1. Нетрудно видеть, что f(x) е С2(Е1) и, кроме того, f"(x) ^ 1 при
всех хеЕ1, так что f(x) сильно выпукла на Е1. Далее, ясно, что /,=0,
xt = 0. В качестве начального приближения возьмем 2¾ = 8. Из (8) получим
последовательность хк = (-1)к -2, к = 1, 2,..., которая расходится, хотя
начальное приближение 2¾ отличается от xt=0 на малое число S.
304 Гл, 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Метод (8) часто применяют на завершающем этапе поиска минимума,
когда с помощью более грубых, менее трудоемких методов уже найдена
некоторая точка, достаточно близкая к точке минимума.
3. Исследуем сходимость метода (2)-(5) без предположения, что X — Еп.
Теорема 2. Пусть X — выпуклое замкнутое множество из Еп, функция f(x) сильно
выпукла и принадлежит классу С2(Х) и
\f"(x)-f"(y)\^L\x-y\, х,уеХ, L= const. (18)
Тогда последовательность {хк} однозначно определяется условиями (6), при любом
выборе начального приближения xq. Если
q = {L/(2ti))\xl-x0\<\, (19)
то последовательность {xk}, определяемая условиями (6), сходится к точке xt
—решению задачи (1), причем справедлива оценка
l^-z.K^ Е «24^V(i-«2V, *=o,i,...; (20)
т= к
здесь ц > 0 — постоянная из теоремы 4,3.4.
Доказательство. В силу теоремы 4.3,1 функция f(x) ограничена снизу и достигает
своей нижней грани на X в единственной точке xt. Из теоремы 4.3.4 следует
</"(*К,0>/*1«12. ^i, ¢6½. (21)
где Ьх —подпространство, параллельное аффинной оболочке множества X. Так как fk"(x) =
~ f"(xk)> то из предыдущего неравенства и теоремы 4.3.4 вытекает сильная выпуклость
функции fk\x) на множестве X при всех к = 0, 1,... Снова обращаясь к теореме 4,3.1, заключаем,
что условия (6) однозначно определяют точку хк + [. Таким образом, существование
последовательности {хк} из (6) доказано. Применив теорему 4.2.3 к функции fk(x) на X, получим
(fk'(xk+i),x-xk+i)>°, ^¾ fc=0,l,... (22)
Так как fk'(x) = f'(xk) + f"(xk)(x — хк), то неравенство (22) перепишется в виде
</'(**) + /"(**)(*t+i-**).*-**+i>>0, хвХ, *=0,1,... (23)
Может случиться, что xk+i — хк, Тогда на (23) имеем (f'(xk), х — хк) ^ 0 при всех х £ X.
Согласно теореме 4.2.3 в этом случае хк — xt —задача (1) решена. Поэтому можем считать,
что хк ф хк + [ при всех к = О, 1,... Положим в (23) х — хк. Получим
(f'(xk) + f"(xk)(xk+\~xk)>xk-xk+\)>°-
Отсюда и из (21) имеем
»\хк + \~хк\2<(f"(xk)(xk+i-xk)<xk+i-xk) <(f'(xk)'xk-xk+i)> ^=0,1,... , (24)
Оценим правую часть (24) сверху. Для этого в (22) заменим к на к — 1. Получим (Д _ \(хк), х—
- хк) ~& О, хеХ. Полагая здесь х = хк + ,, имеем
{fk-i'(xk)>xk-xk+\)^0< * = 1,2,...
Отсюда, из формулы (2.6.5) и условия (18) следует
</'Ю, хк - хк + 1> ^ (f'(xk) - fk-\'(xk)> ч-ч+х)^
= (f'(4)-f'(xk-i)-f"(4-i)(xk ~хк-\)>хк ~xk+i) =
l
= (Ш"(хк -1 + Чхк ~хк-\))- f"(xk - i)ld*K -4-\)ixk~ хк +1) ^
< -2 1¾ -^fc- ll2!^ -^fc + il. * = 1,2,...
§ 10. МЕТОД НЬЮТОНА
305
Подставив полученную оценку в (24), имеем
\xk+\-*k\^(I</(2»))\xk-xk_l\2, Л = 1,2,... (25)
Докажем оценку
К+1 -4\^^IL)42\ А: =0,1,... (26)
При it =0 эта оценка следует из условия (19). Сделаем индуктивное предположение: пусть
\хк ~хк-\\ <(2Wi)?2'"' при некотором к>\. Отсюда и из (25) имеем \хк+1 - хк\ ^
^(i/(2^))(2^/i)2(92'"')2 = (2fi/L)q2". Оценка (26) доказана. Из (26) следует
р ~ I р — I q оо о о
К-»РК Е K+i-zmK Е fV"4 Е ^в2Ч^92'(1-в2')-' (27)
m=fc m=t m=t
для всех р,к,р> к^О. Так как 0 < q < 1, то правая часть (27) стремится к нулю при к -> оо.
Это значит, что последовательность {хк} фундаментальна и сходится к некоторой точке х ,
В силу замкнутости множества X точка xteX. Переходя к пределу при р -> оо, из (27)
получим оценку (20). Остается убедиться в том, что xt —точка минимума f(x) на X. Так
как f(x) е С2(Х), то при к -> оо из (23) имеем (/'(xj, х - 3¾.) > 0 при всех хеХ, Учитывая
выпуклость f(x), отсюда и из теоремы 4.2.3 заключаем, что xt —решение задачи (1). Теорема
2 доказана. D
Из (20) при к =0 имеем |a^-a;t| ^.(2ц/Ь)9(1-¾)-1. Это неравенство означает, что метод (6)
при X ф- Еп, так же как и метод (8), который получен из (6) при X = Еп, сходится, вообще
говоря, лишь при выборе достаточно хорошего начального приближения.
4. Перейдем к рассмотрению метода (2)-(4) с выбором шага ак = А\ где г* —
минимальный номер, для которого выполняется неравенство (10). Этот вариант метода Ньютона будем
называть методом (2)-(4), (10). Покажем, что метод (2)-(4), (10> сходится при любом выборе
начального приближения и этим выгодно отличается от метода (2)-(4), (5).
Теорема 3. Пусть X —замкнутое выпуклое мноокество из Еп, f(x)eC2(X) и
И£|Ч</"(*)£,*К^К12. «б* ^Lx< (28)
где Lx —подпространство, параллельное аффинной оболочке множества X, а ц,М —
постоянные, 0 < ц ^ М. Тогда последовательность {хк}, определяемая методом (2)-
(4), (10), при любом начальном приближении Xq&X существует и сходится к точке xt —
решению задачи (1). Если, кроме того, f"(x) удовлетворяет условию Липшица (18), то
найдется номер &q такой, что в (4) ak = 1 при всех k^k^u справедлива оценка
К-х,|^ £ 92m<^92'(l-<Z2V, *>**>• (29)
m= k
Доказательство. Согласно теореме 4.3.4 функция f(x) сильно выпукла. Тогда из
теоремы 4.3.1 следует существование и единственность точки хк, удовлетворяющей условиям (3).
Согласно теореме 4.2.3 тогда {fk'(xk, х — х~к) ~& 0 или
</'(**) + /"(**)(**-«t).*-5*)»0 при всех хеХ (30)
Если оказалось, что хк=хк, то из (30) имеем (f'(xk), х-х. )S*0, х еХ. В силу теоремы 4.2.3
и выпуклости f{x) отсюда следует хк = Хд = xt — задача (1) решена. Поэтому можем считать,
что хкфхк. Тогда fk(xk) < fk(xk) = 0. Покажем, что тогда существует хотя бы один номер
г ^ 0, для которого выполняется условие (10). С этой целью возьмем произвольное число а,
0 < а < 1, и положим ха = хк + а(хк - хк). Отсюда и из выпуклости fk(x) следует
/*(*„) ^ вЛ(**) + (1 ~ «)/*(**) = аМ*к) < О-
Тогда из формулы
/(¾) -/(¾) = fh(xa) + («2/2)((/"К + ва(хк - хк)) -
-/"(**))(**-**).**-**>> O^a^l, (31)
с учетом условий (28) получим
f(xa)-f(xk)^fk(xa) + (a2/2)(M-n)\xk-xk\2^
^afk(xk) + (cx2/2)M\xk-xk\2, 0^a<l. (32)
306 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Так как хк —точка минимума сильно выпуклой функции fk(x) на X, то согласно теореме 4.3.1
1^-^14(2/^/,(^)-4(^)1 = (2/^)14(^)1. (33)
Подставив эту оценку в (32), получим
/К) -/(¾) ^ -«1/*(**)1 + «2М/01Л(**)1. О ^ а ^ 1.
Возьмем произвольное а, удовлетворяющее условиям
О < е0 = А(1 - е)»/М < а ^ (1 - е)ц/М < 1. (34)
Отсюда и из предыдущего неравенства будем иметь
/(^)-/(¾ + ««(^ - хк)) > а(\ - e(%))|/4(f4)| > ев|Л(**)| (35)
при всех а, удовлетворяющих условиям (34). Возьмем такой номер т^ 1, для которого Am ^
< (1 - е)ц/М < А т ~ '. Отсюда следует, что
0<Eo = A(l-e)^/M<Am^(l-eWM. (36)
Таким образом, а = Ат удовлетворяет условиям (34) и, следовательно, при а = Ат будет
справедливо неравенство (35). Это значит, при г =т выполняется условие (10). Тогда найдется
наименьший номер г = ¾. 0^¾ ^т, удовлетворяющий неравенству (10). Приняв в (4) ак = А\
получим следующее приближение xk+i.
Тем самым показано, что последовательность {хк} из метода (2)-(4), (10) при любом
начальном приближении существует. Из (10) при ^ = ¾ имеем
/(**)-/(** + !) >е«*1Л(**)1. *=o,i,...
Учитывая, что согласно (36) ак = А *° > А т > е0, отсюда получим
/Ы-/(** + 1)>е«б1Л(**)|, *=0,1,... (37)
Таким образом, /(¾) >/(afc + 1) >/*, it =0,1,,., Тогда существует ^11^/(¾) >Д и
11m (/(¾) - /(¾ . 1)) = 0. Из (37) теперь имеем Hm f(xk) = 0, а из (33) следует
к ~> оо /: —юо
11m \хк-хк\=0. (38)
к ~юо
Далее заметим, что согласно (37) последовательность (¾} е М(а^) = {х: хе X, f(x) ^ /(¾)}.
Для сильно выпуклых непрерывных функций множество M(xq) выпукло, замкнуто и
ограничено, Тогда последовательность (¾} имеет хотя бы одну предельную точку, Пусть vt
—произвольная предельная точка (¾} и пусть {хк } -> «„, С учетом (38) и условия f(x) е С (X)
из (30) при к = кт-> оо получим (f'(v), x-v") >0 для всех хеХ. Согласно теореме 4.2.3
тогда v.=x„—точка минимума f(x) на Л, Следовательно, lim f(xk)= lim /(¾ )=/(а:*)=/*,
* * /; —> ОО Я* —* ^О m
т> е, {хк} — минимизирующая последовательность, Отсюда и из теоремы 4,3.1 следует {%}-»
Пусть теперь выполнено условие (18). В силу (38) существует номер fy такой, что
(L/»)\Sk - хк\^ 1 - е при всех к ^ fy, Из (31) с учетом условия (18) и оценки (33) тогда
имеем
/К) -/(¾) ^ ЛК) + («3/2)£|^ - *J3 ^ -«1Л(**)1 + e2(b//*)l/fc(*i)ll** - 4l
f(xk)-f(xa)^\fk(xk)\a(l-a{L/fi)\xk-xk\)^ae\fk(xk)\
при всех а, 0^ а ^ 1, А: > fy, В частности, при а = 1 отсюда заключаем, что условие (1'0)
выполнено при г = г0 = 0, и, следовательно, ак = А0 = 1, xfc + [ = xfc при каждом к ^ fy,
Таким образом, начиная с номера к = fy, метод (2)-(4), (10) превращается в метод (2)-(5) с
начальным приближением х^, удовлетворяющим условию
q = {Ь/{2ц))\хК + ,-хК\ = (Щ2ц))\хК -^|^(1-£)/2<1.
Отсюда и из теоремы 2 следует оценка (29), что и требовалось, D
§ 10, МЕТОД НЬЮТОНА
307
Таким образом, метод (2)-(4), (10) ненамного сложнее метода (2)-(5), (10), по скорости
сходимости не уступает ему и в то же время не столь чувствителен к выбору начального
приближения, как метод (2)-(5). При наличии эффективных методов минимизации
квадратичной функции fk(x) на множестве X метод (2)-(4), (10) можно с успехом применять для
минимизации достаточно гладких функций.
Другие теоремы о сходимости описанных выше вариантов метода Ньютона читатель может
найти в [603],
5. Существуют и другие модификации метода Ньютона, широко используемые в
вычислительной практике. Так, например, в случае X = Еп вместо (8) часто применяют метод Ньютона
с переменным шагом:
** + i = **-«*(/%»*))"'/'(**). * = o,i,... (39)
Параметр ак > 0 в (39) выбирается из тех же соображений, что и в основном варианте метода
Ньютона. Заметим, что приближение хк +, в (39) может быть получено, как решение задачи
минимизации;
fk(x,a) = a(f'(xk),x-xk) + ^(f"(xk)(x-xk),x-xk)^mf, х е Еп (40)
при а = ак. Задача (40) подсказывает, как обобщить метод (39) на случай X фЕп — тогда
приближение хк , [ следует определять как решение задачи:
fk(x,a)-t\ni, хеХ (41)
при а = ак, или как решение вариационного неравенства
<Г(**)(** + 1-**) + «*/'Ы.*-** + 1>>0 VxeX (42)
Практика показывает, что, умело выбирая параметр ак в (39)-(42), можно сделать эти методы
менее чувствительными к выбору начального приближения xq.
Еще раз подчеркнем, что все выше перечисленные варианты метода Ньютона могут быть
эффективно использованы лишь тогда, когда матрица вторых производных f"(xk) легко
вычисляется и все последующие вспомогательные задачи решаются достаточно просто, Желание
преодолеть возникающие здесь трудности привело к появлению так называемых
квазиньютоновских методов
xk+i = xk-akAhf'(xk)> ak>°> & =0,1,..,, (43)
предназначенных для решения задачи (1) при Х = Еп. В (43) матрица Ак выбирается из
условия
lim \\Ak-(f"(xk))-11| = 0. (44)
к —юо
Оказывается, при таком выборе Ак метод (44) также сохраняет высокую скорость
сходимости, присущую методу Ньютона, Другое достоинство методов (43) — существуют
конструктивные способы построения матриц Ак со свойством (44) на основе достаточно простых
рекуррентных соотношений, использующих информацию с предыдущей итерации, обходясь без
вычисления и обращения матрицы / (х). Примером квазиньютоновского метода является
метод Давидона — Флетчера — Пауэлла, в котором матрицы Ак определяются соотношениями
А -Ал- гкТк (Ак%)(Ак1к)Т ь _ 0 1 . А _ г /45^
Ak + l-Ak + TwJ- (АкЧк,*к) ' к-°'1'— Л°~7' (45)
где qk = f'(xk + i) - f'(xk), rk=xk + l-xk, а величина ак находится из условия
gk(ak)=mingk(a), gk(<*) = /(¾ - aAkf'(xk)). (46)
Отметим, что векторы рк = Akf'(xk) удовлетворяют равенствам (9,29), так что метод (39),
(45), (46) одновременно является методом сопряженных направлений.
С квазиныотоновскими методами читатель может подробнее познакомиться в [76; 222; 586;
603; 721; 738; 759; 769], Непрерывные варианты метода Ньютона и его обобщений
рассматриваются в следующем параграфе.
308 Гл, 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
§ 11. Непрерывные методы с переменной метрикой
Рассмотрим задачу минимизации
/(aO-inf, хеХ, (1)
где X —выпуклое замкнутое множество, функция f(x) дифференцируема
на X. Пусть при каждом х еЕп определена квадратная матрица G(x) п-го
порядка, симметричная, положительно определенная. Всякая такая
матрица G(x) в Еп задает новое скалярное произведение (у, z)G — (G(x)y, z)
Vy, z € En, соответствующую норму \y\G = \/(G(x)y, у) и порождает пере-
менную (зависящую от х) метрику р(у, z) = \y—z\G = \/(G(x)(y — z),y — z),
которую мы кратко будем называть G-метрикой.
Определение 1. Точку w е X будем называть G -проекцией точки
z еЕп, если
\w-z\a= lni\y-z\e.
уел
и будем обозначать через w = V$№(z).
Иначе, G-проекция точки z является решением задачи минимизации
ip{y)=\(G{x){y-z),y-z)^M, у еХ. (2)
Так как р"(у) = G(x)>0, то функция <р(у) сильно выпукла на Еп и на
выпуклом замкнутом множестве X достигает своей нижней грани, притом
в единственной точке w (теорема 4.3.1). Как вытекает из (2) и теоремы 4.2.3
точка w будет G-проекцией точки z € Еп тогда и только тогда, когда
(<p'{w),y-w) = (G{x)(w-z),y-w)ZO Чу еХ. (3)
Если G(x) = In — единичная матрица, то G-проекция превращается в
обычную проекцию точки на множество (см. § 4.4). По аналогии с теоремой 4.4.4
с помощью G-проекции можно сформулировать критерий оптимальности
для выпуклых задач (1). Справедлива
Теорема 1. Пусть X — выпуклое замкнутое множество, Х„ —
множество точек минимума функции f(x) на X. Если ж,€1, и функция
f(x) дифференцируема в точке ж„, то необходимо выполняется
равенство
х,=1>$м{х,-а{С{х,))-1Г{х,)) Va>0. (4)
Если, кроме того, f(x) выпукла на X, то всякая точка xt,
удовлетворяющая уравнению (4), принадлежит Xt.
Доказательство. В силу (3) равенство (4) эквивалентно неравенству
(G(xt)[xt ~ (xt - а(С(х,)Г1Г(хЛ у - xt) > 0 Vy е X,
или
WW. W-"О > о Vyex
Поскольку а > 0, то отсюда имеем:
</'Ю. !/-*.)> О VyeX (5)
Так как проведенные выкладки обратимы, то вариационные неравенства (4) и (5) равносильны.
Отсюда и из теоремы 4.2.3 следует утверждение теоремы 1, D
Рассмотрим систему дифференциальных уравнений [28]:
x(t) = P^^(x(t)-a(t)(G(x(t)))-lf'(x(t)))-x(t), О 0, (6)
§11. НЕПРЕРЫВНЫЕ МЕТОДЫ С ПЕРЕМЕННОЙ МЕТРИКОЙ 309
где а(£)>0 — заданная функция. Согласно теореме 1 решение xt задачи (1) удовлетворяет
уравнению (4) при а = a(t) > О V* ^ 0. Это значит, что каждая точка xt S Xt является
точкой равновесия (стационарным решением) системы (6). Можно надеяться, что при некоторых
ограничениях на функции f(x), a(t), матрицу G(x) траектория x(t) системы (6) при больших
t приближается ко множеству Xt. Непрерывный метод с переменной метрикой описан.
Если X — Еп, то Vx^xHz) = z Vze Еп, и (6) превращается в систему
x(t) = -a(t)(G(x(t)))-lf'(x(t)), 0 0. (7)
Если I/E™, то уравнение (6) эквивалентно вариационному неравенству, которое
вытекает из (3):
(G(x(t))[x(t) + x(t) - (x(t) - a(t)(G(x(t)))~lf'(x(t)))]t у - (x(t) + x(t))) > 0
или
{G(x(t))x(t) + a(t)f'(x(t)),y-x(t)-x(t))>0, \/y£X, Vt > 0. (8)
Из (6), (7) видно, что при G(x) = In метод (6) превращается в непрерывный вариант
градиентного метода (1.45) или метода проекции градиента (2.34). Посмотрим, что будет, если
G(x) = f"(x), предполагая, что f(x) е С2(Еп) и сильно выпукла на Еп. В случае X = Еп
из (7) имеем:
x{t) = -a{W(x(t)))-lf{x{t)), 0 0. (9)
Нетрудно видеть, что метод (10.39) является разностным аналогом (схема Эйлера) метода (9),
а классический метод Ньютона (10.8) — это разностный аналог метода (9) при a(t)= а [25].
Если X фЕп, то из (8) при G(x) = f"(x) получим вариационное неравенство
{f(x(t))x(t) + a(t)f'(x(t)),y-x(t)-x(t))^0, VyeX, Vt > 0. (10)
Неравенство (10.42) можно истолковать как разностный аналог неравенства (10). Как видим,
метод (6) при G(x) = f"(x) является непрерывным аналогом метода Ньютона. Поэтому можно
ожидать, что если в (6) матрицу G(x) выбирать близкой к f"(x), то на этом пути удастся
получить непрерывные аналоги квазиньютоновских методов, также имеющих высокую скорость
сходимости, хорошо приспособленных для минимизации овражных функций. Следует сказать,
что проблема конструктивного выбора матрицы G(x) в методе (6) пока еще мало изучена.
Приведем теорему сходимости метода (6).
Теорема 2. Пусть X — выпуклое замкнутое множество, функция f(x) е С1 (Еп)
и выпукла на Еп, Д > —оо, Xt ф 0; функция a(t) ^ а0 > 0, непрерывно дифференцируема
и <*'(*)< 0 Vt ^ 0; матрица G(x) симметрична, и существует сильно выпуклая функция
ф(х)€С2(Еп) такая, чтоф"(х) — в(х) Va; £Еп. Пусть траектория системы (6) с
начальным условием х(0) = xq определена при всех t ^0. Тогда существует точка % = i>lf(x0)&Xlt
такая, что
11m x(t) = u, lim f(x(t)) = f lim x(t) = 0.
t ~ЮО t-*QO t —ЮО
Доказательство. Примем в (5) у = x(t) + x(t) £ X, умножим на a(t) >0 и сложим
с (8) при y=xt:
(G(x(t))x(t) + a(t)(f(x(t)) - /'(as,)), x, - x(t) - x(t)) >0
или
(G(x(t))i(t), B(t)> + (G(s(t))s(t), x(t) - x„) + a(t){f(x(t)) - /4¾). x(t)) +
+ a(t)(f'(x(t))-f'(xj,x(t)-xt)^0 Vt>0, V^G-X,. (11)
По условию теоремы существует функция ф(х), для которой ф"(х) = 0(х) Va>eBn, поэтому
Кроме того
^(/(*(*)) - /(¾) - (/4¾). *(*) - *.)) = (/'(*(*)) - /4¾). *(*)>, «(*) > о,
</'0Ф))-/4¾). *(*)-*»>> о (12)
310 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
в силу выпуклости f(x) (теорема 4.2.4). С учетом этих соотношений из (11) имеем
(G(x(t))x(t)t x{t)) + ^(ф(х,) - ф{х{1)) + (ф'(ф)), x(t) ~ х,)) + /
+ a(t)^(f(x(t))-f(xt)-(f'(xJ,x(t)-xt))^0 Vt>0, Vs^eX,.'
Интегрируя это неравенство на произвольном отрезке [г, t], получим
1(в(х(8))ф),Ц8))ЬНФ(ъ)-Ф(Ф))НФЫ»))М»)-Ъ))\'Ш* +
Т JS=T _
+a(t)(f(x(S))-f(xJ-(f'(xt)Ms)-x*))\SslT-
- \ а'(в)[/(*(в))-/(^)-</'Ю,*(в)-я>>]А<0 Vt>T>0, V^eX,. (13)
Т
Из выпуклости /(#) (теорема 4.2.2) и сильной выпуклости ф(х) (теоремы 4,3.2 и 4.3.4) следует
/(*(*)) - f(xt) - </'(ag, x(t) -xt)Z0 Vt > О,
,/-(¾) - </.(*(*)) + №'(*(*)), *(t) - *,) > »|as(t)- a:J2,
(G(x(t))x(t), x(t)> > x\x(t)\2 Vt > 0.
Отсюда и из (13) с учетом a(t) > О, or'(t) ^ 0 имеем
* J |x(e)|2de+*|x(t)-xj2 ^ Ф(х,)-ф(х(т))+(ф\х(т)), x(r)-xt>+Qf(r)/(x(r))-
т
-/K)-(/'K).*(t)-^>sKt,^) Vi>r>0, V^G-Y,. (15)
оо
Это означает, что \x(t) — xj2 ^ i^(0, х„)/* Vt >0 и J |i(i)|2di < i^(0, xt)/*, Поэтому сущест-
0
вует последовательность {t.} —» оо такая, что {a;(i;)}—» %, {^(¾)} —»0. Так как множество X
замкнуто, x(t) + x(t)eX Vt > 0, то Jim (£(^) + ^(^)) = ¾ еХ. Положим в (8) t = t;; при
г —> оо
г —>оо с учетом lim a(t.) = o:(oo)^ сс0>0 получим a(oo)(/'(uj, у-1^)^0 VyeX. Согласно
i ~> оо
теореме 4.2.3 тогда и,е^,. Из (15)прит=^, ^ = ¾ следует: \x(t)-vt\2 ^v(titvt)/x Vt^O.
Переходя здесь к пределу сначала при t —» +оо, затем при t4 —» оо, имеем lim x(t) = vt.
Тогда lim f(x(t)) = f(v.) = f., lim f'(x(t)) = /'(«»)• Наконец, из (11) при я» = % с уче-
£ —> оо t ~\ оо
том (12), (14) получим: *|i(t)|2 ^ \\G(x(t))\\\x(t)\\x(t) - «,| + or(t)|/'(^(t)) - /'K)||i(t)|
HflH*jx(t)|^||G(a!(t))|||x(t)-'uJ + Qf(t)|/'(x(*))-/'(«*)l Vt^O. Отсюда при t->oo следует,
что lim x(t) = 0. Теорема 2 доказана. П
t ~юо
В заключение заметим, что метод (6), основанный на изменяющейся вдоль траектории x{t)
G-метрике, можно рассматривать как непрерывный аналог большой группы итерационных
методов, которые в литературе принято называть методами «с растяжением пространства»
или методами с переменной метрикой [76; 273; 586; 738; 769].
§ 12. Метод покоординатного спуска
В предыдущих параграфах мы рассмотрели методы, которые для своей
реализации требуют вычисления первых или вторых производных
минимизируемой функции. Однако в практических задачах нередко встречаются
случаи, когда минимизируемая функция либо не обладает нужной
гладкостью, либо является гладкой, но вычисление ее производных с нужной
точностью требует слишком большого объема работ, много машинного
времени. В таких случаях желательно иметь методы минимизации, которые
требуют лишь вычисления значения функции. Одним из таких методов
является метод покоординатного спуска [74; 374; 753].
§ 12. МЕТОД ПОКООРДИНАТНОГО СПУСКА
311
1. Сначала опишем этот метод для задачи
/(a:)-» lnf; хеХ=Еп. (1)
Обозначим ei = (0,..., О, 1, 0,..., 0) — единичный координатный вектор, у
которого г'-я координата равна 1, остальные равны нулю, г = 1, ..., п. Пусть
Xq — некоторое начальное приближение, а а0 — некоторое положительное
число, являющееся параметром метода. Допустим, что нам уже известны
точка хк 6 Еп и число ак > 0 при каком-либо к ^ 0. Положим:
Рк = 4« гк = к-п £ +1, (2)
п
где
означает целую часть числа к/п. Условие (2) обеспечивает
циклический" перебор координатных векторов е,, %,..., еп, т. е.
% = е1. •••' Рп-\ = еш Pn = ei» ■••. Й2п-1 = en. ftn = ei. ■■•
Вычислим значение функции /(ж) в точке я; = хк + акрк и проверим
неравенство
f(xk + akPk)<f(xk). (3)
Если (3) выполняется, то примем
хк + \=хк + акРк> ak + i = ak- (4)
В том случае, если (3) не выполняется, вычисляем значение функции f(x)
в точке х = хк — схкрк и проверяем неравенство
f(xk-akPk)<f(xk). (5)
В случае выполнения (5) положим
хк + \=хк-акРк> ак + \ = ак- (6)
Назовем (к + 1)-ю итерацию удачной, если справедливо хотя бы одно из
неравенств (3) или (5). Если (к + 1)-я итерация неудачная, т. е. не
выполняются оба неравенства (3) и (5), то полагаем
■^ ак ) 1к = П1 Хк = Хк - п + 1 '
ак, %кфпъш. хк^хк_п+и (7)
или 0 ^ к < п — 1;
здесь Л, 0 < Л < 1 — фиксированное число, являющееся параметром метода.
Условия (7) означают, что если за один цикл из п итераций при переборе
направлений всех координатных осей е,,. .., еп с шагом ак реализовалась
хотя бы одна удачная итерация, то длина шага ак не дробится и сохраняется
на протяжении по крайней мере следующего цикла из п итераций. Если
же среди последних п итераций не оказалось ни одной удачной итерации,
то шаг ак дробится. Таким образом, если на итерации с номером к = кт
произошло дробление ак, то
f(xk +ак е,)^Цхк ), f(xk-ake.)Zf(x) (8)
312 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
при всех г = 1,..., п. Метод покоординатного спуска для задачи (1) описан.
Справедлива
Теорема 1. Пусть функция f(x) выпукла на Еп и принадлежит
классу С1(Еп), а начальное приближение 2¾ таково, что множество
M{xq) = {х 6 Еп: f(x) < /(¾)} ограничено. Тогда последовательность
{хк}, получаемая описанным методом (2)-(7), минимизирует функцию
f(x) на Еп и сходится ко множеству Xt.
Доказательство. Согласно теореме 2.1.2 имеем /„ > —оо, Xt ^0.
Из описания метода (2)-(7) следует, что f(xk + l)^f(xk), k = О, 1,..., так
что {xk} е M(xq) и существует lim f(xk) > ft. Покажем, что найдется бес-
к —юо
конечно много номеров &,,..., кт,.. . итераций, на которых шаг а.к
дробится, и поэтому lim ак = 0. Допустим противное: пусть процесс дроб-
к —> оо
ления конечен, т. е. ак = а > 0 при всех к ^ N. Обозначим Ма = {и:
и = xN + a.rei е M(oCq), i = 1,..., п, г =0, ±1,±2,...} — сетку (решетку) с
шагом а. Из описания метода покоординатного спуска при ак = а, к ^ N,
следует, что начиная с номера N все последующие циклы из п итераций
будут содержать хотя бы одну удачную итерацию, и на каждой удачной
итерации будет происходить переход от одной точки сетки Ма к другой
соседней точке этой сетки. По определению удачной итерации переход от точки
к точке сопровождается строгим уменьшением значения функции f(x),
поэтому каждая точка сетки Ма будет просматриваться не более одного раза.
Но множество M(xq) по условию ограничено, и поэтому сетка Ма
состоит из конечного числа точек. Следовательно, процесс перебора точек этой
сетки закончится через конечное число итераций определением точки хк ,
кт > N, для которой выполняются неравенства (8) при всех г = 1,..., п. А
тогда вопреки допущению придется дробить число ак — а. Полученное
противоречие показывает, что процесс дробления ак бесконечен и lim ак =0.
к—* оо
Пусть к,<к2<...<кт<... — номера тех итераций, на которых длина
шага ак дрооится и выполняются неравенства (8). Так как последовательность
{хк} принадлежит ограниченному множеству M(xq), то из {хк } можно
выбрать сходящуюся подпоследовательность. Без умаления общности можем
считать, что сама последовательность {хк } сходится к некоторой точке xt.
С помощью формулы конечных приращений из (8) имеем
(/'К + 0т<Че(), е,Кт ^0, (f'(xkm - 9такте{), e.){~akJ^Q,
откуда
/«< (Ч, + вт <*кт е,) ^ 0, /„, (хкт - втаК et) < 0,
0< вт, 0т< 1 при всех г' = 1,..., п и т = 1, 2,... Пользуясь тем, что f(x)e
<ЕС\Е )vl lim ак =0, отсюда получим fx<(xt)=0, г = 1,..., п, т. е.'/'(ж„) =
т ~> оо т
= 0. В силу выпуклости f(x) тогда ^ Е Xt. Следовательно, lim /(¾)—
к ~> оо
= lim f(xk ) = /(:*:») — /*■ Таким образом, последовательность {хк} является
т ~> оо т
минимизирующей. Отсюда и из теоремы 2.1.2 следует, что р(хк, XJ—^O при
к —» оо. Теорема доказана. □
Заметим, что хотя метод (2)-(7) для своей реализации не требует знания
градиента минимизируемой функции, однако в условии теоремы 1
содержится требование гладкости этой функции. Оказывается, если функция f(x) не
§ 12. МЕТОД ПОКООРДИНАТНОГО СПУСКА
313
является гладкой, то метод покоординатного спуска может не сходиться ко
множеству решений задачи (1). Об этом говорит следующий
Пример 1. Пусть
f(u) = х2 + у2-2(х + у) + 2\х- у\, и = (х, у) € Е2.
Нетрудно проверить, что f(u) сильно выпукла на Е2 и, следовательно,
ограничена снизу и достигает своей нижней грани на Е2 в единственной точке.
Возьмем в качестве начального приближения точку г% = (0, 0). Тогда имеем
f(vb+ael) = f(ael) = a2~2a+2\a\^0 = f(0),f(uk+ae2)^f(ae2)^a2-
— 2а. + 2|а| ^0 = /(0) при всех действительных а. Отсюда следует, что все
итерации метода (2)-(7) при начальной точке и0 = (0,0) и любом выборе
начального параметра а = а0 > 0 будут неудачными, т. е. ик — щ при всех
к = 0, 1, ... Однако в точке ^ = (0, 0) функция /(и) не достигает своей
нижней грани на Е2: например, в точке v = (l, 1) имеем f(v) = —2 <f(u0) = 0.
2. Описанный выше метод покоординатного спуска нетрудно
модифицировать применительно к задаче минимизации функции на параллелепипеде:
/(ж)-игл"; хеХ = {(х1,.. .,хп): а. < х* < Ъ., i = 1,. ..,п},
где а() bi — заданные числа, а{ <bit г — 1,. .., п. А именно, пусть к-е
приближение хкеХ и число ак >0 при некотором к >0 уже найдены. Выберем
вектор рк = et согласно формуле (2), составим точку хк + акрк и проверим
условия
хк + акркеХ, f(xk + akPk)<f(xk). (10)
Если оба условия (10) выполняются, то следующее приближение xk+i, ak + i
определяем по формулам (4). Если же хотя бы одно условие (10) не
выполняется, то составляем точку хк — акрк и проверяем условия
хк~акРк^х^ f(xk~^kPk)<f(xk)- (11)
В случае выполнения обоих условий (11) следующее приближение
определяем по формулам (6), а если хотя бы одно из условий (11) не выполняется,
то следующее приближение находится по формулам (7).
Теорема 2. Пусть функция f(x) выпукла на X и f(x) е С\Х).
Тогда при любом выборе начальных х^е X и а0 > 0 последовательность
{хк}, получаемая методом (10),(4),(11),(6),(7), минимизирует
функцию /(¾) на X и сходится ко множеству решений задачи (9).
Доказательство. Так как X — параллелепипед, то множество
М(х0) = {х: х е X, f(x) ^ f(xo)} ограничено. Так как f(xk + l)^f(xk),
к = 0, 1,..., то {хк} € X и существует lim /(¾) ^ /„. Так же, как в те-
к ~* оо
ореме 1, доказывается существование бесконечного числа номеров fc, < ...
... < кт < ... итераций, на которых длина шага ак дробится, и поэтому
lim акт=0. В силу ограниченности М(яь) из (¾^} можно выбрать сходя-
к ~юо т
щуюся подпоследовательность. Не умаляя общности, можем считать, что
{хк }-n, = (i,',..., <). При каждом г = 1,.. ,,уп, возможны следующие
три" случая.
1) а{<х\<Ь{. Так как lim ак = 0, то найдется номер N такой, что хк^ +
+ ак е{ е X и хк - ак е{ еХ при всех m^N. Поскольку ак при к = кт
дробится, то
/(¾ +ake{)^f(xkJ, f(xkm-akme{)^f(xkJ
314 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
для всех m ^ N'. Отсюда, как и в теореме 1, получаем /,,(¾) = 0, так что
Ь(х,)(х*-х<) = 0, а^х^Ь,.
2) xi = at. Тогда х^ + а^еХ и/(а^ + а^е,)^/^) при всех m > JV.
Следовательно, (/'(^т + Са*„е<)> ei)aJ>° ™и /г<(ж*„"+ втактег) ^° Для
каждого т^ N. Отсюда при m —»оо получим /,.,(¾) > 0 или /х,(х^)(х{ —
- аЛ = /..(1.)(г' - яС) ^ 0, а,- < i' < Ъ..
3) ж»4 = Ь.. ЧотА&хкт - акте{ € X и /(ж^ - а^е4) ^ /(¾) при всех m ^ JV.
Поэтому (f(xkm- в такте{), е{)(-ак ) ^0 или/^(^ - 6»та;^е{) < 0, т > JV.
Отсюда при т—»оо получим /.,(¾} ^0, следовательно,
/„, (аО( ^ - Ь4) = /,,(!.)(а;* - ^) > 0, ц,^'^,.
Объединяя все три рассмотренных случая, заключаем, что
/«<Ю(я:'-яС)>0, a^z'^b,, i =1,..., п.
Суммируя эти неравенства по всем г = 1,..., п, получим
(f'(xt)> х — xt) ^0 для всех ле!
Согласно теореме 4.2.3 тогда х„ € X. Следовательно, lim /(¾) =
= lim /(¾ ) = /(¾) = /„, т. е. (¾} — минимизирующая последователь-
т~> оо m
ность. Отсюда и из теоремы 2.1.2 следует, что lim р(хк, Xt) = 0. Теорема 2
доказана. □ к~*°°
3. Существуют и другие варианты метода покоординатного спуска.
Можно, например, строить последовательность (¾} по правилу
^4+1 = ^4+¾¾. (12)
где рк определяется согласно (2), а ак — условиями
«*>0, дк(ак) = min дк(а), дк(а) = /(¾ + арк). (13)
—оо < а < +оо
Метод (12), (13) имеет смысл применять в том случае, когда величина
ак из (13) находится в явном виде. Так будет, если функция /(¾) —
квадратичная, т. е.
f(x)={(Ax,x)-(b,x), хеЕ\ (14)
где А — симметричная положительно определенная матрица, Ъ е Еп.
Нетрудно убедиться, что для функции (14) метод (12), (13) приводит к
хорошо известному методу Зейделя из линейной алгебры [74; 89].
Хотя и скорость сходимости метода покоординатного спуска, вообще
говоря, невысокая, благодаря простоте каждой итерации, скромным
требованиям к гладкости минимизируемой функции этот метод довольно широко
применяется на практике.
Существуют и другие методы минимизации, использующие лишь
значения функции и не требующие для своей реализации вычисления
производных. Например, используя вместо производных их разностные
аппроксимации, можно построить модификации рассматривавшихся в предыдущих
параграфах методов, требующие вычисления лишь значений функции в
подходящим образом выбранных точках.
§ 12. МЕТОД ПОКООРДИНАТНОГО СПУСКА
315
Другой подход для минимизации негладких функций, основанный лишь
на вычислении значений функции, дает метод случайного поиска, который
будет рассмотрен ниже в § 19. Метод поиска глобального минимума,
излагаемый в следующем параграфе, также относится к методам, не требующим
вычисления производных минимизируемой функции.
Упражнения
1. Нарисуйте линии уровня f(x) = С = const функции из примера 1 и поясните причину
расходимости метода покоординатного спуска для этой функции при выборе щ = (0,0).
2. Опишите метод покоординатного спуска и докажите его сходимость для случая, когда в
задаче (9) at = — оо или Ъ. = оо для каких-либо г, j, 1 ^ г, j ^ п.
3. Докажите сходимость метода (12), (13) для функции (14) [74].
§ 13. Метод покрытия в многомерных задачах
Опишем еще один метод минимизации, основанный лишь на вычислении
значений целевой функции без привлечения значений каких-либо ее
производных. Речь пойдет о методах покрытий, одномерный вариант которых был
изложен в § 1.7. Эти методы служат для минимизации функций,
удовлетворяющих условию Липшица. Заметим, что такие задачи в общем случае
являются многоэкстремальными, т. е. в них могут существовать точки
локального минимума, отличные от глобального минимума. Большинство
методов, описанных выше в этой главе, при их применении к
многоэкстремальным задачам скорее всего нам помогут найти лишь какую-либо точку
локального минимума, расположенную поблизости от начальной точки.
Поэтому эти методы часто называют локальными методами. На практике
для решения многоэкстремальных задач локальные методы обычно
используются следующим образом: на множестве задают некоторую сетку точек и,
выбирая в качестве начального приближения точки этой сетки, с помощью
того или иного локального метода находят локальные минимумы функции, а
затем, сравнивая полученные результаты, определяют ее глобальный
минимум. Однако ясно, что такой подход к решению многоэкстремальных задач
весьма трудоемок и не всегда приводит к цели. Поэтому представляют
большой интерес методы поиска глобального минимума в многоэкстремальных
задачах.
Перейдем к изложению одного из методов покрытий, которые служат для
решения многоэкстремальных задач с целевой функцией, удовлетворяющей
условию Липшица. Ограничимся рассмотрением задачи минимизации на
п ар ал л ел еп ип еде:
/(ж)-игл", х€П = {х = (х\ ,..,хп): а{ < ж* < Ъ{, г = 1, ..., п}, (1)
где а{, Ь{ —заданные числа, at < bit а функция f(x) удовлетворяет условию
\f(x)-f(y)\^L\x-y\a> Vz.yen, (2)
где L = const > 0, la; — г/1 = max \х{ — у*\. В правой части (2) можно было
1 < г < п
поставить любую другую норму |а;—у\р, 1 ^р<оо, например, евклидову
норму |х — у\, как это мы неоднократно делали выше, когда требовали условие
Липшица от функции или ее производных. В силу эквивалентности норм в
316 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Еп условие Липшица в любой норме может быть сведено к виду (2). А
норма |я;—2/loc здесь привлекает нас тем, что такие множества, как
параллелепипед, куб удобно описывать с помощью именно такой нормы. Так, например,
множество {хеЕп: \х-x0\oo^h/2} = {x е Еп: \х1 - х£\ < д/2, г = 1,..., п}
представляет собой куб с центром в точке Xq, ребром длины д и с гранями,
параллельными осям координат. Именно такими кубами мы будем
покрывать параллелепипед П. Кроме того, использование нормы 1-^ позволит нам
изложить многомерный вариант метода покрытий для решения задачи (1)
также просто, как в одномерном случае (см. § 1.7, п. 4).
На параллелепипеде П введем сетку Ylh, состоящую из точек х{ ,. =
= (х^, ж?,. .., х[, ..., х"), j-я координата х[ которых при каждом j = 1,...", п
образована по правилу (ср. с § 1.7):
х( = ai + "2 ' ^2 =х{ + h, ..., ж/+! = х( + д, ...,
*ls-i = х\ + (тз ~ 2)^ аЦ = 111111(0:, + (my - 1)д; Ь}.},
, 2е
где д = j шаг метода, а натуральное число т ■ определяется условием
■ h •
хт.- 1 < Ь}- — 2 ^ х\ +(m} — l)h. В качестве приближения нижней грани /„ в
задаче (1), можно взять величину m'mf(x{ ; ) = Fh, которую можно найти
с помощью простого перебора всех значений функции f(x) по точкам сетки
Ylh. Справедлива
Теорема 1. Для любой функции f(x), удовлетворяющей
условию (2), справедлива оценка
/.«</. + * (3)
Доказательство. Кубы П; ■. л ={х еЕп: \х — х{ ; 1^ < д/2} с
центрами х{ л б Пй покрывают весь параллелепипед П. Это означает, что для
любой точки х 6 П найдется куб П; ; ^содержащий эту точку. Отсюда и
из (2) имеем: f(x) > /(z. ..,^) -L\x- аь J» > Fh- if = Fh-e Ух е П.
Переходя здесь к нижней грани по х € П, приходим к оценке (3).
Метод простого перебора предполагает, что в каждой точке сетки Ylh
вычислены значения функции f(x), которые в определенном порядке
перебираются с целью определения величины Fh. Однако, как и в одномерном
случае, нетрудно указать более эффективные способы определения
величины Fh, которые, вообще говоря, не предполагают вычисления значений
функции f(x) во всех точках сетки Uh и перебора всех точек этой,
сетки. Опишем один из таких методов последовательного перебора. На
первом шаге выбирается произвольная точка vx е Пл, вычисляется значение
/(¾) и полагается Fl = f(vl). Допустим, что в точках v{,v2,.. .,¾ сетки
Ylh уже вычислены значения функции /(¾)... .,/(¾) и найдена величина
Fk = min /(¾) = mm{Fk_ ,; /(¾)}. k ^ 2. Через v^ обозначим ту из точек
vu .. .^vk, в которой Fk = f(vii). Далее, возьмем любую из точек vk + le Uh,
которая в предыдущих шагах не исключалась из рассмотрения и в которой
еще не вычислялось значение функции f(x). Вычислим значение f(vk + i) и
величину Fk+l=mm{Fk;f(vk + i)} = i<mm+if(vi). Имеются две
возможности: либо Fk+i= f(vk+l) < Fk, либо Fk^ = Fk^ f(vk + l). В первом случае,
§ 13. МЕТОД ПОКРЫТИЯ В МНОГОМЕРНЫХ ЗАДАЧАХ
317
когда Fk + l<Fk, полагаем Vj = vk +, и из дальнейшего перебора исключаем
точку Vj и вместе с нею все точки х{ __л еПЛ, для которых
К-.Л-^^Цг^- (4)
Заметим, что некоторые из этих точек могли оказаться исключенными из
перебора уже на предыдущих шагах. Для нас важно лишь то, что среди
исключенных точек заведомо нет таких, в которых значение функции f(x)
было бы меньше, чем Fk+i, В самом деле, f(vj ) — Fk> Fk+l. Для остальных
исключенных точек х( { , не зная значения f(x{ { ), можем сказать, что
f{^..^)~Fk + x=f{xCAytt\)+Fk-^^>-L\x:...irvk\ + Fk-Fk + x>0
в силу ^2) и (4). Рассмотрим вторую возможность: Fk + x = Fk^. f(vj). Тогда
полагаем v- =v. и из дальнейшего перебора исключаем точку vk+i вместе
с точками х. _,. е ПЛ, для которых
It -v \<1^±UZIL (Z\
Fi,...j„ vk + \\ ^ l ' \ '
Нетрудно убедиться, что и в этом случае в исключенных точках
значения функции не могут быть меньше Fk + l. В самом деле, здесь f(x{ ,,- ) —
~Fk + l= f(xit..., )-Fk= f(x. ..Л) - f(vk+l) + f(vk+i) -FkZ ~L\x^\ -
— vk + i\ + f(vk + i) ~ Fk ^ 0 в силу (2) и (5). Общий шаг метода описан.
Так как на каждом шаге метода берется новая точка сетки Uh, которая
еще не исключалась из перебора и в которой значение функции f(x) еще
не вычислялось, то ясно, что на каком-то шаге описанного процесса
перебора такая новая точка не найдется и процесс закончится за N шагов,
N < т, • щ ■... ■ тп, перебором точек «,,...,% сетки 1\ и определением
величины FN= min f(v.) = mmf(xi , ) = Fh. В силу теоремы 1 величина
1 < i < N Пй ' ''' »
Fh удовлетворяет неравенствам (3). □
Как и в одномерном случае, нетрудно привести примеры, когда
изложенный метод покрытий может превратиться в метод простого перебора точек
сетки Y\h. В то же время ясно, что если величины Fk — Fk + l, f(vk + l) — Fk
в (4), (5) достаточно большие, то многие точки сетки Uh будут исключены
из перебора без вычисления в них значения функции.
Различные модификации метода покрытий на классе функций (2),
обобщения этого метода на более сложные области, чем параллелепипед, на
многокритериальные задачи, а также другие методы поиска глобального
минимума читатель может найти, например, в [286; 309; 493; 526; 590; 591;
661; 662; 671].
§ 14. Метод модифицированных функций Лагранжа
1. Рассмотрим задачу
f(x) -> inf; хеХ = {хеЕп: х € Х0,
а(я:)<0, « = 1,..., m, д{(х) = 0, г=т+ 1,...,4, (1)
где f(x), д{(х),.,., да(х) —заданные функции на множестве Х0. Пусть /„ >
>-оо, X ф<2>. Для выпуклой задачи (1) при различных дополнительных
318 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
предположениях в § 4.9 было установлено, что найдутся множители
Лагранжа А* = (А*,..., A*): j
А*еЛ0 = {АеЯ3: А, >0,..., Am^0}
такие, что пара (xt, А*), где xt 6 Х„, образует седловую точку функции Ла-
гранжа ,
Ь(х,\) = /(х)+^\{д{(х), хеХ0, АеЛ0, (2)
г t= 1
L(xt,X)^L(xt,y) = f^L(x,y), хеХ0, А е Л0. (3)
Была также доказана справедливость обратного утверждения: если
(¾) А*) € Х0х А0 является седловой точкой функции (2), то х„ € Xt.
Основываясь на этих фактах, можно предложить различные методы
решения задачи (1), сводящиеся к поиску седловой точки функции Лагран-
жа. Например, здесь естественным образом напрашивается итерационный
процесс, представляющий собой метод проекции градиента по каждой из
переменных я; и А (спуск по переменной х и подъем — по А):
4 + i=Px0(xk-akL*(xk,Xk))> (4)
K+i=PA„{><k + <XkI>x(xk,\k)) = P^(\k + akg(xk))t fc=0,l,... (5)
где
LJ,xk> xk) = (L^(x, A),..., Lx„(x, A)),
Lx(x, A = (LAi(a;, A),.. ., Lx(x, A)) = (д{(х),..., g3(x)) = g(x);
длину шага ак в (4), (5) можно выбирать из тех же соображений, как
это делалось выше в § 2. Заметим, что проекция любой точки А € Е" на
множество Л0 вычисляется просто по формулам РА (A) = (/х,,..., ц3), где
Hi = max{A;,0}, i = 1,..., m, |Ut = A;, г =т + 1,..., s.
Вместо (4) возможно использование других итерационных процессов,
таких, как метод Ньютона и др. В тех случаях, когда задача минимизации
функции (х, А) по переменной х € Х0 при каждом фиксированном А е Лр
решается достаточно просто, можно предложить следующий итерационный
метод:
L(xk+l,\)= Inf. L(x, Хк), Xk+l=PA(\k + akg(xk+l)), fc=0,l...
Однако, как оказалось, сходимость перечисленных методов удается
доказать лишь при довольно жестких ограничениях на данные задачи (1).
Приведем простейший пример выпуклой задачи, когда метод (4), (5) не
сходится к седловой точке функции Лагранжа.
Пример 1. Пусть /(а:) = 0, Х = {хеЕ1: д(х) = х = 0}. Тогда /, = 0,
Xt = {0}. Функция Лагранжа L(x, \) = f(x) + \g(x) = \x на X0xAQ = El х
х Ех имеет седловую точку (0,0). Процесс (4), (5) здесь имеет вид
xk + i = xk ~ак^кь хк + \=хк + акхк, к =0,1...
Поскольку xl+l + \l+i = (xl + X2k)(l + al)^xl + \2k, к=0, 1,..., то ясно,
что при любых (xq, А0) ф0 и любом выборе длины шага ак ^ 0 этот процесс
расходится.
§ 14. МЕТОД МОДИФИЦИРОВАННЫХ ФУНКЦИЙ ЛАГРАНЖА 319
Анализ перечисленных методов показывает, что причина их расходимости
заключается в том, что функция Лагранжа (2) по переменной Л не очень
хорошо «устроена». Чтобы преодолеть возникающие здесь трудности,
можно попытаться видоизменить функцию Лагранжа, строить так называемые
модифицированные функции Лагранжа, которые имеют то же множество
седловых точек, что и функция (2), и которые обладают лучшими
свойствами, чем функция (2). Такие функции, оказывается, существуют и могут
быть использованы для поиска седловой точки функции (2) и для решения
задачи (1). Следуя [24], мы рассмотрим один из возможных здесь подходов.
2. Будем рассматривать задачу
f(x) -у inf, хеХ = {хеЕп: хе Х0, д(х) ^ 0}, (6)
где f(x), д(х) = (gi(x),..., дт(х)) — заданные функции из С1(Х0). Как и
в гл. 3, векторное неравенство д = (ди ..., дт)^0 [д < 0] здесь и ниже
означает, что д{ > 0 [д. ^ 0] при всех г = 1,..., т, а неравенство а^Ъ для
а, Ъ 6 Ет эквивалентно неравенству а— Ъ > 0.
Наряду с классической функцией Лагранжа задачи (6)
L(x,\) = f(x) + (g(x),\), хеХ0, \еА0 = {\ЕЕт:\>0} = Е™ (7)
еще рассмотрим следующую модифицированную функцию Лагранжа:
M(x,\) = f(x) + ^[(\ + Ag(x)yf-^\\\' (8)
переменных х 6 Х0, А 6 Л0, где А — произвольная фиксированная положи»
тельная константа; в (8) принято обозначение
а+=Рв+т(а) = (а|,...,а+), of = тах{а(;0}, г = 1,...,т, (?)
— проекция точки аеЕт на положительный ортант Е™.
Нетрудно видеть, что функция <p(z) = (max{z; О})2 = (z+)2 одной
переменной непрерывно дифференцируема на всей числовой оси Е1, причем
ip'(z) = 2max{z;0} = 2z+.
Отсюда следует, что при f(x), д(х) е С1(Х0) функция (8) непрерывно
дифференцируема по а; и А, причем
^ = Мх(х,\) = Г(х) + (д'(х)У(Х + Ад(х)Г, ,^
™=Мх(х,\) = ±[(\+Ад(х)Г^\], хеХ0, \&Ет,
где д'(х) — матрица порядка т х п, у которой в г'-й строке, j-u столбце
9&(Х) = ^Г> «' = 1, • •., т, У = 1,..., п, а матрица (д'(х))Т получена
транспонированием д'(х). Далее, пользуясь теоремами 4.2.7, 4.2.8 и следствиями
из них, нетрудно показать, что если Х0 — выпуклое множество и функции
f(x), д{(х) выпуклы на Х0, то функция М(х, Л) выпукла по переменной х
на множестве Х0 при любом фиксированном Л еЕт. Отметим также, хотя
это ниже^явно не будет использовано, что М(х, Л) является вогнутой по
переменной Л на множестве Aq при любом фиксированном х е Х0 — в этом
проще всего убедиться, доказав неравенство (Мх(х, \)—Мх(х, ц), \-fi) <0
для всех Л, рь Е Л0 и затем обратившись к теореме 4.2.4.
320 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Перейдем к описанию метода решения задачи (6), использующего
функцию М(х, А). В качестве начального приближения возьмем любые точки
Xq е Х0, А0 € Л0. Пусть к-е приближение хк е Х0, \к е Л0 уже известно.
Составим функцию (ср. с § 6)
ФЛХ) = \\Х-Ч\2 + аМ(х,Хк), хеХ0, (11)
где а — некоторое положительное число, являющееся параметром метода.
Предположим, что существует точка vk, удовлетворяющая условиям
%еХ0, Фк(ук) = МФк(х). (12)
В качестве следующего (к + 1)-го приближения возьмем точку xk + i
такую, что
^+.еХ0, Фк(хк + 1)^ШФк(х)+6*/2, \g(xk+l)-g(Vk)\<6k, (13)
где 8к ^ 0, lim 8к = 0. В частности, если точка vk из (12) известна, то
к —* оо
можно принять xk + l — vk; в общем случае для определения хк + 1 из
условий (13) нужно решать задачу (12) с помощью какого-либо сходящегося
метода минимизации. Дальнейшее изложение не зависит от того, каким
методом решается задача (12), поэтому здесь мы можем ограничиться
предположением, что имеется какой-либо достаточно эффективный метод решения
задачи (12), позволяющий за конечное число итераций найти точку xk + i,
которая удовлетворяет условиям (13). После определения хк + 1 точка \к + 1
находится по формуле
K + l=(K + Ag(xk + l))+. (14)
Правила получения (к + 1)-го приближения хк + 1 &Х0, Хк + 1 бЛ0 изложены.
Описанный метод кратко будем называть методом (13), (14). Для исследования сходимости
метода (13), (14) нам понадобятся некоторые свойства функции <х+, определенной
равенствами (9). Из теоремы 4.4.2 следует, что
|а+-Ь+|^|а-Ь| Уа,ЪеЕт. „ (15)
Далее, система соотношений
<К0< А >0, А^=0, i = 1,...,т, (16)
эквивалентна равенству
А = (А+Л</)+ (17)
при любых постоянных А > 0. В самом деле, если выполняются соотношения (16), то либо
д. =0, А; ^0, либо А; =0, (¾ ^0. В каждом из этих случаев, очевидно, равенство (17) верно.
Таким образом, из (16) следует (17). Докажем обратное! Пусть имеет место равенство (17).
Распишем это равенство в координатной форме
А. = (А£+Л<7,)+ = тах{А,+Л<7£;0}, i = l,...,m. (17')
Отсюда ясно, что Аг- ^0 при всех г = 1,..., т, т. е. А£ > 0. Если А£ =0, то А;<7£ =0 и, кроме
того, из (17') получим 0 = (0 + Л<7;)+ = Х( +Ад{, т. е. д{ ^0. Если же А; >0, то из (17') следует
0<А;=(А^+А<7;)+ = \{+Ад{, что возможно лишь при gi = 0 и Xigi = 0. Эквивалентность (16)
и (17) доказана.
Далее, пользуясь определением (9) функции <х+, нетрудно получить, что
(а+,а) = (а+,а+), (а+, Ъ) ^ (а+, Ъ+) Va, Ь £ Еп.
Отсюда имеем
> {а+,а+) + (Ь+, Ь+) - {а+, Ь+) - (Ъ+,а+) = {а+ - Ъ+, а+ - Ь+),
(а+-Ъ+,а-Ь)^(а+-Ъ+,а+-Ь+). (18)
§ 14. МЕТОД МОДИФИЦИРОВАННЫХ ФУНКЦИЙ ЛАГРАНЖА 321
Теорема 1. Пусть Х0 — выпуклое замкнутое множество из Еп (например, Х0 = Еп),
функции f(x), д.х),.. .,д (х) выпуклы на Х0 и принадлежат классу С1 (Х0), Д >-оо, Х^ф
■ф 0, функция Лагранжа (7) имеет хотя бы одну седловую точку (xt, А*) е Х0хА0 в смысле
неравенств (3). Пусть, кроме того, последовательность {Sk} из (13) неотрицательна и
оо
^2 Sk <оо. Тогда последовательность {(xk, Хк)}, удовлетворяющая условиям (13), (14),
при любом выборе начальных (¾. А0) е Х0 х Л0 и любых фиксированных параметрах а >0,
А > 0 существует и сходится к некоторой седловой точке функции Лагранжа (7).
Доказательство. При сделанных предположениях функция М(х, А) выпукла по
переменной х &Х0 при всех А е Л0, А > 0, поэтому при любых хк е X,, Ад. е Л0, а > О, А > О
функция ФдДж), определяемая формулой (11), сильно выпукла на л0 с константой сильной
выпуклости и = 1. Отсюда и из теоремы 4.3.1 следует, что точка vk, удовлетворяющая
условиям (12), существует и определяется однозначно. Тогда существует и точка xk + i,
удовлетворяющая условиям (13): например, в (13) можно взять xk+i=vk. Здесь важно заметить, что
многие из описанных выше методов минимизации для задачи (12) сходятся и при любом 6к >0
позволяют получить точку хк+ [ из (13) за конечное число итераций. Таким образом, при
выполнении условий теоремы последовательность {(хк, Ад.)} существует и имеются достаточно
эффективные способы реализации каждой итерации метода (13), (14).
Наряду с точкой Ад. + 1, определяемой по формуле (14), введем еще точку
Hk = (\k+Ag(vk))\ *=0,1,... (19)
Покажем, что для любой седловой точки (xt, А*) функции Лагранжа (7) справедливо
неравенство
l^-^|2+fl^-^|2>K-^|2+fl^-^|2+K-^J2+fl^-Afc|2, * =0,1,.-. (20)
Согласно лемме 4.9.2 существование седловой точки (xt, А*) в задаче (6) эквивалентно
соотношениям
(f'M + (9'(xt))TX*,x-xt)^0 VzeXj, (21)
</(*„)«: 0, А*>0, At5.(^) = 0, i = 1,...,т. (22)
В силу эквивалентности соотношений (16), (17) условия (22) можно переписать в следующей
равносильной форме:
А* = (А* + Л</(аО)+. (23)
Из (21) с учетом равенства (23) имеем
(/4¾) + (</'0О№ + Ag(xt))+,x -яО^О, VzeXj. (24)
Далее, из условия (12) и теоремы 4.2.3 следует
(Фк'(ч),*-Ч)>0> Vo;eX0.
Отсюда с учетом формулы (10) получим
{vk-xk+af{vk) + a{gl{vk)jY{\k+Ag(vk)f,x-vk)>0> Vx е Х0. (25)
Примем в (24) x = vk, умножим это неравенство на а > 0 и сложим с неравенством (25) при
х = х^, Получим
К - ** + "(/'(«*) - /4¾)) + «*0/'K))T(A* +Ag(vk))+ -
г, -a(g'(xA)T(\*+Ag(xA)+,x-vk)Z0, к = 0,1,...
Отсюда имеем \и \ *>> \ »\ *// > * к/ ' > >
К -ч*х*- Ч) > а(/'Ю - /4¾). Ч ~ х*) + а((Хк + ^9(ч))+> д\ч)(ч ~ **)) ~
~a((\*+Ag(xt))+, g'(xt)(vk-xt)), fc=0,l,... (26)
Так как функции f(x), д{(х) выпуклы, то согласно теореме 4.2.4
(/4¾) ~ /4¾). Ч - **> > 0, g\vk)(vk - xt) > g(vk) - g(xt) > g'(xt)(vk - xt).
Отсюда и из (26) следует
К - Ч> х* ~ Ч) > «*<(** + Ag(vk))+ - (А* + Ag(xt)f, g(vk)- g(xt)) =
= f((Xk+Ag(vk))+-(X*+Ag(xt))+,[(\k+Ag(vk))-\k]-l\*+Ag(xt))-\*]).
322 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
К правой части этой оценки применим неравенство (18). С учетом формулы (19),
определяющей точку цк, и равенства (23) получим
К - **. х* - Ч) > f <(** +Ag(vk))+ - (\*+Ag(xt))+,
[(A, + Ag(vk))+ - Xk] - [(А* +Ад(ъ))" - A*]) = f (¾ - A*, /¾ - A,), [
т. e.
(¾ ~xk<x* ~vk) + ^^k -Xk'x*-Vk) >0, к =0,1,.., (27)
Справедливы тождества
\xk ~ x*\2 = 1(¾ - vk) + (¾ - ^.)12 = 1¾ - xk\2 + 1¾ ~vk\2+ 2K -^.^- «*>.
|А*-А*|2 = |л4-А4|2 + |А*-л4|2 + 2(л4-А4,А*-^>.
Умножим второе из этих тождеств на а/Л и сложим с первым. Отсюда с учетом оценки (27)
получим обещанное неравенство (20).
Далее, покажем, что
\xk + l-vk\^sk> \Хк + 1-1*к\^А6к> к=0,1,.... (28)
х) сильно выпукла на Х0, то с помощью ti
л
хк+1~Ч\2/2^фк(хк + 1)-®к(ч)<б!/2,
,енке (28). Из формул (14), (19), определ:
я (13) следует
\bk+i-Hk\^A\9(.xk+\)-9(vk)\< Ah-
Оирнт (28) доказаны.
В (п + т)-мерном пространстве Еп + т переменных z = (x, А) = (ж1,..., хп, А[,..., Ат)
введем скалярное произведение (z,, z2) = {х\, 2¾) + (а/А){\ , А ) и соответствующую ему норму
||*|| = <1*|2 +(а/Л)|А|2)'/2. (29)
Тогда, обозначив zk = (хк,\к), wk =(¾) ^), z* =(xt,\*), неравенства (20) и (28) можем
записать и виде
К-*12>К-*12 + К-**И2. ^ = 0,1,..., (30)
■v>k\\Z{Aa + l)6k, к =0,1,... (31)
Поскольку функция Фк(х) сильно выпукла на Х0, то с помощью теоремы 4.3.1 и первого
неравенства (13) получим
что равносильно первой оценке (28). Из формул (14), (19), определяющих точки Хк + ,, цк , ,
неравенства (15) и условий (13) следует
*к\\
Напомним, что по условию ]Г 6к<оо. Таким образом, последовательности {zk}, {wk},
{6к} удовлетворяют условиям леммы 2.6.10. Для полной строгости, конечно, нужно заметить,
что в неравенствах (2.6.30), (2.6.31) использована евклидова норма пространства д" + т1 а в
только что полученных неравенствах (30), (31) — норма (29). Тем не менее, рассуждая так
же, как при доказательстве леммы 2.6.10, нетрудно показать, что существует конечный предел
lim 11¾ — 2*11 и, кроме того,
*-*■» Ит К-¾ || = 0. (32)
к —* оо
Заметим, что
min{l; a/A}\z\2 ^ ||z||2 < max{l; a/A}\z\2,
т. е. нормы \z\ и \\z\\ эквивалентны. Отсюда и из существования конечного предела lim \\zk —
к ~> оо
— 2*|| следует, что последовательность {zk = (хк, Хк)} € Х0 х Л0 ограничена в Еп + т и из
нее можно выбрать подпоследовательность {zk =(хк , Ад. )}, которая сходится в ]$п+т к
некоторой точке с* = (at, Ъ*), причем at е Х0, b е Л0 в силу замкнутости X, и Лц. Покажем,
что с* = (<xt, Ь*) — седловая точка функции Лагранжа (7). Из {zk } —» с* и (31), (32) следует,
что {wk } —» с*, {zk , |} —» с*. Тогда из (14) при к = кТ —»оо получим
Ь* = (Ь* + Л5Ю)+. (33)
§ 14. МЕТОД МОДИФИЦИРОВАННЫХ ФУНКЦИЙ ЛАГРАНЖА 323
В силу эквивалентности соотношений (16) и (17) из (33) следует
sKKO. ь*>о, ь;йю = о, < = 1,...,171 (34)
Далее, переходя в (25) к пределу при к — кт —»оо будем иметь
</'(«,) + 0?'(<О)Т(Ь* + Лд{а,))+, х - а„) > О, х е Лц,
или с учетом (33)
</'(<О + (з'К))ть*,*-<О>0 Va>ex0. (35)
Из соотношений (34), (35) и леммы 4.9.2 следует, что с* = (at, b*) — седловая точка
функции L(x, А) в смысле неравенств (3), а тогда согласно теореме 4.9.1 получаем, что at —
решение задачи (6).
Заметим, что неравенство (30) верно для любой седловой точки, в частности, оно верно
и для найденной точки с* = (<xt, b*). Поэтому существует конечный предел lim \\zk — с*\\,
к —* оо
причем в силу определения точки с* имеем lim \\zk — с*\\ = lim \\zk — с*\\ = 0. Это значит,
что вся последовательность {zk = (хк, Хк)} сходится к точке с* = (<х„, Ь*), и, в частности, {хк}
сходится к <xt — решению задачи (6). Теорема 1 доказана. П
Другие методы поиска седловой точки функции Лагранжа, другие методы решения зада
чи (1) или (6), основанные на связи между двойственными задачами (см. теорему 4.9.6), i
также библиографию по таким методам читатель найдет в [24-26; 222; 234; 28о; 344; 759].
§ 15. Метод штрафных функций
1. Метод штрафных функций является одним из наиболее простых и
широко применяемых методов решения задач минимизации. Основная идея
метода заключается в сведении исходной задачи
/(&)-► inf; хеХ (1)
к последовательности задач минимизации
Фк(х)^Ы; хеХ0, к = 1,2,..., (2)
где %z(x) — некоторая вспомогательная функция, а множество Х0 содержит
X. При этом функция Фк(х) подбирается так, чтобы она с ростом номера
к мало отличалась от исходной функции f(x) на множестве X и быстро
возрастала на множестве Х0\Х. Можно ожидать, что быстрый рост
функции Фк(х) вне X приведет к тому, что при больших к нижняя грань этой
функции на Х0 будет достигаться в точках, близких ко множеству X, и
решение задачи (2) будет приближаться к решению задачи (1). Кроме того,
как увидим ниже, имеется достаточно широкий произвол в выборе
функций Фк(х) и множества Х0 для задач (2), и можно надеяться на то, что
задачи (2) удастся составить более простыми по сравнению с задачей (1) и
допускающими применение несложных методов минимизации.
Определение 1. Последовательность функций {Рк(х), к = 1,2,...},
определенных и неотрицательных на множестве Х0, содержащем
множество X, называют штрафом или штрафной функцией множества X на
множестве Х0, если
lim Pk(x)= < ' .
i->» " ' 1_ оо, УхеХ0\Х.
Из этого определения видно, что при больших номерах к за нарушение
условия х е X приходится «платить» большой штраф, в то время как при
х е X штрафная функция представляет собой бесконечно малую величину
при к —» оо.
324 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Для любого множества X с Еп можно указать сколько угодно различных
штрафных функций. Например, если {Ак} — какая-либо положительная
последовательность, lim Ак = оо, то можно взять 1
к —* оо х
Рк(х) = Акр(х,Х), хеЕп = Х0, к = 1,2,...
(здесь X предполагается замкнутым) или
О, хеХ,
/\. и КС Ж и X кг. У\.) /С — 1 ^ ,Z j ...,
где р(х, X) — inf la; — у\ — расстояние от точки х до множества X, а х—
■уеХ
какая-либо точка из X. Другие примеры штрафных функций будут
приведены ниже.
Допустим, что некоторое множество Х0, содержащее X, а также
штрафная функция {Рк(х)} множества X на Х0 уже выбраны. Предполагая, что
функция f(x) определена на Х0, введем функции
Фк(х) = /(х) + Рк(х), хеХ0, к = 1,2,... (3)
и рассмотрим последовательность задач (2) с функциями (3). Будем считать,
что
Ф4. = 1п!Ф4(я:)>-оо) к = 1,2, ... (4)
хо
Если здесь при каждом к = 1, 2,... нижняя грань достигается, то условия
Ф*Ю = Ф*.. ^еХ0, (5)
определяют последовательность {хк}. Однако точно определить хк из (5)
удается лишь в редких случаях. Кроме того, нижняя грань в (4) при
некоторых или даже всех к =0, 1,... может и не достигаться. Поэтому будем
считать, что при каждом к = 1, 2,... с помощью какого-либо метода
минимизации найдена точка хк, определяемая условиями
хкеХ0, Фк(хк)^Фк« + ек, (6)
где {ек} — некоторая заданная последовательность, ек > 0, fc = 1,2,...,
lim ек = 0 (если хк удовлетворяет условиям (5), то в (о) допускается воз-
к -400
можность ек =0). Отметим, что, вообще говоря, хк f X. Метод штрафных
функций описан.
Подчеркнем, что дальнейшее изложение не зависит от того, каким
конкретным методом будет найдена точка хк из (6). Поэтому мы здесь можем
ограничиться предположением, что имеется достаточно эффективный метод
определения такой точки.
2. Перейдем теперь к исследованию сходимости метода штрафных
функций. Так как
\im Рк(х) = оо при хеХ0\Х,
к —юо
то можно ожидать, что для широкого класса задача (1), последовательность
{хк}, определяемая условиями (6), будет приближаться ко множеству X и
будут справедливы равенства
lim /(¾) =/., limP(xk,Xt) = 0. (7)
к ~* оо к ~юо
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
325
Мы здесь ограничимся рассмотрением задачи (1) для случая, когда
множество X имеет вид
Х={хеЕп: хеХ0, д{(х)ф, г = 1,...,т; &(ж) = 0, г=т+\,..., з}, (8)
где Х0 — заданное множество из Еп (например, Х0 = Еп), функции
f(x), д((х), г = 1,..., s, определены на Х0. В качестве штрафной функции
множества (8) возьмем
Pk(x) = AkP(x),
P(x) = £(max{gi(x);0}y+ ± \д1(х)\р, х е Х0, (9)
г — 1 г — т + 1
где Ак >0, к = 1, 2,..., lim Ак = оо, а р ^ 1 — фиксированное число.
fc-юо
Очевидно, если функции д{(х) будут г раз непрерывно
дифференцируемы на множестве Х0, то при любом р > г функция (9) также будет г раз
непрерывно дифференцируема на Х0. Если в (9) р— 1, то из непрерывности
д{(х), г — 1,. .., з, следует непрерывность Рк(х) на Х0, но гладкости Рк(х)
в этом случае ожидать не приходится. Полезно также заметить, что если
Х0 — выпуклое множество, функции д((х) при г — 1, ..., т выпуклы на Х0,
g.(x) = (av x) — bf — линейные функции при г = т+ 1,..., s, то функция (9)
выпукла на Х0 — это вытекает из следствий к теореме 4.2.8.
Если для краткости ввести обозначения
пЧт\-{ max{ft(a:);0}, i = l,...,m,
ft( )_llft(*)l, * = ™ +1,....,-, { }
то функцию (9) можно записать в виде
Ph(x) = AhP(x), Р(х)=±(дПх)У, хеХ0.
• = i
Функцию Р(х) мы также будем называть штрафной функцией
множества (8), подразумевая при этом, что после умножения на Ак >0, lim Ак=оо,
к—too
она превратится в штрафную функцию в смысле определения 1. Величины
Ак из (9) будем называть штрафными коэффициентами.
Заметим, что существуют и другие штрафные функции множества (8).
Например, вместо (9) можно взять
Рк{*)=£АМ{*)У'> ^¾. ^ = 1,2,..., (9')
• = 1
где pi ^ 1, Аы> 0, lim Аы = оо, г = 1, .. ., а; здесь каждое ограничение
к —> оо
из (8) имеет свой штрафной коэффициент. Весьма широкий класс штрафных
функций множества (8) дает следующая конструкция:
< = i .
где <fii(g) — произвольная функция, определенная при д ^ 0 такая, что
(р;(0) = 0, (рЛд)>0при д>0, г = 1,. .., s. При необходимости можно выбрать
функции wig) так, чтобы штрафная функция Рк(х) обладала различными
полезными свойствами, такими, как, например, непрерывность, гладкость,
326 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
выпуклость, простота вычисления значений функции и нужных
производных и т. п. Возможны и другие конструкции штрафных функций
множества (8). Приведем еще два конкретных примера штрафной функции
£ехр{А^(а:)} + £ exV{Akg?(x)}), х е Х0,
г-1 i*=m+ 1 '
где Ак > 0, к = 1, 2,..., lim Ак = оо.
к —* оо
Прежде чем переходить к строгим формулировкам теорем сходимости
метода штрафных функций, рассмотрим несколько примеров.
Пример 1. Пусть требуется решить задачу
f(u)=x2+xy+y2^ inf, и € Х={и=(х, у) € Е2: х+у-2=0}.
В качестве штрафной функции возьмем Рк(и) = к{х + у — 2)2 и положим
Фк(и) = х2 + ху + у2+к(х + у-2)2, и€Х0 = Е2; к = 1,2,...
Функция Фк(и) при каждом фиксированном к = 1, 2,... сильно выпукла на
£?2 и достигает своей нижней грани на Е2 в точке ut = (¾) 24)> которая
определяется уравнениями
ЩЫ = 2хк + ук + 2Цхк + ук-2) = 0,
Щ^ = хк + 2ук + 2к(хк + ук-2) = 0.
Отсюда получаем
и.
- (_« 4fc_\ ф / v J2^_ j f ф , v
При к —» оо будем иметь г% —» и„ = (1, 1), Фк(и^—у 3. Нетрудно видеть, что
и„ — решение исходной задачи. В самом деле, f'(ut) = (3; 3), (f'(ut), и —
— ut) = 3(ж— 1) + 3(у— 1) = 0 для всех кбХ.В силу выпуклости множества
X и функции /(и), согласно теореме 4.2.3, тогда и„ — точка минимума f(u)
на X, причем f(ut) = ft = 3= lim ¢^(¾). Таким образом, в рассмотренном
к -4 00
примере метод штрафных функций сходится.
Пример 2. Пусть
f(x) = e~x -игл"; же X = (0:6^: s(a:) = же"* = 0}.
Здесь X = {0} = Х„ /„ = 1. Возьмем штрафную функцию ^(ж) = кд2(х) =
= Аж2е-2з: и положим Фк(х) = е~х + кх2е~2х, же Х0 = Е1. Так как Ф,.(ж)>0
при всех хе Е{, lim Ф^(я;) = 0, то Ф^ = inf<l>fc(a:) = 0. В качестве точки хк,
X —* оо К1
удовлетворяющей условиям (6) при ек = е~к + к2е~2к, здесь можно взять
хк — к, & = 1, 2,... Получим lim f(xk) — 0<ft = 1, lim p(a;t, XJ = oo. Таким
/: —* 00 /: —* 00
образом, выясняется, что метод штрафных функций не всегда сходится.
Пример 3. Задача: f(u) = (х— I)2 — у —»inf, и е X = {и = (х, у, z)e
еХ0 = Е3: д{(и) = у2 ^ 0, &(и) = -г ^ 0, ^(и) = х2 - yz < 0}. Здесь £ = 1,
Xt = X = {u = (0, 0, г)Уг >0}. Возьмем штрафную функцию такую: Ф^(я;) =
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
327
= (х - I)2 - у + ку2 + k(max{-z; О})2 + fc(max{z2 - yz; О})2, иеХ0 = Е\
к = 1, 2, ... Очевидно, Фк(и)^ тт(—у+ку2) = --тг УиеЕ3, причем в точке
u* = Oi 2fc> 2fc) значение фЛщ) = ~4к- Следовательно, Фк, = —^ > -оо,
А; = 1,2,..., и точка ик удовлетворяет условию (6) при ек = 0. Однако,
к = 1, 2, ..., и lim p(ut, Д„) = 1, т. е. метод штрафов не сходится. В этой
к —* оо
задаче функции /(и), д{(и), д2(и), дъ{и) являются полиномами, множество
X выпукло и имеет внутренние точки, нижняя грань Ф^ достигается.
Приведем пример задачи, в которой Ф^ = -оо, к = 1, 2, .. .
Пример 4. Задача: f(x) =—х2—игл", хеХ = {хеХ0 = Еи. д(х) = \х\^
<0}. Здесь ft = 0, Х„ = Х = {0}. Возьмем штрафную функцию Ф^(я;) = —ж^+
+ к\х\. Ясно, что Фь„ = inf Фк(х) = -оо, & = 1, 2, ..., и условие (6) теряет
смысл. В то же время, если в этой задаче мы выберем другую штрафную
функцию, как, например, Фк(х) = — х2 + (к + 1)х2 или Фк(х) = —х2+ кх4, то
получим Ф^ = 0 > —оо, причем нижняя грань достигается в точке хк = 0,
fc = l,2,...
Замечание 1. Напомним, что неравенство (6) написано в
предположении, что выполнено условие (4). Если /^ = inf f(x) > —оо, то из (3) и
из Рк(х)^0 УхеХ0 следует, что Ф^ > -оо, к = 1, 2,..., при любом выборе
штрафной функции.
Отметим, что в примерах 1, 2 выполняется условие /„ > —оо, в примерах
3, 4 — ftt = —оо. Для конкретных классов штрафных функций можно
указать другие достаточные условия для выполнения (4). Так, например, если
функция Р(х) взята из (9) или (9'), то Ф(ж, А) = /(х) + АР(х)^Ф(х, J3) =
= f(x) + BP(x) УА^В, УхеХ0. Поэтому Ф,(A) = inf Ф(х,А)^Ф4(В)
жеХ0
У А < В, т. е. функция Ф*(А) монотонно растет (точнее, не убывает).
Отсюда следует, что если Ф„(А) > -оо при некотором А, то Фкаг = Ф*(А) > -оо
для всех к, для которых Ак^ А.
Перейдем к исследованию вопросов сходимости метода штрафных
функций для задачи (1), (8). Для определенности все формулировки и
доказательства теорем проведем для штрафной функции (9), хотя некоторые
из нижеследующих утверждений будут справедливы и для более широкого
класса штрафных функций.
Теорема 1. Пусть функции f(x), д{(х), г' = 1,...,з,
определены, на множестве X,, а последовательность {хк} определена
условиями (3), (4), (6), (9). Тогда
lim f(xk) < lim ¢,(¾) = lim Ф„ ^ /,. (И)
к —юо к-~юо к-~юо
Если, кроме того, /_„ = inf f(x) > -оо, то
P(4)=t(9t(4)Y = 0(A-kl), fc = l, 2,..., (12)
Итд{(хк)^0, г' = 1,...,ш; \im gi(xk) = 0, г =т + 1,..., а. (13)
к—* оо /г —юо
328 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Доказательство. Так как Р(х) >0, то из (3), (6), (9) имеем /
/(¾) < /(¾) + АкР(хк) = Фк(хк) < Ф*. + ек^
^Фк(х) + ек=/(х) + АкР(х) + ек Ух € Х0, к = 1,2,...
Отсюда, переходя к нижней грани пожбХ и учитывая, что Р(х) — 0, хеХ,
получим
1(хк)^Фк(хк)^Фк> + екЩ + ек, fc = 1,2,... (14)
При & —»оо из (14) вытекает (11).
Пусть теперь /м > —оо. Так как /„ )/й, то /„ > —оо, а из (3), Рк(х) ^0,
следует (4) (см. замечание 1). С учетом (14) имеем
0 < АкР(хк) = Фк(хк) - f(xk) <zl + ek-ftt, к = 1, 2, ...
или
0 ^ Р(хк) ^ (I + sup ек - /JA"1, к = 1, 2,...
Оценка (12) доказана. Из нее следует, что lim Р(хк) = 0 или lim gf(xk) =
к ~* оо к ~юо
= 0, г = 1, ..., s. Вспоминая определение (10) для д*{х), отсюда получим
соотношения (13). П
Примеры 2, 3 показывают, что в общем случае неравенства в (11) могут
быть строгими. Приведем достаточные условия, когда справедливы
равенства (7).
Теорема 2. Пусть Х0 — замкнутое множество из Еп, функции
f(x), д{(х),..., дт(х), \дт+{(х)\,..., \д.{х)\ полунепрерывны, снизу на Х0,
/„ = inf f(x) > — cxi. Пусть последовательность {xk}, определяемая усло-
х0
виями (3), (6), (9), имеет хотя бы, одну предельную точку. Тогда все
предельные точки {хк} принадлежат множеству X, точек минимума
задачи (1), (8). Если, кроме того, множество
Xs = {x: хеХ0) gf(x)^ S, « = 1,..., я} (15)
ограничено хотя бы, при одном значении 8 > 0, то для
последовательности {хк} выполняются равенства (7).
Доказательство. При сделанных предположениях для
последовательности {хк} соотношения (11)-(13) сохраняют силу. Пусть vt — какая-
либо предельная точка последовательности {хк}, пусть {хк } —» vt. Заметим,
что vt б Х0 в силу замкнутости Х0. Тогда с учетом полунепрерывности снизу
указанных в условии теоремы функций из соотношений (13) получим
9i{%) ^ JM. 9i(xk ) < lim (7,(¾) < 0, г = 1,..., т,
г—*оо Г к—*оо
IftOOl <}Шк\9Лхк)\ = }'1т\д^хк)\=0, i = m+l,...,s.
г ~* оо г к —юо
Следовательно, % е X. Тогда с учетом (11) имеем /_ ^ /(%) ^ lim /(¾ ) ^
^ lim f(xk) < ft, т. е. lim f(xk ) = /(¾) = /. или vteX^_
к —* оо
Наконец, пусть множество (15) ограничено при некоторых S > 0. Из
соотношений (13) следует, что {хк} е Х6 для всех к ^ /¾. Это означает, что
(¾} имеет хотя бы одну предельную точку. Тогда, как было выше показано,
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
329
все предельные точки {хк} принадлежат Xt. Следовательно, lim р(хк, Xt)=
к ~> оо
= 0. Из тех же рассуждений и неравенств (11) вытекает первое
равенство (7). Теорема 2 доказана. □
Для иллюстрации теоремы 2 рассмотрим
Пример 5. Пусть
f(x) = е~х -> inf; хеХ ={хе Еи. д(х) = х = 0}.
Здесь /„ = 1, -^= {0}. Функции f(x), д(х) непрерывны на замкнутом
множестве Х0 = Е*, /„ = inf е-* = 0, множество Хв = {хе Е{: \х\ ^. 8}
ограничено при любом 8 > 0. Таким образом, все условия теоремы 2 выполнены.
Возьмем штрафную функцию Р(х) = (д(х)У = х2 и положим
Фк(х)=е-х+кх2, хеЕ{, /:.= 1,2,...
Нетрудно видеть, чтоФ^(ж) сильно выпукла на Е{, поэтому Ф^„ = inf Ф,.(х)>
> —оо. Пусть {ек} — произвольная неотрицательная последовательность,
стремящаяся к нулю. Определим точку хк из условия Фк(хк) ^ Фк* + ек, к =
= 1,2,... Для получаемой таким образом последовательности {хк} согласно
теореме 2 имеют место равенства (7).
3. Нетрудно видеть, что рассмотренные в примерах 2 и 5 задачи по
существу одинаковые: минимизируется одна и та же функция е~х на одном и том
же множестве X = {0}, и отличие лишь в том, что в примере 2 множество X
задается ограничениями д(х) = хе~х = 0, а в примере 5 — д(х) = х = 0. Тем
не менее, в примере 2 метод штрафных функций расходится, в примере 5
сходится.
Отсюда заключаем, что для сходимости метода штрафной функции
важное значение имеет способ задания множества X: ограничения, задающие
множество X и штрафные функции этого множества должны быть как-то
согласованы с минимизируемой функцией f(x).
Определение 2. Скажем, что задача (1), (8) имеет согласованную
постановку на множестве Х0, если для любой последовательности {хк} 6
е Х0, для которой
lim a+(asA) = 0, i = 1,..., a, (16)
к-юо
имеет место соотношение
M_f(xk)^l = mif(x). (17)
к -> оо •*
Отметим, что в примере 5 задача имеет согласованную постановку на Е{,
а в примере 2 такой согласованности нет.
Теорема 3. Пусть Фк(х) = f(x) + АкР(х), где Р(х) определена
формулой (9), пусть Фк„ = inf Ф^ж), к = 1, 2,... Тогда для того чтобы,
° НтФ,. = Л, (18)
к —* оо
необходимо, чтобы, задача (1), (8) имела согласованную постановку на
множестве Х0. Если ftt = inf f(x) > -оо, то согласованной постановки
задачи (1), (8) на Х0 достаточно для справедливости равенства (18).
330 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Доказательство. Необходимость. Пусть имеет место
равенство (18). Возьмем произвольную последовательность {хг}е Х0,
удовлетворяющую условиям (16). Тогда lim Р(хг) = 0. Справедливы неравенства
Г -4 00
ф** ^ ®Лхг) ^ f(xr) + Akp(xr)> г- = 1, 2, ... Отсюда при г -> оо получим
Ф;=* < lim j(xT) при всех к = 1, 2,... Переходя здесь к пределу при к —»оо,
г —юо
с учетом (18) будем иметь lim f(xr) ^ lim Фк1г = ft, что и требовалось.
г —* оо к -~*оо
Достаточность. Пусть /м > —оо, задача (1), (8) имеет
согласованную постановку на множестве Х0. Поскольку Фк(х) ^ f(x) при всех х е Х0,
то Ф^ > /м > —оо, и имеет смысл говорить о последовательностях,
удовлетворяющих условиям (6). Возьмем одну из таких последовательностей
{хк}. Согласно теореме 1 тогда справедливы соотношения П 1)-(13).
Заметим, что (13) равносильно (16), откуда следует (17). Из (14), (1/) получим
lim f(xk) = lim Ф^ = ft. Теорема 3 доказана. D
к —* оо к —* оо
Утверждения, уточняющие и дополняющие теорему 3 и определение 2, приведены ниже в
упражнениях 14—16.
Класс задач (1), (8), имеющих согласованную постановку на Х0, указан в теореме 2. Другой
такой класс задач выделяется в следующей лемме.
3
Лемма 1. Пусть в задаче (1),(8) функция Лагранжа Ь(х, А) = f(x) + S ^i9i(x),
i=i
хеХ0, А еЛд = {А =(Ai,..., As)e.Es: А( ^0,..., Am>0} имеет седловую точку на Х0хА0.
Тогда задача (1), (8) имеет согласованную постановку на Х0.
Доказательство. Пусть (xt, A*) S Х0 х Л0 — седловая точка функции L(x, А), т. е.
L(xt,X)^L(xt,X*)^L{x,X*) VxeX0, А еЛц. (19)
Согласно теореме 4.9.1 тогда xt S Xt, /(¾) = Д = L(xt, А*). Из определения (10) функции
gf(x) с учетом условия А еЛ0 имеем
A?ft(*K|A<V(«) Vo)eX0, » = 1 а
Отсюда и из (19) получим
Л^/(*)+ X) №■(*)•■ Va:eXo- (20)
z = l
Возьмем любую последовательность {^}б-Хо' К0Т0Рая удовлетворяет условиям (16). Тогда
из (20) при х=хк получим _^_f(xk)^J^, т. е. задача (1), (8) имеет согласованную постановку
на Х0. П fc-юо
Из теорем 1, 3, леммы 1 следует
Теорема 4. Пусть функция Лагранжа задачи (1), (8) имеет седловую точку и /„ =
= inf f(x) > —оо, пусть последовательность {хк} определена условиями (3), (6), (9). Тогда
lim f(xk) = lim Фь(а;ь)= lim Фь» = Л " справедливы соотношения (11),(12).
Аг —* оо fc —* оо А; —* оо
4. Покажем, что теорема 4 сохраняет силу и без требования /м > —оо. Более того, для задач,
у которых функция Лагранжа имеет седловую точку и даже для несколько более общего класса
задач (1), (8), можно получить оценку скорости сходимости метода штрафных функций.
Определение 3. Скажем, что задача (1), (8) имеет сильно согласованную
постановку, если найдутся такие числа Cj ^ 0,..., с ^ 0, v > 0, что
/„$;/(*)+ t CiigtW v*ex0. (21)
< = i
Как видно из неравенства (20), задачи (1), (8), функция Лагранжа которых обладает сед-
ловой точкой, имеют сильно согласованную постановку, причем в (21) можно взять с; = |А||,
v = 1. Другой важный класс задач с сильно согласованной постановкой будет приведем ниже
в лемме 5. Заметим, что неравенство (21) обобщает очевидное неравенство Д ^ f(x) Ух е X
на более широкое множество Х0.
§15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
331
Теорема 5. Пусть задача (1), (8) имеет сильно согласованную постановку в смысле
1 е о р е м а о. пусть зааача (i), (О) имеет сильно согласованную постановку в смысле
определения 3, Д > —оо, последовательность {хк} определена условиями (3), (6), (9), где
p>v. Тогда ,
O^tfW^PWOi, * = 1.2 (22)
~\с\(РкГ/р^Г(хк)-/^ек, к = 1,2 (23)
-ВА~к^-иНЫч)Ч^ек, -BV/(p_v)^b-/,Ot, * = 1,2 (24)
3* _/|с|у/(р-") р efc 2
N=(E l^l^p-^y^-"', B = (P-i/)i/"/(p-I')p-p/(p-I')|c|p/(p-I/).
4 = 1 '
£сли, кроме того, Х0 замкнутое множество, функции f(x), g^(x) полунепрерывны снизу
на Х0, {Ак} —»оо, {efc}—» 0, и vt — предельная точка последовательности {хк}, то vt е Xt.
Доказательство. Прежде всего покажем, что Фк^ > — оо. Из (21) следует
**(*)-/. = /(*)-/. + >***(*)£- Е ъЫ{*))" +
z = l
+ >Ч Е №))":* Е тЖ-с^ +Akz") VxeX0. (25)
г=1 » = iO0
Нетрудно видеть, что функция <p(z) = — c.z" + AuZp, где р > v, достигает своей
/ г/с. \ 1/(р~ ")
нижней грани при z ^ 0 в точке zt = (—г-) , причем ¥>(^) = min ip(z) =
= _г,"/(р- ")р-р/(р- ">cf/(p~v)(p- i>)Alul(v~"\ Отсюда и из (25) следует, что
ФкЮ-ЬЬ-ВА^Ь-") \/хех0. (26)
Переходя к нижней грани по х е Х0, из (26) имеем
Фы-^-ВА-к"К*-"\ (27)
Отсюда вытекает, что Фк4 > — оо. Это значит, что при ек > 0 точка :¾. удовлетворяющая
условиям (6), существует по определению нижней грани (при ек = 0 существование такой
точки предполагается).
Далее, из (14), (21) имеем
f(xk) + AkP(xk)^ft + ek^f(xk)+ ± с.(д+(хк)У + ек, (28)
г = 1
так что
0^АкР(хк)^± Ci(gf(xk)r + ek, * = 1, 2,... (29)
j = l
Пользуясь неравенством Гельдера
Is i / s \ l/m / s \ Vr 1 1
Е«чЬ4к(Е°Г) (Е ЬЛ , ж + 7=1
4=1 ' 4 = 1 ' 4 = 1 /
при Ь; = ci( a. = (5,+ (¾))17. m = p/i/, г = р/(р - ^), получаем
О ^ Е Мв^))" ^ \с\{Р{хк)у1'\ (30)
i = l
Отсюда и из (29) следует 0 < АкР(хк) ^ \c\{P(xk))vlf + ек или 0 ^ zp/v < \c\Akv/pz + ек,
к = 1, 2,..., где z = (AJcP(o;j£))I/'p. С помощью леммы 2.6.11 тогда получаем
что равносильно оценке (22). Далее, из (28) с учетом (30) имеем
-\c\{P(xk))»/*Sf(xk)-ftZek.
332 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Отсюда и из уже доказанной оценки (22) следует оценка (23). Левые неравенства (24)
получаются из (26) при х = хк и из (27), правые неравенства (24) вытекают из (14). Наконец,
утверждение о том, что предельная точка vt последовательности {хк} принадлежит Xt,
вытекает из оценок (22)-(24) и доказывается так же, как аналогичное утверждение в теореме 2.
Теорема 6. Пусть задача (1), (8) имеет сильно согласованную постановку в смысле
определения 3, Д > — оо, последовательность {хк} определена условиями (3),(6),(9), где
p = v, Ак>\с\ = max \с{\. Тогда
Ul<S 0^(ft+to))'^toK-j^[. (31)
-1^2^1^/(^)-/^¾. (32)
<КФ*Ы-Л$;е*, **. = /„• (зз)
Если Xt ф 0, то
Х, = Хк^ = {хеХ0:Фк(х) = Фк,}. (34)
Если, кроме того, Х0 — замкнутое множество, функции f(x), g£(x) полунепрерывны
снизу на Х0, {sk} —» 0, и vt —предельная точка {хЛ, то vt е Xt.
Доказательство. Из (25) при р = ^, Лд.>]с| имеем Фд.(а:) —Д ^0, x€XQ, так что Фк^
^ Д > —оо, и последовательность (¾}. удовлетворяющая условиям (6), при sk > 0 существует.
Из (28) при p = v, Ak > \с\ сразу получаем оценку (31). Из нее и из (29) при р= v следует
оценка (32). Из (14) и (25) при p=v, Ak> \с\ с учетом того, что min (-qz" + Akz") = 0,
z ^0
приходим к соотношениям (33). Докажем равенство (34). Возьмем произвольную точку are Xt.
Тогда P(a:J = 0 и Фк(х^) = f(xt) - ft =Фк4, так что i, е 1ь. Следовательно, Xt С Xkt. Пусть
теперь xkt е Xkt, т. е. &k(xht) = Ф^. Это значит, что условие (6) при хк = xkt выполняется
с ек — 0. Тогда из оценки (31) при ек = 0 получаем P(xkt) = 0, т. е. xkt е X. Отсюда, из (33)
и из того, что f(xkt) = Фк(хкJ = Ф^ = Д, следует, что хы е Xt. Следовательно, Хк„ С Xt.
Равенство (34) доказано. Последнее утверждение теоремы вытекает из оценок (31)-(33) и
доказывается так же, как аналогичное утверждение в теореме 2. П
Из теоремы 6 следует, что случай р = v интересен тем, что при точной реализации метода
штрафных функции (3), (6), (9) решение исходной задачи (1), (8) может быть получено при
конечных значениях штрафного коэффициента Ак.
Определение 4. Пусть А —некоторый класс задач (1). Говорят, что штрафная
функция Рк (х) является точной на классе А, если существует номер /¾ такой, что множество
решений задачи
Фк(х) = /(х) + Рк(х)^Ы, хех0
при всех к ^ /¾ совпадает со множеством решений произвольной задачи (1) из класса А.
Типичным примером точной штрафной функции на классе задач (1), (8), у которых функция
s
Лагранжа имеет седловую точку, является функция Рк(х) = Ак £) ot(x)< ^к > 1^*1«> [294].
i = l
Это следует из теоремы 6 при р = i/ = 1, с = А* и леммы 1. О точных штрафных функциях см.,
например, [85; 266; 294; 562]
Рассмотрим примеры, которые показывают, что оценки, полученные в теоремах 5, 6, не
могут быть существенно улучшены на классе задач (1), (8), имеющих сильно согласованную
постановку.
Пример 6. Рассмотрим задачу
f(x) = -х -» inf, х S X = {х е Еi: g{x) = х ^ 0}.
Здесь Д = 0, Xt = {0}. Функция Лагранжа Ь(х, А) = -х + Аж, хвХ0 = Е\ А еЛ0 = {А еЕи.
А ^ 0} имеет седловую точку (xt =0, А* = 1), так что согласно (20) неравенство (21) выполнено
при v = 1, с{ = 1, s = 1. Возьмем штрафную функцию Рк(х) = Ак(д+(х))р = Ак(тах{х; 0})р,
р ^ 1, Ак > 1, {Ак} —> оо. Тогда функция (3) будет иметь вид
■Акх", х^0,
"кУ"'-\-х, х<0.
Нетрудно показать, что
0, р = 1/ = 1,
•*=^<»>Н .1^^)-./(,-.,, р>1,
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
333
причем нижняя грань достигается в точке xkt = 0 при р — 1 и xkt = (рАк) ''р ) при р > 1,
к = 1, 2,... Последовательность {:¾} удовлетворяет условиям (5) или (6) с ек = 0, причем
^^-"[(рЛ,)-^-!), р>1, '<***> -^-\ _(рАЛ)-1/0.-1), р>1.
Сравнение этих точных равенств с оценками теорем 5, 6 при ек =0 показывает, что в случае
р = 1 оценки (31), (32) точны, а в случае р> 1 оценки (22)-(24) точны по порядку и отличаются
от точных оценок лишь константами при степени Ак. Если ек > 0, то при р= 1 в качестве
точки хк, удовлетворяющей условиям (6) и наиболее удаленной от Xt, здесь можно взять
я* = е*/(Л,ь-1), * = 1,2 Тогда P(xk) = xk = ek(Ak-\c\)-l,f(xk)-ft = -xk=-\c\sk(Ak-
— |с|)-1, Фк(хк) - Д = (Л^ -\)хк — ек, к = 1, 2,..., что совпадает с оценками (31)-(33).
Если ек > 0, р = 2, то точка xfc = (1/(2Лд.)) + (ек/Ак){12 удовлетворяет условиям (6), причем
АкР(хк)^Акх2к=(1/(4Ак)) + ек + (б/Ак){/2 f(xA)-f^-xk^k{xk)-ft = ek-{l/{4Ak)),
что также свидетельствует о том, что оценки (22)-(24) на классе задач с сильно согласованной
постановкой не являются грубыми.
Этот же пример показывает, что в теореме 6 требование Ак > \с\ не может быть ослаблено.
В самом деле, если Ак < 1 = |с|, р = 1, то ¢^ = -00, если же Ак = 1 = |с|, р = 1, то Ф,„(а:)^0,
®k* — ^1 %к* ~ Е1 vt нарушено равенство (34).
Пример 7. Рассмотрим задачу
/(я) = -х -> Inf, ieI = {ieE': g(a:) = ж2 ^ 0}.
Здесь Д = 0, Xt = {0}. Функция Лагранжа £(а:, Х) — —х + Хх2, x£El, A S В^, седловой точки
не имеет, но тем не менее задача имеет сильно согласованную постановку. В самом деле,
справедливо неравенство ft = 0^—x+\x\ = —x+(g(x))1'2 при всех х£Е , так что неравенство (21)
выполняется при с = 1, v — \j1. Возьмем штрафную функцию Р(х) = (max{a:2;0})p = (х2)р.
Если р> 1/2 = и, то функция Фк(х) = — х + Акх2р, Ак > О, {Лд.}->оо, достигает нижней
грани на Х0 = Е1 при хы = (2p^fc)-1/<2j'- '>, fc = 1, 2 причем P(xkt) = (2pAt)-2p/<2p- »,
f^k*)-f* = -¾. Ф**-Л = -(2p~ l)((2p)2Mfc)-1/<2p- '), it = 1, 2,... Как видим эти оценки
лишь константами при степенях Ак отличаются от оценок (22)-(24). Интересно заметить, что
с увеличением р оценки ухудшаются. Если p — v— \/2, Ак > 1 = |с|, то Фк(х) = — х + Ак\х\,
ф^ = 0. Точка хк — ек(Ак — 1)~1 удовлетворяет условиям (6) и наиболее удалена от Xt ={0}.
Тогда Р(хк) = \хк\ = ек(Ак - l)"1, /(¾) - /„ = -хк, Фк(хк) - /„ = ек, что совпадает с
оценками (31)-(33).
5. Выполнение соотношений (13) или (16), как показывает пример 2, еще не гарантирует
сходимость последовательности {хк} из (6) ко множеству X. Для такой сходимости множество
должно удовлетворять некоторым дополнительным условиям.
Определение 5. Скажем, что множество (8) задано корректными ограничениями
на Х0, если всякая последовательность {xk} S-Xq, удовлетворяющая условиям (16), сходится
ко множеству X.
Примеры 2, 5 показывают, что одно и то же множество может быть задано как корректными,
так и некорректными ограничениями. Как следует из доказательства теоремы 2, ограничения
из (8) будут корректными на Х0, если функции д^(х), г = 1 s, полунепрерывны снизу
на замкнутом множестве Х0, а множество Х(6), определяемое согласно (15), ограничено
при некотором S > 0. Корректными будут также ограничения, для которых удается доказать
неравенство
p(x,X)^h(g+(x) 5+(0=)) \/х£Х0, (35)
где функция h(t) = h(t{ ts) > О при всех t е ££, t ф О, Л(0) = 0, Urn h(t) = 0.
Приведем важные классы множеств (8), задаваемых корректными ограничениями, для которых
неравенство (35) имеет вид
Р(х,Х)$м( max g?(x)Y VxeX0; М > О, у > 0. (36)
Лемма 2. Пусть Х0 — выпуклое замкнутое мноо/сество, функции дх(х) Э™(ж)
выпуклы и непрерывны на Х0, пусть существует такая точка хе Х0, что д{(х) < 0,...
• ■ •> 9mis) < 0; пусть множество X -{хе XQ: д{(х) ^ О 9т(®) ^ 0} ограничено. Тогда
неравенство (36) выполняется с 7=1, M=d\amX( min |5Дж)|) , diam X- sup \u—v\.
334 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Доказательство. Введем функцию д(х) = max д{(х). В силу теоремы 4.2.7 функция
1 < г < пъ
д(х) выпукла на Х0. Возьмем произвольную точку х£Хр\Х. Тогда д(х) >0. Функция /(<) =
= д(х + t(x — х)) переменной t непрерывна на отрезке [0, 1], /(0) = д(х) >0, /(1) = д(х) <0.
Следовательно, существует точка <q е (0, 1) такая, что /(*0) = 0. Положим v = х + t0(x — х);
тогда tQ = \v — х\\х — х\~1, 1 — *q = |г> — ж||ж — х\~1. Пользуясь выпуклостью функции д(х), имеем
9(v) = f(tQ) = 0^tQg(x)+(l-tQ)g(x) mm -tQg(S)^(l-tQ)g(x) wm \v-x\\g(x)\^ \v-x\g+(x).
Отсюда с учетом х, v £ X получаем, что р(х, X) ^ \х — v\ ^ д+(а:)|г1 — х\(д(х))~{ = Мд+(х),
что и требовалось. П
Лемма 3 (Хоффман [796]). Пусть Х = {х£Еп: д{(х)=(а., х)-Ь1 ^0, i = l т}^0,
гдеа{£Еп, Ь1 £ Ж. Тогда
р(х,Х)^М{ max gf(x) Чх£Еп, М{ = const > 0,
1 ^ г ^ s
т. е. неравенство (36) выполняется С7 = 1, Х0 = Еп.
Доказательство. Возьмем произвольную точку х ^ X. Так как X — выпуклое
замкнутое множество, то согласно теореме 4.4.1 однозначно определяется проекция w=Vx(x) точки
х на X. К задаче определения проекции: д(у) — \у — х\ —»inf, у £ X, применимы теорема 4.9.3
и лемма 4.9.2, которые гарантируют существование таких чисел А ( > 0 \т > 0, что
т з
^(«О+Е W(«0 = npfi+E V4=o, ад(«ч,«,>-ь*) = о, i = i ш.
1 = 1 |Ш-Х| £=1
Отсюда, учитывая, что |ги — х\ = р(а:, X) > 0 имеем
x-w=p(x,X) Y, А4а„ I Е A4J = 1, J(aO={i:U^m, Аг>0, (а;,™)-Ь<=0}. (37)
Можно считать, что система векторов {ai,i£l(x)} линейно независима. В самом
деле, если существуют числа 7;> i &1(х), не все равные нулю, yj "liai = 0, то ^ "~ w —
i е /(ж)
= р(х, х) Е (А; - *7;К> ГДе ^г = А; - *7г > °> » 6 Д1). ПРИ всех *, 0 < * < t0, t0 —доста-
i €/(3:)
точно малое число, Можно считать, что среди 7;, * &1(х), есть положительные числа, иначе
изменим знаки всех у,, i£l(x). Положим t = а /7 = min ai/"ti- Тогда ia = А; —<7; ^0,
7,. >0, i е/(я)
i £ /(ж), причем по крайней мере одно число v =Ха — *7„ = 0. Таким образом, заменив в (37)
А; на IA и исключив из 1(х) те номера, для которых vt =0, снова придем к равенству вида (37)
с меньшим числом слагаемых. Последовательно применяя этот прием далее, за конечное число
шагов придем к представлению (37), в котором система {ait г £ 1(х)} линейно независима.
Из (37) следует
, max gt(я) ^ .max д?(х) =г max д.(х) = .max ((a.,x)-bl) =
= ,ma,x>i- я- w) = p(x, X) .max (aj, E A,a.). (38)
Покажем, что величину max (<x;, У) А-а), где система {^, i S/(ж)} линейно независима,
*еЦ*) jei(x)
можно оценить снизу положительной величиной, не зависящей от х. С этой целью возьмем
любое множество индексов IС{1 т} таких, что векторы {at, г £1} линейно независимы,
и введем множество
Ar = {(A4lie/):A4£0, Е A4aJ = l}. (39)
1 Ч е/
Заметим, что АТ —замкнутое ограниченное множество. В самом деле, если А* = (А*, г £
е/)еЛг, А*1-» А, то предельным переходом в (39) легко убедиться, что АеЛг. Следовательно,
АТ замкнуто. Покажем ограниченность АТ. Допустим противное: пусть найдутся \к £ Кг, к —
= 1,2 |Aft|-»oo. Тогда последовательность цк = А к /\ A fc|, fc = 1, 2 ограничена: |^*| = 1.
Выбирая при необходимости подпоследовательность, можем считать, что {^ }—» ^, |^| = 1.
Поскольку I YJ AfaJ = l,TO I yj ^aJ = l/|Afc|-»0= E ^°¾. где ^ = (^°. i S /)^0. Однако
Че/ ' '«€/ ' ie/
это противоречит линейной независимости {ait г £ I}. Следовательно, АТ ограничено,
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
335
На множестве Ат рассмотрим функцию d(X,I)~ тах(а{, £) А- а- ). Убедимся в том,
что d(X, I) > 0 при всех A S Аг. В самом деле, если существует А0 = (Ay, j S I) S Аг, что
d(X°, I) ^ 0, то (dj, X] ^?ai) ^ 0 при всех i е I. Умножим эти неравенства на А°, г е J, и
сложим; получим равенство I £) ^?ai| = 0> противоречащее определению Аг. Таким образом,
ге/
d(A,J) > 0 при всех А еЛг. Функция d(X,I) полунепрерывна снизу на АТ. В самом деле,
пусть А еЛг, {Afc}-> А, А^ еЛг, к = 1,2 пусть i0el и d(A,J) = (aj , X] *jaj)- Тогда
d(A*:,J) = max(a., J] ^J°<) 35 (a,' i S A^а-). Отсюда при fc -» oo получим lim d(Xk, I) ^
^ (<x?. , J] A .a-) = d(A,7) VA еЛг. Согласно теореме 2.1.1 полунепрерывная снизу функция
0 jel
d(X,I) на компактном множестве Л^ достигает своей нижней грани в некоторой точке Xt S Аг,
причем d (I)— inf d(A, I) = d(X*, I)>0. Поскольку множество {/} различных подмножеств
А еЛ,
I множества {1 т}, для которых векторы {а{, г е /} линейно независимы, конечно, то
d = Inf 4,(/) > 0 Отсюда и из (37), (38) имеем max д£(х) ^ р(х, X)d(X, I(x)) ^ р(х, X)dt,
{1} 1 < г < т
или р(х, X) ^.(l/dt) max д£(х), хеЕп. Таким образом, неравенство (36) справедливо с
1 < г <з
7 = 1, М = 1/(¾.. Лемма 3 доказана. П
Лемма 4. Пусть множество
Х={хвЕп: д((х)=(а{, х)-Ъ{ ^0, i=l т; дг(х)=(а{,х)-Ъ{=0, г = т + 1 я}, (40)
где а{€ Еп, Ъг е К непусто. Тогда
р(х,Х)$М max n+(x) VxeEn, М= const. (41)
1 < г < s
Доказательство. Каждое ограничение д; (ж) = (<хг, ж) — Ьг = 0 замерим равносильными
ограничениями hH(x) = g{(x) ^ 0, ЛгД1) = ~9{(х) ^ 0 и воспользуемся леммой 3. Получим
р(х, X) ^ Мх max{gf (х) g+(x); hfm+l(x) tfa(x), h£m+l(x) h%s(x)}.
Отсюда и из л+(1) = тах{9.(1).0}<|9.(1)| = а+(4
}4a(x) = ma-x.{-gi(x)\Qi)^\gi(x)\ = g'f(x), i = m + 1 s,
приходим к неравенству (41). Лемма 4 доказана. П
Другие классы множеств (8), заданных корректными ограничениями, читатель найдет в [84;
527; 670].
6. В лемме 1 был выделен класс задач (1), (8), имеющих сильно согласованную
постановку (см. неравенства (20), (21)). Следуя [670], приведем еще один содержательный класс
таких задач.
Лемма 5. Пусть функция f(x) на множестве Х0 удовлетворяет условию Гельдера
\f(x)-f(y)\^L\x-y\" Чх,уеХ0, L>0, 0<Qf^l; (42)
ограничения, задающие множество (8), корректны на Х0 и удовлетворяют
неравенству (36). Тогда задача (1), (8) имеет сильно согласованную постановку, причем
неравенство (21) выполняется при с, = ... = cs = LMa, v — cry.
Доказательство. Возьмем произвольную точку х е Х0. По определению р(х, X) =
= inf \х — v\ для любого е > 0 найдется такая точка х е X, что \х — хе\ ^ р(х, X) + е. Тогда
с учетом условий (36), (42) имеем
LMa E(ft+(*))e7+ /(*)-/.> iMM max g+(x)) +/(*)-/(*,)>
3* L(p(x, X))a -L\x-x£\a >L(p(x, X))a - L (p(x, X) + e)a.
Пользуясь произволом e > 0, отсюда при е —» 0 получим
ЬМа £ (gt(x))ai + f(x) - Д > 0 Vo; е Х0.
г = 1
Лемма 5 доказана. D
336 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Заметим, что в общем случае из выполнения условий леммы 5 не следует существование
седловои точки функции Лагранжа задачи (1), (8) и, наоборот, существование седловои точки
не гарантирует выполнение условий леммы 5. Это означает, что выделенные в леммах 1, 5 два
класса задач (1), (8), имеющих сильно согласованную постановку, взаимно дополняют друг
друга. Отметим также, что этими двумя классами не исчерпываются задачи (1), (8) с сильно
согласованной постановкой. Поясним это на примере.
Пример 8. Рассмотрим задачу
f(x) = ~xa^>M, хеХ = {х^0: д(х) = хР ^0}, (43)
где а > 0,/3 > 0, Х0 = {хвЕи. х >0} = Е±. Ясно, что X = Xt = {0}, Д = 0.
Далее, имеем
Д = 0 = ~ха + (хР)а1Р = /(в) + (д+(х))а^ Чх е Х0,
так что неравенство (21) выполняется при s = m = 1, с; = 1, v = о>//3. Следовательно,
задача (43) имеет сильно согласованную постановку и к ней применимы теоремы 5, 6. Отметим, что
здесь р(х, Х)=\х—0\ = \х\ = (д+(х))1'Р, хеХ0, т. е. условие (36) выполняется с M=l, 7 = 1//3.
Далее, при 0< а ^ 1 функция f(x) = — ха удовлетворяет условию Гельдера: \ха —уа\^.\х — у\а,
х,уе Х0, так что в этом случае применима лемма 5. При а > 1 условие Гельдера на Х0 — Е^ не
выполняется и лемма 5 неприменима. Далее, функция Лагранжа L(x, \) = —ха +Хх^, х^О,
А ^ 0, задачи (43) при а — /3 имеет седловую точку (¾ = 0, А* = 1). Кстати, седловая точка
здесь не единственная: любая точка (0, А*), А* ^ 1, также является седловои. Заметим также,
что функция f(x) = -i", х ^ 0, выпукла лишь при 0 < а ^ 1, а д(х) = х", х ^ 0, выпукла лишь
при /3^1. Если а ФР, то функция Лагранжа не имеет седловои точки. Таким образом, при
а > 1, /3 > 0, а ф Р задача (43) не охватывается леммами 1, 5.
7. Рассмотренный выше метод штрафных функций дает простую и
универсальную схему решения задач минимизации на множествах, не
совпадающих со всем пространством, и часто применяется на практике. Поскольку
имеется достаточно богатый выбор штрафных функций, то при
составлении функции Фк(х) можно постараться обеспечить нужную гладкость этой
функции, выпуклость, подумать об удобствах вычисления значений
функции и требуемых ее производных и т. п. Кроме того, имеется определенная
свобода в выборе множества Х0 для задачи (2): в задании множества (8)
всегда можно отнести ко множеству Х0 наиболее простые ограничения
(например, Х0 может быть шаром или параллелепипедом в Еп, совпадать с
полупространством или со всем пространством Еп и т. д.), а остальные
ограничения оформить в виде дДа;)<0 или д.(х) = 0 и учесть их с помощью
штрафной функции. Поэтому можно надеяться на то, что вспомогательные
задачи (2), (3) удастся сформировать более простыми, более удобными для
применения известных и сложных методов минимизации, чем исходная
задача (1).
Следует заметить, что хотя сама схема метода штрафных функций
довольно проста, но при практическом использовании этого метода для
решения конкретных задач минимизации могут встретиться серьезные
трудности. Дело в том, что для получения хорошего приближения решения
задачи (1) номер к в (2), (3) (или штрафной коэффициент Ак в (9)) приходится
брать достаточно большим. А с увеличением номера к свойства функции
(рк(х) = f(x)+Pk(x), хеХ0, оказывается, во многих случаях начинают
ухудшаться: эта функция может стать более овражной, некоторые координаты
градиента Фк(х) могут быть слишком большими, могут появиться
дополнительные локальные минимумы и т. п. Это все может привести к тому,
что при больших к методы минимизации, используемые для решения
задачи (2), будут плохо сходиться и определение точки хк, удовлетворяющей
условиям (6), с возрастанием к может потребовать все большего и
большего объема вычислительной работы.
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
337
Поэтому при практическом применении метода штрафных функций
вспомогательные задачи (2) обычно решают лишь для таких номеров к (врзмож-
но больших), для которых удается обеспечить достаточно быстрое убывание
функции f(x) и достаточную близость получаемых точек ко множеству X
при небольшом объеме вычислительной работы. Если полученное на этом
пути приближение к решению задачи (1) недостаточно хорошее, то
привлекают более тонкие и, вообще говоря, более трудоемкие методы
минимизации, стараясь при этом получше использовать ту информацию, которая
получена с помощью метода штрафных функций.
Заметим, что если выполнены условия теоремы 6, то штрафная
функция (9) множества (8) при р = и будет точной и нет необходимости
неограниченно увеличивать штрафной коэффициент Aft, ив этом случае
упомянутый недостаток метода штрафных функций, вообще говоря, не будет
проявляться. Правда, штрафная функция (9) при р = v не всегда будет
обладать достаточной гладкостью, но появившиеся в последнее время методы
минимизации, не требующие гладкости минимизируемой функции (см.,
например, [264; 265; 361; 386; 396; 426; 572; 586; 718; 769; 777]), позволяют
надеяться, что численное решение задачи (2) в рассматриваемом случае не
будет слишком трудным.
Отметим, что при описании и исследовании метода штрафных функций
выше мы предполагали, что функция f(x) и множество (8) известны точно.
Если же указанные исходные данные известны лишь приближенно, то метод
штрафных функций полезно регуляризовать — об этом подробнее см. гл. 9.
Различные прикладные и теоретические аспекты метода штрафных
функций исследованы в [18-20; 84; 85; 151; 218; 222; 250; 266; 286; 294; 295;
302; 319; 343; 374; 377; 379; 471; 562; 603; 613; 670; 720; 721; 738; 759;
774; 785; 786].
Упражнения
1. Применить метод штрафных функций к задачам
а) /(и) = х2 + у2 -* inf; uel = {u=(i,})e Е2: д(и) = -х - у + 1 < 0} или iiSI = {u =
= (х-, у) е Е2: д(и) = -х - у + 1 = 0};
б) /(и) = ху -* inf; и е X = {и = (х, у) е Е2: х2 + у2 ^ 25} или и е X = {и = (х, у) е Е2:
х2 + у2 = 25};
в) /(и) = х2 + у2 + z2 -> inf; и е X ~ {и = (х, у, z) е Е2: х + у + z + I ^0}.
2. Применить метод штрафных функций к задачам из примеров § 2.3.
3. Пусть f(x) = е~2х, а множество X = {х е Ех\ 0 ^ х ^ 1} задано либо ограничениями
д1(х) = -х^0, д2(х) = х- 1 ^0, либо д(х) = \х\ + \х- 11-1=0, либо д(х) = е~х(\х\ + \х-
— 1| — 1) = 0. Выяснить, в каких случаях задача f(x) —»inf, хе X, имеет согласованную или
сильно согласованную постановку на Е .
4. Пусть {Рк(х)} — штрафная функция некоторого множества X. Пусть функция >p(t)
определена при t ^ 0, у>(0) = 0, причем tp(t) -»0 при t -» 0, ip(t) -» оо при t -» оо. Показать,
что тогда W(Pk(x))} является штрафной функцией множества X.
5. Применить метод (3), (6), (9) к задаче f(x) = х2 - х -»inf и х е X = {х е Е1: д(х -
= х ^ 0}, взяв в качестве штрафной функции Р(х) = (тах{0; ж})2. Получить точную оценку
погрешности, сравнить ее с оценками из теоремы 5.
6. Пусть множество X задано либо ограничениями д{(х) = х — 1 < 0, д2(я) = —о; — 1 ^ 0,
либо д(х) = е~х\х2 -1)^0, либо д(х) = х2 — 1 ^ 0. Выяснить, какие из этих ограничений
являются корректными на Е1 или Х0={хе Е : — 1 ^ х ^ 1}.
338 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
7. Пусть X = {х е Еп: д(х) ^ 0}, где д(х) —непрерывная функция на Еп. Доказать, что
для того, чтобы множество X было ограниченным и ограничение д(х) ^ 0 было корректным на
Еп, необходимо и достаточно, чтобы множество Х6 = {х е Еп: д(х) ^ S} было ограниченным
хотя бы при одном S > 0.
8. Пусть Х0 — выпуклое замкнутое множество из Еп, функция д(х) выпукла и
полунепрерывна снизу на Х0, и пусть множество М(С) = {i£ Х0: д(х) ^ С} непусто и ограничено при
некотором С. Доказать, что тогда ограничение д(х) ^0 корректно на Х0 (см. теорему 4.2.17).
9. Рассмотреть задачу: f(x) = х —»inf; хеХ = {хеЕ1: д(х) = х2 + е\х\ ^0}, е >0. Доказать,
что здесь выполняется неравенство (36) сМ=1/е, 7=1. Установить существование седловой
точки функции Лагранжа. Выполняются ли здесь условия теорем 4.9.2, 4.9.4?
10. Применить метод штрафных функций к задаче (43), получив оценки скорости
сходимости метода, и сравнить их с оценками из теорем 5, 6.
11. Применить метод штрафных функций к задаче: /(и) = х2 + (1 — ху)2 —»inf; и е X =
= {и = (х, у) е Е . д(и) = х — <х = 0}, исследовать его сходимость при различных значениях
параметра а.
12. Доказать, что множество X = {х е Еп: gt(x) = (а{, х) — Ь1 = 0, г = 1,..., «}, где а{,...
..., а3 —линейно независимые векторы из Еп, Ьг еК, является корректным на Еп и
неравенство (36) выполняется с 7= 1. М= «||ЛТ(ЛЛТ)~'||, А —матрица размера s х п, строками
которой являются векторы а^.,.,ая. Указание", воспользоваться результатами
примера 4.4.3.
13. Пусть задача (1), (8) удовлетворяет условиям теоремы 4.9.2, причем i^Xt. Доказать,
что тогда Х^ = {хе Х0: Ф(х) = Ф,,}, где
Ф(х) = In .._. 1 .. . + f; maxfo; ^Ш), Ф, = Inf Ф(в).
14. Пусть в задаче (1), (8) Д > —оо, Х^ ф 0, пусть функция Ф(х, A) = f(x) + АФ(х), где
штрафная функция Р(х) определена формулой (9) при р > О, пусть Ф„(Л) = inf Ф(х, А),
хеХ0
А > 0. Для того чтобы lim Ф*(А) = Д, необходимо и достаточно, чтобы задача (1), (8)
А —> +оо
имела согласованную постановку на Х0 (определение 2) и существовало число А0 > О, что
ФДЛ0) > -оо- Доказать [18].
15. Пусть в задаче (1), (8) Х0 — выпуклое замкнутое множество, функции f(x), дЛх),...
■ ■ ■> 9т(х), \дт+\(х)\,..., \д,(х)\ выпуклы на Х0, Д >-оо, пусть функции Ф(х, А), Ф„(Л) взяты
из упражнения 14 при р^ 1. Для того чтобы lim Ф<1(Л) = Д, необходимо и достаточно, чтобы
А —* +оо
задача (1), (8) имела согласованную постановку на множестве Х0. Доказать [18].
16. Доказать, что согласованная постановка задачи (1), (8) на множестве Х0 равносильна
тому, что функция Д(с) = inf f{x), где Х(с) = {i6 X,: gf(x) < с{, г = 1,..., s}, полуне-
х е Х(с)
прерывна снизу при с{ —» +0, г = 1,..., s.
17. Привести пример задачи минимизации, для которой существует точная штрафная
функция (определение 4), дифференцируемая любое конечное число раз. Указание:
рассмотреть задачу: f(x) = 0—>inf, хеХ = {хеХ0 = Е . д(х) = —х^.О}, взять Р(х) = (тах{—х;0})р
Vp>0.
18. Показать, что если в лемме 5 условие (42) выполняется не на всем множестве Х0, а лишь
на множестве Х5 из (15), то метод штрафных функций может не сходиться. Указание:
рассмотреть задачу из примера 4; взять Р(х) = тах{|а:|; 0} = |х|.
19. Пусть W — открытое выпуклое множество, функции f(x), gt(x), г = 1,..., т,
выпуклы на W, д{(х) = (ait х) — bl, i = m + l,...,s; Х0 — выпукло, замкнуто и10с W, пусть в
задаче (1), (8) Д > —оо, Xt ф S3. Доказать, что для того чтобы функция Лагранжа задачи (1),
(8) имела седловую точку, необходимо и достаточно, чтобы неравенство (21) выполнялось с
показателем v—\. Указание: необходимость см. в лемме 1; для доказательства доста-
S
точности применить теоремы 6, 4.6.4 к задаче Ф(х, A) = f(x) + А £) д*(х) —»inf, х е Х0. [83,
2-е издание]. «= 1
20. Пусть каноническая задача линейного программирования
f(x)={c, х) -> inf, хеХ={хвЕп: х^О, Ax=b}, ЬеЕт, Ъ^О, (44)
§ 15. МЕТОД ШТРАФНЫХ ФУНКЦИЙ
339
имеет решение. Докажите, что задача (44) равносильна следующей канонической задаче
g(z) =<с,х> +M(u' + ... + ит) -> inf, ,45>
z 6 Z = {z = (и, х) е Ет х Еп: и > 0, х Z О, и + Ах = Ъ}
при всех достаточно больших М>0 (М-метод [179; 259; 374; 471; 775]). Убедитесь, что z^ —
= (Ь, 0) — угловая точка множества Z. Указание: рассмотрите задачу: /, (z) = (с, х) —> inf,
z g 2[ = {z = (и, i) ^ 0: и + Ах = Ь, и — 0}, равносильную (44), ограничение и = 0 учтите с
помощью штрафной функции P(z) = \u\x, и > 0 и, пользуясь леммой 1 и теоремой 6 при
р= i/= 1, ек=0, Ak = М>\Х*\00, с = А* — решение двойственной к (44) задачи, установите,
что P(z) —точная штрафная функция.
21. Пусть Xt — множество решений задачи (1), (8), Xt(A) — множество решений задачи
Ф(х, А) = /Ы + АР{х) ->inf, х е X), где функция Р(х) взята из (9), Ф*(Л) = inf Ф(х, А),
lim Ф (А) = /„. Можно ли тогда утверждать, что inf \х — у\-*0 при Л —» +оо.
л-too з:еЛГ,,!/еЛГ,(А)
Указание: рассмотреть задачу [18]: /(о)) = тах{ш(о: , х2); ш(1— а; , а; )} — х —> Inf, жеХ =
= (0) = (0)1. ж2, ^,^)6^^3,(0)) = 0)40, S2(o)) = ш(о)3, о)1)-^2 <0, <7з(о)) = ш(о)4, о)3)-0)2 ^0},
где ш(и, г;) = у u2 + v2 - « — функция Белоусова — Андронова [84]; штрафную функцию взять
равной Р{х)— £) (тах{рДо));0})2; показать, что задача выпукла, /„ = О, Х^ = {х е Е : х =
= x2 = x3 = 0,x^0}^^A)=^-Jl + t2 + t-At2tXt(A) = {xeEi:xl = ^,x2 = t,x3^-^ +
+ i, о;4 >-4 + %^-,0<t< ^}; убедиться, что lim ¢,(^) = 0, lim inf Jo;-
— y\ = +oo. Другие примеры, другие типы сходимости Х^(А) к ^ исследованы в [18-20].
22. Применить метод штрафных функций к задаче: J(u) = и —»inf, и е (7 = {и е i70: g(u) =
2
= —-—j ^ 0}, где К, = {и е .Б : и ^ -а}, 0 < <х ^ +оо. Показать, что при 0 < а < +оо задача
1 + и
имеет сильно согласованную постановку (в (21) взять s = m = 1, с, = у 1 + <х , -у = w). Что
будет при <х = +оо? Проверить, что условия лемм 5.15.1, 5.15.4 не выполняются при всех а,
0< <х< +оо.
§ 16. Доказательство необходимых условий экстремума
первого и второго порядков с помощью штрафных функций
1. Начнем с необходимых условий первого порядка — дадим другое и, по-
видимому, более простое доказательство правила множителей Лагранжа,
отличное от изложенного в § 4.8 и не опирающееся на теорему отделимости
и теорему о неявных функциях, для задачи
/(я:)-inf, хеХ, (1)
Х = {хеХ0: д{(х)^0, « = 1,...,т; gt(x) = 0, «=т+1, ..., я}. (2)
Как и в § 4.8, введем функцию Лагранжа задачи (1), (2)
8
C(x,X) = X0f(x)+^2 \{д{(х), хеХ0,
» = i
A=(A0,...,AS), А0^0,..,Ат^0. (3)
Теорема 1. Пусть Х0 — выпуклое замкнутое множество из Еп,
функции f(x), д{(х), г = 1,..., з, определены, на Х0. Пусть v —точка
локального минимума в задаче (1), (2), пусть функции f(x), g{(x), г' = 1,...
340 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
..., s, непрерывно дифференцируемы в некоторой окрестности 0(v, е)п
П Х0 точки v. Тогда существуют числа А0, A,,..., A„, такие, что
\={\0,...,\.)ф0, A0^0,A1^0,..,Am^0, (4)
(C.(v,\),x-v)>0 УхеХ0, (5)
*ift(«) = 0, « = 1,..., т. (6)
Как видим, в этой теореме на задачу (1), (2) наложены более жесткие
ограничения, чем в теореме 4.8.1, что связано со способом доказательства,
использующим штрафные функции. Множество всех А, удовлетворяющих
условиям (4)-(6), как и выше, будем обозначать через A(v) — это конус
Лагранжа. В § 4.8 было замечено, что конус A(v) выпуклый, а конус A(v)U
U {0} замкнутый.
Доказательство теоремы 1. Введем функцию g0(x) = f(x)+\x—v\2,
хеХ0, множество W0 = X0C\S(v, 7), где S(v, 'у) = {хеЕп: |ж —v|<7}. 7>0.
Так как v —точка локального минимума функции f(x) на X, то можем
считать число 7 столь малым, что j < 1 и f(x) ^ f(v) Ух е X П S(v, 7).
Рассмотрим вспомогательную задачу минимизации
д0(х) —► inf, х €W = {х eW0: д{(х) ^0, г = 1,...,т;
д{(х) = 0, г =m+ l,...,s} (7)
Так как д0(х) > f(x) ^ f(v) при всех х eW, х ф v, причем g0(v) = f(v),
то ясно, что v — единственное решение задачи (7) и g0t = inf д0(х) —
= f(v). Применим к задаче (7) метод штрафных функций. Введем функ-
т з
цию Фк(х) = д0(х) + к X;(max{fi(.(a;),'0})2 + к £ д?(х), х € Х0. Так как
г =1 г = т+1
W0 компактное множество, функции д0(х),Фк(х) непрерывны на W0, то
g0t, = inf д0(х) > -оо, Фк^ = inf Фк(х) > -оо и существует точка хк € WQ,
xew0 xew0
для которой Фк(хк) — Фк:1,. Далее, множество W(S) = {x € W0: д^(х)^. S, г =
= 1,. .., s} ограничено при всех S > 0, так как W0 ограничено. По
теореме 15.2 тогда
lim 1¾ -v\=0, lim д0(хк) = g0t = /(«) = lim f(xk). (8)
к ~too к-юо k—*oo
Применяя теорему 4.2.3 к задаче: Фк(х) —»inf, х е W0, имеем
(Фк'(хк),х-хк)>0 VxeW0. (9)
Покажем, что неравенство (9) на самом деле верно для всех х е Х0 при
всех достаточно больших номерах к. Возьмем произвольную точку х еХ0 и
положим х^ = хк + а(х — хк), 0 < а < 1. Так как Х0 выпуклое множество, то
хк*£хо- Далее, fa:te-v|< |a:te-^ + |^-v| = a|a:-a:J + |:Efc-i;|. Сучетом (8)
имеем: \xk — v\<^ У к ^ /¾. а\х — хк\ < ^ Va, 0< а < а0 = о;0(я;)< 1. Поэтому
\хка ~ v\ < 7 или ^te € W0 Vfc ^ /¾. Va, 0 < a < a0, и в (9) можем положить
х = Ждд. Получим (¢/(^), «(ж — :¾)) > 0 при всех а, 0 < а < а0 = сх0(х),
к ^ /¾. Следовательно,
(¢,/(¾). я:-¾)^ 0 Vz€X0, Vfc^Ab. (10)
§ 16. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМЫХ УСЛОВИЙ ЭКСТРЕМУМА 341
Подставим в (10) явное выражение для производной Фк'(хк) = /'(хк)+2(хк —
т з
-v)+J22k тах{&Ю; °Ь/Ю + Е 2к9г(ч)9г'(хк). Будем иметь
1 = 1 г = 171+ 1
(f'(xk) + 2(хк -v)+± Ы'(хк), х-хк)>0 Ухе Х0, Ук > ко, (11)
• = i
= ( 2ктах{д,(хк);0}^0, i = l,...,m; п_.
^ 12^(¾). i = m+ 1,...,8. { г>
/ • \1/2
Разделим неравенство (11) на ( 1 + J2 Учк) ^ 1- Получим
/ s 4-1/2
V- = (1 + Е /4 J > 0. Аа = /*ЙЛМ, г = 1,..., а, причем в силу (12)
<Ao*/'(^)+2A0*(i*-«)+Е WOO, =:-¾) £0 VzeX0, fc^Ab, (13)
• = i
где ' ---
A,.fc >0, г = 1, ..., m, Vfc > ^¾. Последовательность {\к = (\0к, ■ ■ ., А,4)}
ограничена, так как \Хк\ — 1. Пользуясь теоремой Больцано — Вейерштрасса и
выбирая_при необходимости подпоследовательность, можем считать, что
{\к} —> А =(А0, .. ., As), где Аг. ^ О, i =0, .. ., m, |А| = 1. Как видим,
условия (4) для полученного А выполнены. Так как f'(x), д/(х) непрерывны и
{хк} -»ив силу (8), то из (13) при к —»оо получим неравенство (5).
Наконец, если ^(^) = 0, то А;д(и) = 0. Если же g{(v) <0 при некотором г,
1 < г < т, то д/(хк) < 0 Vfc ^ &, ^ /¾. Тогда из (12) видно, что /½ = О и
поэтому AiJc =0 Vfc ^ &,. При А: —»оо отсюда имеем А; =0 при &(«)<(), так
что снова \{д{(у) = 0. Равенства (6) получены. Теорема 1 доказана. □
Читатель, конечно, обратил внимание, что в условиях близких теорем 1 и 4.8.1 (см. также
теоремы 2.3.1, 2.3.2) к функциям /(i),s;(x), i = 1,..., s, предъявляются несколько разные
требования гладкости. Ясно, что это связано с методами доказательства упомянутых теорем.
В связи с этим возникает интересный вопрос, каковы минимальные требования к гладкости
функций f(x), дЛх), 1 = 1,..., s, для того, чтобы правило множителей Лагранжа оставалось
справедливым? Более тонкие исследования показывают [40], что для этого достаточно, чтобы
функции /(ж), Я{{х), 1 = 1,..., s, были непрерывны в окрестности точки v и дифференцируемы
в точке v.
2. Перейдем к доказательству необходимых условий экстремума второго порядка (см.
теоремы 2.4.2, 2.4.3) для задачи
/(x)-»inf, хвХ = {хеЕп: $(вК0, i = 1,...,т, д{(х) = 0, i = m + l,...,s}, (13.А)
получающейся из задачи (1), (2) при Х0— Еп. Пусть v —точка локального минимума
задачи (13.А). Согласно теореме 1 конус Лагранжа A(v), состоящий из точек X— (А0,..., As),
которые удовлетворяют условиям
А>0, A0>0,...,Am>0, £>,А) = 0, Aift(w) = 0, i = l,...,m,
непуст. Напомним.что конусом Арутюнова точки v множества (2) называется подмножество
Aa(v) таких точек A eA(ii), для каждой из которых существует сопровождающее
подпространство П = П(А) С Еп со свойствами:
dimn(A)>max{n-|7(u)|;0}, (14)
n(X)ckerG'(v) = {heEn: (g/(v), h) = 0, iel(v)}, (15)
(Cxx(v, X)h, h) > О УЛеП(А), (16)
где I(v)—{i: l^i^m, g4(ij)=0}u{i: m+1 ^¾ ^ s}— множество индексов (номеров) активных
ограничений точки и, |Дг|)| —количество элементов множества I(v), G(x)={g{(x), iel(v)}.
342 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
В § 2.4 было показано, что так введенное множество Aa(v) в самом деле является
конусом. Как мы видели на примерах, конус Арутюнова, в отличие от конуса Лагранжа A(v),
необязательно является выпуклым и может иметь весьма сложную структуру (пример 2.4.6).
Покажем, что конус Aa(v) и {0} замкнут. Для этого сначала докажем одну важную лемму,
обобщающую известную в математическом анализе теорему Больцано — Вейерштрасса.
Определение 1. Пусть задана последовательность множеств {Пу.} С Еп. Верхним
пределом, последовательности {Пу.} называется множество, обозначаемое Cs Пк и состо-
к —юо
ящее из таких точек х$, для каждой из которых существует своя последовательность {хк},
хкеПк, к = 1, 2,..,, для которой .-¾ является предельной точкой [428, стр. 344].
Лемма 1 (Арутюнов [44]). Пусть г — целое число, 0 ¢. г ¢. п, а {Пу.} —
последовательность таких подпространств из Еп, что dim ГЬ. > г, к — 1, 2,... Тогда существует
подпространство П из Еп, такое, что dimn ^г и ПС Cs Пк. /
к —юо
Пример 1. Пусть П[ = {и = (а:, у, z)eE3: х = 0, у = 0}, П, = {и = (а:, у, z)eE3: z = 0}.
Очевидно, П., По—подпространства из Еп, (ШпП| = 1, dimn2 = 2. Рассмотрим
последовательность {Пу.} такую, что П2; _ [ = П,, П2г = П2, г = 1, 2, Здесь Cs Пу. = П, U П2.
к —* оо
Очевидно, dim Пу. ^ г = 1, так что условие леммы 1 выполнено. В качестве подпространства
П из утверждения леммы можем взять П = П[ или П = П2. Отметим, что здесь Cs Пк не
* -too
является подпространством и включение П с Cs Пк строгое.
к —юо
Пример 2. Пусть Пу. = {х S Еп: (ск, х) — 0}, где ск — заданный вектор из Еп, \ск\ — 1,
к = 1, 2,... Здесь dimП. = го — 1 = г. В качестве П из утверждения леммы можем взять
подпространство П = {х£Еп:{с, х)—0}, где с —произвольная предельная точка последовательности
{ск}. Верхний предел последовательности {Пу.} является объединением всех таких
подпространств П.
Доказательство леммы 1. Пусть rk = dimT[k. Тогда dimП£ = го — rk, где
Пк — ортогональное дополнение к П в Еп, В Пк возьмем ортонормированный базис ек,,..,
■ ■ ■> екп- г4> т' е' 1%'1 ~1< 0 = 1. ■ • ■. п ~ rk, (ekj, е^) = 0 VjV Р< 1 ^ Ъ V ^ п - гк. Тогда
Пу. = {х е Еп: (ек-, х) = 0, j = 1,..., го — гк}. Добавим к базисным векторам {е.■} нулевые
вектора екп_ г , = 0,..., eto_ г = 0. Тогда для Пк получаем представление Пк = {х е Еп:
(е. ■, х) = 0, j = 1,..., n — r}, в котором количество «порождающих» подпространство Пу.
векторов ек [,..., екп _ г уже не зависит от к, Эти вектора, очевидно, образуют ортогональную
систему- (еь'> екг>)~® ^ЗфР< l^iiP^"-''' Вместо свойства |е,.| = 1 теперь можем гарантировать
лишь ограниченность: |е..| ^ 1, j = 1,..., го — г. Пользуясь классической теоремой Больцано —
Вейерштрасса из анализа применительно к последовательностям векторов {eki},..., {екп_ г},
можем утверждать, что существует подпоследовательность {ек ■} —»е ■, где kv —»оо при v —»оо,
j = 1, . . ., го — г, причем (е-, ер) = 0 VjVp, 1 ^У, р^го — г, |е.| ^ 1, Vj = 1,. . ., п —г, и часть
векторов е. может оказаться равной нулю. Пусть для определенности |е.| = 1 при j — 1,..., р, и
е. =0 при j = p+l,..., n — r (возможность p — Q здесь не исключается). Положим П — {хеЕп:
(е., ж) = 0, у=1,,..,п-г} = {хбВ": (е., х) = 0, j = 1,.. ,,р}. Поскольку е,,..., е линейно
независимы, то ясно, что dim П± = р, dim П= го—р^ го — (го—г) = г. Покажем, что ПС Cs Пк.
к —юо
Возьмем произвольную точку xq е П. Убедимся, что Xq — предельная точка последовательности
{а;^ —Рп (¾)} проекций точки xq на Пу., к = 1, 2,... Воспользуемся неравенством Хоффма-
на (15.41*): />(^, Пл ) = 1¾-Рп (^)1 = 1^-¾ К М max |(efc ,, ^)1 = Mmax|(efc . -
v ку v \ ^ j ^ 71 — Г vJ vJ
— е., xq)\ —» 0 при ь< —» оо. Таким образом, XlC.Cs Пу.. Лемма 1 доказана. П
Теперь можем доказать замкнутость конуса Ka(v) U {0}. Пусть последовательность {А у.} е
eAa(v), {Ay.}—» А ф0. Покажем, что X eAa(v). По определению конуса Aa(v) для каждого
Ау. найдется сопровождающее подпространство ЩАу.) со свойствами dim П(Ау.) > тах{го—
-|7(и)|;0} = г, ЩА'^СкегС^), {C^v, Xk)h, h) > 0 \/heU(\k), it = 1,2,... По лемме
1 существует подпространство П такое, что dim П > г = тах{го — |7(v)|;0}, П с Cs П(Ау.).
_ к —юо __
Так как конус ker G'(v) замкнут, ЩАу.) Cker G'(v), то нетрудно убедиться, что Cs П(Ау.) С
_ к —юо
С ker G'(v). Следовательно, П с ker G'(v). Покажем, что (Cxx(v, X)h, h) ^ 0 V/i е П. Возьмем
произвольную точку hQ S П С Cs ЩХк). По определению Cs П(Ау.) найдутся hk е ЩХк)
к —юо к ~* оо
§ 16. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМЫХ УСЛОВИЙ ЭКСТРЕМУМА 343
такие, что h0 будет предельной точкой последовательности {hk}, т. е. 3{hk } —»/¾. А по
определению ЩХк ) имеем (Cxx(v, Хк )hk , hk ) ^ 0, v = 1, 2,... Отсюда при v -> оо получим
(Cxx(v, A)/iq, /¾) ^ 0 V/i0 S П. Это значит, что подпространство П обладает свойствами (14)-
(16) и, следовательно, является сопровождающим подпространством точки А~. Включение А~е
S Aa(v) доказано в случае А ф 0. Отсюда, учитывая, что последовательность {Хк} £ Aa(v)
может также сходиться к точке А =0, заключаем, что конус Aa(v) и {0} замкнут.
Теперь можем приступить к доказательству основной теоремы настоящего параграфа.
Теорема 2 (Арутюнов [44]). Пусть v —точка локального минимума задачи (13.Л),
пусть функции f(x),gx(x),...,gs(x) дважды непрерывно дифференцируемы в некоторой
окрестности точки v. Тогда
Aa(v)^0, (17)
max {C^iv, X)h, /i)>0 V/i S K(v) П {h e En: (f'(v), h) ^ 0}, (18)
где A e A», 1*1-1
K(v)={heEn: (gi'(v),hH0 Viel(v)n{i: l^i^m}, (g/(v),h)=0, i=m+l,.. .,*}. (19)
Доказательство. Рассмотрим вспомогательную задачу минимизации
д0(х) = /(х) + \х-у\*-*Ш,
х е W = {х в Еп: \х - v\ ^ % д{(х)^0, i = l,..., т, д{(х) = 0, г = т+ 1, ..., s},
аналогичную задаче (7), предполагая число "/ >0 столь малым, что 7 < 1. f(x) > /(■") Va: е
61П S(ii, 7) = W, S(v, 7) = {i6 .Б": \x — г>| < 7}. Тогда, как и в (7), нетрудно доказать,
что v —точка строгого локального минимума задачи (19.А). К задаче (19.А) применим метод
штрафных функций. Имея в виду, что при выводе необходимых условий второго порядка нам
придется иметь дело со вторыми производными рассматриваемых функций, воспользуемся
более гладкими, чем в (7), штрафными функциями и рассмотрим задачу
т A S О
Ф*(*) = ЯЬ(*)+* E(n"*{ff<(*);0})4 + * Е ff?(*)-» Inf, xeW0=S(v,-y). (20)
i = 1 i = m+1
Рассуждая также, как при доказательстве теоремы 1, нетрудно установить, что задача (20)
имеет решение, т. е. существуют точки xk Gffi, ^к(хк)~^к* = т^ ®к(х)< и справедли-
вы равенства (8), означающие сходимость метода штрафных функций (20). В частности, из
{хк} —» v следует, что \хк — v\ < 7, т. е. хк е int W0 Vfc > йц. Во внутренних точках локального
минимума необходимо Фк'(хк) = 0, $fc"(a;t) > 0 Vfc > йц (теорема 2.2.1). Пользуясь
выражениями производных функции Ф(х) из (20), имеем
т s
Ф*'(**) = ЯЬ'(**)+ Е 4fc(max{Si(a:fc);0})V^)+ Е 2fc9i(xt)9/(xt) = 0,
г — 1 ъ — т + 1
®t'4^J=V'(^)+E[4Mmax{Si(o:,);0})3S/'^)+12fc(max{S.(a:,);0})2(S/(a:)t))TS/(a:,)]+
+ Е [24(*t)ff/K) + 2*(ff/(**))Tff/(**)]>0, V*>V
Обозначим
= Г 4fc(max{ff4(Bfc);0})3>0, i = l,...,m, (т
^к \2k9i(xk), i = m+l в.
= 1
АмЯЬ'Ы+Ё Attffi'K) = 0. vfc>*b- (22)
• = i
WK) + E W(**) + E ^kX0k(max{g{(xk)-0})2(9i'(4))T9{'(xk) +
+ E 2fcA0j£(s/(ag)V(^)>0, Vfc>Ao, (23)
г = m + 1
/ S 2\~i/2
ГДе лоь = (! + E ^Л J . ЛгУс = ^ЬЛ(№- «' = 1) ■ ■ ■. s.
4 i = 1 '
Разделив предыдущие соотношения на 11 + £) /¾. J > 1, получим
344 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
По определению множества I(v) имеем gt(v) <0 Vi <£I(v). Поэтому с учетом непрерывности
gt(x) и первого равенства (8), беря при необходимости к0 еще большим, можем считать, что
9{lxh) <0 Vfc ^ йц. Отсюда с учетом (21) имеем
max{Si(x-t);0} = 0, ^=0 Vi i I(v) V* > fy,
так что Xik = ^ikXoh ^°> i — !.■■■> т< ^ik~® Vi £HV)< Vfc > fcg. Так как \Хк\ = 1, где Хк =
= (A0Jc,..., А,,,.), то, выбирая при необходимости подпоследовательность, можем считать, что
{Хк} -> А. Кроме того, заметим, что в силу (8) 5(/(¾) = /'(%) + Мхк ~ v\2(xk — v)-* f'(v)
з
при к —»оо. Переходя в (22) к пределу при к —»оо, получим А0/'(з^) + £) А^д/(г|) = 0. Таким
i = l _ /
образом, Cx(v,X) = 0, А4дг(г;) = 0, г = 1,..., т, \Х\ = 1, А0 >0,..., А >0, т. е. А бЛ(и)?/
Теперь совершим предельный переход при к —» оо в неравенстве (23). Введем
последовательность подпространств Пк ={h е Еп: (д/(хк), h) = 0, г S Цг|)}, А; = 1,2,... Размерность
ортогонального подпространства П^ равна числу линейно независимых векторов системы
{д/(хк), i S I(v)}, т. е. не превышает числа \I(v)\. Тогда сИтПд. ^ тах{п — |7(ti)|;0}= г.
По лемме 1 найдется подпространство П такое, что dim П ^ max{n — |-Г(")|; 0} и П с Cs Пк.
к ~юо
По определению Cs Пк каждая точка he Cs Пк является пределом какой-либо подпосле-
к —* оо к ~* оо
довательности {hk }, hk еПд. , т. е. (3/(¾ ), /¾ ) = 0, iel(v). Однако (¾ }-»г1, поэтому при
v —»оо из последних равенств получим (g'(v), h) = 0, i6 J(ii), т. e. /i 6 ker G'(v). Это значит,
что £s nt ckerG'(ii) и подавно П с ker G (v). Поскольку max{g;(.xfc);0} = 0 при Vi £I(v),
к~юо . ,
А; > &0, а для г S /(г>) имеет место равенство ((s/(a:fc))Ts/(a;fc)/it, /ifc) = |ffi'(a:fc)/ifc|2 = 0 для
V/it S nt, то из (23) при k = kv имеем
((½ 90"(хк ) + Е Att *"(** ))¾ , ftt > = <£e(*t , А ь )¾ , ftt > > 0,
г=1 " " "
где hk еПк , v = 1, 2,..., взяты такими, что {/¾ } —> ft S П. Так как {:¾} —» и, {Ад. } —> А,
S0"(a:t) = /"(a;t) + 4|a;fc--'u|27n + 8(a;fc-'u)(a;t-'u)T-»/"(ij), где 1П — единичная матрица пХп,
то из последнего неравенства при v —»оо получим (£^.(^, А)Л, h) > 0 V/i е П. Таким образом,
доказано, что подпространство П обладает_свойствами (14)-(16) и, _следовательно, является
сопровождающим подпространством точки A~eA(ii). Это значит, что А &ка(у), т. е. Ка{у)ф!3.
Утверждение (17) доказано.
Остается доказать неравенство (18). Заметим, что поскольку конус Aa(ti)u{0} замкнут, то
множество {А~еЛц(г|), |А| = 1} замкнуто и ограничено, т. е. компактно. Отсюда и из
непрерывности С<(ь, X) по А следует, что в правой части (18) максимум достигается хотя бы в
одной точке А = А(Л) при каждом h S K(v), (f'(v), h) ^0. Нам надо доказать, что этот
максимум неотрицателен при всех h е К(у), (f'(v), h) ^ 0. Зафиксируем произвольную точку h
из K(v), (f'(v), h) $:0. Можем считать, что h^0, так как при h — 0 неравенство (18)
выполняется тривиально при всех А. Для сокращения записей примем, что v = 0, /(0) = 0, так что
f(x) ^ /(0) = 0 Va; е X, \х\ ^ 7'. к этому случаю легко прийти, переходя к переменным х — и,
f(x) — f(v). Неравенство (18) сначала докажем при дополнительном предположении, что в
задаче (13.А) все ограничения gt(x)^.0, г = 1,..., т, в точке x=v = 0 являются активными,
т. е. 7(0) = {г; г = 1, 2,..., s}. Рассмотрим следующую вспомогательную задачу минимизации
в пространстве переменных z = (i,x)6J5" х Е1:
50£(г) = 50(а:)~Х5о(е'1) + \х~^ + ^(x)-»inf, z£Z(e), (24)
2(e) = {zeZ0: giE(z) = gt(x) - X9i(eh) ^0, г = 1,..., m,
9iAz) = 9i(x)-X9i(eh) = 0, i = m + 1,..., s}, (25)
где g0(x) = f(x) + \x\4, Z0 = {z = (x, x) G En+ ': \x\ ^ 7, x > 0}; параметр e столь мал, что
0<e[/i|<7;
f 0
0 при0^х^1,
(X-1)4 прих>1.
§ 16. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМЫХ УСЛОВИЙ ЭКСТРЕМУМА 345
Нетрудно видеть, что точка z = (х = eh, х = 1) G Z(e), так что Z(e) ф 0 и ЗдД2) = О- Введем
множество Лебега ME(z) = {г£ Z(e): 3bE(z) ^ floe(^)}- Так как Функции 5fe(z), г = 0,..., s,
непрерывны при всех z е Z0, то ME(z) замкнутое множество. Убедимся, что оно ограничено,
причем равномерно по е, 0< е <7|/i|-1. Заметим, что ME(z) = Me1(z)UMe2(z), где М ,(z) =
= ME(z)n{z: О^х < 1}, ^2(2) = ME(z)n{z: х > 1}. Множество Me1(z) с {z = (х,х): N ^
^7> О^х ^ 1} и. очевидно, ограничено равномерно по е, 0< е <'у|/г]—'. Рассмотрим множество
Me2(z). Пусть z£Me2(z). Тогда имеем 0=50e(z)^ inf д0(х)~х sup д0(х) -(|а;| + |e/i|)4 +
М<7 М<7
+ (X - I)4 или (х - I)4 - хА «: (27)4 - В V* = (в, х) G Ме2(г), где Л = sup ^(х) > О, В =
М<7
= inf <jj)(a:) <0. Проведя элементарное исследование графика функции р(х) = (х_ 1) — хА>
М<7
X € В', нетрудно показать, что уравнение ip(x) = (27)4 — В имеет два решения х\ > Хг> причем
Х2 > 1. Отсюда заключаем, что Me2(z) с {г = (ж, х): |я| ^ 7. 1 ^ X ^ Хг). т- е- множество
М o(z) также ограничено, причем равномерно по е, 0 < е < 7|Л|-1. Таким образом, множество
ME(z) компактно, и непрерывная функция g0E(z) достигает на этом множестве своей нижней
грани хотя бы в одной точке zE = (а:Е,хЕ) £ ME(z) (теорема 2.1.1). Однако, inf %E(z) =
z £ Z(e)
= "mf floe(z) = 3oe(ze) < ЗоД^) < О- Так как множество ME(z) ограничено равномерно по
гбМ, (z)
е, 0< е < 71^1-1. т0 семейство {zE} решений задач (24), (25) при 0< е <7|М_1 равномерно
ограничено: |о;е| < 7. О < Хр < Х2-
Покажем, что zE е int Z0 при всех достаточно малых е > 0. Сначала убедимся, что хе > 0.
Заметим, что если х е 1У (см. множество задачи (19.А)), то z = (х, х = 0) е £(е). Для всех
таких точек г = (ж, х= 0)G Z(e) имеем 30E(z) = s0(a:) + |a:-e/i|4 = /(a:)+|a:| +|a;-e/i|4 >0 Ve,
0<е <7|/'Г'- Однако s0e(ze) ^s0e(z)^0. Следовательно, zE^(x, х=0), т. e.^xe >0. Далее,
покажем, что lim хЕ = 0 = г». Пусть a—'произвольная предельная точка семейства {хЕ} при
е-»0, пусть а= lim же . Так как z =(х ,хЕ)£ Z(e), 0<хЕ ^Хг> т° из (25) имеем: \хЕ\ < 7>
к —* оо *
3.(¾) < XE9i(sh) < X2|ffj(e/i)|, i = 1,..., m, |ft(xe)| < ХеЫеЛ)1 < X21¾(еД)|, * = m+ 1, . .., s.
Отсюда, учитывая, что lim gAeh) = g{(0) = 0 Vi e 7(0) = {i: i = 1,..., s}, при e = ej. —> 0
получим: |a|<7, зг(а)^0, i' = 1, .. ., m, gi(a) = 0, i = m+ 1,..., s, т. e. a£ 1У. Из (24) следует:
9o(xs) =5оЛге) + Хе50(еЛ)-|а;е-е/1|4-1/-(хе)<Хе5о(е'1)<Х2ко(е/г)1- Полагая здесь е = е. и
устремляя fc —> оо с учетом равенства lim g0(eh) = g0(0) = 0, имеем д0(а) < 0. Однако г> = 0 —
точка минимума д0(х) на 1У, аеТУ, поэтому 0= ^(0) < з0(я). Таким образом, з0(а)=0,
т. е. х= а—решение задачи (19.А). Но задача (19.А) имеет единственное решение, поэтому
<х = 0. Это означает, что семейство {хЕ} при е —> 0 имеет единственную предельную точку
а=0. Следовательно, lim хЕ = 0 и \х | < 7 ПРИ всех е, 0< е < е0 <т|/г|-1. Таким образом,
е —* оо
zE eint Z0 при Ve, 0 < е < е0.
Применим к задаче (24). (25) уже доказанное утверждение (17), согласно которому конус
Арутюнова AaE(zE) точки zE непуст при всех е, 0< е <7|/i|~'. Покажем, что все отличные
от нуля предельные точки семейства конусов {AaE(zE), е >0} при е —>0 принадлежат конусу
Лц(0). Пусть А фО — одна из таких предельных точек. Этозначит, что существуют {efc}_-+
—> 0 е, > 0, и точки А с е Л„ (z, ) такие, что lim АЕ = А. Нам нужно показать, что А е
* eJ aeJ ^7 к -too *
еЛц(0). Сначала установим, что А еЛ(0). Пусть AE(zE) — конус Лагранжа задачи (24), (25),
соответствующий точке ze = (х , хе)• Так как А _ С Лце(г ) С Ле (ze) и ze е int Z0 ,Ve, 0 < е < е0,
то по определению множителей Лагранжа задачи (24), (25)
Ag = (A0glAlgl...,A„), |AJ = 1, AOE^0,AlE^0,...,AmE^0, (26)
9CE(zE,АЕ) /dCFjzEl\E) dCE(zE,\E)\_
Wz = 1 Ш ' &x )~ ' ( '
Afc(ff<K)-X«ff<(eft)) = 0, 1 = 1,....m, (28)
где CE(z,\) = \0g0E(z)+ t, Aj(fle(a;) -xg{(eh)), z = (x,x)£ZQ, X{ >0, i = 0,..., m, e = ek,
г — 1
к > A^. Подробнее распишем равенство (27):
346 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
9CAt Ле) = Л0,(/'К) + 4|».|Ч + 41¾ - eh\2(xE - eh)) + £ Ate <;/(*.) = О, (29)
i = \
-^^ = ^0.(-^) + ^.))+ Е Aft(-ff,(eft)) = 0.
^
(30)
Учитывая, что хЕ —> v = 0, gAeh) —> л(0) при е—>0, 0<хе<х2, 0<е<е0, lim А = А,
из (26), (28), (29) при е - ек -»0 имеем
A=(A0,...,As)^0, Ае^0, i=0,...,m, £,(0, А) = 0, Aifle(0) = 0, i = l,...,m.
Это означает, что предельная точка А е Л(0).
Далее, покажем, что А е Лц(0). По определению конуса AaE(zE) для каждого набора
A. GAa.(z.) существует сопровождающее подпространство Пе с.Еп + , которое обладает
свойствами:
dlmng>n+l-|J,(«,)|, (31)
ПЕ с kevGE'(zE) = {n = (/1,77)6 Еп х В1: <%^,^) = 0, i е 7.(¾)}. (32)
<£„,(«„ А,)^)> О V^enE, (33)
где 7.(z.)— множество активных индексов точки z , G—■ вектор-функция с координатами
д, , г £ I (z ). Так как в рассматриваемом случае 1(0) = {г: г = 1, 2,..., s}, то /F(zr) С 7(0) и
|i.(*.)K|7(0)|,0<e<e0.
Введем подпространство
П1Е = ПЕП{м = (Л,г?)еВ"х Е1: <%^,^> = 0, ieJ(0)\Jg(*g)}.
С учетом оценки (31) имеем
dimnlE S*n+ 1-7(0), Ve, 0<е<£о. (34)
Далее, из включения (32) следует
nlEckerGE'(zE)n{„: (^ф1,^) = 0, i^I(0)\IE(zE)} =
= {^ = (Л, г?) е В" х Е': (Щ^1,») = (VW. Л> - Sfa(eft)4 = 0, i е ДО)}. (35)
Заметим, что
/■ /, Гх_^«(«.Л) (£.,х(*, А))т
-матрица размера (п+ 1) х (п+ 1), где CEXX(z, А) = A0</0."(z) + £ Ае<7г."(а:), £e,x(z, А) = 0,
£EXX(z, A) = A0i/>"(xE). Отсюда с учетом (33) получаем * = '
<£«»(*«. А>, Ai) = (/:.,,(¾. А.)Л, Л) + CEXX(zE, A.)r72 =
= <(*оЕ5о."(*.) + Е Atosfa"(*.))ft, Л) + A0^"(x.)r?2 ^0 V^ е П1е с Пе. (36)
{ = 1
В Еп введем подпространство П2е, состоящее из тех h€En, для которых /u = (ft, 77 = 0) €П1е.
Для таких ц из (34)-(36) имеем:
dim П2е ^ max{n - |7(0)|; 0}, 0 < е < е0, (37)
n2EckerG'(zE) = {h£En:(g/(xE),h)^0, г е 7(0)}, 0<е<е0, (38)
<^(*E>A.)/i,/i) = ((A0.<70.''(*.) + Е Afcfffa"K))ft,ft)>0 V/ien2E, 0<е<е0.(39)
i = 1
В (37)-(39) возьмем е = ек и устремим к —>оо. Вспомним, что {хЕ }—>0, {Ае }—>АеЛ(0).К
последовательности подпространств П2е применим лемму 1. Согласно этой лемме существует
подпространство Пс Cs П2е , dim П^ max{n-|7(0)|;0}. Возьмем произвольную точку hn е П.
§ 16. ДОКАЗАТЕЛЬСТВО НЕОБХОДИМЫХ УСЛОВИЙ ЭКСТРЕМУМА 347
По определению Cs П2е точка ft0 является предельной для некоторой последовательности
{hk}, hk е П2е . Без умаления общности можем считать, что сама последовательность {hk}
сходится к /¾. Тогда из (38) при е- ек, h = hk и к —> оо имеем (з/(0), ft0) = 0, Vi £ /(0),
т. е. /¾ е ker G'(0). Следовательно, П с ker G'(0). Наконец, учитывая, что д0£"(х) = f"(x) +
+ 4|a:|27n + 8:EcT + 4|a:-eft|27n + 8(a:-eft)(a:--eft)T из (39) при е-ек, h=hk £ П2е ик -> оо
s _ *
получим ((А0/"(0) + £ ^,-5/40)¾. ло) > °- т- е- (Схх(°> x)h> h)>° Vft е П. Это значит, что
i=\
подпространство П обладает свойствами_(14)-(16) и является сопровождающим
подпространством для точки А. Следовательно, А = А (Л) еЛа(0). Тем самым показано, что любая отличная
от нуля предельная точка семейства конусов {Л (ze), е >0} при е —>0 принадлежит Ац(0).
Теперь мы можем доказать утверждение (18). С этой целью воспользуемся равенством (30).
Напомним, что задачу (24), (25) мы рассматриваем при произвольном фиксированном ft ф О,
ft е K(v) fl{/i6B": (/'(■")> h) < 0}, где конус K(v) определен согласно (19); v =0, 7(0) = {г:
i = l,..., s}. Тогда
<70(eft) = 50(0) + (fl0'(0), eft) + | <<70"(0)eft, eft) + о(е2) =
= /(0) + е(/'(0), ft) + ie2(/"(0)ft, ft) + о(е2) < ie2(/"(0)ft, ft) + o(e2),
fl£(eft)=fl{(0)+(fl/(0), eft)+ie2(fli"(0)eft, eft)+o(e2) < ±e2<<//'(0)ft, ft)+o(e2), i £7(0),
Подставим эти неравенства в (30). Учитывая, что Afc > 0, г — 0,..., т, i/>'(xe) > 0, получим
>KMeh) + Е Ato^(eft)=A0g^'(xg)>0.
• = 1 я
Отсюда, разделив на е2 > 0, имеем г - '
А0,<Г(0)Л,Л>+ £ Ate(fli"(0)ft,h) + 2A0E^+ £ 2Afe^>0.
i=l е j=i е
Перейдем в этом неравенстве к пределу при е = ек —>0. Учитывая, что Ае —> A = A (ft) еЛа(0),
получим *
<(V"(0)+ t A{fl/'(0))h» = (^(0,A(ft))ft,ft)>0.
f=i
Так как Л (0) конус, то т^4т4т G A (0). Следовательно, _ тах_ (£ (и, A)ft, ft) ^ (£^ (и,
|А(Л)| АеЛ„(0), |А |= I ^
I w. vi )ft, h) ^0. Неравенство (18) и, следовательно, теорема 2 доказаны в предположении,
что в точке v локального минимума задачи (13.А) все ограничения д{(х) < 0, г = 1,..., т,
активны.
Рассмотрим общий случай, когда среди этих ограничений имеются неактивные, т. е. д{ (v) <0
для некоторых номеров i, 1 ^ г < т (возможность, когда все такие ограничения неактивны,
здесь не исключается). Так как функции gt(x) непрерывны, то число 7 в задаче (19.А) можно
считать столь малым, что д^х) < 0 Va;, |а: — г|| < 7> » ^ ^(0). Рассмотрим задачу:
g0(x)~+mf, xeW,={xGJS": |я-и|<7> ft^K0.
ie7(v)n{l<i<m}, ffi(x)=0, i=m+l, , s}, (40)
полученную из задачи (19.A) исключением неактивных ограничений. Заметим, что Wi С W, так
как если х £ И^, то 5г-(а;) < 0 Vi $ 7(ii) в силу выбора 7 и поэтому х £ 1У. Отсюда, учитывая,
что иеИЛ, имеем inf f(x)^ inf f(x) = f(v)^ inf /(ж). Это значит, что inf f{x) =
x eWl x eW x eW{ xeWl
= inf f(x) = f(v), т. е. точка v — решение задачи (40). Однако в задаче (40) все ограничения
X £ W
gi(i)<0b точке v активны, и, следовательно, к этой задаче применима уже доказанная часть
теоремы. Поэтому конус Лагранжа A(v) и конус Арутюнова Aa(v) задачи (40) непусты, и для
функции Лагранжа С(х, А) = £ *ч9{(х) этой задачи справедливо неравенство
iei(0)
max (4>,A)ft,ft)3*0 Vfte7C»n{/»,ft<0}. (41)
АеЛ», |А|=1
348 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Каждой точке А = (А0, А8-, г е I(v)) поставим в соответствие точку А = (А0,..., As) по
правилу А0 = А0, А£ = А{, i G I(v), А£ = 0, г $ I(v). Образуем множества A(v), Aa(v), состоящие
из всех тех точек А, которые получены с помощью указанного правила из точек А множеств
Л(г|), Aa(v) соответственно. Нетрудно убедиться, что так построенное множество A(v)
является конусом Лагранжа задачи (13.А) в точке и, а множество Aa(v) — конусом Арутюнова,
причем для каждой точки А еЛц(г|) в качестве сопровождающего подпространства П(А) можно
взять подпространство П(А) для соответствующей точки A &А (v). Неравенство (18) является
следствием неравенства (41) и равенства Cxx(v, A) = Cxx(v, А) для любых соответствующих
точек А € А(у) и A G А(у). Теорема 2 доказана. D
Тем самым доказаны и теоремы 2.4.2 и 2.4.3.
Упражнения
1. Пусть Q = (Q0,..., Qs), где Q{ —симметричная матрица пхп, г = 0,..., s, К = {х£ Еп:
{Q{x, х) ^0, г = 1,..., т; (Q{x, х) = 0, г = т+ 1, ..., s}. Пусть Лц(0, Q) — конус Арутюнова
задачи f(x) = (Q0x, х) —> inf, х е К в точке v = 0. Доказать, что многозначное отображение
Аа: Q —> ЩЕ3+ ') замкнуто (полунепрерывно сверху).
2. Пусть v —■ точка локального минимума задачи: f(x) —> inf, a;6X = {i€ Еп: gt(x) <
^0, i= 1,..., m; 5,.(0:) = 0, г = m+ 1,..., s}, где g.(x) = {a{, F(x)), F: En -» Er —заданное
отображение, ai,..., as — заданные векторы из E . Доказать, что тогда конус Aa(v) можно
заменить на другой конус Aa(v), в котором коразмерность сопровождающих подпространств П
не превышает г, т. е. dim П^тах{п--г-;0}. Указание: заметить, что д/(х) = (F'(х))Т ait
и, следовательно, (gi'(x),h) = 0 V/i ekerF'(a:) (подробности см. [44]).
§ 17. Метод барьерных функций
1. Идеи метода штрафных функций могут быть использованы для
построения минимизирующих последовательностей задачи
/(я:)-Inf, хЕХ, (1)
которые обладают какими-либо дополнительными свойствами. Скажем,
можно строить последовательность {хк}, каждый член которой
принадлежит множеству X, но находится вне некоторого заданного
«запрещенного» подмножества 'у С X. В качестве «запрещенного» множества 7 может
служить, например, граница Гр X множества X или какая-либо часть
границы. Дело в том, что при применении того или иного метода решения
задачи (1) при X ф Еп может случиться, что каждое получаемое
приближение хк будет принадлежать Гр X. Однако если структура границы
множества слишком сложна, то реализация такого метода может потребовать
большого объема вычислительной работы и, кроме того, сходимость
метода может оказаться очень медленной. В таких случаях можно попробовать
как-то построить «барьер» вблизи всей границы 7 = Гр X или какой-либо ее
части 7 (или какого-либо другого заданного подмножества 7 С X), который
исключал бы возможность попадания очередного приближения хк на 7-
Определение 1. Пусть j — некоторое подмножество множества X.
Функцию В(х) назовем барьером или барьерной функцией подмножества
7, если В(х) определена, конечна и неотрицательна во всех точках хе
е X \7, причем lim B(vT) = 00 для всех последовательностей {vr} € X \ j,
которые сходятся к какой-либо точке v е 7-
§ 17. МЕТОД БАРЬЕРНЫХ ФУНКЦИЙ
349
Заметим, что в определении 1 подразумевается, что Х\^ф0. Это значит,
что если 7 = Гр X, то int X = X \ 7 ф 0. Заметим также, что в точках я; 6 7
барьерная функция В(х) не определена (можно принять В(х) = оо, х G 7)-
Пользуясь теми же конструкциями, которые использовались при
построении штрафных функций, нетрудно выписать барьерные функции для
множеств 7. задаваемых ограничениями типа равенств или неравенств.
Например, если 7 = {х 6 Еп: хеХ, д(х) = 0}, где д(х) непрерывна на X, X\j^0,
то в качестве барьерной функции здесь можно взять В(х)= \д(х)\~\ или
В(х) = \д(х)\~2, или В(х) = max{- In |з(я;)|; 0}. Если же j = {х е Еп: х е
е X, д(х) ¢. 0}, где X \j ф0, д(х) непрерывна на X, то можно принять
В(х) = (д(х)У, р>0, или В(х) = \ In д(х)\, х е X \ 7 и т. п.
Перейдем к описанию метода барьерных функций для решения задачи (1),
предполагая, что подмножество 7 Q X и некоторая его барьерная функция
уже заданы. Введем функции
Fk(x) = f(x) + akB(x), хеХ\7, к = 1,2,..., (2)
где {аЛ — положительная последовательность, сходящаяся к нулю.
Величины (¾} из (2) называются барьерными коэффициентами. Рассмотрим
последовательность задач
Fk(x)->ltd; хеХ\ъ k = l,2,... (3)
Обозначим Fkt= Inf FK(x), k = 1, 2,... Будем предполагать, что в исходной
задаче (1) /„ = inff(x) > -00. Так как Fk(x) ^ f(x) при всех х eX\j, то
Fkt ^ /* > -оо. Тогда условия
хкеХ\-у, Fk(xk)^Fkt + ek, k = 1,2,... (4)
определяют последовательность {xk}, где ek > 0, lim ek =0; если окажется,
к -4оо
что Fk(xk) = Fkt, то в (4) допускается ek = 0.
Поскольку, как обычно, мы подразумеваем, что функция f(x) конечна во
всех точках хЕ X, то согласно определению 1 для любой
последовательности {vr} е X \ 7, {ч.} —► v 6 7 справедливо равенство lim Fk(vr) = 00 при
каждом фиксированном к = 1, 2, . .. Таким образом, функция Fk(x)
неограниченно возрастает вблизи 7- Поэтому следует ожидать, что при
фиксированном к функция Fk(x) вблизи j не может принимать значения, близкие
к Fktl и точка хк, определяемая условиями (4), не будет расположена на
слишком близком расстоянии от 7- В то же время благодаря тому, что
барьерные коэффициенты {ак} —»0, не исключается возможность того, что
с увеличением номера к точки хк, постепенно «преодолевая барьер», будут
приближаться к 7-
Для приближенного решения задачи (3) при фиксированном к и
определения точки хк, удовлетворяющей условиям (4), могут быть
использованы различные методы минимизации. В частности, если j = Гр X и
X \ 7 = int X ф 0, то для решения задачи (3) может быть применен,
например, градиентный метод (см. § 1):
^,,-+1 = ^-0^(¾^ Чо = хк~и г = 0,1...
Поскольку Хь € int X, то при достаточно малых аг > 0 точка я;^г + 1
также будет принадлежать int X, и мы избавлены от неудобств, связанных с
350 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
учетом границы X, — нужно лишь на каждой итерации следить за
соблюдением включения хк 6 int X, а при его нарушении уменьшать длину шага
аг. Правда, для этого величину аг1, быть может, придется брать слишком
малой, и сходимость градиентного метода, возможно, замедлится, но это
уже будет «платой» за выполнение условия хк 6 int X. \
Дальнейшее изложение не зависит от того, с помощью какого
конкретного метода минимизации будет найдена точка хк, удовлетворяющая
условиям (4). Поэтому мы здесь можем ограничиться предположением, что
имеется достаточно удобный метод определения точки хк из (4).
Метод барьерных функций описан. Отметим, что в литературе этот
метод иногда называют методом внутренних штрафов (или методом
внутренней точки), а метод штрафных функций из § 15 — методом внешних
штрафов (или методом внешней точки) [721]. Для иллюстрации метода
барьерных функций приведем пример.
Пример 1. Пусть требуется решить задачу
/(ж) =-ж-игл"; хеХ = {хеЕ1: д(х) = х < 0}.
Очевидно, здесь ft = 0, Xt = {0}. Границей множества X является j =
= Гр Х = {хеЕ1: д(х) = х = 0} = {0},аХ\-у = {хеЕ1:д(х) = х<0} = Ы X.
В качестве барьерной функции для 7 возьмем В(х) = —1/х (х < 0). Пусть
ак = к"1, к = 1, 2, ... Тогда функция (2) будет иметь вид Fk(x) = — х —
— (кх)~\ х < 0. Нетрудно видеть, что здесь Fkt = inf Fk(x) = 2/vfc и точка
X <о
хк = — l/y/к удовлетворяет условиям (4) при ек = 0, к = 1, 2, ... Ясно также,
что lim Fht= lim /(¾) = 0 = /,, lim xk = 0 = xt.
к —too к —too к —too
В качестве барьерной функции здесь можно также взять и В(х) =
= 11п(—х)\. В этом случае Fk(x) = —х + | 111(-0:)1¾-1. х < 0, к = 1, 2, ...,
Fkt = (I +ln k)k~l, а точка хк = — к'1 удовлетворяет условиям (4) при ек = 0.
И здесь {/(¾)} -► /„ = 0, (¾} -► х, = 0.
Перейдем к исследованию сходимости метода барьерных функций.
Теорема 1. Пусть j — некоторое подмножество из X, Х\уф<2), и
/♦ = /♦., где ft = ltff(x), /w= inf/(i)>-oo. (5)
x x\~/
Пусть В(x) —какая-либо барьерная функция подмножества j, а
последовательность {хк} определена условиями (4). Тогда
lim Fkt=lim Fk(xk)=\im /(¾) =/ф) lim акВ(хк) = 0. (6)
к—too к ~~*оо к—too к—too
Кроме того, если множество X ограничено и замкнуто, a f(x)
полунепрерывна снизу на X, то (¾} сходится к Xt.
Доказательство. Из определения /w, Fkt, неотрицательности
барьерной функции и условий (4) следует
-оо < /„ < /(¾) < Fk(xk) < Fkt+ek < Fk(x)+Ek=f(x)+akB(x)+ek (7)
при всех жб-Х'\7, к = 1, 2, ... Так как В(х) конечна в любой точке ж€Х\7,
{ак} —»0, то из (7) при к —»оо получим
f„<]im_Fk^\imFk^f(x), хеХ\7.
Переходя в этих неравенствах к нижней грани по х 6 X \ 7, будем иметь
Л* < JiHL Fk* < T™Fk* ^ /«- т- е- ,lim Fk* = L- Отсюда и из (7) вытекает
§ 17. МЕТОД БАРЬЕРНЫХ ФУНКЦИЙ
351
,lim Fdxk) = )im f(xk) = f**- Так как /* = /**. то первые соотношения (6)
к ~-юо к-юо
доказаны. А тогда из 0 < акВ(хк) = Fk(xk) — /(¾) —» 0 при А; —» оо получим
и второе из соотношений (6). Последнее утверждение о сходимости
минимизирующей последовательности (¾} к I, следует из теоремы 2.1.1. □
Полезно заметить, что при доказательстве теоремы 1 были
использованы не все свойства барьерных функций: соотношение lim B(vT) = oo, где
{vT} е X \ 7, {vT} —> v е j, нам не понадобилось. Поэтому теорему 1 и ряд
доказываемых ниже теорем можно использовать не только как теоремы о
сходимости метода барьерных функций, но и как утверждения,
выражающие собой достаточные условия устойчивости нижней грани относительно
возмущений (погрешностей) минимизируемой функции и некоторых типов
возмущений множества, на котором ищется минимум.
2. Рассмотрим возможности построения барьерных функций для
задачи (1) в случае, когда
X = {х е Х0, 9i(x) < 0, % = 1,..., т}; (8)
здесь Х0 — заданное множество из Еп, функции д^х),..., дт(х)
определены и полунепрерывны снизу на Х0. Положим
j = {х е X: д{(х) = 0 хотя бы для одного г, 1 < г < т}. (9)
Будем предполагать, что множество
X(-0) = {xeX0:9i(x)<0, i = 1,.., m} (10)
непусто. Тогда X \ 7 = Х(—0) ф 0. Довольно широкий класс барьерных
функций для множества (9) дает следующая конструкция:
т
5(^)=Eft(-ft(4 хеХ(-О), (11)
где <Pi(t) — неотрицательная ^-функция переменной t > 0 такая, что
lim (^(¢) = 00 при всех г' = 1,...,т. В самом деле, возьмем произволь-
ную последовательность {vr} el\7, сходящуюся к некоторой точке v е 7-
Согласно (9) тогда найдется номер j, 1 < j < m, для которого g3-(v) = 0.
Так как д^х) полунепрерывна снизу, а gj(vT) < 0, г =1,2,..., то 0 =
= gAv) ^ hm_gAvT) ^ lim g.(vT) < 0, т. е. lim 0.(^) = 0. Это значит, что
•З(Ч-) ^ tp Л—g-(vT))—> 00 при г —»оо, так что функция (11) является
барьерной для множества (9).
При необходимости в (11) функции (p{(t) нетрудно выбрать так, чтобы
барьерная функция В(х) обладала различными полезными свойствами,
такими, как непрерывность, гладкость, выпуклость, простота вычисления
значения функции и нужных ее производных и т. п., если, конечно, исходные
данные в задаче (1), (8) обладают такими свойствами. Например, взяв в (11)
tp{(t)= \jt или <p{(t) = (max{- In t; 0})p, p ^ 1, получим соответственно
,,*(*)'
B(x) = -J2
(12)
B(x)=-£(max{-ln(-9i(x));0}Y, xeX(-O).
352 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Если Х0 выпукло, функции gt{x), г = 1,..., т, выпуклы на Х0, то множество
Х(—0) = Х\гу выпукло и функции (12) также будут выпуклыми на Х(—0) —
это следует из следствий к теореме 4.2.8. Далее, функции (12) будут
обладать той же гладкостью, какой обладают функции д{(х), г = 1, ..., т —
у второй функции (12) для этого нужно взять параметр р достаточно
большим.
Может сложиться впечатление, что если функции д^{хУ ..., дт(х)
непрерывны на Х0, то множество j, определяемое условиями (9), будет состоять
только лишь из граничных точек множества (8). Однако это не всегда так —
множество 7 может содержать и внутренние точки X.
Пример 2. Пусть д(х) = \х\ — 1 при |ж| < 1, д(х) = 0 при 1 < \х\ < 2,
д(х) = \х\ — 2 при \х\ ^ 2. Тогда множество X = {х €. El = Х0: д(х) < 0}
представляет собой отрезок — 2 < х ^ 2 на числовой оси, a int X = {х е Е1:
— 2 < х < 2}. В то же время множество Х(—0) — {х Е Е1: д(х) < 0} = {х:
-1<х<1}сЫ X, HoX(-0)^int X,aj = {xeX:g(x) = 0} = {x: 1<|я;|<
< 2} наряду с граничными точками ж = 2иж = -2 содержит и внутренние
точки множества X (см. также множество X из примера 4.9.2).
Таким образом, для множества (8) не всегда выполняется равенство
ГрХ = ГрХ0и7, (13)
где 7 определяется условиями (9), а функции (11), (12), являющиеся
барьерными функциями для подмножества 7> могут и не быть таковыми
хотя бы для части границы X.
3. Отдельно остановимся на условии (5), которое было существенно
использовано в теореме 1 при доказательстве сходимости метода барьерных
функций.
Нетрудно привести примеры задач (1), (8), в которых функции
f(x),gi(x),...,gm(x) непрерывны, множество X замкнуто и ограничено,
но условие (5) не имеет места. Например, если f(x) = x, а множество X
взято из примера 2, то /„ = — 1 > ft = —2.
Однако даже выполнение условия (13), при котором функции (11), (12)
будут барьерными функциями j — части границы X, еще не гарантирует
справедливость равенства (5).
Пример 3. Пусть f(uk) = е~х, X = {и — (х, у) € Е2 = Х0: д(и) =
= (х2 + у2- \){у - I)2 < 0}. Тогда 7 = Гр X = {и е X: д(и) = 0} = {и е Е2:
х2 + у2 = 1 или у = 1}, Х0 = Е2, Гр Х0 = 0, так что условие (13)
выполнено. Далее, Х\'у=Х(-0)={иеЕ2: д(и)<0}={и: a:2+y2<l}=int X, поэтому
/ = inf /(u) = e~' >0. В то же время /„ = lim /(¾) = 0, где ик =(к, 1)еХ
X\j к -»оо
при к = 1, 2, ...
Заметим, что в этом примере Х(—0) = {и: х2+у2^. 1}с1, но Х(—0)фХ.
(Напоминаем, что через Z мы обозначаем замыкание множества Z.)
Приведем две теоремы, дающие достаточные условия для выполнения равенства (о). Имея
в виду дальнейшие применения, утверждения сформулируем для множества
Х(С) = {хеЕп:хеХ0, д{(х)<С, i = l,...,m}, (14)
где С — некоторая постоянная. Обозначим
Д(С) = inf /(*), Д(С-0)= Нт Л(С-е), Д(С + 0)= Нт Д(С + е). (15)
§ 17. МЕТОД БАРЬЕРНЫХ ФУНКЦИЙ
353
Теорема 2. Пусть для некоторых С, Eq >О множество Х(С — £q) непусто и
Х(С-0) = Х(С), (16)
где
Х(С-0) = {иеХ0: g{(u)<C, i = l,...,m}.
Пусть, кроме того, функция f(x) полунепрерывна сверху на множестве Х(С). Тогда
UC-0) = ft(C) = xMQ)f(x). (17)
Доказательство. Прежде всего, заметим, что
Х(С-е)СХ(С-6)СХ(С-0)СХ(С)
при всех 0 < 6 < е < Sq, поэтому
ft(C)<xM_o)f(x)^ft(C-S)^ft(C-e).
Это значит, что функция Д(С) переменной С не возрастает и существует предел
ElimQ Д(С - е) = Д(С -0) > x({nf 0)/(«) £ Л(С). (18)
Возьмем произвольную точку х еХ(С). В силу условия (16) найдется последовательность
{xj.} еХ(С-О), сходящаяся к точке х. Это значит, что xk Gin, gt(xk) < C—eik < С, еек >0, к =
= 1,2 где lim ей=0, i'=l го. Таким образом, хк е А (С — ек), где et = min е{к >0,
/: —* оо 1 ^ г' ^ m
{et} —>0, и fJ,C — ек) ^.f(xk), к = 1, 2,... Отсюда при А; —>оо, учитывая полунепрерывность
сверху функции f(x), получим lim ft(C—e)= lim ft(C—ek)^f(x). В силу произвольности
е —* +0 к —* оо
жеЛ^С) тогда Д(С—0) <Д(С). Сравнивая это неравенство с (18), приходим к равенству (17).
Теорема 2 доказана. D
Таким образом, если условия теоремы 2 выполнены при С = 0, то методом барьерных
функций (2), (4), (8)-(11) для задачи (1), (8) можно получить последовательность {хк},
обладающую свойствами (6).
Аналогичное утверждение справедливо для выпуклых задач (1), (8).
Теорема 3. Пусть Х0 — выпуклое множество на Еп, функции f(x), gx(x) 9т(х)
выпуклы на Х0. Тогда равенства (17) справедливы при всех С > Ct = max inf дДа:).
1 ^ i ^ т XQ
Доказательство. Как было установлено в теореме 2, функция ft(C) переменной С
не возрастает. Возьмем произвольные С, е >0, С > С — е > С^. Пусть хеХ(С), уеХ(С — е).
В силу выпуклости Х0 тогда ха = ау + (1 — а)х е Х0 при всех а, 0 ^ a ¢. 1. Кроме того,
из выпуклости gt{x) имеем д{(х ) < аде(у) + (1-- а)д{(х) ^ а(С — е) + (1 — а)С = С — ае,
О< a ¢. 1. Это значит, что жа ел(С — ае). Тогда с учетом выпуклости функции f(x) получим
Д(С)^ inf f(x) < UC-ae)<f(xa)^af(y) + (l-a)f(x) для всех в еХ(С), у еХ(С-
- е). Следовательно, Д(С) ^ inf f(x) < Д(С - ае) ^ aft(C - е) + (1 - аг)Д(С) < Д(С) +
л {С — 0)
+ <*[/*(<? —ео)-/+(^)1 для всех а, 0<а ^ 1, 0<е<е0<С-С,,. Отсюда при а —>+0с учетом
монотонности Д(С) получаем равенства (17), что и требовалось. D
4. Пусть множество X задается условиями
Х = {хеЕп: хеХ0, д((х)^0, i=l,...,ro; д{(х) = 0, 1 = 171+1,...,«}. (19)
Если это множество не имеет внутренних точек, то реализация ряда методов минимизации
(например, методов из § 3-5, 11 и др.) на X может стать затруднительной или даже
невозможной. В то же время при применении методов § 14, 15 к задаче (1), (19) могут получиться
такие последовательности {хЛ, которые не принадлежат множеству X и нарушают какие-
либо из ограничений gt(x) <0, д-(х) = 0 на недопустимо большую величину. В таких случаях
может оказаться целесообразным использование метода барьерных функций.
Заметим, что этот метод выше изложен для задачи (1), (8) в предположении, что
множество Х(—0), определяемое условиями (10V непусто. Однако такое предположение для
множества (19) при го < s не имеет смысла. Поэтому описанный выше метод барьерных функций
к задаче (1), (19) непосредственно неприменим и требует модификации, обобщения. Опишем
один из возможных здесь подходов [390].
354 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Введем теперь последовательность расширенных множеств
Vk = {xeXo:g{(x)<0k, i=l т; \д{(х)\<вк, i = m + 1 s}, (20)
где вк >0, к = 1, 2,..., 11 m вк = 0. Так как X с Vk, к = 1, 2 то из X ^ 0 следует Vfc ^ 0,
к —* оо оо
А; = 1,2,... Предполагая, что функция /(ж) определена на множестве (J Vfcl рассмотрим
последовательность задач fc = 1
/(x)-»Inf; xeVk, к = 1,2,... (21)
Для решения задач (21) могут быть использованы различные методы минимизации. Мы здесь
остановимся лишь на методе барьерных функций. Обозначим
7fc = {х 6 ^1ь и выполняется хотя бы одно из равенств зДа:) = #^, i = 1, ..., т;
5^-(^) = ¾. 9j(*) = -0kt У = ш+ 1,...,4- (22)
Поскольку IcVj., XC\^k — 0,to X с\гк\')кф0, к = 1, 2,... В качестве барьерной функции
Вк(х) подмножества fk возьмем
в*М=Ьл-^))+ Е ^(¾+ *(*)). *б^Н. (23)
i=l г = т+ 1
где функция ip^t) определена, конечна, неотрицательна и не возрастает при t > О,
lim fi(t) =оо, i = 1, ..., s. Например, в качестве tp^t) можно взять tp^t) = t , f(t) =
= (max{-lnt;0})p, p^ 1.
Далее, составим функцию
*"*(*) = /(*) + »* В* (*). *6У*\7*. (24)
где (¾} — барьерные коэффициенты: ак > О, А; = 1, 2,..., {ot} —> 0. В отличие от
рассмотренного выше варианта метода барьерных функций, здесь мы будем требовать, чтобы барьерные
коэффициенты {ак} и параметры {вк} стремились к нулю согласованно в следующем смысле:
lim ак¥>.(вк)=0, 1 = 1,...,4 (25)
к —* оо
Предположим, что fkt = inf f(x) > —оо, к — 1, 2,... Так как Вк(х) ~£ 0, ак > 0, то ^(а;) ^ /(ж)
при всех х £Vk\'yk, и поэтому Ffc<, = inf Fk(x) ^ /fc<, > —оо, к = 1, 2,... С помощью какого-
либо метода минимизации определим точку хк, удовлетворяющую условиям
**6^\7*, **♦***(**) <**♦ + **. *=1,2,..., (26)
где {ек} — некоторая положительная последовательность, сходящаяся к нулю; если Fk(xk) =
= Fkt, то в (26) допускается ек =0. Метод барьерных функций для задачи (1), (19) описан.
Теорема 4. Пусть функции Fk(x), Bk(x), множество Vk, "/k определены
соотношениями (20),(22)-(24), выполняются равенства (25) и, кроме того,
Нт Д* = Л>-оо, Д, = Inf/(as), /* = Inf/(*)- (27)
Тогда для последовательности {хк}, определяемой условиями (20), справедливы
соотношения
lim Fkt= Hm 1^)= lim /(¾) = Д, Ит <.4BtK) = 0. (28)
К —*00 К —*00 К —* ОО К —* ОО
£с/ш, кроме того, множество
Х(6) = {хеХ0: gi(x)^S, i = 1,...,т,- |з<(в)|<«, i = m+ 1,..., s} (29)
компактно при некотором S > 0, множество Х0 замкнуто, а функции g\(x),..., дт(х),
\9m+i(x)\, • ■ ; \9Я(Х)\ полунепрерывны снизу на Х(6), то {xk}~> Xt —множество решений
задачи (1),(19).
Доказательство. Из определения fkt, Fkt, неотрицательности Вк (х) и условий (26)
имеем
-°o<fk^f(xk)^Fkt+ek^Fk(x)+ek=f(x)+akBk(x)+ek, xeVk\%, fc = l,2,... (30)
§ 17. МЕТОД БАРЬЕРНЫХ ФУНКЦИЙ
355
Так как функции tp{(t) из (23) не возрастают при t >0, то <£;(вк — д{(х)) ^^-(¾). i = 1,..., т;
<Р{(0к ± зДа;)) = Vi(^). * = т + 1,..., s, для всех а: е X. Поэтому в силу/условия (25)
0^акВк(х)^2ак£ ^)-+0, fc-+oo, \/хвХ. (31)
< = 1
Тогда при к —> оо из (30) с учетом условия (27) получим
Д ^ lim F^ ^ lim Ffc<,</(x) при всех igl.
fc-~»oo fc-too
Переходя к нижней грани по х е X, отсюда имеем lim Fk = Д. Тогда из (30) следует
.lim Fk(xk) = Jim /(¾) = /*• Наконец, 0 ^ акВк{хк) = Fk(xk) - f(xk) -+ 0 при к -+ оо. Ра-
к —* оо к —* оо
венства (28) доказаны.
Пусть теперь выполнены все условия теоремы. Так как {вк} -+0, то Vk с Х(6) при всех
к ^ &Q. Тогда Ж;. еХ($), А; ^ йц. В силу компактности Х(5) последовательность {хк\ имеет
хотя бы одну предельную точку. Пусть xt — произвольная предельная точка {хк}, пусть
подпоследовательность {хк )-+0:,,. В силу замкнутости Х0 тогда xt е Х0. Из полунепрерывности
снизу функций gi(x),.!.,gm(x), \gm+i(x)\,...,\ga(x)\ и условия хк eVk следует, что
или
9i(xt)^Jm_gi(xk)^lim вк=0, г = 1 т, \д,(хЖ Hm 1,9,-(¾ )|< lim 0,.=0
г—>оо г к—*оо г—* оо г к —юо
ft(x*)='°> «' = "1+1,...,е.
Таким образом, а:,, gX. Отсюда с учетом полунепрерывности снизу f(x) на Х(6) получим
Л ^ /(¾) ^ Нш /(¾ ) = lim /(¾) = Д, т. е. /(¾) = Д или х е Jf . Тем самым показано,
г —> оо >■ к —* оо
что любая предельная точка последовательности {хк} принадлежит Xt, Отсюда следует, что
(¾} -> Х^. Теорема 4 доказана. D
При некоторых более жестких ограничениях на данные задачи (1), (19) можно получить
оценки погрешности метода (20)-(26).
Теорема 5. Пусть для задачи (1), (19) справедливо неравенство
-оо <Д £/(*) + t ctigtix)? VxeX0, с,. £0, v >0 (32)
t' = l
(am. определение 15.3 и лел!Л1Ы 15.1,15.5). Тогда последовательность {xk}, определяемая,
условиями (20)-(26), существует и справедливы оценки
-\cUe^f(xk)-f^Fk(xk)-f^2ak ± <р{(вк) + ек, (33)
t' = l '
0^акВк{хк)^2ак± ^(вк) + ек + \с\{в^ fc = l,2,..„ ,- (34)
t' = l
где |с|, = £) |с,.|. £сли, кроме того, множество (29) компактно при некотором 6 >0, Х0
« = 1
замкнуто, а функции f(x),gi(x),..,,gm(x), \gm+\(x)\,...,\ga(x)\ полунепрерывны снизу
на Х(6), то {хк} -> Х„.
Доказательство. Из определения (20) множества Vk и условия (32) следует
-оо < Д £/(*) + Ё с^+О»))" ^ /(^)+14¾^ ^(0)) + |с|, 9к\ (35)
< = 1
при всех х е ^А\7Л. Отсюда имеем Ffc(x) ^ Д-|с|,0Л" >-оо xeVk\yk, или -FJ.* ^ Д — |с|, 0^ >
> —оо, к = 1, 2,... Таким образом, последовательность (¾}. удовлетворяющая условиям (26),
существует. Далее из (31) следует
0^akBk{xJ^2akt ¥>М), xteXt С X сХк\>ук, fc = l,2,...
Поэтому с учетом неравенств (26), (35) имеем
Л </(**) + МЛ" < **(**) + МЛ" < ^ + ¾ + И,С ^
^ **(*.) + е* + ИЛ" < Л + 2¾ Ё ^(¾) + е* + |c|,0t", * = 1, 2,...
i = l
Отсюда получаем оценку (33).
356 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Далее, из соотношений 0^ <чВк(хк) = (Fk(xk) — ft) — (f(xk) — ft) и уже доказанной
оценки (33) вытекает оценка (34). Последнее утверждение доказывается так же, как аналогичное
утверждение теоремы 4. D
5. Отдельно остановимся на условии (27), которое существенно использовалось при
доказательстве равенств (28). Нетрудно привести примеры задач (1), (19), когда это условие не
выполняется.
Пример 4. Пусть f(x) = е~х, Х = {хеЕ1=Х0: д(х) = (х2 - 1)(1 + х*)~1 < 0}. Ясно,
что Х = {хеЕ1: |я|^1}, Д = inf/(ж) = е-1. Возьмем Vk = {xeEl: д(х)^6к = 1/к2}.7аккак
х =re Vk при r^k, то lim f(x ) = 0=/,. к = 1, 2,... Таким образом, здесь lim fkt = 0<
т —> оо k ~юо
< е-1 =Д — условие (27) не выполняется. Заметим, что в рассмотренном примере множество
Х(6) — {х е Е': s(a:) < 5} не является компактным ни при каком 6 > 0.
Приведем теорему, дающую достаточные условия для выполнения условия (27).
Теорема 6. Пусть множество Х0 замкнуто, функции f(x),g\(x),...,gm(x),
\дт+ \(х)\,..., |ss(a;)| определены и полунепрерывны снизу на Х0. Кроме того, пусть
множество
Х(С) = {хеЕп: хеХ0, gf(x)^Q i = l,s}
непусто, а множество X(C + s0) ограничено и замкнуто при некотором е0 > 0. Тогда
(см. обозначения (15))
lim пЛ(С+в) = Л(С + 0) = Д(С). (36)
Доказательство. Так как Х(С) С Х(С + 6) С Х(С + е) при любых 0 < 6 < е ^ е0,
то Д(С+ е) ^ f*(C+ S) ^ ft(C). Таким образом, функция Д(С) переменной С не возрастает
и существует предел lim Д(С + е) = /ДС + 0) < Д(С). Возьмем произвольную последова-
s—> +0
тельность {е&}, 0 < Sj. $; е0, сходящуюся к нулю. При сделанных предположениях множества
Х(С+ек) СX(C+sq) при каждом к = 1, 2,... ограничены и замкнуты. Согласно теореме 2.1.1
тогда существует точка wk € Х(С + ек) такая, что f(wk) = fi,(C + ек), к = 1, 2,... Поскольку
Х(С + е0) — компактное множество и 1¾ е X(С + е^) С Х(С + е0), то последовательность
{wk} имеет хотя бы одну предельную точку. Пусть wt —какая-либо предельная точка {wk}.
Не умаляя общности, можем считать, что сама последовательность {wk} —» w^. По
построению wk е Х(С + £;.), т. е. wk е Х0, gf(wk) 4 С + ек, г = 1,..., s. Используя замкнутость
множества Х0, полунепрерывность рассматриваемых функций, отсюда при к —»оо получаем
wt е Х(С). А тогда Д(С) ^ f(wt) ^Jim_f(wk) = lim ft(C + ek) = Д(С + 0). Сравнивая с
fc-too fc-too
ранее установленным неравенством Д(С + 0) ^ /«(С1), получаем равенство (36).
Нетрудно видеть, что при С = 0 из (36) вытекает условие (27).
Различные аспекты метода барьерных функций исследованы в [222; 286; 319; 390; 613; 721;
759; 774].
Упражнения
1. Применить метод барьерных функций к задачам:
а) f(u) = х + у -> inf; и еХ = {и = (х,у)еЕ2: g{(u) = х2 - у2 ^0, д2(и) =-х^О};
б) f(u) = у ->inf; ивХ -{и = (х,у) еЕ2: д(и) = sin х + х - у ^ 0};
Bj f(u) = (u - 1)3 -> Inf; ueX = {u = (x,y)eEl: g(u) = -и - 1 ^ 0};
г) к задачам из упражнений 15.1;
д) к задачам из примеров § 2.3, если считать, что множество 7 совпадает с границей
множества X.
§ 18. Метод нагруженных функций
1. Методы, рассмотренные в § 15, 17, объединяет общая идея — в ней
исходная задача минимизации заменяется свойством вспомогательных
задач минимизации, в которых множество имеет более «простую» структуру,
а целевая функция становится более «сложной» и содержит штрафные или
§ 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
357
барьерные слагаемые, учитывающие ограничения, задающие множество
исходной задачи. К методам такого типа относится также метод
модифицированных функций Лагранжа из § 14, в котором вместо исходной задачи
минимизации решается задача поиска седловой точки функции Лагранжа
на «простом» множестве Х0 х Л0. К упомянутым методам идейно
примыкает и излагаемый ниже метод нагруженных функций. Как и выше будем
рассматривать задачу
/(ж)—»- inf; X = {х€ Еп: х€ Х0, д{(х)^0, г = 1, .. ,,т;
9i(x) = 0, г=т+ 1,...,а}. (1)
В методе нагруженных функций задача (1) сводится к задачам
минимизации некоторых вспомогательных функций на множестве Х0и к поиску
минимального решения (корня) некоторого уравнения. Для учета
ограничений типа равенств и неравенств в этом методе также используется идея
штрафов, но, в отличие от метода штрафных функций, в нем нет
неограниченно возрастающих коэффициентов, аналогичных штрафным
коэффициентам. Заметим также, что метод нагруженных функций применим к более
широкому классу задач, чем метод модифицированных функций Лагранжа.
Введем семейство функций
<&(x,t) = L\max{f(x)-t;0}\p<> + MP(x), хеХ0, (2)
зависящее от скалярного параметра t, —оо < t < оо, где Р(х) — уже
знакомая нам штрафная функция множества X:
т з
P(x)='Z{maX{gi{x);0}Y'+ £ \gt{x)\*, (3)
г = 1 г — m + 1
величины р,- > 1, г = 0, ..., з, L > О, М > 0 фиксированы и являются
параметрами метода. Положим
P(t)= inf Ф(х,г). (4)
Поскольку Ф(х, t) ^ О при всех i иже Х0, то p(t) ^ 0 при любом t.
Предположим, что в задаче (1) ft> —оо, Х¥ф(д. Возьмем произвольную точку
ж, 6 I,. Тогда P(xt) = 0 и ¢(^,/,) = 0. Следовательно, р(Д)=0, т. е. /„
является корнем уравнения
P(t) = 0. (5)
С другой Стороны, Ф(х, t) > 0 при всех (</, h'i£ Х0, и поэтому можно
ожидать, что для широкого класса задач будет выполняться неравенство
p(t) > 0 при всех t < /„. Если это в самом деле так, то задача поиска /„
сведется к поиску минимального корня уравнения (5). Такое сведение
задачи минимизации привлекательно тем, что для поиска минимального корня
уравнения (5) с одной неизвестной могут быть использованы такие
широко известные методы решения уравнений, как методы деления отрезка
пополам, простой итерации и т. п. [59; 74; 89]. Основная идея метода
нагруженных функций описана.
Заметим, что в этом методе могут быть использованы и другие
конструкции функции Ф(х, t), отличные от (2). Например, можно принять
Ф(х,г) = ь\/(х)-г\*> + МР(х), хеХ0, -оо<*<оо, (6)
где функция Р(х) взята из (3), L > О, М > 0, р{ ^ 1. Повторив предыдущие
рассуждения для функции p(t), определяемой из условий (4), (6), можно
358 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
показать, что здесь также р(/*) = 0, и высказать гипотезу о том, что для
широкого класса задач (1) число ft, по-видимому, будет минимальным корнем
уравнения (5).
2. Прежде чем переходить к формулировке условий, при которых
высказанная гипотеза в самом деле будет справедлива, рассмотрим примеры. Во
всех примерах ограничимся рассмотрением функций Ф(х, t) из (2) и (6) при
L=M = pq = ...=p, = 1.
Пример 1. Задача: f(x) = — х —»inf, х € X = {.х е Еи. д(х) = х <0}.
Здесь ft = О, xt = 0. Функция (2) имеет вид
Ф(х, t) = max{- х - t; 0} + тах{ж; '0}, х е Х0 - Е'.
Если t >0, тоФ(0, t)=0 = ini<b(x, t) = p(t). Если же t <0, тоФ(а:, *) = жпри
х^ — t, Ф(х, t) = —t при 0<я;<— t; Ф(х, t) = — х — t при х <0 (нарисуйте
график функции Ф(х, t) при различных t). Поэтому т1Ф(х, t) = p(t) = — t
при t <0. Таким образом, p(i) = max{—1;0}. Очевидно, минимальный
корень уравнения (5) здесь совпадает с /„=-0.
Функция (6) будет иметь1 вид
Ф(х, t) = | - х- t\ + max{a:;0}, хеЕ1.
Если t ^0, то, взяв х = — t, получим Ф(—t; t) = 0=p(t). Если же t <0, то
Ф(х, t) = 2x + t при ж> -t; Ф(ж, t) = -t при 0< я; < -*; Ф(х, t) — -x-t
при ж<0, и, следовательно, p(t) = — t при t <0. В рассматриваемой задаче
функции p(t), построенные на основе функций (2) и (6), совпали.
Пример 2. Пусть f(x) — х, X = {хеЕ1: д(х) = х2 — 1 <0}. Ясно, что
здесь X = {хЕ.Е1: —1^а:^1 },/„ = —1,¾ = — 1. Если согласно (2) принять
Ф(ж, t) = max{a: - t; 0} + max{a:2 — 1; 0}, xeX0 = El,
то нетрудно показать, что р(Ь) — ЫФ(х, i) = max{—t — 1;0}. Если же за
основу взять функцию (6), то Е'
Ф(ж,*)=|я;-*|+тах{я;2-1;0}, хеЕ1, p(i)=inf Ф(х, t)= max{|i|-l; 0}.
В рассматриваемой задаче функции p(t), построенные с помощью
функции (2) и (6), оказались разными, но минимальный корень уравнения (5) в
обоих случаях совпадает с /„ = — 1.
Пример 3. Пусть f(x) — x, Х = {хеЕ1; д(х) = х2 = 0}. Тогда X = {0},
f„ = 0, ^ = 0. Для функции (2), Ф(х, t) = max{a; - t;0} + х2, х е Х0 = Е\
получим
(0, t>0,
P(t)=l t2, -1/2<* <0,-
[ —t — 1/4, t < —1/2.
Если взять функцию (6), то Ф(х, t) — \х — t\ + х2, х € Ех, и
р(*)Л '*' l*^1/2'
W \ |*| — 1/4, |*| > 1/2.
Здесь также минимальный корень уравнения (5) совпадает с /* = 0.
§, 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
359
Однако нетрудно привести примеры задач (1), когда минимальный корень
уравнения (5) строго* меньше ft.
Пример 4. Пусть f(x) = x, Х = {хвЕ1: д(х) = (х2- 1)(я;4+ I)-1 ^
< 0}. Здесь X = {х € Е'1: - 1 < х < 1} и, очевидно, ft = -1, xt = -l. Если
согласно (2) примем,
Ф(х, t) = max{a;- t;0}+ тах{д(х);0}, х еХ0 = Е\
то при t ^ — 1 получим1 Ф(—1, t) = 0 = т1Ф(а;, t) = p(t). При t < — 1, взяв
хк = —к ¢. t, также будем иметь lim Ф(-к, t)= \im д(-к) = 0 = ЫФ(х, t) =
к ~> оо к—юо К1
= p(t). Таким образом, в рассматриваемом случае p(t) = 0 при всех t. Если
в качестве минимального решения уравнения (5) здесь взять tt = —оо, то
получим tt < ft = -1.
Рассмотрим функцию (6)
Ф(х, t) = \x - t\ + тах{д(х);0}, х€ Х0 = Е1.
Если |t| < 1, то при х = * получим Ф(*, t) = 0 = p(t). Пусть |*| > 1. Введем
множества A, = {xeEl: \x-t\ < Щ^-}, А2 = {хеЕ2: \х-1 \ > Щ^-}. Так
как А{ \JA2 = El, А{ ПА2 = 0, то тогда p(t) = infФ(х, t) = min{in№(a;, t);
inf Ф(а;, t)\ ^ min{min fif(a;); (|t| — 1)/2} > 0 при всех t, \t\> 1. На первый
A2 A1
взгляд создается впечатление, что здесь /„ = — 1 —минимальный корень
уравнения (5). Однако 0 < p(t) ¢. Ф(*, t) = g(t) при \t\ > 1 и lim p(t) =
t —> —оо
= lim #(4) = 0. Поэтому есть основание считать, что минимальный корень
t —> —оо
уравнения (5) и в этом случае равен tt = —оо < ft.
Любопытно сравнить задачи из примеров 2 и 4. В них функции f(x)
и множества X совпадают. Но эти задачи отличаются способом задания
множества X. Это различие приводит к тому, что в примере 2 минимальный
корень tt уравнения (5) совпадает с ft, а в примере 4 получим tt <'/„.
Отсюда можно сделать вывод: для выполнения равенства tt = ft, лежащего
в основе метода нагруженных функций, исходные данные задачи (1) должны
удовлетворять некоторым дополнительным условиям, они должны быть как-
то согласованы. Для формулировки этих условий нам прежде всего нужно
уточнить, что понимать под минимальным корнем уравнения (5).
Определение 1. Число tt назовем минимальным корнем
уравнения (5), если p(tt) = 0, p(t)>0 при всех t < tt и lim p(t)>0. Ее-
t —> —оо
ли же lim p(t) = 0, то примем t„ = —оо. Если p(t) > 0 при всех t > 0 и
t —> —ОО
lim p(t)>0, то по определению положим tt = oo.
t —* —оо
Чтобы показать, что все указанные в определении 1 возможности в самом
деле могут реализоваться, рассмотрим еще несколько примеров.
Пример 5. Пусть
X,
-к2,
х2-1,
б/и,
х>-2,
-(k + l)<x^-k,
' N <2,
|ж| > 2,
/С — /,) Oj
I к-— ■ к- —»— ■ ■ *г '/■ s. к- л: zz у . л
(7)
I Т" — I ITI <. 7
360 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
X = {х е Е' = Х0: д(х) < 0}. Тогда /* = — 1, х„ = — 1. Рассмотрим функцию (6)
Ф(х, t) = \f(x)- t\ + max{g(x);0}, хеЕ1.
Покажем, что р(—к2 — к) ^ к, к = 2, 3,... В самом деле, если х > —2, то
Ф(х, — к2 — к)~^\х + к2 + к\ = к2 + к + х^ к2 ^ к при всех к = 2, 3,... Если
-\i + l)<x^-i, 2<г<&, тоФ{х,-к2-к)^\-12+к2+к\ = к2-г2+к^к, а
если -{i + \)<x<.-i, i^k + l, тоФ(ж, -k2-k)^\-i2+k2+k\ = i2-(k + l)2+
+ k + l^k + l> к. Таким образом, Ф(х, —к2 — к)^к для всех хе Е\ поэтому
р(—к2—к)^к\ к = 2, 3,.. .Следовательно, lim p(t)= lim р{—к2 — к) — оо,
t —* —оо к ~юо
С другой стороны, 0< р(—к2)^.Ф(—к, — к2) — д(—к) = 6к'1, к =2, 3,..., так
что lim p(t)= lim р(—к2) = 0. Согласно определению 1 тогда tt = — оо <
t —> -оо k—too
Остановимся также на функции (2)
Ф(х, t,) = max{f(x)- t\0} + max{g(x)\0}, хеЕ1.
Нетрудно видеть, что если t ^-1, то Ф(— 1, t) — 0=p(t). Если же t < — 1, то
при кл/^i получим Ф(—&, i) = max{-fc2-1; 0} + д(-к) = д(—к)—»0 = p(i).
Таким образом, здесь /э(4) = 0 при всех t и согласно определению 1 имеем
** = -оо.
Пример 6. Переопределим функцию f(x) из (7) в точках х — к"1 так:
/(fc-1) = —к2, к = 1, 2,. .. Функцию д(а;) и множество X оставим такими
же, как и примере 5. Повторив прежние рассуждения, нетрудно убедиться,
что минимальный корень уравнения (5) здесь будет равным tt = ft как при
использовании функции (2), так и функции (6). В отличие от примера 5,
здесь ft = —оо, поэтому справедливо tt = ft.
Любопытно посмотреть, что будет, если множество X из (1) пусто, но Х0
непусто. В этом случае задача (1), конечно, перестает быть содержательной,
но тем не менее функции Ф(х, t), p(t) из (2), (4), (6) будут иметь смысл.
Пример 7. Пусть/(ж)=1, X = {xeEl: g(x) = e~xl ^0}. Здесь Х0=Е1,
X =0. Согласно формуле (2) имеем Ф( х, t) = max{ 1 - t; 0} + e~x", x e E',
поэтому p(i) = max{l — t; 0} и tt=\. Если же воспользуемся функцией (6)
Ф(ж, i) = |l - i| + e-*2, то p(i) = |l - i| и i„ = l.
Если здесь взять д(х) = е-*2 + 1, то получим p(t) — тах{1 — t\ 0} + 1 для
функции (2) и p(t) = |1 — t| + 1 для функции (6), так что минимальный
корень уравнения (5) согласно определению 1 будет равен tt — оо.
Пример 8. Пусть f(x) = х, X — {хЕЕх: д(х) = е"*2 < 0}. Здесь
Хй — Е\ Х = 0. Согласно (2) имеем Ф(х, t) = max{a; - t; 0} + e~xl. Так
как при х = — к ^ t функция Ф(—к, t) = е~к —» 0 при к —» оо, то p(t) =
= 0 при всех t, и tt = —оо. В случае функции (6) Ф(х, t) = \х — t\ +
+ e-*2 = min{ inf Ф(ж, i); inf Ф(х, t)} ^ min{ inf e-*2; 1) = c(t) > 0
при всех x € El, поэтому p(t)>0 при всех t. Ho 0< p(t) <Ф(*, t)—>0 при
t —» +oo или t —» — оо, так что lim p(t)= lim p(t) = 0 и t„ = —oo.
( —> +oo £ —> —oo
Если же здесь взять д(х) = е-*2 + 1, то Ф(я;, t) ^ 1, а; е i?1 и p(t) ^ 1 при
всех t, и поэтому *„ = +оо.
§ 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
361
3. Примеры 7, 8 подсказывают, что для того чтобы единообразно охватить
возможность, когда в задаче (1) X = 0, целесообразно принять
f inf/(i), Хф0,
L=\ х (8)
\ +оо, х = 0, хоф0.
Тогда справедлива следующая
Теорема 1. Пусть функция p(t) определена формулой (4), где
функция Ф(х, t) взята из (2) или (6). Пусть *„ —минимальный корень
уравнения (5) в смысле определения 1, а величина /„ определена
согласно (8). Тогда *» < /„.
Доказательство. Если X = 0, то /„ = +оо и утверждение
теоремы тривиально. Поэтому пусть X ф 0. Так как мы условились
рассматривать функции, принимающие лишь конечные значения в области
своего определения, то /, < оо. По определению /„, существует
последовательность {хк} е X такая, что lim /(¾) = /„ ^ — оо. Если /„ > —оо, то
к ~> оо
lim ¢(¾) /») = 0 = р(/„) и поэтому *„ < /„. Если же /„ = — оо, то, взяв
к ~> оо
^ = /(¾). получим р(*Л) = Ф(а;Л, tfc) = 0, fc = 1,2,. . . Поскольку {ifc}-»-oo,
то отсюда следует lim p(t)= lim p(tk) = О, так что ** = /* = —оо. Теорема
t __, _оо к ~юо
доказана. П
Рассмотренные выше примеры показывают, что для выполнения
равенства t* =/* важное значение имеет способ задания множества X:
ограничения, задающие множество X должны быть как-то согласованы с
минимизируемой функцией f(x). Напоминаем, что в § 15 было введено понятие
согласованной постановки задачи (1) на X, (см. определение 15.2),
означающее, что для любой последовательности {хк}ЕХ0, которая удовлетворяет
условиям
lim gf{xk) = 0, i = 1,..., в, (9)
к ~* оо
имеет место соотношение
JiSL/(¾) > Л- (Ю)
к ~* оо
Распространим это понятие на случай, когда Хоф0, Х=0и
согласно (8) /„ = +О0. Здесь следует различать две возможности: inf Р(х) = 0 и
infP(a;)>0. Если inf Р(х) = 0, то существует хотя бы одна
последовательно -¾
ность (¾} е Х0, удовлетворяющая условиям (9), — в этом случае скажем,
что задача (1) имеет согласованную постановку на Х0, если для любой
последовательности (¾} е 10, для которой справедливы соотношения (9),
имеет место равенство lim /(¾) = +00 = /,. Кстати, это же равенство по-
к ~> оо
лучается и из (10) при /„ = +оо. Наконец, если Хо^0, X = 0, infP(a;)>0,
хо
то по определению будем считать, что задача (1) имеет согласованную
постановку на множестве Х0.
Оказывается, введенное понятие согласованной постановки задачи (1)
играет важную роль при выяснении того, будет ли *» = /, или *»</».
Теорема 2. Пусть функция p(t) определена формулой (4), где
функция Ф(х, t) взята из (2) или (6), пусть *„ —минимальный корень
уравнения (5), а величина /, определена формулой (8). Тогда для выпол-
362 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
нения равенства £* =/* необходимо и достаточно, чтобы задача (1)
имела согласованную постановку на множестве Х0.
Доказательство. Необходимость. Пусть tt = /„. Если
/„ = —оо, то постановка задачи (1) согласована, так как lim /(3^)^-00 = /,,
к —t оо
для любой последовательности (¾} € Х0. Поэтому пусть /„ > —оо.
Возьмем произвольную последовательность (¾} е Х0, удовлетворяющую
условиям (9). Согласно определению (3) функции Р(х) тогда lim Р(хк) = 0. От-
к —t оо
сюда и из неравенств Ф(хк, t) ^ p(t) > 0, справедливых для всех t < tt = /„
и /: = 1,2,..., при к —»оо получим
lim maxff(at)-t;0>^p(t)>01 t < i„ (И)
к —* оо
в случае использования функции (2) и
M_\f(xk)-t\^p(t)>0, t<t„, (12)
А: —* оо
в случае использования функции (6).
Покажем, что из (11), (12) следует неравенство lim /(¾) ^ £* = /*. В
к —* оо
самом деле, при выполнении (11) для каждого t < tt найдется номер /¾ =
= ko(t) такой, что max{/(^)-i;0}^p(i)/2>0 или/(^)-4 ^р(*)/2>0
для всех к^-кд. Тогда lim /(¾) ^ t при любом i < i„. Устремляя t —» i„ — О,
& —* оо
отсюда получим неравенство lim /(¾) >£* = /*.
& —* 00
Рассмотрим случай (12). Пусть lim /(¾) = lim /(¾ ) = а. Имеются две
k-too г-too
возможности: либо а^ *,, либо а< i„. Если а^ *„, то требуемое неравенство
lim /(¾) ^ t» = /» установлено. Остается рассмотреть возможность а< i„.
А: —* оо
В этом случае величина а не может быть конечной.
Допустим противное: пусть —оо < а< *„. Тогда при t = а получим
lim 1/(¾) — а.| = | lim /(¾ ) - а\ = О,
что противоречит условию (12). Таким образом, если а< tt, то а=—оо, т. е.
lim f(xk) = lim /(¾ ) = —00. Тогда, взяв £,. = /(¾ ), r = 1, 2,.. ., получим 0<
fc-too г-too
<р(*г)<Ф(ж^ , /(¾ )) = MP(xt)—>0 при г—»оо. Это значит, что lim p(t) =
r !-t-oo
= lim p(tr) = 0 и согласно определению 1 тогда tt = — 00. Но по условию *„ =
г—t 00
= /,, поэтому Jim_ /(¾) = /» = *« = — 00, дело свелось к ранее рассмотренному
к —* оо
случаю.
Тем самым установлено, что для любой последовательности (¾} 6 Х0,
удовлетворяющей условиям (9), справедливо неравенство (10). Наконец,
если такой последовательности (¾} не существует, т. е. inf Р(х)>0, то за-
дача (1) имеет согласованную постановку по определению. Необходимость
доказана.
Достаточность. Пусть задача (1) имеет согласованную
постановку на Х0. Покажем, что тогда i„ = /„. Сначала рассмотрим случай, когда
*„ = — оо. Это значит, что lim p(t)= lim p(tk) — 0, где {tk}—»— 00. По опре-
( _, _оо k—t 00
делению p(tk), согласно формуле (4), следует существование точки хк 6 Х0
§ 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
363
такой, что p(tk) < Ф(^1 */,) < P(*fe) + 1Д. к = 1,2, ... Отсюда при к —>оо
имеем lim Ф(хк, tk) = 0. Это означает, что lim Р(хк) — 0и lim max{/(a;j£)-
/: —> оо /: —> оо /: —> оо
— tk; 0} = 0 в случае использования функции (2) и lim \f(xk) — tk\ = 0— в
к ~> оо
случае функции (6). Но по построению {tk} —»— оо, поэтому последние два
равенства возможны только при lim f(xk) = —оо = t„. С другой стороны, из
к ~> оо
{P(a;t)}—>0 и формулы (3) следует выполнение условий (9). В силу (10)
тогда lim f(xh) ^ /». Следовательно, /„ = tt = -оо.
к —* оо
Пусть теперь t„ > —оо. В силу теоремы 1 тогда /«>*«> —оо.
Возьмем произвольное t < /„. По определению p(t) существует
последовательность {хк} е Х0 такая, что lim Ф(хк, i) = p(t). Может случиться, что
к ~> оо
lim Р(хи) = d > 0. Тогда из Ф(хк, t) > МР(хк) при fc —» оо следует, что
к —> оо
p(t)^ М \im_P(xk) = Md >0. Если же Jim_P(a;t) = 0= lim Р(хк), то
/: —> оо к —юо г-4 оо
lim 5^(¾ ) = 0, г = 1,..., 5. В силу (10) отсюда имеем lim f(xk )>/*>*.
Г—> оо Г к—> оо г
А тогда p(t) = lim ¢(¾ , t) ^ L (/„ — t)4» > 0 как в случае использования
г —юо г
функции (2), так и функции (6). Тем самым показано, что p(t) >0 при всех
t < /„. Кроме того, в рассматриваемом случае *„ > —оо по определению 1
имеем lim p(t) > 0. Следовательно, t» > /„, что в силу теоремы 1 возможно
t —> —оо
только при i„ = /,. Теорема доказана. □
В § 15 были приведены достаточные условия, гарантирующие
согласованную постановку задачи (1) на Х0 (см. теорему 15.2, леммы 15.1, 15.5).
4. Подробнее остановимся на частном случае функции (2), когда
Ф(х, t) = imax{/(x) -t;0} + MP(x), х е Х0, (13)
где L > 0, М > 0, а функция Р(а:) взята из (3) при некоторых рг ^ 1, i = 1 s.
Оказывается, функция (13) и соответствующая ей функция p(t) обладают рядом полезных свойств,
облегчающих поиск минимального корня уравнения (5).
Теорема 3. Функции Ф(ж,<), p(t), определяемые формулами (13),(4), монотонно
убывают (вообще говоря, не строго) при возрастании t и удовлетворяют неравенствам
Щх,г)-Ф(х,т)\^Ь\г-т\, (14)
\p(t)-p(T)\$L\t-T\ (15)
при всех х е Х0 и любых t, т. Если ftt = inf f(x) > -оо, mo
Ф(х,г) = -Ы+Ь/(х) + МР(х), p(t) = -Lt'+inf(Lf(x) + MP(x)) (16)
хо
при всех t ^ Д„ —линейные функции по t.
Доказательство. Простым перебором возможных значений функции max{d; 6} легко
доказываются неравенства
тах{/(я)- <;0}3*тах{/(а:)-т;0}, t s? т, хвХ0,
|тах{/(я)- <;0}-тах{/(о;)-т;0}|^|< - т\, хеХ0.
Отсюда следует невозрастание функции Ф(х, t) по переменной t и неравенство (14). Далее,
для любых t ^ т имеем Ф(х, t)^Ф(х, т) ^ р(т) или Ф(х, t)^р(т) при каждом хеХ0. Отсюда,
переходя к нижней грани по х е Х0, получим p(t) ^ р(т) при всех t ^. т.
Докажем неравенство (15). Зафиксируем произвольные t, т. По определению нижней грани
при каждом е > 0 существуют точки xt, хт е Х0 такие, что
p(t) ^ Ф(хи t) ^ p(t) + е, р(т) ^ Ф{хг, т) s: р(т) + е.
Тогда, учитывая уже доказанное неравенство (14), имеем p(t)~р(т)^Ф(хт, <)-Ф(а:т) т)+е<
^Ь\г-т\ + е,р(г)-р(т)>Ф(хг,г)-е-Ф(х,т)>-Ь\г-т\~е,т.е.\р(г)-р(т)\^1^-т\ + е
364 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
при любом е > 0. Отсюда при е —» +0 получим неравенство (15). Формулы (16) следуют из
того, что f(x) - t ^ /„„ - * > 0 при всех х е Х0. Теорема 3 доказана. П
Если задача (1) имеет согласованную постановку на Х0 и Д > -оо, то, опираясь на
теорему 3, можно предложить следующий итерационный метод определения Д. Сначала выберем Д
так, чтобы /)(¾) > 0 (например, если /„» = inf/(a:)> -оо, то можно взять любую точку Д ^ Д*).
хо
Следующие приближения определим по формулам
h + i=h+p(4)/L, к =0,1,... (17)
Теорема 4. Пусть функция p(t) ^ 0 при всех t, —оо < t < +оо, удовлетворяет
условию (15), пусть Д —минимальный корень уравнения (5) в смысле определения 1, Д > -оо.
Тогда при любом выборе начального приближения t0, —оо < t0 < Д, последовательность
{Д}, определяемая условиями (17), сходится к Д.
Доказательство. Так как p(t) ^ 0, то из (17) следует, что последовательность { Д}
монотонно возрастает и поэтому существует lim Д = а^ оо. Покажем, что а= Д. По условию
к —» оо
t0 < Д. Допустим, что при некотором к ^ 0 оказалось Д < tt. Тогда p(t) > 0 при всех t ^ Д.
Возьмем произвольное t, tk ^ t < Д,[. С учетом условий (15), (17) имеем
р(*)=р(Д)+Ы*)-р(Д)] > p(h)-L(t-tk) > P(tk)-L(tk+l-tk) = 0, tk^t<tk + i.
Это значит, что p(t) >0 при всех t < tt+ [, т. е tk + [ ^ Д. Может случиться, что p(tk+i) = 0.
Тогда Д + 1 = ** — в этом случае итерации (17) заканчиваются. Если р( Д + ,) > 0, то Д + , < Д
и итерации продолжаются дальше.
Таким образом, имеются две возможности. Либо процесс (17) закончится тем, что p(t0) >
>0,..., р(Д _ ,)>0, р(Д) = 0 — тогда Д = Д — а, утверждение теоремы верно. Либо р(Д) >0,
Д < Д, p(t) > 0 при t < tk для всех к = 0,1,... — в этом случае lim Д = а^. t и p(t) > О
к —» оо
при всех t < а. Покажем, что а= Д. Если последовательность {Д} неограничена сверху, то
а = оо= Д. Если же Д <а<оо, к =0, 1,..., то, учитывая непрерывность функции p(t), из (17)
при к —» оо получим а= a + p(a)/L или р(а) = 0. Это значит, что Д = а при а < оо. Теорема
доказана. D
Заметим, что на каждом шаге метода (17) нужно вычислить одно значение функции p(t),
и для этого в свою очередь нужно решить задачу минимизации
Ф{х, t)->inf; хеХ0. (18)
Поскольку функция (13), вообще говоря, не является гладкой, то это обстоятельство может
вызвать некоторые трудности при решении задачи (18). Однако имеющиеся методы решения
негладких задач минимизации (см., например, [264; 265; 361; 386; 396; 426; 572; 586; 718; 769;
777]) позволяют надеяться на то, что вычисление приближенного значения p(t) не окажется
слишком трудным.
При изложении метода (17) предполагалось, что величины p(tk) известны точно. Однако
задача (18) на практике, как правило, будет решаться приближенно, и точное значение p(tk)
удастся вычислить лишь в редких случаях. Поэтому желательно обобщить итерационный
процесс (17) на случай, когда значения функции известны неточно. Опишем одно из возможных
таких обобщений [143].
Предположим, что вместо точных значений функции p(t) известны лишь некоторые
приближения />„(*), v = 1,2,..., удовлетворяющие условиям
р„(')^°- k(*)~p(')K%, ^ = 1,2,...: ^7, = 0. (19)
Пусть Д — начальное приближение, Д < Д. Пусть (у— 1)-е приближение Д_ [ при некотором
v ^ 1 уже известно. Для определения следующего приближения Д рассмотрим итерационный
процесс
W =*,*+М*,*)А. * = 0,1,...; До = *0. (2°)
аналогичный процессу (17). Поскольку функция pv(t) может не обращаться в нуль ни в одной
точке даже в том случае, когда уравнение (5) имеет конечный минимальный корень (так
будет, например, если pv(t) = p(t) + 7^ ^ % > Щ> т0 процесс (20) следует прекращать не по
критерию pv(tvk) — ^>, как было выше в (17), а по условию вида p„(tvk)<0„, где величина 0„ >0
стремится к нулю при v—»00 и как-то согласована с погрешностью 7„. Предположим, что такая
последовательность {6V} уже задана (условия согласования {ви} и {7„} будут обсуждаться
ниже). Тогда имеются две возможности:
§ 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
365
1) либо найдется номер к = kv ^ 0 такой, что
Ру{*А)>0у, fc=° K-h МЧ^в": (21)
в этом случае процесс (20) заканчивается и полагаем
2) либо *>-** (22)
9ЛКк)>К при всех к =0,1,... (23)
Тогда, как будет показано ниже, при выполнении условий (15), (19) и согласованном
изменении величин 9и и),, будет справедливо равенство
t„ = oo. (24)
Метод поиска минимального корня уравнения (5) при условиях (15), (19) описан.
Теорема 5. Пусть функция p(t) неотрицательная при всех t, не возрастает,
удовлетворяет условию (15), a tt> —оо —минимальный корень уравнения (5) в смысле
определения 1. Кроме того, пусть функция {/>„(*)} удовлетворяет условиям (19) и
0„Z%, 1,= 1,2,... (25)
Тогда последовательность {<„}, определяемая методом (20)-(24), сходится к tt при
любом выборе начального приближения t0, —оо < t0 < tt. При этом, если tt < оо, то
итерации (20) при каждом v ^ 1 будут заканчиваться за конечное число шагов выполнением
условий (21); случай (23) возможен лишь при t„ = оо.
Доказательство. Сначала рассмотрим случай tt < оо. Тогда при каждом
фиксированном v ^ 1 имеются две возможности:
1) t k ^ tt < оо при всех k = 0,1,... В силу монотонности {tuk\ тогда существует lim tvk ^
к —► оо
^ t < оо. Переходя в (20) к пределу при к —» оо, получим lim />„(*„*.) = 0. Это значит, что
к —t оо
за конечное число итераций процесс (20) закончится выполнением условий (21).
2) Найдется номер I ^ 0 такой, что tvl ^ tt < tu + ,. Тогда с учетом соотношений (15), (19),
(20) получим
** + 1 = **+ РЛ*а)/ь = *«г + Ы*л) - />(*„()]/£ +
+ Ы*л) - Р(К)\/Ь ^ tvl + %/L + i, - tvl = i, + %/L. (26)
Далее, в силу монотонности p(t) имеем p(t) =0 при t ^ tt, поэтому p(tvl + ,) =0. Отсюда и
из условий (19), (25) следует
/v(^ + i) = M'w + i)-/>('w + iK%<^- (27)
Это значит, что условия (21) выполнятся при некотором kv ^ I + 1.
Объединяя обе рассмотренные возможности, заключаем, что при tt < оо процесс (20) при
каждом v ^ 1 заканчивается за конечное число шагов kv выполнением условий (21), причем
в силу (26)
** = ** ^ *»+%,£-', ./=1,2,... (28)
Покажем, что lim t„ = t.. Из (28) имеем lim t„ ^ t.. Пусть lim tu = lim tu = а. Тогда с
I/ _t oo v * I/ -> oo ^ j/-too гнш '.
учетом условий (15), (19), (21) получим
0 s: р(а) < [р(а) - p(tv)\ + [p(tv) - Pv{iv)\ + Pv(tv) ^L\a~ tvJ + ^ + в^-*0
при r —» оо, т. e. p(a) = 0. Ho t„ — минимальный корень уравнения (5), поэтому а^ tt.
Следовательно, lim t„ = lim t„ > t. ^ lim t„. Это значит, что lim t =t . Случай t < oo
[/_, oo ^ r —t oo r I/ —too I/—too
полностью рассмотрен.
Пусть теперь tt = оо и пусть процесс (20) при каждом v ^ 1 заканчивается выполнением
условий (21). Покажем, что тогда {<„} —» оо. Возьмем произвольное число Т > 0. Согласно
определению 1, если t„ = oo, то lim p(t) >0 и p(t) >0 при всех t. Отсюда и из непрерыв-
t —t —оо
ности функции p(t) следует, что inf p(t) = рТ > 0. Так как {0„} ->0, {7„} ->0, то найдется
номер v0 — v0{T) такой, что ву+%<рт при всех i/> ь-0. Тогда p„(*)^p(*)-7i/ ^Рт"% > К
для всех t ^ Т и I/ ^ 1^0. Это значит, что условия (21) не могут выполняться при t^ ^ Т, если
ь< ^ i^0. Тогда согласно (21), (22) tv>T для всех ь< ^ ь<0 = ь'о(Т'). что означает выполнение
равенства lim tv = 00.
366 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Остается рассмотреть случай, когда при некотором v ^ 1 выполняются условия (23).
Выше было установлено, что при t„ < оо процесс (20) при всех v ^ 1 закончится выполнением
условий (21). Следовательно, если при каком-либо v ~& 1 реализуются условия (23), то t„ =оо.
Теорема 5 доказана. D
Заметим, что условие (25) в теореме 5 существенно: его нарушение может привести к тому,
что метод (20)-(24) не будет сходиться.
Пример 9. Пусть f(x) = х ->inf; х е X = Х0 = {х е Е': х^О} — это частный случай
задачи (1), когда д;(а:) = 0(или s = 0). ТогдаФ(х, t) = max{a:-t;0}, х>0и p(t)= inf Ф(х, t) =
= max{-t;0} (ср. с примером 1). Здесь tt = ft—0, ж„ = 0. Если pu(t) = max{—1;0} + у и
®v < 7j/. т0 Pj/(*) ^ 7„ > #„ при всех t. Поэтому в методе (20)-(24) реализуется случай (23), и
искомый минимальный корень tt = 0 уравнения (5) в рассматриваемом случае не будет найден.
Причина этого явления — нарушение условия (25).
Заметим также, что на практике вместо полуоси t0 $; i < оо часто приходится работать на
каком-то отрезке t0 ^ t ^. Т, где величина Т ограничена, например, разрядной сеткой ЭВМ.
В этом случае метод (20)-(24) требует модификации. А именно, итерационный процесс (20)
при каждом v ^ 1 здесь будет заканчиваться определением номера kv ^ 0 такого, что будет
выполнено одно из двух следующих условий:
Ру{*ук)>К. fc=0 *v-i; аЛЧ^*"' Ч^г> (29)
и пи
РЛ**)>0„, k=0 fc„-l; t^-i^T^t^. (30)
В качестве ь<-го приближения t будем брать
*„ = m,n{4;T>' " = li2'-" (31)
Если выполнены все условия теоремы 5, то, немного видоизменив доказательство этой
теоремы, нетрудно установить, что при t0 < tt < Т для достаточно больших номеров v > v0
процесс (20) будет заканчиваться выполнением условий (29) и оценки (28), а последовательность
{<„}, определяемая методом (20), (29)-(31), сходится к числу min{tt;T}. Таким образом,
метод (20), (29)-(31) позволяет определить, принадлежит ли tt отрезку [<q, Т], и в случае
tt е [t0, Т] позволяет найти tt с нужной точностью.
Для определения tt при условиях (19) может быть также использован метод деления
отрезка пополам.
5. Кратко остановимся на случае, когда функция p(t) из (4) определяется с помощью
функции
Ф(х, t) = i|/(x)-t| + MP(x), хеХ0, (32)
где L > О, М > 0, функция Р(х) взята из (3) при некоторых р; ^ 1, г = 1,..., s.
Поскольку \\f(x) — t| - \f(x) — т|| ^ |t — т\, то, рассуждая так же, как при доказательстве
теоремы 3, убеждаемся, что функции Ф(х, t), p(t) из (4), (32) удовлетворяют условиям (14),
(15). Это значит, что для поиска минимального корня уравнения (5) и в этом случае может
быть применен описанный выше метод (20)-(24) или его модификация (20), (29)-(31). Только
условие (25) здесь нужно заменить условием
в„>27„, ./=1,2,... (33)
Такая замена связана с тем, что функция (32), в отличие от (13), а также соответствующая
ей функция p(t), вообще говоря, не будут монотонными (см. примеры 1-8). Справедлива
Теорема 6. Пусть функция p(t) неотрицательна при всех t, удовлетворяет
условию (15), a tt > —оо — минимальный корень уравнения (5) в смысле определения 1. Кроме
того, пусть функции {p„(t)} удовлетворяют условиям. (19), а последовательности {(?„},
{%}—условию (33). Тогда последовательность {*„}, определяемая методом. (20)-(24),
сходится к tt при любом выборе tg. ~~°° < *о < **■ При этом, если tt < оо, то
итерации (20) при каждом v ~& 1 будут заканчиваться за конечное число шагов выполнением
условий (21); случай (23) возможен лишь при tt = оо.
Доказательство проводится дословно так же, как доказательство теоремы 5. Нужно лишь
неравенство (27), полученное в предположении монотонности p(t) и условия (25), заменить
следующим неравенством, вытекающим из условий (15), (19), (26), (33):
P^*4i + i)HM*4i+i)-''(^i+i)W/'(*Hi+i)-P(**)]^%+L(*4i+i-**)^H^^- а
Нетрудно также показать, что при выполнении условий теоремы 6 последовательность {<„},
полученная методом (20), (29)-(31), сходится к min-ft,,; Т}.
§ 18. МЕТОД НАГРУЖЕННЫХ ФУНКЦИЙ
367
Приведем пример, который показывает, что условие (33) в общем случае не может быть
ослаблено.
Пример 10. Пусть J(j;)sO, X — произвольное непустое множество вида (1). Тогда
d>(x,t) = \t(+MP(x), хеХ„и />(*) = |t|; <„ = 0 = / Пусть Pv(t) = |t|'+ %, v =1,2,...
Предположим, что условие (33) нарушено, т. е. ви < 27„. Возьмем начальное приближение
^,= tJ/0<min{7I/ -9V;0}. Тогда pv(tvo)=\tv0\+% = -*„о+% >в„. Далее, tvl=tv0+pv(tv0) =
= 7„ > 0, и снова pv(tvi) = pv(7j/) = 27„ > в ■ Отсюда с учетом монотонности pv{t) при t ^ О
имеем p„(t)^p„(t„i)>0„ для всех t ^ t^,. Это значит, что р„(*,д.)> #„ для всех fc=0, 1,... —
реализовался случаи (23), и искомый минимальный корень tt = 0 уравнения (5) здесь не будет
найден.
Полезно заметить, что при описании методов (17), (20)-(24) и (20), (29)-(31), а также
при формулировке и доказательстве теорем 4-6 никак не использовался тот факт, что
функция p(t) получена из (4) и как-то связана с задачей (1), с методом нагруженных функций.
Это значит, что описанные методы могут быть использованы для поиска минимального корня
уравнения (5) для любой неотрицательной функции p(t), удовлетворяющей условию (15) и
приближенно заданной посредством условий (19).
По поводу метода нагруженных функций см., например, [143; 154; 286; 608; 670].
Упражнения
1. Найти минимальное решение уравнения (5), где функции Ф(ж, t), p(t) определяются
из (2), (3), (6), (13) или (32), и проверить условие tt = Д для задачи: /(ж)-» inf; хеХ = {хеЕ1:
х 6 -¾. 9(х) ^ 0}, где:
а) /(a:) = arctga:, д(х) = х2—4, д(х-{х2-А){х^ + \)~х, д{х) = х, g(x) = x(x2 + l)"1, д(х) = х2,
Х0 = {хеЕи. х> 1}, Х0 = {а;е.Е': х^О}, Х0=Е1;
б) f(x)=xsiax, д(х)=х2-1; д(х)=(х2-1)(х* + 1)-\ g(x)=(x2-l)e-xK, Х0±{хеЕ1: хЩ;
в) f(x) — произвольная функция, X = Х0 = Е ;
г) /(ж) = 1 при х^. 1, f(x) = x"1 при х>\; д(х) = х-\, 0(х) = (а:-2)(а:2 + 1)~'1, д(х) = е"х\
Х0 = {х е Е1: х ^ 0} или Х0 = Е1;
R)f(x)=l,g(x)=x,g(x)=x2 + l,g(x)=e-x\x2+l),g(x)=x2e-xl;X0=El,X0={xeEl:x^0}.
2. Найти функцию p(t) для задачи f(x) ->inf; х е X — {х е El = XQ: д{х) = \х\ — 1 < 0},
беря за основу функции Ф(ж, t) из (13) и (32), сравнить результаты с примером 2.
3. Показать, что если функция p(t) построена с помощью функций (2) или (6) при рь>
> 1, то условия (14), (15), вообще говоря, не будут иметь места (ни с какой константой L).
Указание: рассмотреть задачу (1) при f(x) = 1, X —Х0.
4. Указать такой способ задания множества X из примера 5, чтобы задача имела
согласованную постановку на Х0 = Е1. Рассмотреть возможности д{х) =.\х\ — 1, д(х) = х2 - 1,
д(х) = е~х (х — 1) (воспользуйтесь теоремой 2).
5. Выяснить геометрический смысл методов (17), (20)-(24) и (20), (29)-(31), а также
геометрический смысл условий (25), (33).
6. Проверить, будут ли функции Ф(х, t) из (2), (6), (13), (32), а также соответствующая
функция p(t) из (4) выпуклы, если исходная задача (1) выпукла.
7. Пусть в задаче (1) Д > —оо, Xt ф 0, и эта задача имеет согласованную постановку на
множестве Х0. Пусть последовательность {tk} построена методом (17), а последовательность
{хк} определена условиями: хк е Х0, p(tk) — Ф(хк, tk), к =0, 1,... Можно ли ожидать, что
{хк} —> Xt? Приведите примеры.
8. Пусть функция Лагранжа задачи (1) имеет седловую точку (xt) А*) е Х0 хЛд. Показать,
что эта же точка (xtl А*) является седловой точкой функции Лагранжа для задачи
max{/(a:) - t;0}-> inf; хеХ
при всех t ^ Д. Выяснить связь между множествами точек минимума последней задачи и
задачи (1).
9. Для задачи (1) ввести функцию
Ф,(а:, t) = L max{/(a:); t} + MP(x)> хвХ0,
368 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ-МНОГИХ ПЕРЕМЕННЫХ
гдеР(а:) взята из (3), L >0, М>0, и положить p,(t)= inf ¢,(0:, t). Показать, что Д = р,(/ ).
яеХ0
Можно ли утверждать, что Д будет минимальным корнем уравнения р( (i) — i = 0? Пользуясь
равенством max{/(o;)) t} — max{f(x)~ t;0} + t, установить связь между функциями Ф^х, t),
P\(t) и функциями Ф(х, t), p(t) из (2), (13).
10. Для задачи f(x) -> inf; х е X = {х е Х0, д\(х) ^ 0,..., дщ(х) ^ 0} ввести функцию
G(w,x) = max{f(w)-f(x);gl(w),...igm(w)} или G(w, х) = (/(го) - f(x)) g^w) .. .gm(w)
переменных x, w e X0 и рассмотреть итерационный процесс G(xk + llxk) — inf G(iu, xk)\
исследовать его сходимость (метод центров, [319; 345; 613]). we\
§ 19. О методе случайного поиска
Наряду с описанными выше методами минимизации функций переменных
существует большая группа методов поиска минимума, объединенных под
названием метода случайного поиска. Метод случайного поиска, в отличие
от ранее рассмотренных методов, характеризуется намеренным введением
элемента случайности в алгоритм поиска. Многие варианты метода
случайного поиска сводятся к построению последовательности {хк} по правилу:
Ч + \ = хк + ак£, к=0,1,..., (1)
где ак — некоторая положительная величина, £=(£',...,£") — какая-либо
реализация n-мерной случайной величины £ с известным законом
распределения. Например, координаты £; случайного вектора £ могут представлять
независимые случайные величины, распределенные равномерно на отрезке
[—1, 1]. Как видим, метод случайного поиска минимума функции п
переменных предполагает наличие датчика (или генератора) случайных чисел,
обращаясь к которому, в любой нужный момент можно получить какую-либо
реализацию n-мерного случайного вектора £ с заданным законом
распределения. Такие датчики, оформленные в виде стандартных программ, имеются
в библиотеках подпрограмм на ЭВМ.
1. Приведем несколько вариантов метода случайного поиска минимума
функции f(x) на множестве X С Еп, предполагая, что fc-e приближение
хк 6 X, к ^ 0, уже известно.
а) Алгоритм с возвратом при неудачном шаге. Смысл этого алгоритма
заключается в следующем. С помощью датчика случайного вектора
получают некоторую его реализацию £ и в пространстве Еп определяют точку
vk = хк + а£, а = const > 0. Если vk 6 X и /(¾) < /(¾). то сделанный шаг
считается удачным, и в этом случае полагается xk + i =¾. Если vk е X, но
/(¾) ^ /(¾). или же vk $ X, то сделанный шаг считается неудачным и
полагается хк +, = хк.
Если окажется, что хк = хк +, = ... = xk+N для достаточно больших N, то
точка хк принимается в качестве приближения искомой точки минимума.
б) Алгоритм наилучшей пробы. Берутся какие-либо s реализаций £,,...
...,£„ случайного вектора £ и вычисляются значения функции f(x) в тех
точках х = хк + а£, г = 1, ..., а, которые принадлежат множеству X. Затем
полагается xk + i = хк + аЛ , где индекс ^ определяется условием
/(¾+ «£<,)= pin /(¾+ «£<)•
1 <i<s
Величины s > 1 и а = const > 0 являются параметрами алгоритма.
§ 19. О МЕТОДЕ СЛУЧАЙНОГО ПОИСКА
369
в) Алгоритм статистического градиента. Берутся какие-либо а
реализаций £[,...,£,, случайного вектора £ и вычисляются разности Afki =
= /^ + 7^)-/(¾) Для всех хк + -у^еХ. Затем полагают Рк = ± £ £<Д/Н,
где сумма берется по всем тем г, 1 ^ г ^ а, для которых :¾ + 7^ S X. Если
a;t + apt 6 X, то принимается :¾ +, = % + серк. Если же хк + арк ¢X, то
повторяют описанный процесс с новым набором из а реализаций случайного
вектора £. Величины а > 1, а >0, 7 >0 являются параметрами алгоритма.
Вектор рк называют статистическим градиентом. Если X = Еп, а =п,
и векторы ££ являются неслучайными и совпадают с соответствующими
единичными векторами е; = (0, . . ., О, 1,. . ., 0), г = 1, . .., п, то описанный
алгоритм, как нетрудно видеть, превращается в разностный аналог
градиентного метода.
2. В описанных вариантах а)-в) метода случайного поиска
предполагается, что закон распределения случайного вектора £ не зависит от номера
итерации. Такой поиск называют случайным поиском без обучения.
Алгоритмы случайного поиска без обучения не обладают «способностью»
анализировать результаты предыдущих итераций и выделять направления, более
перспективные в смысле убывания минимизируемой функции, и сходятся,
вообще говоря, медленно.
Между тем ясно, что от метода случайного поиска можно ожидать
большей эффективности, если на каждой итерации учитывать накопленный опыт
поиска минимума на предыдущих итерациях и перестраивать вероятностные
свойства поиска так, чтобы направления £ более перспективные в смысле
убывания функции становились более вероятными. Иначе говоря,
желательно иметь алгоритмы случайного поиска, которые обладают способностью к
самообучению и самоусовершенствованию в процессе поиска минимума в
зависимости от конкретных особенностей минимизируемой функции. Такой
поиск называют случайным поиском с обучением. Обучение алгоритма
осуществляют посредством целенаправленного изменения закона
распределения случайного вектора £ в зависимости от номера итерации и результатов
предыдущих итераций таким образом, чтобы «хорошие» направления, по
которым функция убывает, стали более вероятными, а другие направления —
менее вероятными. Таким образом, на различных этапах метода
случайного поиска с обучением приходится иметь дело с реализациями случайных
векторов £ с различными законами распределения. Имея в виду это
обстоятельство, итерационный процесс (1) удобнее записать в виде
ж* + 1 =¾+ "*£*> fc=0, 1,..., (2)
подчеркнув зависимость случайного вектора £ от к.
В начале поиска закон распределения случайного вектора £ = £0
выбирают с учетом имеющейся априорной информации о минимизируемой
функции. Если такая информация отсутствует, то поиск обычно начинают со
случайного вектора £Q = (£о, .. ч £о)> компоненты £0\ г = 1, . . ., п,
которого представляют собой независимые случайные величины, распределенные
равномерно на отрезке [—1, 1].
Для обучения алгоритма в процессе поиска часто берут семейство
случайных векторов £ = £(«;), зависящих от параметров w = (wl,..., wn), и
при переходе от к-й итерации к (к + 1)-й итерации имеющиеся значения
параметров wk заменяют новыми значениями wk+i с учетом результатов
предыдущего поиска.
370 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
Приведем два варианта метода случайного поиска с обучением для
минимизации функции f(x) на всем пространстве.
а) Алгоритм покоординатного обучения. Пусть имеется семейство
случайных векторов £ = £(w) = (£')•••) £")> каждая координата £' которых
принимает два значения: £* = 1 с вероятностью р1 и £* = — 1 с вероятностью
1 — р', где вероятности р' зависят от параметра wl следующим образом:
о,
5(1+ »').
1 1,
«7* <-1,
|«;'|<1,
wl > 1,
Р£ = < £(1+ «;'), h'l^l, (3)
= 1,..., п.
Пусть начальное приближение 2¾ уже выбрано. Тогда для определения
следующего приближения х1 в формуле (2) при k = 0 берется какая-либо
реализация случайного вектора £0 = £ (0), соответствующего значению
параметров «; = w0 = (0, 0,..., 0). Приближение х% определяется по формуле (2)
при к = 1 с помощью случайного вектора £, = £(0). Пусть известны
приближения 3¾) хи ..., хк и значения параметров «7fc_, = («>*_ n ..., wk_{) при
некотором & > 1. Тогда полагаем
w*=/K_i-« sign [(/(^.,)-/(1^2))(2:4-1-2:4-2)]. (4)
где величина /3>0 называется параметром забывания, 8 ^0 —
параметром интенсивности обучения, /3 + 8 > 0. При определении следующего
приближения xk + i в формуле (2) берем какую-либо реализацию случайного
вектора £к = £{wk), wk = (wlk,..., wj).
Из (3), (4) видно, что если переход от точки хк_2 к жЛ_, привел к
уменьшению значения функции, то вероятность выбора направления xh-\~ хк-2
на следующем шаге увеличивается. И наоборот, если при переходе от хк_2
кжц., значение функции увеличилось, то вероятность выбора направления
хк-\ ~ хк-2 на последующем шаге уменьшается. Таким образом,
формулы (4) осуществляют обучение алгоритма. Величина 8 ^ 0 в (4) регулирует
скорость обучения: чем больше 8 > 0, тем быстрее обучается алгоритм;
при 8=0, как видно, обучения нет. Величина /3^0 в формулах (4)
регулирует влияние предыдущих значений параметров на обучение алгоритма;
при /3=0 алгоритм «забывает» предыдущие значения wk_x. Для
устранения возможного чрезмерного детерминирования алгоритма и сохранения
способности алгоритма к достаточно быстрому обучению, на параметры wi
накладываются ограничения \wj.\ < с,., и при нарушении этих ограничении
wl заменяются ближайшим из чисел с{ и — с,., г = 1, ..., п. Величины /3, 8,
с{ являются параметрами алгоритма.
Вместо формул (4), посредством которых производится обучение
алгоритма, часто пользуются другими формулами
^t=(3w,k_l-8(f(xk_l)-f(xk_2))(x'k_l-xl_2), г=1,...,п, к=2, 3,. .. (5)
Описанный алгоритм покоординатного обучения имеет тот недостаток,
что поиск и обучение происходят лишь по одному из 2т направлений
£=(£']...)£"), где либо £' = 1, либо £'' = — 1. Отсутствие
«промежуточных» направлений делает покоординатное обучение немобильным в
областях с медленно изменяющимися направлениями спуска. От этого недостатка
свободен следующий алгоритм.
§ 19. О МЕТОДЕ СЛУЧАЙНОГО ПОИСКА
371
б) Алгоритм непрерывного самообучения. Пусть имеется семейство
случайных векторов £ = £(w)= ,4 w,, где w — (wl, . .., wn) — параметры
обучения, 77 = (771,..., 77")— случайный вектор, координаты 77' которого
представляют собой независимые случайные величины, распределенные
равномерно на отрезке [—1, 1]. Поиск начинается с рассмотрения
случайных векторов £о —£(0)> £1 =£(0). реализации которых используются при
определении приближений Xq, х{ по формулам (2). Обучение алгоритма при
к ^ 2 производится так же, как в алгоритме покоординатного обучения, с
помощью формул (4) или (5). При больших значениях \wk\ влияние
случайной величины 77 уменьшается, и направление £к = £(wk) становится более
детерминированным и близким к направлению wk. Во избежание излишней
детерминированности метода на параметры wk — (wl, ..., w£)
накладываются ограничения \wk\ < с = const, и при нарушении этих ограничений wk
заменяется на т-^с.
\wk\
Приведенные алгоритмы случайного поиска с обучением показывают, что
процесс обучения в ходе поиска сопровождается уменьшением фактора
случайности и увеличением степени детерминированности алгоритма поиска
минимума, направляя поиск преимущественно по направлению убывания
функции. В то же время наличие случайного фактора в выборе
направления дает возможность алгоритму «переучиваться», если свойства функции в
районе поиска изменились или предыдущее обучение было неточным.
Случайный поиск с обучением в некотором смысле занимает промежуточное
положение между случайным поиском без обучения и
детерминированными методами поиска минимума из предыдущих параграфов. Разумеется, и
в методах предыдущих параграфов можно обнаружить в том или ином виде
элементы самообучения алгоритма, однако наличие случайного фактора в
алгоритме делает метод случайного поиска более гибким.
3. Весьма усложняет решение задачи минимизации функций многих
переменных наличие помех, когда на значения функции f(x) в каждой точке
х накладываются случайные ошибки.
Задача минимизации функций при наличии случайных ошибок относится
к задачам стохастического программирования. Более подробно о
стохастическом программировании, о теоретических и вычислительных аспектах
методов случайного поиска, стохастической аппроксимации см., например,
в [34; 77; 128; 226; 251; 256; 262; 301; 302; 305; 308; 318; 374; 377; 401;
495; 518; 538; 542; 586; 610; 662; 709; 713; 720; 777].
§ 20. Общие замечания
Выше были рассмотрены лишь немногие из известных в настоящее время
методов минимизации. Заметим, что по сей день интенсивно продолжается
разработка все новых и новых методов решения экстремальных задач, о
чем свидетельствует неуклонно растущее количество публикаций в научной
печати по этой тематике.
1. Возникают естественные вопросы: чем руководствоваться при выборе
метода для решения той или иной конкретной экстремальной задачи, какой
же метод является наилучшим? Иногда считают, что тот метод лучше, у
которого выше скорость сходимости на некотором фиксированном классе
372 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
задач. Однако при таком способе оценки методов не принимается во
внимание такое важное качество, как трудоемкость каждой отдельно взятой
итерации метода. Нередко бывает, что при решении конкретной задачи
выгоднее применять метод, который сходится не очень быстро й для получения
решения с нужной точностью требует довольно большого числа итераций,
но тем не менее из-за того, что каждая итерация метода осуществляется
просто, суммарный объем вычислений и, следовательно, общее машинное
время для получения решения оказывается меньшим, чем при применении
другого быстросходящегося метода, каждая итерация которого весьма
трудоемка. Таким образом, при характеристике метода минимизации важным
является не столько скорость его сходимости, сколько общий объем
вычислений, общее машинное время, необходимое для получения решения с
нужной точностью.
При практическом использовании методов значительная часть времени,
отведенного на расчеты, часто затрачивается на вычисление значений
минимизируемой функции или ее производных. Поэтому в тех случаях, когда
вычисление значений функции намного проще вычисления ее производных,
естественно, выгоднее пользоваться теми методами, которые для своей
реализации требуют лишь вычисления значений функции. Конечно, возможны
и такие ситуации, когда имеются простые аналитические выражения для
производных минимизируемой функции, — в таких случаях, возможно,
выгоднее применять методы, использующие градиент или производные более
высокого порядка.
Важными характеристиками метода минимизации являются также
область сходимости метода, устойчивость метода к погрешностям, объем
памяти ЭВМ, необходимой для реализации метода, удобство программирования,
широта класса задач, к которым применим метод, и т. п.
Большое количество разнообразных и отчасти противоречивых
характеристик методов, недостаточная разработанность методики оценки
упомянутых характеристик затрудняют сравнение методов друг с другом. Иногда
для сравнения методов минимизации задают некоторый набор тестовых
задач (набор таких задач см., например, в [613; 738]) и лучшим признают тот
метод, с помощью которого удастся решить указанные тестовые задачи с
нужной точностью за меньшее число итераций, меньшее число вычислений
значений функции или ее производных, или за меньшее машинное время.
Несомненно, такие «соревнования» методов полезны, хотя и на их основе
нельзя делать окончательные выводы о преимуществах того или иного
метода. Здесь следует также заметить, что один и тот же метод, примененный
для минимизации одной и той же функции, может привести к различным
результатам в зависимости от того, на каком алгоритмическом языке
составлена программа, каково качество транслятора (квалификация
программиста), на какой ЭВМ решается задача и т. д.
Конечно, хотелось бы иметь метод, наилучший во всех отношениях.
Однако такого универсального метода пока нет, и вряд ли такой метод
существует. Поэтому для эффективного решения конкретной задачи
минимизации, по-видимому, нужно разумно сочетать различные методы с учетом
всевозможной априорной информации о решаемой задаче (гладкость
исходных данных, выпуклость, физические или какие-либо иные соображения об
области возможного расположения точки минимума и т. д.), имеющихся
вычислительных средств, ресурсов машинного времени и т. п. В тех случаях,
когда нет никакой априорной информации о задаче, которую нужно решить,
§ 20. ОБЩИЕ ЗАМЕЧАНИЯ
373
по-видимому, сначала полезно попробовать применить не очень точные, но
простые методы минимизации (например, метод перебора значений
функций на сетке с небольшим числом узловых точек, метод покоординатного
спуска, метод случайного поиска), а затем на основе накопленной
информации при необходимости перейти к более точным методам.
2. Успешное решение различных классов прикладных экстремальных
задач невозможно без пакета минимизации, состоящего из библиотеки
подпрограмм, охватывающей достаточно много методов минимизации, а
также управляющих и вспомогательных программ. Пакеты минимизации могут
быть использованы в автоматизированном или диалоговом режиме.
При работе с пакетом в диалоговом режиме математик-вычислитель,
получая сведения о текущих результатах, оперативно вмешивается в процесс
минимизации, осуществляет переход от одного метода к другому,
изменяет параметры методов, параметры программ. Диалоговый режим работы с
пакетом минимизации позволяет лучшим образом использовать опыт и
интуицию математика-вычислителя и предъявляет высокие требования к его
профессиональным знаниям в области методов решения экстремальных
задач.
В тех случаях, когда пользователь, т. е. специалист, проводящий расчеты,
не является компетентным в области методов решения экстремальных
задач, желательно иметь пакеты минимизации, работающие в автоматическом
режиме. Для работы в этом режиме пакет должен содержать управляющую
программу, обеспечивающую автоматический выбор наиболее подходящей
последовательности используемых методов, их параметров в зависимости
от конкретной решаемой задачи.
Принцип построения пакетов минимизации, примеры таких пакетов
описаны в [286; 499]. Заметим, что создание эффективно действующих и
достаточно универсальных пакетов минимизации, которые могут быть
использованы в различных режимах, представляет собой важную и большую научно-
техническую задачу.
3. Следует обратить внимание читателя на то, что первоначальная
постановка прикладных задач минимизации зачастую бывает достаточно грубой,
упрощенной и предполагает, что в процессе решения задача будет
уточняться. Это значит, что первоначальный вариант задачи не всегда имеет
смысл решать слишком точно. Иногда гораздо выгоднее с помощью
простых методов, с небольшой затратой машинного времени получить грубые
предварительные результаты и затем проанализировать их вместе с
экспертами, с заказчиком. Уже при таком упрощенном анализе может выясниться,
что некоторые параметры и ограничения, ранее казавшиеся
несущественными и поэтому не учтенные в первоначальной постановке задачи, должны
быть включены в нее, и наоборот, часть прежних параметров и ограничений
могут оказаться несущественными и без ущерба для существа задачи могут
быть опущены. Заметим, что процесс уточнения постановки задачи весьма
удобно проводить с помощью пакета минимизации в диалоговом режиме.
Иногда стремятся учесть многие детали задачи и создать слишком
подробную математическую модель исследуемого процесса, а затем пытаются
найти наилучшие, оптимальные значения всех параметров процесса.
Однако такой подход может привести к задаче минимизации с очень большим
числом переменных, и численное решение такой задачи может встретить
непреодолимые трудности. Но даже в тех случаях, когда удается найти
оптимальные значения параметров, их практическое использование может
374 Гл. 5. МЕТОДЫ МИНИМИЗАЦИИ ФУНКЦИЙ МНОГИХ ПЕРЕМЕННЫХ
оказаться невозможным из-за того, что заказчик, будучи не в состоянии
охватить полученную информацию, может не понять разумность
выработанных на ее основе рекомендаций и может от них вообще отказаться. Поэтому
на первых этапах исследования прикладных задач минимизации желательно
пользоваться простыми моделями, учитывающими основные, определяющие
параметры.
4. К сожалению, последнему совету удается следовать не всегда.
Например, математические модели социально-экономических процессов,
достаточно адекватно отражающих основные закономерности, как правило,
чрезвычайно сложны, содержат большое число переменных и приводят к
так называемым задачам минимизации большой размерности. Численное
решение таких задач обычными методами становится невозможным даже
при использовании самых мощных современных ЭВМ. Некоторые классы
задач большой размерности допускают разбиение на ряд слабо связанных
между собой подзадач, имеющих сравнительно небольшие размерности,
решая которые, иногда удается получить приближенное решение исходной
задачи. Следует заметить, что задачи минимизации большой размерности
к настоящему времени изучены недостаточно. Некоторые методы решения
таких задач см., например, в [222; 470; 564; 613; 711; 746; 747; 759].
5. В ряде методов минимизации, описанных выше, предполагалось, что
начальная точка Xq, принадлежащая множеству X, известна. Для
некоторых множеств, таких как, например, параллелепипед, шар, гиперплоскость,
указать такую точку 2¾ совсем нетрудно. Однако не следует думать, что
определение точки 2¾ из любого множества X всегда просто. Например,
если
X={xeEn:gt(x) = 0, г = 1, ...,*}, (1)
то для определения точки х^еХ нужно решать систему уравнений (вообще
говоря, нелинейных). Чтобы найти какую-либо точку множества
Х={хеЕп: хеХ0, &(ж)<0, г=1,.. .,т, д((х)=0, «=т+1,.. .,s}, (2)
придется решать смешанную систему уравнений и неравенств.
Определение решения систем линейных или нелинейных уравнений и неравенств
представляет собой весьма серьезную задачу, которой посвящена
обширная литература; см., например, [59; 74; 89; 131; 192; 214; 222; 286; 334;
444; 480; 481; 550; 613; 630-635; 671; 695; 704; 747; 752].
Полезно заметить, что задачу нахождения какой-либо точки Xq,
принадлежащей множеству (1) или (2), можно переформулировать в виде задачи
минимизации. А именно, в случае множества (1) введем функцию
P(x)=ta?(x), гея*,
а в случае множества (2) — функцию
ТП !1
P(z)=£(max{ft(a;);0}y+ £ \д((х)\", х е Х0, р>0.
и рассмотрим задачу минимизации
P(x)->inf; х € Х0.
Для решения этой задачи могут быть использованы любые подходящие
методы минимизации. Если X ф 0, то условие XqE X равносильно условию
Р(х0) — 0 = inf Р(х) = Pt. Если Pt > 0, то X = 0. Если же Pt = 0, но нижняя
§ 20. ОБЩИЕ ЗАМЕЧАНИЯ
375
грань Р(х) на Еп не достигается, то также X = 0. Здесь предполагается,
что множество Х0 имеет столь простую структуру, что нахождение точки
Xq € Х0 не вызывает трудностей.
6. Интересно проанализировать доказательства теорем сходимости
градиентного метода, методов проекции градиента, возможных направлений,
условного градиента и т. д. Такой анализ показывает, что проводимые
рассуждения опираются на предположения одного и того же типа, содержат
много общих моментов, техника получения оценок скорости сходимости
имеет общие черты. Возникает вопрос, нельзя ли создать общую методику
исследования сходимости если и не всех, то хотя бы некоторых достаточно
широких семейств методов минимизации? Оказывается, это возможно. К
настоящему времени сделаны весьма удачные и интересные попытки
создания такой методики, позволяющей единообразно исследовать сходимость
широких классов методов минимизации, получать оценку скорости
сходимости. К сожалению, мы здесь не имеем возможности останавливаться на
этих увлекательных вопросах и отсылаем читателя к работам [77; 286; 319;
374; 495; 542; 582; 586; 613].
Можно, конечно, задаться вопросом: зачем нужны теоремы сходимости
методов? Ведь на практике мы все равно можем реализовать лишь
конечное число шагов используемого метода, и факт сходимости метода как будто
не так уж и важен. К тому же условия теорем сходимости зачастую труд-
нопроверяемы, в них редко учитываются погрешности задания исходных
данных, погрешности в реализации метода. В общем, основания для
сомнений есть. В то же время нетрудно привести немало доводов в пользу теорем
сходимости методов. Такие теоремы подтверждают «добротность»
используемого метода, очерчивают границы его применимости, из них нередко
можно узнать о качественном поведении метода, о его сильных и слабых
сторонах, не прибегая к трудоемким численным экспериментам, в
формулировках и доказательствах таких теорем могут содержаться полезные для
практики конструктивные соображения. Роль теорем сходимости
содержательно обсуждается в [586]. Завершим главу цитатой из [586]:
«теоретические исследования методов оптимизации могут дать много информации
вычислителю-практику. Нужно лишь при этом проявлять разумную
осторожность и здравый смысл».
ГЛАВА 6
Принцип максимума Понтрягина
В этой главе рассматриваются задачи оптимального управления процессами,
описываемыми системами обыкновенных дифференциальных уравнений. Этот класс экстремальных задач
существенно отличается от рассмотренных: если в задачах минимизации функции конечного
числа переменных искомая точка минимума являлась точкой n-мерного пространства, то в
задачах оптимального управления искомая точка минимума представляет собой функцию,
принадлежащую некоторому бесконечномерному функциональному пространству. Такие задачи
имеют многочисленные приложения в механике космического полета, в вопросах управления
электроприводами, химическими или ядерными реакторами, виброзащиты и т. д.
Эффективным средством исследования задач оптимального управления является принцип
максимума Понтрягина [587], представляющий собой необходимое условие оптимальности в
таких задачах. Принцип максимума, открытый коллективом российских математиков во главе
с академиком Л. С. Понтрягиным, представляет собой одно из крупных достижений
современной математики и является краеугольным камнем современной математической теории
оптимального управления. Принцип максимума Понтрягина существенно обобщает и
развивает основные результаты классического вариационного исчисления, созданного Эйлером, Ла-
гранжем и другими выдающимися математиками прошлого. Появление принципа максимума
стимулировало последующее бурное развитие теории экстремальных задач и методов их
решения.
Из обширной литературы, посвященной различным аспектам современной теории
оптимального управления и управляемых систем, их приложений, упомянем [6-10; 12; 14; 15; 21; 31;
34; 36-39; 40-44; 46; 47; 50; 55-58; 67; 72; 79; 81; 93; 96-101; 105; 106; 108; ПО; 115; 121;
132; 134; 135; 137; 140; 141; 148; 151; 198-202; 204-207; 209; 210; 212; 217; 221; 225; 240; 241;
244; 245; 249; 253; 254; 267; 269; 274-280; 282; 283; 286; 288; 291; 293; 310-312; 321-325;
328; 329; 331; 332; 336; 358; 366; 376; 379; 380-386; 406; 409-414; 417; 418; 427; 429-431;
436; 440; 457; 476; 477; 486-488; 497; 498; 500; 502; 503; 505; 513; 528-533; 541; 545; 546;
566; 568-571; 578; 582; 583; 587; 589;602; 611; 616; 637; 643; 646; 653-656; 663; 677; 683; 687;
688; 695; 702; 703; 712; 715-717; 719; 720; 722-724; 726-729; 731-734; 739; 744; 753-756;
781; 787; 809; 818; 819].
§ 1. Постановка задачи оптимального управления
1. Приведем несколько конкретных задач оптимального управления.
Пример 1. Движение плоского маятника, подвешенного к точке опоры
ss//s/,jvs,/// ПРИ помощи жесткого невесомого стержня (рис. 6.1),
в\ \\ как известн0> описывается уравнением
[eYv 1в+ Ьв + mgl sin 9 = M(t),
i V4 где I — длина жесткого стержня маятника, m — мас-
! V\ са, сосредоточенная в конце стержня, I — ml2 — мо-
! ^^- мент инерции, д — гравитационная постоянная (уско-
' т рение силы тяжести), Ъ > 0 — коэффициент демпфиро-
Рис. 6.1 вания, г — время, М(т) — внешний управляющий
момент, в — в(т) — угол отклонения стержня от точки
устойчивого равновесия. Если сделать замену переменной t = rymgl/I,
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 377
то это уравнение можно привести к виду
ф + /3ф + sin ip-u(t), (1)
где
4> = 4>(t) = 6(ty/l/(mgl)), Р = Ь/уД^4, u(t) = M(ty/l/(mgl))/(mgl).
Обозначим xl(t) = ф^) (угол отклонения маятника), a;2(i) = <£>(£)
(скорость маятника). Тогда уравнение (1) запишется в виде системы двух
уравнений первого порядка:
xl(t) = x2(t), ^(4) = -/3^(4)-801^(4) + ^4). (2)
Пусть в начальный момент 4=0 маятник отклонился на угол ж'(0) = Xq и
имеет начальную скорость х2(0) = х$. Будем также считать, что функция
u(t) — управляющий момент (выбор которого может влиять на движение
маятника) — удовлетворяет ограничению
N*)|^7i 7 = const > 0, 4^0. .(3)
Здесь возможны следующие постановки задач оптимального управления:
выбрать управление и(4), удовлетворяющее условиям (3) так, чтобы:
1) за минимальное время Т остановить маятник в одной из точек
устойчивого равновесия, т. е. добиться выполнения условий
а;1(Г) = 27гА;, х2(Т) = 0 (4)
при некотором к, к = 0, ±1,... (задача быстродействия);
2) за минимальное время Т добиться выполнения условия
(х\Т))2 + (х2(Т))2^е,
где е > 0 — заданное число;
3) к заданному моменту времени Т величина (xl(T))2 + (х2(Т))2,
или l(xl(t))2dt, или \((х1(Ь))2+ (x2(t))2)dt, или max 1^(4)1, или
0 0 0<!< т
max max{|a;1(4)|,|a;2(4)|} принимала минимально возможное значение, или
4) в заданный момент Г выполнялось равенство х2(Т)=0, а величина х1(Т)
была максимально возможной (задача о накоплении возмущений), или
5) к заданному моменту Т добиться выполнения условий (4) и миними-
т
зировать величину \ u2(t)dt (условие (3) здесь может быть опущено).
о
Если колебание маятника ограничено какими-либо упорами, то в
перечисленных задачах нужно еще требовать выполнения условия вида
^'(iJl^/z, /х = const >0.
На управление u(t) вместо условия (3) (или наряду с условием (3)) могут
накладываться ограничения вида
т
\ u2(t)dt ^R,
о
где R = const > 0.
378
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
При изучении малых колебаний маятника часто полагают sin (pnstp, и
тогда уравнение (1) и эквивалентная ему система становятся линейными и
будут иметь вид
ф + Рф + ip = u(t)
и соответственно
xl(t) = x2(t), x2(t) = -px2(t)-xl(t) + u(t).
Пример 2. Как известно [249, с. 129], движение центра масс
космического аппарата и расход массы описывается системой дифференциальных
уравнений
r = v, v = gp/G + F, G = -gq, O^t^T, (5)
где t — время, г = r(t) = (r{(t), r2(t), rJt)) — радиус-вектор центра масс
аппарата, v = v(t) = (v^t), v2(t), v3(tf) — скорость центра масс, G =
= G(t) — текущий вес аппарата, д— коэффициент пропорциональности
между массой и весом, р — p(t) = (p^t), ^(t), %(*)) — вектор тяги
двигателя, q — q(t) — расход рабочего вещества, F — F(r, t) = (Fu F2, F3) —
вектор ускорения от гравитационных сил.
В каждый момент времени t движение космического аппарата
характеризуется величинами r(t), v(t), G(t), называемыми фазовыми координатами.
Пусть в начальный момент t = 0 фазовые координаты аппарата известны:
r(0) = r0, v(0) = v0, G(0) = G0. (6)
Величины q = q(t), р = p(t) являются управлением — задавая их по-
разному, можно получить различные фазовые траектории (решения)
задачи (5), (6). Конструктивные возможности аппарата, ограниченность
ресурсов рабочего вещества накладывают на управление q(t), p(t) ограничения,
например, вида
#шп<Ь(4)К%,ах, ЯтЫ < Ч{ * ) < Яшах, О < t < Т,
т
или 5 q2(t)dt < R, R = const > 0. Кроме того, на фазовые траектории за-
о
дачи (5), (6) могут накладываться некоторые ограничения, вытекающие,
например, из условий того, чтобы вес аппарата был не меньше
определенной величины или траектория полета проходила вне определенных областей
космического пространства (областей повышенной радиации) и др.
Здесь возникают задачи выбора управлений q(t), p(t) так, чтобы
управления и соответствующие им траектории задачи (5), (6) удовлетворяли всем
наложенным ограничениям, и кроме того, достигалась та или иная цель.
Например, здесь возможны следующие задачи:
1) попасть в заданную точку или область космического пространства за
минимальное время;
2) к заданному моменту времени попасть в заданную область
пространства с заданной скоростью (совершить мягкую посадку, например) и с
максимальным весом аппарата или с минимальной затратой энергии;
3) достичь определенной скорости за минимальное время и т. п.
Большое число прикладных задач оптимального управления, которые
связаны с механикой полета летательных аппаратов в космосе и атмосфере, с
работой электроприводов, химических и ядерных реакторов, с вопросами
виброзащиты и амортизации, с математической экономикой и т. д.,
читатель найдет в [21; 53; 67; 108; 110; 240; 246-249; 253; 254; 293; 328; 417;
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 379
418; 431; 457; 466; 497; 498; 500; 568; 608; 611; 612; 616; 683; 712; 715;
716; 719; 726; 727; 750; 751; 753-756].
2. Приведенные в примерах 1, 2 задачи являются частным случаем более
общей задачи оптимального управления, к формулировке которой мы
переходим. Пусть движение некоторого управляемого объекта (течение
управляемого процесса, изменение управляемой системы) описывается
обыкновенными дифференциальными уравнениями
х1 = f'(xi, х2,..., хп, и1, и2,..., иг), г = 1,..., п,
которые в векторной форме можно записать в виде
x = f(x,u,t), (7)
где t —время, х = (х\ х2,..., хп) — величины, характеризующие движение
объекта в зависимости от времени и называемые фазовыми
координатами объекта, и = (и1, и2,..., иТ) — параметры управления («положение
рулей» объекта), выбором которых можно влиять на движение объекта,
/ = (/', /2,..., /п); функции f{(x, и, t), г = 1,..., п, описывающие
внутреннее устройство объекта и учитывающие различные внешние факторы,
предполагаются известными.
Для того, чтобы фазовые координаты объекта (процесса, системы) (7)
были определены в виде функций времени x = x(t) на некотором отрезке
i0 < t < Т, необходимо в начальный момент времени *0 задать начальное
условие x(t0) = XQ и параметры управления и = (и\ и2,..., ит) как функции
времени u = u(t) при t е [t0, Г]. Тогда фазовые координаты х = x(t) будут
определяться как решение следующей задачи Коши:
x(t) = f(x(t),u(t),t), t0^t^T, (8)
x(t0) = Xo. (9)
Нетрудно видеть, что функции u = u(t), называемые управлениями,
должны удовлетворять определенным требованиям непрерывности, гладкости,
так как, с одной стороны, при слишком «плохих» (слишком «разрывных»)
u(t) задача (8), (9) может не иметь смысла, с другой стороны, слишком
«плохая» функция u(t) не будет иметь физического смысла управления. В
большинстве прикладных задач в качестве управлений u — u(t) могут быть
взяты кусочно-непрерывные функции. Напоминаем, что функция u(t)
называется кусочно-непрерывной на отрезке [t0, Т], если u(t) непрерывна во
всех точках i 6 [t0, Т], за исключением, быть может, лишь конечного числа
точек г, те [i0, Т], в которых функция u(t) может терпеть разрывы
типа скачка, т. е. существуют конечные пределы
lim u(t) = u(r--0), lim u(t) = и(т{+0),
( -t т( - 0 ( -t т. + 0
но, вообще говоря, и(т{ — 0) ф и(т{ +0), г = 1,..., р. В тех прикладных
задачах, в которых разрывные управления технически нереализуемы,
рассматриваются лишь непрерывные управления u(t). Встречаются также задачи,
в которых, кроме непрерывности, от u(t) требуется существование кусочно-
непрерывной производной u(t)—такие управления называют кусочно-
гладкими.
В теоретических исследованиях упомянутые классы
кусочно-непрерывных, кусочно-гладких управлений часто бывают слишком узкими, и вместо
380
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
них приходится рассматривать более широкие классы управлений, такие,
как, например, пространство Lp[t0, Т] при некотором р, 1 < р < оо [393].
Через LTp[t0, Т] при 1 ^ р < оо будем обозначать пространство измеримых
вектор-функций u(t) = (ul(t),..., uT(t)), t0 < t < T, для которых функция
|u(t)| суммируема на [i0, Г] в смысле Лебега, и, следовательно, имеет
смысл норма
\\u\\l = (l \u(t)\pdt} , 1<р<оо.
Если р = оо, то под i^[t0, Т] понимается пространство ограниченных
измеримых вектор-функций u(t) = (u'(t),..., uT(t)), t0 < t < T, с нормой
||u||L = ess sup ' |u(i)| = inf sup |v(i)|,
где 'u(i) пробегает множество всех измеримых функций, совпадающих с
u(t) почти всюду на отрезке [i0, Т]. Если читатель недостаточно знаком с
интегралом Лебега и пространствами LTp[t0, Т] [393], то всюду в этой главе
он может считать, что все рассматриваемые управления u(t) суть кусочно-
непрерывные функции.
Далее, как видно из примеров 1, 2, значения управлений не могут быть
совершенно произвольными и подчиняются некоторым ограничениям. Такие
ограничения можно описать условием
u(t)eV(t), t0^t^T, (10)
где V(t) — заданное множество из Ег при каждом t e[i0,T]. Например,
в случае ограничений (3) V(t) = {u: и <Е El,\u\ ^. j} при всех 4. Для
кусочно-непрерывных управлений выполнение условий (10) требуется для
всех t 6 [t0, Г], в которых управление непрерывно, а для измеримых
управлений — почти всюду на [i0, Т].
Кроме ограничений (10), возможны также и ограничения вида
||u||£:=S \u(t)\4t^Rp, Л'= const>0, (11)
при некотором р, 1<р<оо.
Таким образом, постановка задачи оптимального управления прежде
всего предполагает, что выбран некоторый класс функций — управлений
(например, кусочно-непрерывные, кусочно-гладкие или функции из Lrp[t0, Т],
1 ^.р^оо) и указаны налагаемые на них ограничения (например,
ограничения вида (10) или (11)).
Заметим, что в учебной литературе символом z(t) — (zl(t),..., zm(t))
часто обозначают как значение функции в точке t, так и саму функцию,
которая представляет собой отображение области определения функции в
пространстве.^"1, ставящее в соответствие каждой точке t из области
определения некоторую точку из Ет. Отдавая дань традициям, мы будем
продолжать пользоваться этим не вполне определенным символом в тех случаях,
когда из контекста нетрудно понять, идет ли речь б функции в целом или
о ее значении в конкретной точке. В тех случаях, когда обозначение z(t)
может привести к недоразумениям, за значением функции в точке t будем
сохранять обозначение z(t), а саму функцию будем обозначать,, через z(A
или просто z. В свете этих обозначений подчеркнем, что ограничения (10)
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 381
являются ограничениями на значения функции, и поэтому было бы
бессмысленно вместо (10) писать и(-) е V(t). Ограничение (11), наоборот,
накладывается на всю функцию и(-) в целом и не является ограничением на
значения функции — функция и(-), удовлетворяющая этому ограничению,
в отдельных точках или промежутках малой длины может принимать
произвольные значения. Поэтому (11) можно записать в виде ||«(-)||l < -R, а
обозначение ||ii(i)||L ^ R, иногда встречающееся в литературе, не вполне
удачное.
3. Итак, пусть заданы точка 2¾ € Еп и некоторое кусочно-непрерывное
управление и = и(-) = u(t), t0 < t < Г, или управление и(-) Е L*[tot Т]
при некотором р^ 1. Рассмотрим задачу Коши (8), (9). Сразу же
возникает вопрос: что понимать под решением этой задачи? Если функции u(t),
f(x, и, t) непрерывны, то, как обычно принято в учебниках по
дифференциальным уравнениям [376; 588; 694], под решением задачи (8), (9) можно
понимать функцию х = х(-) = a;(t), t0 < t ^ Т, которая непрерывно
дифференцируема на отрезке [i0, Т] и удовлетворяет условиям (8), (9). Однако
для случая кусочно-непрерывных или измеримых управлений, как видно
из (8), требовать существование непрерывно дифференцируемого решения
задачи (8), (9), вообще говоря, не имеет смысла. Поэтому мы будем
пользоваться следующим более общим определением решения задачи (8), (9).
Определение 1. Непрерывную функцию х = x(-) = x(t), t0< t< Т,
удовлетворяющую равенству
э:(*)=$/(э:(т),гф-),1-)<*г + аь, *0<*<^ (12)
будем называть решением или траекторией задачи (8), (9),
соответствующей начальному условию 2¾ и управлению и = и(-), и будем обозначать
через х = х(-, и, 2¾) = х(-, и(-), 2¾) или х = x(t, и, Xq), или х = x(t, и, Xq, t0),
t0< t < Т. Начальную точку x(t0, и, 2¾) будем называть левым концом
траектории х(-, и, Xq), *й — начальным моментом, х( T,u,Xq) — правым
концом траектории, Т — конечным моментом.
В тех случаях, когда ясно, какому именно управлению и(-) или
начальному условию 2¾ и начальному моменту t0 соответствует траектория, в
обозначении х(-, и, Xq, t0) букву и или а^, t0 будем опускать и просто писать
х(-, и), ИЛИ х(-, Xq), или х = х(-) — x(t), t0 < t < Т.
Классические теоремы существования и единственности решения задачи
Коши
x = g(x,t), x(t0) = x0,
в учебниках по дифференциальным уравнениям обычно доказываются при
требовании непрерывности g(x, t) и дх(х, t) по совокупности
переменных в некоторой области, содержащей точку (xq, t0) (условие
непрерывности дх(х, t) часто заменяется условием Липшица д(х, t) по переменной
х) [376; 588; 694]. Однако если u(t) eL'[t0, Г], р > 1, то непрерывности
д(х, t) = f(x, u(t), t) по переменной t ожидать не приходится, и
классические теоремы существования и единственности решения здесь становятся
недостаточными. Тем не менее, используя ту же технику доказательства
упомянутых классических теорем, можно получить существование и
единственность решения задачи (8), (9) и для кусочно-непрерывных управлений
u(t) или u(t) е LTp[t0, Г], р^\. Мы здесь ограничимся доказательством
следующей теоремы.
382
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Теорема 1. Пусть функция f(x, и, t) определена и непрерывна по
совокупности переменных при всех (х, и, *) е Еп х ЕТ х [i0, Т] и пусть
\f(x,u,t)-f(y,u,t)\^L(t)\x-y\ (13)
при всех (х, и, *), (у, и, t)eEnxErx[tn, Т], где L(t) — неотрицательная
функция, принадлежащая Ь^0, Т]. Тогда для любого ограниченного
измеримого управления u(t) (m. е. г*(*)е L^[i0, Т]) и начального условия
Xq задача (8), (9) имеет, и притом единственное, решение x = x(t),
определенное на всем отрезке [t0, Т]. Это решение имеет производную x(t)
почти всюду на [*0, Г], x(t) е L^[t0, Т] и удовлетворяет уравнению (8)
при почти всех t е [t0, Т].
Доказательство. Пространство непрерывных вектор-функций
x(t) = (xl(t),.. ., xn(t)), t0< t < Г, с нормой
||a:|L= max \x(t)\
обозначим через Cn[t0, Т]. Как известно [179], Cn[t0, Г] —полное
нормированное пространство. Зафиксируем какие-либо точки 3¾ и ограниченное
измеримое управление u = u(t), t0< t < Т. Можно показать [14], что тогда
для любой функции x(t)e Cn[t0, Т] функция f(x(t), u(t), t) будет
ограниченной измеримой функцией переменной t на отрезке [t0, Г]. Определим
отображение А:
z(t) = Ax=\f(x(T),u(T),T)dT + oo0, t0^t^T, (14)
'о
действующее из Cn[t0, Т] в Cn[t0, Г]. Значение функции z(-) = Ах(-) в
точке t будем обозначать через Ax(-)(t). Покажем, что отображение Аш —
m-я степень отображения А — при достаточно большом m будет
сжимающим [393]. Для этого с помощью индукции докажем, что для любых ж(-),
y(-)ECn[t0,T]
\Amx(-)(t)-Amy(-)(t)\^± max \х(т)-у(т)\(\ L(r)dr)m (15)
при всех t, t0 ^ t < Г, m = 1, 2,... Из (14) с учетом условия (13) имеем
\Ax(-)(t) - Ay(-)(t)\ = П/Ит), и(т), т) - f(y(r), и(т), т)]йт
t
<
^\Ь{т)\х{т)-у{т)\йт^ max \х(т) - у(т)\[Ь {т)йт. (16)
Оценка (15) при т = 1 доказана. Пусть оценка (15) верна для некоторого
m ^ 1. Тогда с помощью неравенства (16) получим
1^+^(-)(4) - A™ + iy(-)(t)\ = \A(Amx(^)(t) - A(Amy(.))(t)\ <
^\L(r)\Amx(.)(r)-Amy(.)(T)\dT^
* 1 /T \m
^L(T)i ™a* ЫО-у(0\(ЪНО<%) dr<
^^ ™f*MO-y(0\SL(r)(lL((;)dt;) dr =
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 383
т+ 1
для любых t Е [t0, Г]. Оценка (15) доказана. Из этой оценки следует, что
\\Атх(.) - А™у(.)\\с < JLj(]L(T)dT)m\\x(.) - у(-)\\с.
1 /^ \ m
Так как lim —-А\Ь(т)с1т) =0, то при достаточно большом т будем иметь
т -too m- V /
. /Т \ т
—Л jL(r)dr) < 1. Таким образом, отображение Ат является сжимаю-
щим. Из принципа сжимающих отображений ([393, с. 82]) следует
существование единственной функции х(-) е Сп[*0, Г], для которой х(-) = Ах(-),
что равносильно выполнению равенства (12).
Из свойств интеграла Лебега с переменным верхним пределом (см. [393,
с. 344]) и из (12) следует, что получившаяся функция x(t), i0 < 4 ^. Т,
абсолютно непрерывна, ее производная £(i)eL"[i0, Г], и уравнение (8)
удовлетворяется почти всюду на [i0, Г]. Теорема! доказана. П
Замечание 1. Вместо условия (13) можно потребовать
непрерывность £ = (^¾^ г',У = 1,...,п}при(я;, u,t)e Еп xErx[t0, Г], однако
в этом случае существование решения задачи (8), (9) можно гарантировать,
вообще говоря, лишь на отрезке [i0, t0+a], где а — достаточно малое число.
Замечание 2. Если управление и = u(t) е L*[t0, Г], 1 <р < оо, то
теорема 1 и ее доказательство останутся в силе, если, например,
дополнительно потребовать
\f (х, и, t)\^C0(\x\+ ^) + 0^) (17)
для всех (х, и, t)eEn х Ет x[t0, Г], где С0 = const > 0, C,(t)>0, C{(t)e
е L{[t0, Г). Условие (17) нужно для обеспечения включения f(x, u(t), t)e
Е Ь^0, Т] для любых х(-) е Cn[t0, Г], и(-) € Lrp[t0, Г], чтобы
отображение (14) имело смысл.
Более тонкие теоремы существования и единственности решения
задачи (8), (9) для управлений u(t)e Ьтр[Ь0, Г], 1 <р< оо, можно найти в [14;
132; 212; 358; 457].
Остановимся еще на случае линейной системы, когда вместо (8) имеет
место
■ x(t) = A(t)x(t) + B(t)u(t) + f(t), <о<*<Г, (18)
где A(t) = {ai:j(t)}, B{t) = {bi;j{t)} — матрицы размеров n х п и n х г
соответственно, /(*) = (/'(*),..., /"(*)), *0 < * < Т.
Теорема 2. Пусть элементы {a{.(t)}, {Ьу(*)} матриц A(t), B{t)
принадлежат £«,[*„) ТЪ а /(*) е £"[*<» т1 Тогда для каждого
управления и = u{t) е LTp[t0, Г], где р — какое-либо фиксированное число,
1 <р ^ оо, и любой точки х0е Еп задача Коши для системы (18) с
начальным условием x(t0) = XQ имеет, и притом единственное, решение
x = x(t) в смысле определения 1, определенное на всем отрезке [*0, Г].
Это решение имеет производную x(t) почти всюду на [t0, Г], x(t)e L"
384
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
[*0, Т] и удовлетворяет уравнению (18) почти всюду на [t0, Г].
Если кроме перечисленных условий, еще имеет место включение /(*)€
eL;[t0,T], mox(t)eL;[t0,T].
Доказательство. Нетрудно видеть, что правая часть уравнения (18)
удовлетворяет условию (13) с L(t) = \\A(t)\\ е ЬН0, Т]. Кроме того,
g(t) = A(t)x(t) + B(t)u(t) + f(t)eL^[t0, Т] для любых x(t)eCn[t0, Г],
u(t) е Lp[t0, Т]. Дальнейшее доказательство проводится так же, как
доказательство теоремы 1. D
4. Вернемся к постановке задачи оптимального управления. Как видно
из примеров 1, 2, не только на управляющие параметры объекта, но и на
его фазовые координаты могут накладываться некоторые дополнительные
ограничения, которые не вытекают из свойств системы (8) и ограничений
на управления. Такие ограничения можно описать условием
x(t) = x(t,u(-),x0,t0)eG(t), <„<*<з; (19)
где G(t) — некоторое заданное множество из Еп при каждом t € [i0, Г],
например, G(t) = {xeEn: Gi(x,t)^0,i = l,...,m3; Gl(x, t) = 0, 1=1713 +
+ 1,..., s3}, G{(x, t) — заданные функции, t0^t^ Т. Ограничения (19)
часто называют фазовыми ограничениями.
Далее, начальный и конечный моменты времени t0 и Т, t0 < Г,
характеризующие продолжительность движения объекта, могут зависеть от
управления (например, в задачах быстродействия) и не всегда могут быть заданы
заранее. В таких случаях обычно указывают ограничения
*0е90, Г ев,, " < (20)
где в0, 0! —заданные множества на числовой оси R = {i: — 00 < * < +00}
(не исключается возможность, что в0 = Е или в[=Е).
Наконец остановимся на условиях; которым должны удовлетворять
левый и правый концы траектории. Собственно говоря, из включений (19)
при t = t0 и t = Т уже следуют условия x(t0) е G(t0), х(Т) € G(T), и в
некоторых случаях нет необходимости как-то еще иначе выделять
ограничения на концы траектории. Однако могут возникнуть ситуации (например,
при G(t) = Еп, t0<t < Г), когда такие ограничения удобнее выделить и
рассматривать самостоятельно. В таких случаях будем считать, что в Еп
при каждом t0 6 в0 задано множество S0(t0) и при каждом Г 6 в[ —
множество 5,(Г), и условия на концах траекторий будем записывать в виде
z(*o)e5o(*o)> *0еО0; ^(DeS^T), Геб,.' (21)
В задачах оптимального управления принята следующая классификация
условий (20), (21). Если множество 90 состоит из единственной точки *0, то
начальный момент называют закрепленным; если 9, состоит из одной
точки Г, то конечный момент называют закрепленным. Если множество
50(*0) [или 5[(Г)] состоит из одной точки и не зависит от *0, т. е. S0(t0) =
= (¾}. t0 е 60 [или соответственно Sl(T) — {xl}< Геб,], то говорят, что
левый [правый] конец траектории закреплен: Если 50(i0) = Еп, t0 е 90
[или S,(T) = En, Те9,], то левый [правый] конец траектории называют
свободным. В остальных случаях левый [соответственно правый] конец
траектории называют подвижным. Примером того, как могут задаваться
множества S0(t0), является
S0(t0) = {х: х е Еп, /1,(1,^)^0, 4 = 1,...,1710,
hi(x,t0) = 0, г=ть + 1,...,з0},- (22)
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 385
где функции h{(x, t), i = 1,..., s0, определены при х е Еп, t 6 90.
Аналогично, примером множества 5[(Г) служит
Si(T) = {y:yeEn, Л(у,Г)<0, г = 1,...,т,,
д{(У,Т)=0, * = m, + l в,}, (23)
где функции д{(у, t), г = 1,..., зи определены при у е Еп, t е в,.
В приложениях нередко возникают также задачи, в которых левый и
правый концы траектории должны выбираться согласованно, в зависимости
друг от друга. Это требование можно записать в виде
(x(t0),x(T))eS(t0,T), t0e©0, Г ев,, (24)
где S(t0, Т) при каждом (*0, Г)бв0хв1 представляет собой заданное
множество из Еп х Еп. Примером такого множества является
3>(*о> Т) = {(х, у)еЕпх Еп: 9i(x, у, t0,T)^0, г = 1,..., тп,
9i(x,y,t0,T)=0, i = m + l,...,s}, (25)
где д((х, у, t, Т) — заданные функции переменных (х, у, t, Т) 6 Еп х Еп х
Х0ох9,. Понятно, что множества (21) являются частным случаем
множества (24), когда S(t0, T) = S0(t0) х S^T); множества (22), (23) —частный
случай (25).
5. Теперь перейдем к непосредственной формулировке задачи
оптимального управления. Пусть заданы множества 90, 9, на числовой оси Ж,
infe0<supe,; V(t) С ЕГ, G(t)cEn при всех t, inf90 < t < sup 9,;
S(t0, T), t0 € 90, T е 9,. Пусть движение фазовой точки х = (ж1,..., хп)
описывается системой обыкновенных дифференциальных уравнений (7), где
функция f(x, и, t) определена при х е G(t), и е V(t), t е [t0, Т].
Набор (xq, и(-), х(-), i0, Т) назовем допустимым или допустимым
процессом, если t0e®0, Т€9,, *0< Т, управление и = и(-) = (и1^), ..., uT(t))
определено и кусочно-непрерывно на отрезке [i0, Т] и удовлетворяет
ограничению (10) на этом отрезке, а х = х(-) = х(-,и(-), Xq)— траектория
задачи (8), (9) (см. определение 1), которая определена на отрезке [i0, Т]
и удовлетворяет фазовому ограничению (19), (x(t0) = Xq, х(Т)) 6 5(4,, Г).
Будем предполагать, что множество допустимых наборов (процессов)
непусто.
Пусть на множестве допустимых наборов задана функция (или, как часто
говорят, целевая функция или функционал)
J(x0, «(•), х(-), t0, Т) = ] f°(x(t), u(t), t)dt + дЧъ, x(T), t0, Г), (26)
!°
где f°(x, и, t), g°(x, y,,t, T) — заданные функции при x, у e En, ueV(t),
inf90< t < sup.9,, T e9,.
Задача оптимального управления заключается в том, чтобы
минимизировать или максимизировать функцию (26) на множестве
допустимых наборов. Мы ограничимся рассмотрением лишь задач
минимизации, так как задача минимизации J всегда может быть сведена к
эквивалентной задаче минимизации (-J).
Обозначим
Jt = iniJ(x0,u(-),x(-),t0, Г),
386 Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
где нижняя грань берется по всем допустимым наборам. Допустимый
набор (:%,, ut(-), xt(-), t0t, Tt) назовем оптимальным процессом или
решением задачи оптимального управления, %(■) — оптимальным управлением,
ХЛ')~оптимальной траекторией, если J(%, ч(-), xt(-),\t0t, Tt)==J„.
Сформулированную задачу оптимального управления можно записать в
следующем кратком виде:
J(ab,n(-),o;(.),to^)=?/0(a;(t),n(t),t)dt+ff0(ab,a;(r),t0,rHinf, (27)
x(t) = f(x(t),u(t),t), t0^t^T, (28)
(x(t0) = x0,x(T))eS(t0,T), *0ев0, Гев,, (29)
x(t)eG(t), t0^t^T, (30)
u(t)eV(t), (31)
подразумевая (если не оговорено другое), что управление и = и(-) —
кусочно-непрерывно на отрезке [i0, Г] и условие (31) выполняется во всех
точках непрерывности управления и(-). Нетрудно видеть, что значение
кусочно-непрерывного управления в точках разрыва не влияют ни на
решение уравнения (28) (см. определение 1), ни на значение функции (27) и,
следовательно, на задачу (27)-(31) в целом. Поэтому в задаче (27)-(31) не
так важно, как определено управление и(-) в точках разрыва и выполняется
ли в этих точках включение (31).
Заметим, что в задаче (27)-(31) управления можно брать также из класса
ограниченных измеримых функций; в этом случае изменение управления
и(-) на множестве меры нуль не влияет на задачу и поэтому естественно
считать, что включение (31) выполняется для почти всех t е [t0, Г].
Если /° = 1, д° — 0, то J(xq, и(-), х(-), t0, Т) = Т — t0 — в этом случае
задачу (27)-(31) называют задачей быстродействия. Если f'(x, и, £) =
= f<(x, и), i = 0, ..., n, д°(х, у, t, Т) = д°(х, у), множества S(t0, Г), V(t),
G(t) не зависят от времени, то задачу (27)-(31) называют автономной
или стационарной.
Если начальный момент закреплен, т.* е. 0о = {*о}> т0 в формулировке
задачи (27)-(31) включение ^бв0 опускают, вместо J(x0, и(-), х(Л, t0, Т)
пишут короче: J{xu, и(-), х(-), Т) или J(x0,u(-), Т), вместо 5(*0,Т) пишут
S(T). Аналогично поступают, если закреплены конечный момент Т или
один из концов траектории. В том случае, когда G(t) = En при всех t или
S(t0, T) = S0(t0)xSl(T), где S0(t) = En' Или 5,(t)=£;n, или V(t) = En, то
соответствующие из условий (29), (30), (31) в постановке задачи (27)-(31)
также явно не указывают.
В приложениях встречаются задачи оптимального управления более
общего вида, чем задача (27)-(31). Возможны ситуации, когда наряду с
ограничениями на управления и фазовые координаты, записанными, так сказать,
в разделенном виде (30), (31), имеются более сложные ограничения вида
(u(t),x(t))eW(t), t0^t^T, (32)
где W(t) — заданное множество из ЕгхЕп, например, вида W(t) = {(u, х):
R4u, х, t\ ¢.0, i = 1,..., m4; Лг'(и, x, t) = 0, г =m4 + 1, .. ., .¾}. t0 < t < T,
В,{(и, x, t) — известные функции. Такие ограничения называются
смешанными. Ограничения (30)-(32) накладываются на значения функций u(t),
x(t) в каждой точке t, поэтому их можно назвать точечными ограничени-
§ 1. ПОСТАНОВКА ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 387
ями. Наряду с точечными ограничениями возможны также ограничения
вида
Ji(xo, и(-), х(-), i0, Г)<0, г=1,...,т5,
J{(x0,u(-), х(-), t0, Т)=0, г =т+ 1, ..., s5,
где Т
^(х0, и(-), х(-), *0, Т) = I f?{x{t), u(t), t)dt + д°(хо, х(Т), t0, Т),
f°(x, и, *), д°(х, у, t, Г), г = 1,. .., % — заданные функции.
Ограничения (33) накладываются на функции и(-),х(-) = х(-,и(х),х0) в целом,
поэтому их, в отличие от точечных, можно назвать интегральными
ограничениями. Кстати, заметим, что ограничения вида (11) относятся к
интегральным.
В теории оптимального управления рассматриваются также задачи,
учитывающие запаздывание информации, задачи с параметрами, с дискретным
временем, с более общим видом целевой функции, задачи для интегро-
дифференциальных уравнений, для уравнений с частными производными,
для стохастических уравнений и др. Важнейшим обобщением задач
оптимального управления являются дифференциальные игры, описывающие
конфликтно-управляемые системы, управляемые системы в условиях
неопределенности. При исследовании управляемых систем наряду с задачами
оптимизации описанного выше типа рассматриваются также и другие
важные проблемы, такие, как управляемость, наблюдаемость, синтез,
инвариантность, чувствительность, устойчивость, стабилизация, идентификация,
фильтрация и т. д. У нас здесь нет возможности хотя бы бегло
остановиться на перечисленных аспектах теории управляемых систем, и по этим
вопросам мы отсылаем читателя к литературе, упомянутой во введении к
настоящей главе.
§ 2. Формулировка принципа максимума. Примеры
1. Начнем с рассмотрения задачи оптимального управления с
закрепленным временем. А именно, пусть требуется минимизировать функцию
Jix,, и(-), х(-)) = \ f°(x(t), u(t), t)dt + д°(х0, х(Т)) (1)
'о
при условиях
x(t) = f(x(t),u(t),t), t0^t^T; x(t0) = x0, (2)
gi(x0,x(T))^0, i = 1,..., m, ^(^.^(^))=0, i = m + 1,..., s, (3)
u = u(t)eV, (4)
где моменты *„, T предполагаются заданными, и = (и1,..., ит), х = (х1, ...
..., хп), / = (/ , ..., /"); управление и = и{-) является кусочно-непрерывной
функцией на отрезке [i0, Т] и удовлетворяет условию (4) во всех точках
непрерывности; f{(x,u, t), д*(х,у) — заданные функции. Подчеркнем, что
в задаче (1)— (4) множество V С Ет не зависит от времени и фазовые
ограничения при t0<t<T отсутствуют. Очевидно, задача (1)-(4)
является частным случаем задачи (1.27)-(1.31). В (3) не исключаются
возможности, когда отсутствуют ограничения типа неравенств (m = 0), типа
равенств (s = m ^ 1) или все ограничения (3) (s = m = 0). Предполагается,
388
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
что функции Я'(я;, и, 4), j = 0, ..., п, д3(х, у), j = 0,..., з, имеют частные
производные df3' /дх* = f3it дд3'/дх{ = g3xi, dgj/dyi = g3yl< i = 1,..., п.
Обозначим f3 = (f34 ..., //.). fl/ = (flii • • -, fli.)' 5y =(5»ч • --, fl£). Для формулировки
принципа максимума введем функции:
Я(а:, и, *, г/», а0) =-Оо-Ия. и> 0 +V'l/'fa, и> *) + ••• +V\,/"(a:, «, 4) =
= -Оо/°(а:>и> *) + (^,/(е, и, О), (5)
/(ж, у, 0) = 0050(0:, ^) + 0,5^2:, ^) + --- + 0^(2:, Z/)>'
здесь V = ("01, • • -, VO> а = (°о> а1, ■ ■ •> а») — вспомогательные переменные,
определяемые ниже. Функцию Н(х, и, 4, ф, Oq) называют функцией
Гамильтона— Понтрягина, а функцию 1(х, у, а) — малым лагранжианом.
Пусть u = u{t) — кусочно-непрерывное управление на отрезке [40, Г],
x{t) = x{t, и, хй) — решение задачи (2), соответствующее этому
управлению и = и(-) и начальному условию 0¾ и определенное на всем отрезке
[40, Г]. Паре (и(4), я;(4)), 4 ^ * ^ ?\ поставим в соответствие следующую
систему линейных дифференциальных уравнений относительно переменных
ф=ф{1) = {ф^),...,фп{1)):
Лц\_ ЭЯ(д, и, t, ^i(t), (¾) _
i &i u = u(t),x = x(t)
(6)
называемую сопряженной системой. Систему (6) можно записать в
векторной форме
ф{1) = -Нх{х{1),и{1),1,ф{1),а0), 40<4<Г, (7)
где Нх = (Нх,,.. ., Нх„). Подчеркнем, что в (6), (7) и всюду ниже запись
вида Hxi{x{t), u(t), 4, V(4), о0), ^,(¾. х(Т), о), ^,(¾. я:(Г), о), ^,(¾. z(T)),
g3yi{xu, х{Т)), как это обычно принято, означает, что сначала вычисляется
соответствующая частная производная функций Н(х, и, 4, ф, Oq), д3(х, у) и
затем вместо аргументов подставляются их конкретные значения.
Если система (2) линейна относительно х, и, т. е.
x(t) = A(t)x(t) + B(t)u(t) + f(t), 40<4<Г
(см. обозначения в (1.18)), то Н(а;, и, 4, ф, а~) = -а0/0(х, и, 1:) + (ф, A(t)x +
+ B(t)u + /(4)) и сопряженная система (7) может быть записана и виде
^(4) = 0,,/0(0:(4),44),4)-04(4))^(0, <о < * < Т,
где (A(t))T — матрица, полученная транспонированием матрицы A(t).
Из теоремы 1.2 следует, что если зафиксировать постоянную Oq, момент
времени 4,, 40< 4, ^ Г, и точку ф0еЕп, то линейная система (7) будет иметь
и притом единственное решение ф(1) = ф{1,и,х0,ф0, 4,), удовлетворяющее
условию -0(4,) = -00 и определенное на всем отрезке [40, Т].
Теперь можем перейти к формулировке теоремы, выражающей
необходимое условие оптимальности — принцип максимума для задачи (1)-(4).
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 389
Теорема 1. Пусть функции fj(x, и, t), j = О,..., п, д3'(х, у), j =
= 0,...,s, имеют частные производные //,, д£,, д3,, г = 1, ..., п и
непрерывны, вместе с этими производными по совокупности своих
аргументов при х е Еп, у е Еп, и eV, t е [t0, Г], где V —замыкание
множества V. Пусть (х0, u(t), x(t)), t0^.t^. Т, — решение задачи (1),(4).
Тогда необходимо существуют числа 00,0,,...,0, и вектор-функция
t/j(t) = (i>\(t),..., i>n(t)), t0 < t < T, такие, что
1) 0 = (0,,,0,,...,0,)^0, о0>0, о, >0, ..., om>0; (8)
2) V4*) является решением сопряженной системы (6),
соответствующей рассматриваемому решению (xq, и(-), х(-));
3) для всех t е [*0, Г], являющихся точками непрерывности
оптимального управления и(-), функция H(x(t),u,t,^(t), Oq) переменной
и = (u1,..., иТ) достигает своей верхней грани на множестве V при
и = u(t), т. е.
maxH(x(t), и, t,ijj(t), 0(,) = H(x(t), u(t), t,ip{t), aQ); (9)
и eV
4) выполнены, условия
ФЛЪ)=Ыхо,ЧТ),а)= ± ^(^,^))=^^
&г
(10)
ФЛТ)=Ых0, х(Т), о)=-£ а^(х0,х(Т))=-^Р^, . = 1,.. ,п,
aj9l(x0,x(T))=0, j = 1,..., m. ; (И)
Условия (10) называют условием трансверсальности, условие (11) —
условием дополняющей нежесткости. В том случае, когда управление
и(-) является ограниченной измеримой функцией,: т. е. и(-) б L^ltg, Т.], то
формулировка теоремы 1 полностью сохраняется, но равенство (9) (как и
включение (4)) будет выполняться почти всюду на отрезке [t0, Г].
Центральное место в теореме 1 занимает условие максимума (9):
оказывается, если и(-) — оптимальное управление, а х(-) — оптимальная
траектория, то непременно найдутся такие числа %, а,, . .., а, и такое решение
i>{t) системы (6), (10), что функция H(x(t),u, 4,-0(4),¾) переменной и
будет достигать своего максимума на V именно при u = u(t) во всех точках
t е [i0, Т] непрерывности управления и(-). Поэтому теорему 1 и
нижеследующую теорему 2, дающие необходимое условие оптимальности, принято
называть принципом максимума.
2. Однако как практически пользоваться теоремой 1 для поиска решения
задачи (1)-(4)? Здесь обычно поступают следующим образом.
Рассматривают функцию Н(х, и, t, ф, а0) как функцию г переменных и = (и1,..., ит) е
6 V, считая остальные переменные (х, t, ф, Oq) параметрами, и при каждом
фиксированном наборе (х, t, ф, %) решают задачу максимизации:
Н(х, и, t, ф, Oq)—>sup, и е V. (12)
Отсюда находят функцию
и = и(х, t, ф, Oq) е V, (13)
на которой достигается верхняя грань в задаче (12), т. е.
Н(х, и(х, t, ф, а„), t, ф, Oq) = sup Н(х, и, t, ф, а0). (14)
390
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Если исходная задача (1)-(4) имеет решение, то, как следует из (9),
функция (13) определена на непустом множестве.
В ряде случаев функция (13) может быть выписана в явном виде.
Например, если г
p\x,u,t) = fi{x,t)+Y:fii{x,-tW, j =0,..., п,
i = i
V = {и = (ul,.. .tur) е Ег: а(^Чй, г = 1,..., г},
где at, /3t —заданные числа, то
п г
Н{х, и, t, ф, Oq) = -а0/0°(я;, i) + £ ф,$Цх, t) + £ ¥>ЛХ, *, Ф, ^%)^.-
з=\ t=l
здесь для краткости обозначено
п
ipt(x, t, ф, Oq) = -aQf^(x, t) + Е Ф^Ъ(х, t), i = 1,..., г.
Ясно, что решением задачи (12) тогда будет вектор-функция и(х, t, ф, а0) с
координатами
и' = ««(*, t, ф,%) = {&> при п<? \ ф; *> > °' . ,
v.,v,"o/ ^ а;,при п(х, t, ф, Оо)<0, « = 1,...,г.
В частности, если а{ = — 1, /¾ = +1, то и\ = sign <р((х, t, ф, Oq), i = 1,..., г.
Полученная формула дает довольно много информации о структуре
оптимального управления: можно ожидать, что г'-я координата
оптимального управления является ступенчатой функцией со значениями ai или
Pt, причем точки переключения определяются условием <р((х, t, ф, Oq) =
= 0. Обратим внимание читателя на возможный особый случай, когда
(р((х^), 4, ф^), а0) = 0 на каком-либо промежутке [г,, т2] С [i0, Т]. В этом
случае функция Н не будет зависеть от и* ■ и из условия (9) не удастся
извлечь никакой Полезной информации об г-й координате управления и(-)
при t € [tj, т2]; источником информации об и'(-) на этом особом участке
[тп т2] является само равенство <р{(х(Ь), t, ф^), %) — 0.
Если множество V имеет вид
V = {ueEr:\u\ = (j:(u{y^lft.^R])
то, пользуясь известным неравенством Коши — Буняковского, также
нетрудно выписать функцию (13) в явном виде:
«<*.*>*>ао)=ЩШк' ^=(^...,<л.).
Ряд задач, в которых удастся получить явное выражение для функции (13),
приводятся ниже в примерах. .
Допустим, что функция (13) нам рке известна. Тогда можем рассмотреть
следующую систему из 2п дифференциальных уравнений
x = f(x,u(x,t^,a0),t),
Ф = -Ях(ъ и(х, 4, Ф> ао), 4> Ф> ао)> t0^t ^Т,
относительно неизвестных х(-), ф(-). Как известно [376; 588; 694] общее
решение системы (15) зависит, вообще говоря, от 2п произвольных числовых
параметров (например, такими параметрами могли бы служить начальные
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 391
условия x(t0), V>(*o)) и Для определения этих параметров нам нужно иметь
2п условий. Кроме того, параметры %, аи ..., as, встречающиеся в
теореме 1, также неизвестны и для их определения нужно еще s + 1 условие.
Таким образом, для определения 2n + s + 1 неизвестных числовых
параметров нам нужно 2n + s + 1 условие. Где их взять? Оказывается, эти условия
также могут быть извлечены из теоремы 1. А именно, условия
трансверсальности (10) и дополняющей нежесткости (11) нам дают 2п + т уравнений;
еще s — т уравнений
^(^,^(^))=0, j = m + \,...,s (16)
вытекают из условий (3). Для получения еще одного уравнения заметим,
что функция Н(х, и, t, -ф, а0), определенная согласно (5), линейна и
однородна относительно переменных фи ..., фп,а0, т. е. Н(х, и, t, осф, аа^) =
= аН{х, и, t, ф, а0) при любых а. Отсюда и из условия (14) тогда имеем
и(х, t, аф, аа0) = и(х, t, ф, а^) Va > 0. (17)
Из (8), (10), (11), (17) следует, что если некоторый набор %, . . ., ая,
фх,..., фп удовлетворяет условиям теоремы 1, то этим условиям
удовлетворяет также набор 01%, ..., aas, афи ..., афп при любых а > 0. Это
означает, что теорема 1 определяет величины а%, ..., aas, афи ..., афп лишь с
точностью до положительного множителя, и этим множителем мы можем
распорядиться по своему усмотрению. Например, опираясь на первое из
условий (8), можно положить
И2 = !>? = !■ (18)
В тех задачах, в которых удается показать, что %> 0, вместо условия
нормировки (18) часто берут % = 1.
Таким образом, для определения 2п + s + 1 параметров — 2п параметров
общего решения системы (15) й параметров %, a,, ..., as — у нас имеется
система 2п + s + 1 уравнении (10), (11), (16), (18). Разумеется, эти
уравнения надо решать совместно с неравенствами
%>0, ...,ат>0, 9i(x0,x(T))^0, t = 1,..., m. (19)
Если исходная задача (1)-(4) имеет решение, то согласно теореме 1
система (10), (11), (16), (18), (19) также имеет решение. Попутно заметим,
что для тех г, 1 ^ г < т, для которых д{(х$, х{Т)) <0 (неактивные
ограничения), из (11) вытекает, что а{ =0, и неопределенными остаются лишь
а,., с номерами г, для которых д^Хц, х(Т)) = 0 (активные ограничения). Это
означает, что из уравнений (11) существенное значение имеют лишь
подсистемы &(zo, х(Т)) = 0, г € I, состоящие из активных ограничений.
Итак, основываясь на теореме 1, от исходной задачи (1)-(4) мы пришли
к специальной краевой задаче, состоящей из условия максимума (14),
системы дифференциальных уравнений (15) и условий (10), (11), (16), (18),
(19). Такую краевую задачу естественно назвать краевой задачей
принципа максимума для задачи оптимального управления (1)-(4).
Можно ожидать, что имеются лишь отдельные, изолированные функции
(x(t), ip(t)), t0 ¢. t ^. T, и значения параметров а0, аи ..., о,,
удовлетворяющие условиям (10), (11), (15), (16), (18), (19), Возьмем один из таких
наборов x(t), -0(4), «о! ап • • ■! ai> и подставим их в (13); получим функцию
u(t) = u(x(t), 1,ф{1),а0), to^t^T. (20)
392
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Пусть эта функция оказалась кусочно-непрерывной на [*0, Г]. Из (13),
(14), (20) тогда следует, что полученное таким образом управление u(t),
t0 ^. t ^. Т, удовлетворяет условию (9) и, следовательно, согласно
теореме 1 может претендовать на роль оптимального управления задачи (1)-(4),
а функция x(t) = x(t, u(-), x(t0)), t0 ^ t ^ T, — на роль оптимальной
траектории этой задачи. Будет ли найденная пара (u(t), x(t)), t0 ^ t ¢. Т, в
самом деле решением задачи (1)-(4), теорема 1 не гарантирует, так как
эта теорема, вообще говоря, дает лишь необходимое условие
оптимальности. Более того, ниже на примерах мы увидим, что бывают случаи, когда
пара (u(t), x(t)) удовлетворяет условиям теоремы 1, но не является
решением задачи (1)-(4). Однако, если из каких-либо соображений известно,
что задача (1)-(4) имеет решение, а краевая задача принципа максимума
однозначно определяет функции (x(t), ip(t)) и параметры Oq, аи ..., а3, то
управление (20) будет оптимальным. Если информации о существовании
решения задачи (1)-(4) нет или краевая задача принципа максимума имеет
несколько решении, то для выяснения вопроса об оптимальности
получаемых здесь управлений требуется дополнительное и порою весьма сложное
исследование.
Как найти хотя бы одно решение краевой задачи принципа
максимума? Напрашивается следующий подход: сначала попытаться определить
решение системы (15) на отдельных отрезках времени, в пределах которых
управление (13) является непрерывным, затем из полученных «кусков»
составить («склеить») решение на всем отрезке протекания процесса,
добиваясь удовлетворения краевых условий и условий на параметры. На этом
пути, как увидим ниже на примерах, нередко удается найти решение
краевой задачи принципа максимума и оптимальное управление исходной
задачи (1)-(4). Полученное решение весьма информативно, наглядно, помогает
лучше понять специфику задач оптимального управления. Примеры таких
задач, в которых удается найти решение в аналитической форме,
желательны как в теоретическом, так и в прикладном отношениях.
К сожалению, получить решение краевой задачи принципа максимума
в аналитической форме можно лишь в частных случаях для задач со
специальной структурой (линейность управляемой системы по фазовым
переменным, малая размерность задачи, простые ограничения на управление и
т. п.). В общем случае, для задач повышенной сложности речь можно вести
только о численном решении. Однако и на этом пути имеются серьезные
трудности, связанные прежде всего с разрывным характером функции (13)
(выше мы уже видели, что даже в простейших случаях эта функция может
иметь разрывы с неопределенностью на многообразиях разрыва). Это
значит, что система (15) является, вообще говоря, разрывной по фазовым и
сопряженным переменным, что делает проблематичным использование
традиционных методов [59; 74; 89; 481; 635]. Поэтому для численного решения
задач оптимального управления приходится разрабатывать специальные
методы с учетом специфики таких задач (см., например [56; 57; 134; 135; 206;
282; 582; 653-656; 719; 753; 811; 818]; один из методов будет изложен в
следующей главе).
Следует предупредить читателя, что краевая задача принципа
максимума весьма своеобразна и таит в себе немало опасностей. Прежде всего,
возможно вырождение принципа максимума, когда на отдельных участках
времени функция Н(х, и, t, ф, а0) не зависит от переменной й, что
приводит к появлению особых управлений, требующих отдельного исследования.
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 393
Кроме того, существуют задачи оптимального управления, которые с виду
формулируются достаточно просто и полностью укладываются в схему
задачи (1)-(4), но оптимальное управление в них имеет бесконечное число
переключений на конечном отрезке времени (так называемые четтеринг-
режимы). Это значит, что задача (1 )-(4) не всегда имеет решение в
классе кусочно-непрерывных управлении. Более того, задача (1)-(4) может не
иметь решение даже в классе измеримых управлений, что приводит к
необходимости использования более широких классов допустимых управлений
(скользящие режимы, импульсные управления). Не имея возможности
обсуждать возникающие здесь тонкие и интересные проблемы (укажем лишь
на приводимые ниже примеры 6, 7.4.2, упражнения 7, 9, 16), отсылаем
читателя к специальной литературе [57; 72; 108; 132; 199; 207; 212; 253; 254;
322; 323; 325; 417; 418; 656; 716; 717; 723; 787; 819].
3. Посмотрим, как выглядит краевая задача принципа максимума для
задач оптимального управления (1)-(4) для некоторых конкретных классов
функций д*(х, у), соответствующих различным режимам на левом и правом
концах траектории. Начнем с рассмотрения случая, когда концы траектории
закреплены:
x(t0) = x0, х(Т) = х{. (21)
Если положить д'(х, у) = х1 — х£, г = 1, ..., п, д1(х, у) = уг — х\, г = п +
+ 1,...,2п, то условия (21) запишутся в виде (3): д^Хц, х(Т)) = 0, г =
= l,...,2n = s, m = 0. Поэтому условия (11) здесь отсутствуют, а условия
трансверсальности (10) дадут
V»(*o) = £ aj9UVo, х(Т))= 0^2(¾. *(Т))+ (а„ . .., ап),
j=0 (22)
V>(T) = -£ a.^U, я( Г)) = -0^(¾. z(T))-(a„+i> •••> а*.)-
з=о
Оказывается, условие афО из (8) здесь может быть заменено условием
|оо| + И*)1^0 Vt€[t0, Г]. (23)
В самом деле, если (23) не выполняется, то а0 = 0, xp(t) = 0, 1¾ < t ^. Т.
А тогда в силу (22) г/>(*0) = °= (а,, ..., а„), ф(Т) = 0 = (an + l,..., <%„) и,
следовательно, а= (а*, а,, ..., а,п) = 0, что противоречит (8). Это значит,
что для задачи (1), (2), (4), (21) выполняется условие (23). Тогда условие
нормировки (18) можно заменить условием
Ы + №(*,)! = 1. (24)
где *,— какая-либо подходящая точка из отрезка [ioi^1] (часто берут t\=tQ
или tx = T). Таким образом, краевая задача принципа максимума для
задачи (1), (2), (4), (21) состоит из системы (15), граничных условий (21), (22),
неравенства а0 ^ 0 и условия нормировки (24). Так как неизвестные
параметры а,,.. .,Ооп входят лишь в условие трансверсальности (22) и не входят
в (15), (21), (24), то эти параметры и условия (22) можно исключить из
дальнейшего рассмотрения. В итоге, для определения функций (x(t)^(t)),
t0^.t^T, и параметра а^О имеем краевую задачу принципа максимума,
состоящую из системы In дифференциальных уравнений (15), In граничных
условий (21) и условия нормировки (24). Конечно, при необходимости
исключенные параметры а,,...,а2г1 могут быть определены из условия (22)
после того, как уже будут найдены x(t)^(t),aQ из (15), (21), (24).
394
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Теперь рассмотрим задачу (1), (2), (4) при условиях, когда левый конец
траектории закреплен: x(t0) = х^, а правый конец свободный. Этот случай
граничных режимов соответствует задаче (1)-(4), в которой д'(х, у) = х1 —
— 2¾% г = I, ..., п = s, m = 0. Поэтому условия (11) здесь отсутствуют, а
условия трансверсальности (10) запишутся в виде:
^(^ = 00^^)) + (^,...,0, ф(Т) = -00^(¾.^)). (25)
Покажем, что в рассматриваемом случае также выполняется условие (23)
и, более того, можно гарантировать, что % > 0. В самом деле, если Oq = 0,
то, как видно из (25), ф(Т) = 0 и система однородных уравнений (6) будет
иметь лишь тривиальное решение V>(*) = 0, а ТОгда $(t0) = 0 = (au.. .,ап).
Пришли к противоречию с первым условием (8): а = (а0, аи ..., ап)фО.
Следовательно, а0 > 0, и можем принять условие нормировки 0,,= 1. Таким
образом, краевая задача принципа максимума для задачи (1), (2), (4) с
закрепленным левым концом и свободным правым концом состоит из системы (15),
граничных условий (25), x(t0) = Xq и условия нормировки Oq = 1. Так как
параметры аи . .., ап входят лишь в первое из условий (25), то это условие
и параметры аи ..., ап можно исключить из дальнейшего рассмотрения, и
в результате краевая задача принципа максимума сведется к системе 2п
дифференциальных уравнений (15), которая решается при условиях
Е(<о) = аь. Ф(Т) = -д°у(х0,х(Т)), а0=1. (26)
Аналогичные рассуждения показывают, что если в задаче (1), (2), (4)
левый конец траектории свободный, правый конец закреплен, то
соответствующая краевая задача принципа максимума представляет собой
систему (15), которая должна решаться при условиях
х(Т) = хи ф(Ь0) = д°(х0,х(Т)), 00=1. (27)
Если в задаче (1), (2), (4) оба конца траектории свободны, то краевая
задача принципа максимума состоит из системы (15) и условий
1>{to) = &(xo,*{T)), ^) = -^(½ ^Г)), 0,,= 1. (28)
Далее, рассмотрим задачу (1), (2), (4) в случае, когда левый конец
траектории закреплен: x(t0) = Xq, а правый конец подвижный и удовлетворяет
условиям
дЧх(Т))^0, г = 1,..,т,; д*(х(Т)) = 0, г = т, + 1, ..., *,. (29)
Здесь мы имеем дело с задачей (1)-(4), в которой функции д*(х, у)
определены так: д{(х, у) = дЧу), г = 1,..., s{; д*(х, у) = х{ -3¾. г = я, + 1,...
..., a, + п = s, тп = щ. Условия (10), (11) на правом конце траектории с
учетом (8) запишутся в виде
ф{Т) = -Оо<7°(% х{Т)) - Е ajgi(x(T)),
ajgi(x{T)) = 0, aj^O, i = 1,..., m,; a0>0,
на левом конце — в виде:
№o) = %92(%,x(T)) + (a.i + l,'.:'.,a;i + n). (31)
Условие а = (ао, аи ..., а, +п)фО здесь может быть заменено условием (а0,
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 395
аи ..., as) фО). В самом деле, если бы (oq, аи ..., а,) = 0, то в силу (30)
ф(Т) = Ь, и однородная система (6) будет иметь тривиальное решение
ф(Т)=0; тогда V(*o) = 0 и из (31) бУДет следовать (as+1, ..., as+n) = 0,
что противоречит условию а^О. Поэтому условие нормировки (18) можно
заменить на
а§+а* + ... + а*=1, (32)
а условие (31) и параметры as +1, ..., as +п исключить из рассмотрения. В
результате, краевая задача принципа максимума будет состоять из
системы (15), начального условия ж(*0) = ^, условий (29), (30), (32)."
Аналогично показывается, что в задаче (1), (2), (4), когда левый конец
траектории свободный, а на правом конце заданы условия (29), краевая
задача принципа максимума будет состоять из системы (15), условий (29),
(30) на правом конце, условия нормировки (32) и условия на левом конце
Ж) = %&Хо,х{Т)), (33)
Рассмотрим задачу (1), (2), (4), когда оба конца траектории подвижны,
причем условия на правом конце задаются в виде (29), на левом конце пусть
/i'Oc(to))<0, г = 1,,..,^: к1(х(Ь0)) = 0, ^=^+1,...,.¾. (34)
Здесь мы имеем дело с задачей (1)-(4), в которой функции д{(х, у)
определены так: д'(х, у) = д1(у), г = 1, ..., m,; gi(x,y) = hi~n>i(x), г = т, + 1,...
..., ml + m0 = m, д{(х, у) = дг т°(у), г = т, +гщ+ 1,..., гщ + s{; д{(х, у) =
= hl \ i = гщ + s{ + 1, ..., s0 + s{ = s. Условия (10), (11) на правом конце
траектории с учетом (8) запишутся в виде (30), а на левом конце получим
^(¢0)=00^(^.^))+1:^^(¾). byfc'U)=0, Ь,>0, ^=1,...,,^. (35)
з = 1
Таким образом, краевая задача принципа максимума, соответствующая
задаче (1), (2), (4), (29), (34), состоит из системы (15), условий (29), (30),
(34), (35), условия нормировки
ag + of + ... + ^ + bf + ... + Ь= = 1.
Если в (1), (2), (4) левый конец удовлетворяет условиям (34), а правый
конец закрепленный, то систему (15) нужно решать при условиях (34), (35),
х(Т) = хи условии нормировки
а§ + Ь? + ... + Ь*'=1. (36)
Если в задаче (1), (2), (4) левый конец удовлетворяет условиям (34), а
правый конец свободный, то система (15) решается при условиях (34)-(36),
ф(Т) = -а0д°у(х0,х(Т)).
4. Сформулируем принцип максимума для задачи оптимального
управления, когда начальный или конечный моменты времени не закреплены. А
именно, пусть требуется минимизировать функцию
J(% u(-), z(-), *о, T)=]f°(x(t),u(t), t)dt + ff°(% х(Г), <„, Г) (37)
при условиях
x(t) = f(x(t),u(t),t), t0^t^T; x(t0)=x0, (38)
396
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
<7г(%:Е(Т),*0,ТК0, i=\,...,m; ^(¾.^ Т), t0,T)=0, i=m+l,..., s, (39)
u = u(t)eV, (40)
где один из моментов t0 или Т или оба эти момента заранее неизвестны
и подлежат определению вместе с управлением u(t) и траекторией x(t)
из условия минимума функции (37): д{(х, у, t, Т), г = О, ..., s — заданные
функции переменных хеЕп, у€Еп, t ЕЖ, Т еЖ, t ^ Г; остальные
обозначения те же, что и в задаче (1)-(4). В (39) не исключаются возможности,
когда отсутствуют ограничения типа неравенств (m = 0), типа равенств
(a = m > 1) или все ограничения (39) (s = m = 0). В этой задаче функция
Гамильтона — Понтрягина Н(х, и, t, ф, Oq) определяется также, как в (5), а
5
функция 1(х, у, а) заменяется на 1(х, у, t, Т, а) = ]Г) а{дг(х, у, t, Т).
Теорема 2. Пусть функции f3'(x, и, i), j = 0,..., п; д3{х, у, t, Г),
j = 0, ..., s, имеют частные производные /£, gi<, gfr, г = 1, ..., п; д{, д3Т
и непрерывны вместе с этими производными по совокупности своих
аргументов при х е Еп, у е Еп, и е V,' t е Ж,, Т еЖ, t < Т. Пусть
(х0, и(-), х(-), t0, Т) — решение задачи (37) —(40), управление u(t), t0 ^.
¢. t ^ Т, кусочно-непрерывно. Тогда необходимо существуют числа
Oq, а{,..., as и вектор-функция ф(Ь) = (ф{(Ь),..., V>„(*))> t0^t ^ Г,
удовлетворяющие условиям I)—3) теоремы. I, условиям трансверсальности
V»(*o)= *«(% х(Т), t0, T,a)=J2 ayfli(% х(Т), t0, Г),
j'\ (41)
ф(Т)=1у(х0, х(Т), t0,T,a) = -j: ajgfixo, х(Т), t0, Т),
H(x(t0), u(t0 + 0), t0, i>(t0), Oo) =
= -/,(¾. x(T), t0,T,a) = -± 0,5/(¾. x(T), t0, T) (42)
(если t0 закреплено, mo условие (42) отсутствует);
Н(х(Т),и(Т-0),Т,ф(Т),%) =
= lT{xQ,x{T),t0,T,a)=J:aig3T{xQ,x{T),t0,T) (43)
з=о
(если T закреплено, mo условие (43) отсутствует) и условию
дополняющей нежесткости
ajg3{x0,x{T),t0,T)=0, j = 1,..., т. (44)
С помощью теоремы 2 задачу (37)-(40) можно свести к краевой задаче
принципа максимума, действуя по той же схеме, что и в задаче П )-(4).
Это снова приведет нас к конечномерной задаче максимизации (12),
откуда определяется функция (13), и к системе 2п дифференциальных
уравнений (15) относительно функций x(t), ф^). Для определения 2п
параметров, от которых зависит общее решение системы (15), и параметров
а0, ах,..., as имеем In условий (41), т условий (44), s — т условий типа
равенств из (39), условие нормировки (18), а наличие неизвестных
моментов t0, Т здесь компенсируется появлением дополнительных условий (42),
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 397
(43); разумеется, поиск упомянутых параметров нужно вести с учетом
неравенств из (8), (39). Расшифровка условий трансверсальности (41), (42) для
различных режимов на концах траекторий, когда каждый из концов может
быть закрепленным, свободным или подвижным, проводится точно так же,
как и выше; в частности, условия (41) здесь приведут к тем же
условиям (21)-(36). Естественно, в задаче оптимального управления с
незакрепленным временем функции gl, h* из условий (29), (34) наряду с х,у могут
зависеть еще от переменных t0, Т, как например, в (1.22), (1.23).
5. Для иллюстрации теорем 1, 2 рассмотрим конкретные примеры задач
оптимального управления. т
Пример 1. Минимизировать функцию J(u)= J(u2(i) +a;2(£))di при
условиях x(t)=u(t), O^t^T, х(0)=х(Т)=0. о
Здесь момент Т > 0 задан; V = El. Задача, конечно, несложная: пара
(u(t) = 0, x(t) = 0), 0^ t ¢. Т, очевидно, является единственным ее
решением. Продемонстрируем на этой простой задаче изложенную выше схему
использования принципа максимума — теоремы 1. Выпишем функцию
Гамильтона — Понтрягина Н(х, и, ф, а0) = — а0(и2 + х2) + фи и сопряженную
систему ф = —Нх = 2а0х. Если а0 = 0, то функция Н = фи может достигать
своей верхней грани на множестве V — Е^ лишь при ф =0. Однако
соотношения а0 = ф — 0 противоречат условию (23). Следовательно, % > 0. Тогда
можем считать, что а0= 1. В этом случае функция Н = —и2—х2 + фи
достигает верхней грани на Е1 при и ^= ф/2— вот какой вид имеет функция (13)
в рассматриваемой задаче. Тогда краевая задача принципа максимума
запишется в виде
х = ф/2, ф=2х, 0<*<Т; х(0) = х(Т) = 0.
Отсюда однозначно определяем х^)=ф^)=0, O^i^T. Тогда u(t) =
= -0(4)/2 = 0, O^i^T, — получили известное нам оптимальное управление.
Перейдем к рассмотрению более интересной задачи оптимального
управления, которая в зависимости от величины конечного момента Т имеет
единственное решение или бесконечно много решений, или не имеет
решения. Эта задача любопытна также и тем, что даже в том случае, когда она
не имеет решения, краевая задача принципа максимума будет иметь одно
или даже бесконечно много решений.
Пример 2. Пусть требуется минимизировать функцию J {и) =
= l(u2(t)-x2{t))dt при условиях x(t)=u(t), O^t^T, х(0)=х(Т)=0, Г>0.
о
Функция Гамильтона — Понтрягина здесь имеет вид Н = —(^(и2 — х2) +
+ фи, сопряженная система такая: ф =—Нх = —2а0х. Если (¾ = 0, то Н = фи
достигает своей верхней грани на V = El лишь при ф =0, что
противоречит условию (23). Следовательно, а0 > 0. Можно считать, что 0,, = 1. Тогда
Н = х2 - и2 + фи и sup Н достигается при и = ф/2. Краевая задача прин-
иеЕ>
ципа максимума имеет вид х = ф/2, ф = —2х, 0^ t ^ Г, х(0) = х(Т) = 0.
Общее решение этой системы дается формулой x(t) = С sin t + D cos t,
ф^) = 2С cos t —2D sin t, где С, D —произвольные постоянные. С учетом
условия ж(0)=0отсюда имеем D=0, итогда x(t) — C sin t, ф^) = 2С cos t.
Условие x(T) = 0 приводит к равенству С sin Т = 0. Возможно, что Тфкк,
к = 1, 2,...; тогда С = 0 и краевая задача принципа максимума будет иметь
398
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
единственное решение x(t) = 0, ф^) = 0, 0<* < Т, а управление,
подозрительное на оптимальность, равно u(t) = -0(4)/2 = 0, 0 ^ t < Т.
Если же Т — жк, к — целое положительное число, то краевая задача
принципа максимума имеет бесчисленное множество решений x(t) = С sint,
ф(t) = 1С cos, t, зависящих от одного параметра С, и управлений,
подозрительных на оптимальность, будет бесконечно много: u(i) = С cos *,
0<i < Г.
Спрашивается, будут ли найденные управления оптимальными?
Оказывается, ответ на этот вопрос зависит от величины Т. Рассмотрим случаи
Г>7ГИ0<Г^7Г.
1) Т > ж. Покажем, что тогда inf J (и) = —оо. Для этого возьмем
последовательность управлений um = um(t) = ^- cos ^ и соответствующих им
траекторий хт = xm(t) = т sin ^, 0 < t < Г, т = 1, 2,... Тогда J(um) =
■■ Т 1 / 7Г2 \
= Kum(*) — xm(t))dt = 9-^m2( —2 — Ч ~* ~°° ПРИ m —* °°' Следовательно,
о \Т /
при Т > ж рассматриваемая задача оптимального управления не имеет
решения. В то же время краевая задача принципа максимума при всех Т > ж
разрешима, причем при Т = жк, к = 2, 3,..., она имеет бесконечно много
решений, при остальных Т > ж—единственное решение.
2) 0<Г<7г. Тогда для любых кусочно-непрерывных v(t), для которых
существует решение x(t) задачи x(t)=v(t), O^i^T, х(0)=х(Т)=0, имеем
J(v) =\{v2- x2)dt = \{v2 + x2 ctg2 t - a;2 Sin"2 t)dt =
о 0
T T
= \(v2 + x2 ctg2 t -2xxctgt)dt = \(v(t)-x(t) ctg tfdt > 0.
о 0
Заметим, что проделанные преобразования законны, так как все
подынтегральные функции, встретившиеся при этих преобразованиях, ограничены
и lim a;2(t)ctg t =0, а в случае Т = ж еще и lim х2(t) ctg t =0. Итак,
J(v) ^0, а на управлениях u(t) = 0 при Т < ж и u(t) = с cos t при Т = ж
будем иметь J {и) = 0. Таким образом, при Т < ж рассматриваемая задача
оптимального управления имеет единственное решение, при Т = ж —
бесчисленное множество решений, причем все решения найдены с помощью
принципа максимума. т
Пример 3. Минимизировать функцию J(u) = ^ \l(x2(t) + u2(t))dt
при условиях x(t) = —ax(t) + u(t), х(0) = Xq. о
Здесь Xq, а > О, Т > 0 — заданные постоянные, V = Е\ правый конец
траектории свободный. Составим функцию Гамильтона — Понтрягина Н =
= —а0(х2 + и2)/2 + ф(—ах + и) и выпишем сопряженную систему
ф = -Нх = а0х + аф, 0 ^ t < Т.
Из условия (26) трансверсальности для свободного правого конца
траектории имеем ф(Т) = 0, ^ = 1. Тогда функция Я = -(х2+ и2)/2 + ф(-ах + и)
достигает своей верхней грани по и па V = Ei при и = ф, и краевая задача
принципа максимума запишется в виде
х = —ах + ф, ф=аф+х, х(0) = х0, ф(Т) = 0.
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 399
Таким образом, подозрительным на оптимальность является управление
„A!_„2AT -AT ,
n(t)=^(t)=^(Ae_a)-;(A;a)e2AT, о<*<г, a = v^tt
(см. пример 8.5.2).
Пример 4. Пусть точка движется по оси Ох по закону x(t) = u(t),
t ^ 0. Требуется найти кусочно-непрерывное управление u(t), \u(t)\ ^ 1,
0< t < Т, такое, чтобы точка, выйдя из начального положения х(0) = 1
с нулевой скоростью, пришла в начало координат с нулевой скоростью за
минимальное время Т.
Положим, что х1 = х, х2 = х — фазовые координаты точки. Тогда задачу
можно переформулировать так: быстрейшим образом перевести фазовую
точку (ж1, х2) из состояния (1,0) в состояние (0,0), считая, что движение
подчиняется уравнениям £'(*) = x2(t), x2(t) = u(t), t > 0. Здесь V = {u€
eEl:\u\^l},f°=l,g0 = 0.
Составим функцию Н = —а0+'ф1 х2+гр2и и выпишем сопряженную систему
Jl = -Hj=0, ф2 = -Н^ = -фи t>0.
Отсюда имеем -0,(4)=(7, -02(4)=—C4+.D, где С, D — постоянные.
Отметим, что ip2(t)j£0, так как в противном случае C=D=0, а тогда -0,(/:)=0 и
равенство 171^=-0,,=0, вьггекающее из (43), приводит к противоречию с
условием (23). Из условия max Я следует u(t)= sign -02(t)= sign(—Ct +D),
t ^0. Таким образом, оптимальное управление (если оно существует)
является кусочно-постоянной функцией, принимающей значения +1,-1 и
имеющей не более одной точки переключения i,, при переходе через которую
u(t) меняет знак. Нетрудно убедиться, что траектория, выходящая из точки
(1,0) и соответствующая управлению u( 4)=+1 при 4^0, или u(t)=— 1 при
4^0, или u(4)=+l, 0<4<4,, u(t)=— 1, 4^4,, никогда не будет проходить
через точку (0,0). Остается рассмотреть управление u(t)=— 1, 0:¾ 4 < 4,,
u( 4 )=+1, 4^4,. Этому управлению соответствует траектория (a;'(t), z2(4)):
т'т=/ 1_*2/2) 0<4<4„ l!(tu( -'- <К*<*„
*' 1472-24,4 + 4,41, *>*„ *' I 4-24,, *>*,.
Из условия х1(Т) = х2(Т) = 0 находим 4, = 1, Г = 2. Тогда
xim-i !-42/2, 0^t<l, 2rn_f-4, 0< t <1,
1 Г'~\ (4-2)2/2, Ut<2, *' 1.4-2, 1<4<2.
В качестве величин Oq, -0,, -02, участвующих в формулировке принципа
максимума, могут служить Oq = 0, -0,(4) = -1, -02(4) = 4-1,0^4^2. Можно
показать, что полученные управление и траектория в самом деле являются
решением поставленной задачи быстродействия, об этом см. пример 7.4.4.
Пример 5. Требуется перевести точку х = (х1,х2) из состояния
2¾ = (2, -2) на множество Si = {xeE2: gl(x) = xi=0} быстрейшим образом,
предполагая, что движение точки подчиняется уравнениям £'(4) = x2(t),
x*(t) = u(t), причем u(t)eV = {ueEl: \и\ < 1}.
Как и в предыдущем примере, здесь Н=—а0+'ф1х2+'ф2и, сопряженная
система имеет вид: -0,=0, ^=--0,, откуда следует -0,(4)=(7, tp2(t)=—Ct+D,
400
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
С, D = const. Условия трансверсальности (30), (43) здесь дают
ф,(Т) = -аи ф2(Т) = 0, -а0 + фх{Т)х2{Т) + ф2{Т)и{Т) = Н\^т=0.
Следовательно, t/j2(t) = C(T — t), 0:¾ t < Т. Заметим, что здесь С ф0, так
как при С = 0 получим ф^) = ф2^) = 0, 0< t ^. Т, а тогда а, =0, из условия
jJli = T = 0 вытекает (¾ = 0 — противоречие с условием (32). Итак, С ф0,
t/j(t) = C(T — t)^0 при 0< t < Т. Из условия max Я тогда имеем
u(t) = sign i>2{t) = sign С, 0<*^£
Подозрительными на оптимальность здесь могут быть лишь управления
u(t)= 1 или u(t) = — 1, 0< t ^ Т. Если u(t) = 1, то из краевой задачи
х' = х2, £2=1, 0<i^T; ^(0) = 2, а;2(0) = -2, а;1(Г) = 0
получим Г=2, ^(£)=(4-2)72, ж2(*)=*-2, 0<t<2. Если u(i)=-l, то из
¢1=12. ¢2 = -1, 0<i^T; ^(0) = 2, а:2(0) = -2, а;1(Г) = 0
будем иметь Г = \/8-2, ^(4) = 4-(4+2)72, ж2(4) = -4-2, 0< t < \/8-2.
Таким образом, краевая задача принципа максимума здесь дает два
решения. Однако лишь управление u(t) = — 1, 0< i < Т = v8 — 2, может
претендовать на оптимальность, так как Г = 2>\/8 —2, а управление u(t)= 1,
0 ^ t < Т заведомо неоптимально.
Пример 6. Рассмотрим задачу минимизации функции
J(u) = \((ul(t))2 + (u2(t))2)dt + х'{\) + х2{\) (45)
о
при условиях
xl(t) = ul(t), x2(t) = u2(t), 0< t < 1,
^(0) = 0, z2(0) = 0, ^(1)^0, (x2(l))2 - х1(1) ^0, У '
где и = u{t) = (u\t),u2{t)). Эта задача является частным случаем
задачи (1), (2), (4), (29) при L = 0, Г = 1, п = г = 2, /° = (и1)2 + (п2)2,
f(x,u, t) = u, V = E2, x = (xl, x2), y = {y\y2), g°(x, y) = yl+y2, д1(х,у) = у1,
g2(x, у) = —ух+{у2)2, Щ = a, =2; левый конец траектории закреплен. Из (46)
видно, что правый конец любой допустимой траектории этой задачи удов-
1
летворяет равенствам: ж'(1) = 0, ж2(1) = 0. Тогда J(u) = J \u(t)\2dt ^ 0 для
о
всех допустимых управлений. Поскольку и = u(t) = 0 допустимое
управление и J(0) = 0, то J„ = 0, u(t) = 0 — единственное оптимальное
управление задачи (45), (46). Функция Гамильтона — Понтрягина И = —а0((и1)2 +
+ {и2)2) + фхих + ф2и2 не зависит от х, поэтому сопряженная система имеет
вид ф\ = 0, ф2 = 0, 0 ^ t < 1. Следовательно, фх(t) = с,, фЛt) = с,, с,, (¾ —
постоянные. Далее, здесь 1(х, у, а)=а0(у1+у2)+а{у1 Л-^—у +(у2) ) и
условия (30), (32) дают
-^1(1) = 00-1 + 0,-1+0,(-1) = 0,, + 0,-02,
-^(1) = 00-1 + 0,-0 + 02-2^(1) = 00, (47)
с^ + а2 + а22 = 1, а0 ^ 0, а, > 0,. ' а,, > 0.
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 401
Покажем, что в этой задаче ^ = 0. В самом деле, если %>£), то можем
воспользоваться условием нормировки 0,) = 1. Тогда функция Н = —\и\2 + (ф, и)
достигает своего максимума на V = Е2 в точке и = ф11 = с/2, с = (си (¾).
Соответствующая траектория x(t) = tc/2 условию ж(1) = 0 может
удовлетворять лишь при q =(^ = 0. Таким образом, ф(Ь)~0, 0<*<1. Из второго
условия (47) тогда следует, что ^ = 0, что противоречит равенству а0= 1.
Следовательно, % = 0. Но тогда линейная функция Н = (ф, и) на Е2 может
иметь конечный максимум (который, кстати, должен достигаться на
оптимальном управлении u(t) = 0) лишь при ф —ф^) = с=0.Из условий (47),
учитывая, что Oq = 0, получаем a, = (¾ > 0. Таким образом, краевая задача
принципа максимума здесь дает а — (^ = 0, а{ = а, аг = а), а > 0, ф(1)=0,
0:¾ t ^ 1. Как видим, условие (23) в этой задаче не выполняется,
функция Н = 0, и условие максимума (9) не позволяет определить оптимальное
управление u = u(t) = 0.
Говорят, что оптимальное управление и(-) является особым на отрезке
[ex, /3]c[t0, Г], если H(x(t), и, t, V>(£),«%) при t е[а, (3] не зависит от и. В
этом случае для набора (ж = x(t), i, г/> =г/»(*), Oq) при t 6 [а, /3] условие (14)
не дает никакой полезной информации об оптимальном управлении,
функция (13) становится неопределенной и пользоваться формулой (20)
невозможно. В частности, когда нарушается условие (23), т. е. а0 =0, ф(Ь) =0,
t0 ^ t :¾ Т, то имеем дело с одним из типичных случаев появления особого
управления. Так случилось в только что рассмотренном примере 6.
Разумеется, условие (23) само по себе не исключает возможность появления
особого управления, но тем не менее полезно подчеркивать случаи, когда
оно выполняется.
К сожалению, условие а = (oq, ..., as) ф 0 из (8) само по себе не всегда
приводит к условию (23). Так в задаче (1), (2), (4), (29), как показывает
пример 6, в общем случае (23) не выполняется и приходится
довольствоваться условием а = (oq, ..., as) фО и вытекающим из него условием
нормировки (32). Для того чтобы в задаче (1), (2), (4), (29) из афО следовало
условие (23), можно дополнительно потребовать, например, чтобы
градиенты д1у(х(Т)),..., ду'(х(Т)) были линейно независимы. Тогда либо а0 ^0,
либо ao = 0, но согласно (30) ф(Т)фО и однородная система (6) будет иметь
нетривиальное решение ф^), t0 ^ t < Г. Аналогичные требования,
гарантирующие условие (23), можно сформулировать и для задачи (1), (2), (4),
(29), (34) и других задач оптимального управления, рассмотренных выше.
Об особых управлениях читатель может прочесть в [108, 199; 476].
В следующих примерах покажем, как выписывается краевая задача
принципа максимума для некоторых задач оптимального управления движением
математического маятника (см. пример 1.1).
Пример 7. Пусть требуется минимизировать функцию
J(u) = (xi(T))2 + (x2(T))2 (48)
при условиях
£'(*)= a;2(i), x2(t) = - sin xl(t)~f3x2(t) + u(t), O^t^T, x(0) = x0, (49)
u(t)eV = {ueEx: |u|^l}, (50)
где x = (xl, x2) — фазовые координаты, 3¾ = (¾1, a^) — заданная точка, Г >
> 0 — заданный момент времени. В этой задаче правый конец траектории
402
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
свободен, /° = 0, д°(у) = (у1)2 + (у2)2. Выпишем функцию Гамильтона —
Понтрягина
■ Н(х, и, ф) = фхх2 + ф2(-^&т хх — (Зх2 + и)
и сопряженную систему
ф\ = -Нх>=ф2со&хх, ф2 = -Нх1 = -ф{+(Зф2, O^t^T. (51)
Из условий (26) имеем
ФЛТ) = -90Ах(Т)) = -Ы(Т), ф2{Т) = -д${х{Т)) = -2х2{Т). (52)
Из условия шах Н следует и = sign ф2. Тогда краевая задача принципа мак-
симума запишется в виде
хх = х2, х2 = - sin ж1 - (Зх2 + sign ф2,
ф '= ф2 cos х1, ф2 = -ф{ +/3ф2, O^t^T,
х(0) = х0) ф,(Т) = -2хх(Т), ф2{Т) = -2х2{Т). (54)
Если краевая задача (53), (54) имеет решение (ж(*),-0(4)), 0^ t ^ Т,
причем ф2^) обращается в нуль в конечном числе точек, то функция
u(t) = sign ф2(t) будет управлением, подозрительным на оптимальность в
задаче (48)-(50).
Заметим, что если для некоторого управления v = v(-) из (50) решение
x(-,v) задачи Коши (49) таково, что x(T,v) — 0, то J0v) = 0. Это значит,
что v(-) — оптимальное управление в задаче (48) — (50). Любопытно, что
это управление является особым — его нельзя получить из принципа
максимума. В самом деле, при x(T,v) = 0 из (51), (52) следует -0(4,-^) = 0,
0< t ^ Т, а тогда H(x(t,v), и, ip(t, v)) = 0, 0< t < Т, при всех ueV к
условие (9) не суживает исходное множество управлений, подозрительных
на оптимальность. т
Пример 8. Минимизировать функцию J(u) — \u2(t)dt при услови-
0
ях (49) и закрепленном правом конце х(Т)=0; Т>0 — задано.
Здесь V — Е', Н = —а0и2 + ф{ х2 + ф2(— sin хх — /Зх2 + и), сопряженная
система имеет вид (51). В случае Oq = 0 функция Н может достигать своей
верхней грани на Ех лишь при ф2 = 0. Но если ф2^) = о, 0 ^ t ^ Т, то из
второго уравнения (51) получим -0,(4) = 0, что противоречит условию (23).
Таким образом, можем считать а0=\. Тогда из условия max Л получим
и = ф2/2. Краевая задача принципа максимума будет иметь вид
хх'= х2, х2 = — sin ж1 — (Зх2 + ф2/2,
фх =-02 cos ж1, ф2 = -фх+(3ф2, O^t^T, х(0) = Хо, х(Т) = 0,
Пример 9. Рассмотрим задачу быстрейшего перевода точки х =
— (х , х2) из состояния Xq ф0 в начало координат (0,0), предполагая, что
движение точки подчиняется условиям (49), (50). Эта задача является
частным случаем задачи (37)-(40). Если /°= 1, д° = 0; функция Гамильтона —
Понтрягина имеет вид
Н — — а0 + фхх2 + ф2(— sin хх — (Зх2 + и). (55)
Отсюда ясно, что сопряженная система будет иметь вид (51), а условие
max Н выделит функцию и = sign-(/¾. Краевая задача принципа максимума
М<1
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 403
в этом случае будет состоять из системы (53), граничных условий х(0) =
= Xq, х{Т) — 0, условия трансверсальности H\t = т — —а0 + ф2{Т)и{Т) — 0,
вытекающего из (43), и условия (23). Отметим, что в этой задаче i[;2(t)^0,
В самом деле, если бы ф2^) = 0, то из (51) будем иметь ф1^) = 0, а из
H\tl=T = 0 получим Oq = 0, что противоречит (23). ,
Пример 10. Пусть требуется быстрейшим образом перевести
точку х = (ж1, х2) из состояния Xq в начальный момент t0 = 0 в состояние,
удаленное от точки (0, 0) на расстояние, равное е > 0, предполагая, что
движение точки подчиняется условиям (49), (50). Это значит, что
правый конец траектории является подвижным и удовлетворяет условиям
\х(Т)\2 = (х1 (Т))2 + (х2(Т))2 = е2. Здесь функция Н имеет тот же вид (55),
сопряженная система — вид (51), условие maxH дает и = sign ф2. Из
условия трансверсальности (30), (43) имеем 1"'^' '
ф{Т) = -2а,х{Т), Н(х{Т)МТ),Т,ф(Т),аъ) = 0. (56)
Оказывается, здесь а, ф 0. В самом деле, если а, = 0, то из (56) будем
иметь ф(Т) = 0, а из (51) будет следовать V(i) = 0; тогда из (55), (56)
получим 00 = 0, что противоречит условию (32). Итак, а{ фО; тогда условие
нормировки (32) можем заменить на равенство |а,| = 1. Таким образом,
краевая задача принципа максимума в рассматриваемой задаче состоит из
системы (53), граничных условий х(0) = Xq, ф(Т) = ±2х(Т), |ж(Т)|2 = е2,
Я|! = т=0, из которых нужно определить функции x(t), ip(t), параметры %,
Т. Отметим, что здесь ф2(Ь)^0. В самом деле, если ф2^) = 0, то в силу (51)
ф{(Ь) = 0, а тогда х(Т) = 0, что противоречит равенству |я;(Т)|2 = е2 > 0.
Пример 11. В задаче из примера 10 условие 1^(3^)1 = е2 на правом
конце траектории заменим неравенством |ж(Г)|2 < е2, считая, что |ж(t0)| > е2.
Тогда функция Н, сопряженная система (51), условия (56) останутся без
изменений; здесь также выполняется условие дополняющей нежесткости
а1(\х(Т)\2-е2)=0. Оказывается, и в этой задаче можно показать, что а, фО.
В самом деле, если а, =0, то в силу (56) ф(Т) = 0, из (51) будет следовать
ф(Ь) = 0, а из Я|! = т = 0 получаем а0 = 0, что противоречит условию (32).
Итак, а, фО. С учетом а, ^0 можем принять а, = 1. Таким образом,
краевая задача принципа максимума будет состоять из системы (53), условий
х(0) = х0, ф(Т) = -2х(Т), \х(Т)\* = е\ Я|! = т = 0. Как и в предыдущем
примере можно показать, что ip2(t)^0.
Предлагаем читателю самостоятельно выписать краевую задачу принципа
максимума для задач из примеров 10, 11 с заменой условий на правом конце
одним из условий х'(Т) = 0, \х1(Т)\2^е2, \х1(Т)\2 = е2, где » = 1 или 2.
6. В следующем параграфе будет приведено доказательство теорем 1,
2. Здесь мы приведем эвристические соображения, которые помогают пот
нять, откуда появляется сопряженная система, условия максимума, условия
трансверсальности, фигурирующие в теоремах 1, 2, и установить связь
между принципом максимума Понтрягина и правилом множителей Лагранжа.
Для простоты рассмотрим задачу (1), (2), (4) при дополнительном
предположении, что V = ET, д°(х, у) = д°(у), условия на правом конце траектории
имеют вид
94^)) = 0,...,^(:0) = 0, (63)
на левом конце
^(х(Ь0)) = 0,...,11*(х(^)) = 0. (64)
404
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
+
Воспользуемся процедурой исследования задач на условный экстремум
(см. гл. 2) и введем множители Лагранжа: непрерывную вектор-функцию
-0(*)=(^1 (*),• • •iV'nC*)) Для учета ограничений (2), постоянные (ап...
.. .,as )=а для учета ограничений (63), постоянные (Ьи.. .,Ь8 )=Ь —для
учета (64), постоянную Oq — для функции (1), и составим функцию Лагранжа
Цх(-), «(■), Ф(-), Оо, а, Ъ) = -Oo[X/°(a:(t), «(t), t)rft + д°(я:(Г))
+ S(V>(*). /(i(t), «(*). *) - ЗД><** - Ё <V5y(z(T)) - Ё Ьу^Х*о))-
*„ 3 = 1 3'=1
С помощью функции Гамильтона — Понтрягина (5) можно записать
функцию Лагранжа в следующем виде:
т
£(&(■). u(-)> V'(-). <%>а>ь) = П-^И*), «(*)» *i V»(*)i ао) -
- (</>(*), ЗДЖ* - Ё^УИГ))- ЁЬуИ^(*о))-
Все аргументы функции Лагранжа считаются независимыми
переменными. Дадим приращения (вариации) переменным x(t), u(t), т. е.
рассмотрим x(t)+ Sx(t), u(t)+ 6u(t), t0 ^. t < Т, здесь u(t), 6u(t) — кусочно-
непрерывны, a x(t), Sx(t) — непрерывно дифференцируемы на [t0, T].
Тогда вариация функции Лагранжа, представляющая собой главную линейную
часть приращения этой функции, имеет вид
SjC=][(Hx, 6х) + (Ни, 8и)- (ф,8х)Щ -
...'- Ё ъ(9&*{Т)), бх(т)) - £ ь,(/»в'и*о)), &(*о)>;
j' = 0 j = l
для краткости аргументы у функций под интегралом опущены. Интегрируя
по частям, находим
f(V(t), 8x(t))dt = (</>(*), Sx(t)) T - ](4(t), Sx(t))dt.
Тогда
SC=l[(Hm + 4(t), Sx(t)) + (Hu, 8u)]dt -
~ (E a.gi(x(T)) + i>(T), Sx(T)) + (- E &Л'И*о)) +V>(*o)> &>(<o)
V=o ' x j = i
Пользуясь независимостью вариаций Sx(-), Su(-), из условия
стационарности S£ = 0 имеем
-0 + #.(¾ u, t, ф, Oq) = 0, Ни(х, и, t, ф, Oq) = 0,
Ф(Т) = -£а3.9их(Т)), ^(<о)=ЕЬЛУИ*о))-
з=о j=i
Таким образом, получены, почти все основные соотношения теоремы 1,
кроме условий (8), (9). Вместо условия (9) мы получили равенство Ни=0,
являющееся следствием (9) при V=Er. Подчеркнем, что приведенные здесь
§ 2. ФОРМУЛИРОВКА ПРИНЦИПА МАКСИМУМА. ПРИМЕРЫ 405
рассуждения, конечно, не могут считаться строгими, и являются лишь
полезными наводящими соображениями при получении необходимых условий
оптимальности. Систематическое и строгое изложение правила
множителей Лагранжа применительно к различным классам задач на экстремум, в
частности, к задачам оптимального управления дано в [14; 15; 209; 210].
Упражнения
1. С помощью принципа максимума решить задачу быстродействия при условиях х = х2,
x2 = u(t), x(0)eS0, x(T)eSi;u(t)eV = {ueEi: |u|^l}, где50 = {а;еВ^:/1(а;) = |а;|2=1}или
S0 = {xe E2: h(x) = \x\2^ 1}, или S0 = {(0, 0)}, или S0 = {(1,0)}, a 5, = {xeE2, g{x) = \x\x =0},
или S, = {x e E2: g(x) = \x\2 = 4} или S, = {x e E2: g(x) = \x\2 ^ 4}.
1
2. Применить принцип максимума к задаче: J(u) = \ \u(t)\2dt —»inf; х1 = х2, х2 = и1 (t),
О
х3 = х\ хА = u2(t)-g, 0^ t < 1; х(0) = (-1,0, 0,0), ж(Т) = (0,0,0, 0). Здесь х = (х1, х2, х3, х\
и = (и1, и2); g = const ^0.
3. Применить принцип максимума к задаче о мягкой посадки космического корабля на
Луну с минимальной затратой горючего ([724], с. 36, 44, 54): J(u) = т(Т)—» sup; h(t) = v(t),
v(t) = -g + u(t)/m(t), rh(t) = -ku(t), u(t)e V = {ueEl: 0<u^ a}, 0< t ^ T; h(0)=h0>0,
^(0) = ^, 171(0) = 77¾ >0; h(T) = 0; момент T заранее не задан. Здесь m(t) — масса корабля,
h(t) — высота, v(t)—вертикальная скорость корабля над Луной, u(t) — тяга двигателя, д —
гравитационное ускорение Луны, а >0, к > 0 — постоянные (ср. пример 1.2).
4. Рассмотреть задачи из примеров 7-11 для малых колебаний маятника, считая sin о:1 «i,
cos а: г» 1. Найти решения краевых задач принципа максимума.
5. Рассмотреть задачи из примеров 1, 2 при дополнительном ограничении u(t) е V = {и е
еЕ1:\и\^1}.
6. Применить принцип максимума к задаче: J(u) = x2(T)—> inf; x = u(t), u(t)eV = {u£ E :
\u\^ 1}, 0^ t ^ T; 0:(0) = ¾) момент T>0 задан. Сколько решений имеет эта задача при я^ = 0?
х0 = Т?
7. Показать, что в задаче J(u)= \(x2(t)-u2(t))dt -> inf; х = u(t), u(t) e V = {u e El:
о
|u| < 1}, 0< t ^ 1; 0)(0) = 0, оптимальное управление не существует, inf J{u) = —1 (см.
пример 7.4.2). Что дает здесь применение принципа максимума?
1
8. Найти минимум функции J(u) = \ sinu(t)dt при условии х = cos u(t), u(t)€V = {u£
О
еВ1: |u| <7г/2}, 0^ t < 1; о:(0) = 0, х(1)= 1. Показать, что u(t) = 0, 0^ t ^ 1 —оптимальное
управление, и убедиться в том, что в принципе максимума здесь надо принять (¾ = 0.
т
9. Применить принцип максимума к задаче: J(u)= \ |o;(t2)|2dt -»inf; x=u(t), u(t)e V =
о
= {u e El: \u\ ^ 1}, 0^ t ^ T; o;(0) = 1, o;(T) = 0; момент T > 0.задан. Показать, что при
Т> 1 оптимальное управление: u(t) = -l, 0^ t < 1; u(t) = 0, 1 ^ t ^ Т, на участке 1 ^ t ^ Т
является особым, т. е. его нельзя определить из принципа максимума.
1 ,.,
10. С помощью принципа максимума исследовать задачу: J(u) = \u(t) cos ^ ' dt -> inf;
x = u(t), u(t)6V = {ueJS1: |u|^l},0^t^l;x(0) = 0. °
т
11. Показать, что задача: J(u) = ] u2(t) (u(t)- \fdt -^ inf; x = u(t), u(t) eV = {ueEl:
0
O^u^l}, O^t^T; 0:(0) = 0, o;(T)=l при T=l имеет единственное решение, априТ> 1 —
бесконечно много решений. Изменится ли этот вывод, если V = Е ? Если х(Т) = — 1?
406
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
12. С помощью принципа максимума исследовать задачу: J (и) = |а:2(1)|2 —» inf; ж1 = х2,
x2 = u(t), и(г)еУ = {иеЕи. |u|^l}, 0:(0) = (^,3¾2).
13. Пусть задача оптимального управления автономна (см. § 1), (и(-), х())— ее решение,
а ф(-), ад, а,,..., а3, определены из принципа максимума (теоремы 1, 2). Показать, что тогда
H(x(t), u(t ),ф(г ),ф0) = const, <о<*< т- .
14. Сформулировать принцип максимума для задачи оптимального управления с
параметрами w = (w ,..., wp) (они не зависят от времени):
т
J(«(■), w) = $ f°(x(t), u(t), t, w)dt + 3(,(¾. x(T), t0, 1» -> inf,
!°
x(t) = f(x(t),u(t),t,w), t0^t^T, x(t0) = x0, ,,, ,
}'(а5,л(Т),^Д(»)<0, i = l;..,m, ^(¾.^). *o. ?>) = 0, i = rr* + 1,..., s,
u(t)ev; fo^t^n ше!^
где TF—заданное множество из Ep, остальные обозначения см. выше. Рассмотреть случаи
W = Ег и 1У = {го: qf(w) = 0, i = 1,..., к}, где <7,-(ги) — заданные гладкие функции на Ет,
i = I,..., к. Указание: ввести новые переменные хп + ' посредством условий хп + '(<) =
= О, t0 ^ t ^ Т, xn + l(t0) = wl, г = 1,..'., к, в пространстве (х1, ..., i"+ ) воспользоваться
теоремой 1 или 2, а затем исключить переменные хп + г, Фп + {, г = 1,..., к.
15. Сформулировать принцип максимума для задачи получающейся из задачи (1)-(4)
или (37)-(40) добавлением условий (1.33). Указание: ввести новые переменные xn+t
посредством условий xn + i(t) = f?(x(t),u(t),t), tg^t^T, xn + i(tQ) = 0, i = 1,..., s2;
*ч+'(П+Я?0%,*(Т),А>.Г)£0, < = 1 m2;o:" + i(T) + S9(3b,a:(T),t0, 7) = 0,,- = ^ +
+ 1,..., s2, в пространстве (x ,..., хп + "г), воспользоваться теоремой 1 или 2, затем исключить
переменные жп + 1, т/)п_|_.г., i = 1,..., s2- - . .
16. Показать, что в задаче
т
J(u)=\x2(t)dt^>M, х = у, y = u(t), O^t^T,
О
a;(0) = ¾. 1/(0) = 2/о, К,%)?*0, Ht)|^l,
при достаточно большом Т оптимальное управление имеет счетное число переключений с +1
на — 1, причем точки переключения лежат на кривой х — Су2 sign у, С — некоторая постоянная
(четтеринг-режим) [322; 323; 819]. Указание: рассмотреть задачу быстрейшего попадания
из точки (ггд, уд) в точку (0, 0) и, пользуясь принципом максимума, убедиться, что оптимальное
управление не может иметь конечное число переключений.
§ 3. Доказательство принципа максимума
1. Доказательство теорем 2.1, 2.2 проведем при дополнительном
предположении, что вектор-функция f(x, и, t) = (/'(ж, и, t),.. ., fn(x, и, t))
удовлетворяет условию Липшица по переменным (х, и), т. е.
\f(x,u,t)-f(y,v,t)\^(\x-y\ + \u-v\), L>0, (1)
при всех (х, и, t), (у, v, t)e Еп х Еп х [i0, Г]. Покажем, что тогда решение
задачи Коши
x = f(x,u(t),t), t0^t^T, x(t0) = x0 (2)
непрерывно зависит от начальной точки Xq и управления u = u(t). Сначала
докажем одно утверждение, которое часто приводится в учебных пособиях
по дифференциальным уравнениям и в литературе известно как неравенство
Гронуолла.
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
407
Лемма 1. Пусть функции tp(t),b(t) неотрицательный непрерывны,
на отрезке t0^t^T, а = const ^ 0. Пусть
ip(t)^a\ip(T)dT + b(t), t0^t^T. .:(3)
Тогда
СК <,:>(*)< a J Ь(т)е"<!-т>сЬ-+Ь(*), tQ < t < X (4)
В частности, если b(t) = b = const ^ 0, mo
(К ¥>(*)< be^-W^t ^2: (5)
Если же
<p(t)^a\ip(T)dT + b(t), t0^t^T, (6)
то ! ; ,
0^(*Ка$Ь(т)еа<т-!>сгт + Ь(*), *0 < * < Т; (7)
а при b(t) = b = const ^ 0 будем иметь
(К¥>(*)Оеа(т-!\ t0^t^T. (8)
Доказательство. Положим i?(t) = a J <p(r)dT. Заметим, что
i?(t0) = 0, R(t)^0, R(t) = atp(t), t0^ t < Т. С учетом (3) и а >0 имеем
R(t) ^ aR(t) + ab(t) или R(t)-aR(t) ^ ab(t), t0^t^T.
Умножая обе части последнего неравенства на е~а(!~!о) получим
■^(Ri^e-^-^^abi^e-^-^, t0^t^T.
Интегрирование этого неравенства от *0 до t с учетом i?(i0) = 0 приводит
к оценке'
i?(t)e-"(!-'■>>< а \ Ь(т)е-а(т-^(1т,
t, , . .
или t
R(t)^a\ Ь(т)еа<г-тЫт, t0^t^T.
Ч
Подставив эту оценку в правую часть (3), сразу получим требуемое
неравенство (4). Если b(t) = b = const, то непосредственно вычисляя интеграл
в правой части (4), придем к оценке (5).
Неравенства (7), (8), вытекающие из (6), доказываются аналогично с по-
т
мощью вспомогательной функции R(t) = а\{р{т)йт, t0^.t^T. Лемма 1
доказана. □ t . ■
Теорема 1. Пусть вектор-функция f(x,u, t) непрерывна по
совокупности переменных (х, и, t) е Еп х V х [*0, Г], удовлетворяет
условию (1). Тогда
т
max \x(t, v, щ) - x(t, и, Xq)\ К; с^ - Хо\ + % I \v(t) - u(t)\dt, (9)
t„<t <т
!„
408
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
где x(t, и, Xq) — решение задачи Коши (2), соответствующее
управлению u = u(t)e L^[t0, Т]: u(t) eV, t0^t < Г, и начальному условию Xq;
Доказательство. Существование траекторий x(t, и, Xq), x(t, v, у0),
t0^.t^.T, следует из теоремы 1.1. Обозначим для краткости Au(t) = v(t) —
— u(t), Ax(t) = x(t, v, y0) — x(t, u, Xq), Ax0 = y0 — x0. Тогда из (1.12) следует
t
Ax(t) = l[f(x(T,v,y0),v(T), t)-/(:e(t, u, аь), u(t), T)]dr + Axq.
Отсюда с учетом условия (1) имеем
\Ax(t)\ < L J \Ах{т)\йт + L I \Аи{т)\йт + |А^|.
Это неравенство запишется в виде (3), если принять <p(t) = \Ax(t)\, a = L,
т
b(t)= b = L J \Au(t)\dt + \Axq\. Отсюда и из леммы 1 следует оценка (9).
!°
Более тонкие теоремы о непрерывной зависимости решений задачи (2)
от исходных данных, справедливые без дополнительного требования (1) и
удобные для использования при доказательстве принципа максимума,
читатель найдет, например, в [14, 132; 212; 588].
2. Приступим к доказательству теорем 2.1, 2.2. Приводимое ниже простое
и изящное доказательство этих теорем принадлежит А. В. Арутюнову [44].
Доказательство теоремы 2.1 будет состоять из трех этапов. Вначале
исходная задача (2.1)-(2.4) аппроксимируется семейством конечномерных
задач. Затем к конечномерной задаче будет применен метод штрафных
функций для учета ограничений на концах траекторий и выведено необходимое
условие оптимальности для получившейся штрафной задачи. Наконец,
будет совершен предельный переход в полученных необходимых условиях и
установлена справедливость принципа максимума.
Сначала доказательство проведем в предположении, что решение
(¾.) Ч(*)) £*(*)) задачи (2.1)-(2.4) единственно. Через tut2,...
обозначим каким-либо образом занумерованные рациональные точки
интервала (t0, Г), являющиеся точками непрерывности оптимального управления
u„(i). Выберем во множестве V всюду плотную последовательность точек
vuv2, ... Зафиксируем произвольный номер N ^ 1 и для любого
натурального числа I < N выберем такие точки tlp = tlp(N)e(t0, Г), р=1, ..., N + l,
что
t; = tn < ... < tlp < ... < tlN +,, tlN + [ — t, ^ 1 /N,
[*«.*w + i]n[ttl*w + 1] = 0 VI, k, l^k, l^l,k^N,
причем, оптимальное управление u(t) непрерывно на отрезках [*,, tlN + i],
1 = 1, .. ., N. Обозначим через £ квадратную матрицу £ = {£гр} размерности
N, элементы которой удовлетворяют ограничению
<K^dw = min (V;!-*«„)■ (12-А)
Для каждой такой матрицы £ определим управление и(-, £) следующим
образом:
n(U)=(V **<*<** + ** Ul.Xtf, (13)
[_ ut(t) в остальных точках отрезка [*0, Г].
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
409
Нетрудно видеть, что управление (13) кусочно-непрерывно, u(t, ¢) е V
при всех t е [t0, Г]. Рассмотрим задачу: минимизировать функцию
т
Jw(ab, ¢) = 7(¾. и(; О) = $ /°И*), «(*, О, *)Л + ^(¾. х(Т)) (И)
при условиях:
x(t) = f(x(t),u(t,£),t), t0^t^T, x(t0) = x0, (15)
^,^))^0, i = l,...,m, g^, x(T)) = 0, i = m+ 1,...,8, (16)
£ = {£*}■• <K ^dW) ^=1,...,^, (17)
где управление u = u(t, £) определяется согласно (13). Подчеркнем, что при
каждом фиксированном JV ^ 1 задача (14)-(17) является конечномерной
задачей минимизации в пространстве переменных (х0, ¢): ¾ = (xl,.. ., х£),
£ = {£«„> i,p=i,...,^}.
Нетрудно видеть, что любой набор (¾ u(-, ¢)), допустимый в
задаче (14)-(17), является допустимым и в задаче (2.1)-(2.4), причем
значения целевых функций в обеих задачах на таком наборе совпадают.
Отсюда следует, что нижняя грань JN целевой функции задачи (14)-(17) не
меньше нижней грани J„ в задаче (2.1)-(2.4): JN > Jt. В то же время
оптимальный набор (x0t,ut(-)) задачи (2.1)-(2.4) является допустимым в
задаче (14)-(17), так как согласно (13) u(t,0) — u„(i), t0^.t^T. Тогда
Jt = ./(%,,, u„(-)) = J(%, u(-, 0)) = Jw(%, 0) > JN<. Следовательно, J, = Jw> =
— 4(¾^ 0). По предположению задача (2.1)-(2.4) имеет единственное
решение. Тогда и задача (14)-(17) также будет иметь единственное решение
(%) £* =0) ПРИ каждом фиксированном N > 1.
Применим к задаче (14)-(17) метод штрафных функций. Обозначим
ftwKi 0 = ft(^, я:(Г)) = 3,(¾) z(^ «(•, ¢), 0¾)). г = 1,..., в,
9?(*,у) = \Т{0''9Чх'у)}' 'I1—;™' (is)
{. 9 > г — m ~t I,..., s.
Рассмотрим задачу: минимизировать функцию
Ф*(аЪ, О = 4(¾ О + Ак ±Ш*о, О)2 =
= $№(*),и(и),0**+А°(^*(Г)) + А £(^,z(T)))2 (19)
при условиях
x(t) = f(x(t),u(t,t),t), t0^t^T, x(t0) = x0, (20)
£ = {U> «ке,,^, г,р =1,...,n, (21)
k-%1^1, (22)
где Ак>0, к=0, 1,...; {At}—>оо (например, Ак=к). Если ввести множество
и0 = {ЫО- k- %1<1, 0^,,^, г,р = 1,.. .,
то задача (19)-(22) может быть кратко записана в виде
*fc(^.€)-T*Inf, (аь.Ое^о- (23)
410
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Покажем, что задача (23) имеет хотя бы одно решение. Сначала убедимся,
что функции JAxq, О, &w(zb, О непрерывны по совокупности (xq, £") на
множестве U0. Пусть (xq, £), {xq + Axq, £ + Л£) 6 U0. Согласно оценке (9) с
учетом (13) имеем
maxT\x(t, и(-,£ + A£),x0 + Ax0)-x(t,u(;£),x0)\^
< cJA^I +¾ J |u(i, £ + АО - n(i, ОИ* =
'о
N !.р+£.Р+Д£.р
= 0,^^1 + ¾ £ J |«„-«,(*)!<** ^Да^ + с^Де!, (24)
где ''P=1 *» + t*
^ = ¾^2 sup sup |«„-и,(*)|, |Д£| = max |Д£,|.
Из непрерывности функции f°(x, и, t), g'(x, у) по совокупности своих
аргументов и оценки (24) следует непрерывность функций Jn{xq, £)> 5^(¾ 0>
^(¾ £)> ^(¾) О на компактном множестве £/0. Согласно теореме 2.1.1
Фь = inf Ф^(ж0, О > — оо и существует хотя бы одна точка (а^, £к) € ?70,
в которой нижняя грань достигается. Покажем, что последовательность
(¾) £к = {£гР})> ^=0,1,..., решений задач (23) сходится к решению
(а^, £ф = 0) задачи (14)-(17). Воспользуемся теоремами 5.15.1, 5.15.2.
Проверим выполнение условий этих теорем. Непрерывность функций JN(x0, £)>
giN(xQ, £) мы уже установили. Из непрерывности Jn{xq, £) и
компактности UQ следует, что Jtt — inf Jn{xq, £) > -оо. Множество Us = {(¾, £)eU0:
5^(¾) О ^ ^. г = 1,..., а} ограничено в силу ограниченности U0 при
любом о > 0. Все условия теорем 5.15.1, 5.15.2 выполнены. Поэтому решение
задачи (23) или (19)-(22) сходится к решению задачи (14)-(17) как по
функции, так и по аргументу. Поскольку задача (14)-(1/) имеет
единственное решение (¾^ £ф = 0), то
11m £k = t =0, lim afo = a^, ' lim Ф^а^, £к) = Jw = J,. (25)
к —ioo к ~too к —too
Из оценки (24) при £ = £ф = 0, 2¾ =¾. Д£ = £t, Да% = а™ - % получаем
lim max \xk(t) - х„(г)\ = О, (26)
■ к —* оо tn < t ^ T.
где a;t(t)=a;(t,ut(-),^)=a;(t,u(-,0),^) — оптимальная траектория в
задачах (14)-(17), (2.1)-(2.4), xk(t)=x(t, и(-, £,.), %.)— оптимальная
траектория в задаче (19)-(22). Кроме того, из теорем 5.15.1, 5.15.2 следует
\im gr(x0k,xk(T)) = 9r(x0t,xt(T)) = 0, 4 = 1,...,8. (27)
к ~* оо
Задача (19)-(22) представляет собой задачу оптимального управления с
подвижным левым концом и! свободным правым концом траектории и
поэтому для приращения функции (19) нетрудно получить формулу, которая
понадобится нам при получении необходимых условий оптимальности для
задачи (19)-(22). Будем рассматривать задачи (19)-(22) со столь большими
номерами к, чтобы
1¾-;%.!<!, (K££<dwl l,p=l,...,N; (28)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
411
это возможно в силу равенств (25), из которых вытекает, что
неравенства (28) будут выполняться для всех к ^/¾. где /¾ — достаточно большое
число. Оптимальному решению (а^, £к) задачи (19)-(22) в силу (28)
можно дать такие малые ненулевые приращения (Axq, Д£)> что
К,+А^-^|<1, 0^tP+^<dNt Д^О, l,p=l,...,N, к^к,. (29)
Тогда оптимальное управление uk(t) = u(t, £,) и траектория xk(t) =
= x(t, 14,(-), Xqj.) задачи (19)-(22) получат приращение Au(t) = u(t, £k +
+ A£k)-u.(t), Ax(t) = x(t, uk+Au, x0k + Ax0)-xk(t), t0< t < Т.
Приращение Ax(t) удовлетворяет условиям
Ax(t)=Af=f(xk(t)+Ax(t),uk(t)+Au(t),t)-f(xk(t),uk(t),t), (m
t0^t^T, Ax(t0) = Ax0, '
вытекающим из (20). Из (24) для Ax(t) следует оценка
max |Az(t)|< с,|Да*,|+ 0^(^1. (31)
С учетом оптимальности (:%, £,) для приращения функции (19) получим
О < ДФ, =Фк(хок + Ах,, tk+A£)- ¢,(¾. £,) =
= ][f°(xk(t) + Ax(t),uk(t) + Au(t),t)-f°(xk(t),uk(t), t)]dt +
+ ^(¾ +Д¾, xk(T) + Ax(T)) - д\х^к, xk(T)) +
+ Ак>±[(дПхок+^ч(Т) + Ах(Т))?-(д?(х0,хк(Т))У} =
= JA/°dt + (jX. 4(T))+ E 2.4,^+(¾. ^(T))^,, z,(T)), ДаЛ +
+ ^(^.^4(^))+^2^,^(^,^(^^(^,^(^)^1(^^+11,,, (32)
где
Af° = f°(xk(t) + Ax(t),uk(t) + Au(t),t) -f°(xk(t),uk(t),t),
Rik=((9°* {.в.)-90л- .■))+El2^(ft+(_0_)ffi(.0.)-ft+(..,)9i(...))Iд¾)+
+^°(-0-)-^O(-■ -))+g2A^^(.^)^(-0-)_^(-■ -^^-■ -))^0,(^: (33)
для краткости здесь обозначено " ) =(х0к + вАх0, хк(Т) +вАх(Т)), 0<
<в<1,(...) = (х0к,хк(Т)). •■ ,v"'
«Ofc =
1 + Е(2А,^(^,а;,(г)))2"1/2
i = i
(34)
a«=2At0^(¾. хк(Т))аок, i = 1,...,8, a, = (^,,..., а3,).
412
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Отсюда и из (18) следует, что
(Xoo^l, aik>0, ...,атк>0, к|2=£с4 = 1. (35)
Для преобразования правой части равенства (32) к более удобному виду,
введем функции
Н(х, U, t, ф, Оц) = -%f°(x, u,t)+ (ф, f(x, и, t)),
l(x, у, a) = a0g°(x, y)+ ... + asgs(x, y)
и сопряженную задачу
^*(*) = --H«(:ci«.*iV'i4o)L=^(t),«=ib(t)I*=^1%=%4i (37)
ФЛТ) = -±ал9^хак,хк(Т)) =-^^^^-, (38)
где aik взяты из (34). Напоминаем, что в соответствии с определением 1.1
решением задачи (37), (38) называется непрерывная вектор-функция фк(Ь),
являющаяся решением интегрального уравнения
А(*) = $ Нх{хк{т), ик{т), т, фк(т), а^йт + фк{Т). (39)
Система (37) линейна относительно фк\ существование и единственность
решения задачи (37), (38) следует из теоремы 1.2. При сделанных
предположениях относительно функций f'(x, и, t), г =0, ..., п, как видно из (39),
функция фк(Ь) во всех точках непрерывности управления uk(t) непрерывно
дифференцируема и удовлетворяет уравнению (37).
Умножим равенство (32) на % > 0 и с учетом обозначений (34), (38)
перепишем его в виде
(К а0кАФк = ] a0kAf4t + (± attfli(abt) хк(Т)), АхЛ -
-(фк(Т),Ах(Т)) + ао,Л14. (40)
Преобразуем третье слагаемое из правой части (40). С учетом
соотношений (30), (37), (38) имеем
(фк(Т), Ах(Т)) = $ ^<V*(t), b*(t))dt + (фк(Ь0), Ах,) =
= ]((1>k(t), Ax(t)) + (фк(Ь), Ax(t)))dt + (фк(Ь0), Ах0) = :
= ](фк(Ь), Af)dt - ](Hx(xk(t),uk(t), t, фк{1), aQk), Ax(t))dt +
+ (фк(Ь0),Ах0). (40.А)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
413
Подставим (40.А) в (40); с учетом обозначений (36) будем иметь
0 < Оо,АФ, = - l[H(xk(t) + Ax(t), uk(t) + Au(t), t, фк(1), %k) -
- H(xk(t), uk(t), t, фк(Ь), %k)]dt +(^4*ok.*b{T),ak) _ ^(U д^ +
+ \(Hx(xk(t), uk(t), t, фк(Ь), a0k), Ax(t))dt + Oo,i?u. (41)
В силу формулы конечных приращений
Н(хк + Ах,ик +Аи, t, фк, аок) = Н(хк,ик +Аи, Ь,фк,а0к) +
+ (Нк(хк + в1Ах,ик+Аи,Ь,фк,а0к),Ах), 0< 0, < 1. (41.А)
Отсюда и из (41) получим
О < ао.ДФ, = - ][H(xk(t), uk(t)+Au(t), t, фк(1), aQk) -
- H(xk(t), uk(t), t, фк(Ь), %k)]dt + ^«bfci^Ikffc) _ фМ, A^ + Rk,
где ^ = ^0^,,+^, (42)
R2k = ~ I(Ht(xk(t) + e{Ax(t), uk(t) + Au(t), t, фк(1), %k) -
- Hx(xk(t), uk(t), t, фк(1), aQk), Ax(t))dt. (43)
Покажем, что
i?, = o,(|A^| + |A^|), limok(a)/a=0. . (44)
a —i\J
Из непрерывности функции g{(x, у), gf(x, у), gx(x, у), gly(x, у), оценки (31)
и выражения (33) для Rlk следует, что %Лц = ол(|Да%| + |Д£|). Далее,
перепишем выражение (43) для R2k в виде R2k = R3k + Rik, гДе
^ = - \Шч(*) + ОАФ), «(*. ^ + АО, *, <М*), %k) ~
- Hx(xk(t), u(t, £к + АО, *, V*(*)> <%*), Ai('f))dt, (45)
Д« = - \(Hx(xk(t), u(t, ^ + АО, *, V>*(*)> %к) ~
- Hx(xk(t), u(t, Q, t, фк(1), OoJ, Ax(t))dt.
Напомним, что управления u(t, £k), u(t, £k+A£) определены согласно (13).
Отсюда и из неравенств (21), (22), (28), (29), (31) следует, что аргументы
х, и, t, ф функции Нх в формулах (45) принадлежат ограниченному
замкнутому множеству QkN = {(х, и, t, ф): \х\ < max |a:fc(t)l + ^(1%,! + 1) +
+ C2WiV2dw, \u\^ sup k(i)| + max \v\, t0^t^T, \ф\^ max |^(*)l}-
414
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Непрерывная функция Нх(х, и, t, ф, а0к) переменных (х, и,Ь,ф) на
компактном множестве Qk„ будет равномерно непрерывна на этом множестве.
Отсюда и из оценки (31) следует, что R3k = ок(]Д^| + |Д£ |). Далее, с учетом
определения (13) управлений u(t, £к), u(t, £к + Д£) имеем
I ту I
1-^4¾ I —
£ ? S (%(*)."P,t,A(*).%)-
(,p=i
~Hx(xk(t), ut(t), t, 4k{t), OoJ, Ax(t))dt
й
<: 2|Д£ | sup \Hx(x, u, i, V, o0fc)||Aa:(t)| = ок(|Даь| + |Д£ |).
Суммируя полученные оценки для i?lfc, Д3к- Щк > придем к оценке (44).
Итак, нужная формула (42) для приращения функции (19) с оценкой
остаточного члена (44) получена. Положим Д£ =0, Д^ = — е I —^'^ к —
— фк(^) ), где число е > 0 столь мало, что выполняется первое из
неравенств (29); тогда Ди(*) = 0 и из (42), (44) получим 0 ^ ащДФ* =
■ —£
Щх0к>хк(Т)'ак)
дх
МЬ>)
+ ок(е) или
£
°fc(g)
Отсюда при е
ЩХ0к<Хк(Т)>ак) ,1, (4. \
■ О имеем
ФМ=д1Ы'%(Пак\ *>К- (46)
Далее, положим в (42) Да\, = 0, матрицу Д£ = {Д£;р} возьмем так, чтобы
элемент, находящийся на пересечении произвольным образом
фиксированных 1-й строки и р-то столбца, 1 ^ I, р ^ N, равнялся е > О, а остальные
элементы равны нулю, причем е возьмем столь малым, чтобы выполнялось
второе неравенство (29). Тогда согласно (13)
при % + £*<*< tlp + £ * + £,
О в остальных точках из [i0, Т],
Au(t) = u(t,$k + A$)-u(t,$k) =
и из (42), (44) получим
О^ОокДФ,=- ^[H(xk(t),vp,t^k(t),a0k)-
Л**' -H(xk(t),4(t),t^k(t),avk)]dt=ok(e). (47)
Заметим, что подынтегральная функция gk(t) = H(xk(t), vp, t, фк{Ь), а^к)~
~H(xk(t), ut(t), t, фк{Ь), Oofc) непрерывна на отрезке [tlp + £*, tlp + £* +
+ e]. Применяя теорему о среднем, из (47) имеем 0 ^ —gk{% + £гР + в2е)е +
+ок(е), 0< #2< 1. Разделим это неравенство на е>0 и совершим предельный
переход при е —> 0. Получим 0^ —gk(tiv + £,*) или
[H(xk(t), «Р, *, <М*)> «о*) - #(**(*), Ч(*), *, A(t), «о*)].-<„ + «{ < 0 (48)
.§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
415
при всех к ^ &Q, I = 1,.. ., N, р = 1, ..., N.
Заметим, что соотношения (35), (37), (38), (46), (48), представляющие
собой необходимое условие оптимальности в задаче (19)-(22), вполне
аналогичны соотношениям (2.7)-(2.10) из теоремы 2.1. Соотношения (35), (37),
(38), (46), (48) получены при фиксированном N > 1 и справедливы при
каждом к ^ &Q. Для завершения доказательства теоремы 2.1 остается
сначала перейти в этих соотношениях к пределу при к —> оо, считая N
фиксированным, затем совершить предельный переход при N —> оо. Поскольку
построенные выше последовательности {%}, {i>k(t)} зависят от N, то их
предельные точки, вообще говоря, также будут зависеть от N. В
дальнейшем нам будет полезно явно подчеркнуть эту зависимость и поэтому
упомянутые последовательности и их предельные точки ниже будем снабжать
индексом N.
Согласно (35) последовательность ак = (oQk,alk,.. . .,а^) = ak(N), к =
= 0, 1,..., ограничена и, пользуясь теоремой Больцано — Вейерштрасса, из
нее можно выбрать подпоследовательность, сходящуюся к некоторой точке
а = a(N) = ((^(N), ^(TV),..., ak(N)). Без умаления общности дальнейших
рассуждений можем считать, что сама последовательность {afc(-/V)}
сходится к a(N). Из (35) следует
0<a0(7V)^l, 0,(^0,...,0^)^0, \a(N)\' = ±a%N) = \. (49)
»=0
Далее, пользуясь непрерывностью д*(х, у) и равенствами (25), (26), из (38)
при к —> оо получим
lim A(T;N) = ^(T;N) = -dl(x°*'^«N». (50)
к —» оо "
Покажем, что последовательность {i>k(t)} = {фк{Ь, N)} равномерно на
[£0, Г] сходится к решению i[)(t; N) системы уравнений
^(*;^) = -Я,(!ц,(*),ч(*),*.^(*;^).ао(^)). to^t^T, (51)
с начальным условием (50). Как и в задаче (37), (38) решение задачи (51),
(50) существует, единственно, является непрерывным решением
интегрального уравнения
</>(<; N) = ] Hx(xt(r), ч(т), г, ф(т; N), (^(N^dr + ф(Т; N), (52)
г
во всех точках непрерывности оптимального управления ut(t) непрерывно
дифференцируемо и удовлетворяет уравнению (51).
Обозначим Д^(*) = А(*: N)-il)(t;N), t0^t <: Т. Из (39), (52) с учетом
определения (36) функции Я и ее производной Нх имеем
ДА(*)= X t ^ik(-r)f:(xk(T),uk(T),T)dT + bk(t;N) + AA(T), (53)
г t = i
где , т ... ,
bk{t\N) = -\{ckik{N)-ch{N))px{xk{T),uk(T),T)dT-
t
- %(Ю ][f!(xk(T), ик(т), т) - >Л^(т), щ(т), r))dr -
t
- %(N) ШхЛт), щ(т), т) - /Л^(т), Ч(т), T)]dr +
416
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
+ ] рМт; N)[f:(xk(r), ик(т), г) - f:(xt(r), ик(т), r)]dr +
+ ] t ФЛт; N)[f:(xt(r), ик(т), т) - f;(x*(r), ut(r), r)]dr. (54)
г i = i
Покажем, что {bk(t;N)} —>0 при к —>оо (N фиксировано!) равномерно на
отрезке [t0, Т]. С этой целью заметим, что в силу (21), (22), (28),
оценки (24) при £ = 0, Д£ =£к и определения (13) управления uk(t) = u(-, £к)
аргументы (х, и, t) функций f£(x, и, t), входящих в (53), (54), принадлежат
компактному множеству QN = {(х, и, t): \х\ < max |ж„(*)| + С[(|:%| + 1) +
+ CjjvTV2^, \и\ < sup К(£)| + sup \vp\, t0 < t ^ T} при всех к ^ ^¾.
Непрерывные функции f*(x,u,t) на QN будут ограничены и
равномерно непрерывны по совокупности аргументов (х, и, t) € Q„. Следовательно,
max max \f*(x, и, t)\ = LN <oo. Отсюда и из {^(-^))-^00(-^) получа-
ем, что 1-е слагаемое из правой части (54) стремится к нулю равномерно на
[*0, Г]. Равномерная сходимость к нулю 2-го слагаемого из (54) следует из
равномерной непрерывности f°(x,u,t) на QN и равномерной сходимости
{xk(t)} к xt(t), вытекающей из оценки (24) при £ = 0, Д£ = £к. Для 3-го
слагаемого из (54) с учетом определения (13) управлений uk(t) = u(t, £к),
ut(t) = u(t;0) имеем
Oo(JV) П№*Ы, ик(т), т) - Я(х,(т), ч(т), T)]dT
t
= ao(JV) £ " Г №Ыт), vp, т) - £Ыт), щ(т), T)\dT <
l,p=l t,p
^<%(^)l£J-2, max \tf(x,u,t)\-+0
(1, и, t) € Q„
при к —>оо равномерно на [£0, Г], так как |£J —>0 в силу (25). Аналогично
доказывается равномерная на [t0, Т] сходимость при к —> оо 4-го и 5-го
слагаемых из (54). Таким образом,
lim sup \bk(t;N)\=0. (55)
к ~* °° % =s(=s т
Далее, из (53) имеем
|Д^(*)1 < ILN ± \^ik(r)\dr + \bk(t;N)\ + |Д^(Г)| ^
<: LN^ \ LN\A^k(r)\dr + \bk{t; N)\ + |Д^(Г)|, t0^t^T.
t
Как видно, функция tp(t) = \Ai/jk(t)\ удовлетворяет неравенству (6) с а =
= LNy/n, b(t) = \bk(t; N)\ + \Аг[)к(Т)\. Тогда в силу (7) получаем
|A^(*)l = №(t;W)-^(*;JV)l<
< LNV^]{\bk(t;N)\ + \Афк(Т)\) exp{LNV^(r - t)}dr +
+ \bk(t;N)\ + \&MT)l t0^t^T.
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
417
Отсюда и из (50), (55) следует
lim max \4k{t;N)-1>{t;N)\ = 0. (56)
Из (46) с учетом (26), {ak(N)} —> a(N) при к —>оо тогда имеем
lim A(to;N) = 4>{to;N)="{*"*£)MN)). (57)
к —» оо ^^
Перейдем к пределу при&—юо в неравенстве (48). При этом заметим, что
\xk(t + At)-xk(t)\^ $ f(xk(r),uk(T,tk),T)dT ^LN\At\,
t
Vt, t+At€[t0, Г] Vfc^^,
где LN = sup|/(a;, u, t)\, QlN = {(x, u, t): \x\ ^ max |a;t(t)| + 1, |u| ^
Яш t£[t0<T]
< sup |ut(t)| + sup \v\, t0^.t^T}, k^ — достаточно большой номер;
(€[(0,Г] Up«JV
здесь учтено, что max |a;fc(i)| < max \xt(t)\ + 1 Vfc ^ &g в силу (26),
sup \u(t, £k)\ ^ sup |u»(£)l + max \v | в силу (13). Отсюда и из (25),
(26) имеем lim xk(tt + £t) = х^ь). Аналогично, с использованием (25),
к —»оо
(26), (37), (38), (56) доказывается, что lim ■фк{Ь1р + £,1) = ф{Ь1] N). Отсюда
к —* оо
и из (48) при к —> оо с учетом равенства lim aQk(N) = (^(N) и непрерыв-
к —»оо
ности функции Н по совокупности своих аргументов получим
[H(xt(t),vp,t,i)(t;N)M^)-H(x^t)Mt),tMt;N),a0(N))]t^O (58)
для всех I, р = 1,..., N.
Наконец, совершим предельный переход при N —> оо в
соотношениях (49)-(51), (57), (58). Выбирая при необходимости
подпоследовательность из {o(7V)}, можем считать, что сама последовательность {a(N)} —>
—> a = (oq, an ..., as). Тогда из (49) сразу получим
О^Оо<1, 0,^0,...,0^0, |о|2=£о? = 1. (59)
г=0
Из (50) при N —> оо имеем
lim ф{Т;Н) = ф{Т) = -Щ^'х*{Т)'а). (60)
JV—* оо wv
Покажем, что последовательность {^(t;N)} равномерно на [*0, Г]
сходится к решению ф{Ь) системы уравнений
^(*)'=-Я,(^(*),ч(*).*.^(*),ао). to^t^T; (61)
с начальным условием (60). Существование и единственность решения
задачи (61), (60) следует из теоремы 1.Г. Выпишем интегральное уравнение,
которому удовлетворяет решение задачи (61), (60):
ф(Ь) = 1 Нх(щ(т), Ч(т), т,ф(т), ajdr + ф(Т).
418
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Отсюда и из (52) для разности А.ф(t) = ^(t; TV) — ф(Ь) имеем
AV-(t) = Ш-aoiN) + ОоШаЦт), Ч(т), г) +
+ 12Щ{т№{х,(т), ч(г), r))dr + &ф(Т), t0<:t<:T.
Тогда
г
t
где L = max sup \fi(xt(r), ut(r), т)\. Отсюда и из неравенств (6)-(8)
следует
^ exp{Lv^(T - t0)}(L(T - to)K(^) - ool + |Д^(Г)|), t0^t^T.
Тогда в силу (60), {а0(-Ю} "^ °о будем иметь
lim max |^(t;JV)-V(*)| = 0. (62)
Из (57) с учетом (62), {a(iV)} —> а получаем
lim ф{Ь0-Н) = ф{10)=Щ^хд^а). (63)
It+At
\ Hx(xt(r), ut(r), т, ф(т; N),
<h(N))dr
<Ь,|Д*| Vt, t+At€[t0, Г], JV>7V0, где!,1=8ир|Я1(а;,,(т),ч(т),т,
•0, /i)|, (д={(ф,ц): \ф\^ max |^(t)|+l; I/^I^Oq+1}; здесь учтены равенст-
ва (62) и lim 00(^)=¾. Отсюда из (12), (62) имеем lim ^(¢,-.^)=^0(4,).
JV—» 00 JV —»00
Переходя к пределу при 7V—>оо, из (58) получаем
H(xt(tt), vp, t,, V(*i). «о) ~ H(x*(ti), 4(*i). *n V»(*i). Oo) < 0, ? = 1, 2,...
В силу плотности последовательности точек {г>р} во множестве V отсюда
получаем
Я(аЦ*,), v, *,, </<(<,), оо) ^ Я(^(*,), «,(*,), t„ V(<,), <%) V« € V; г = 1, 2,...
Последовательность {*,} рациональных точек интервала (t0, Г),
являющихся точками непрерывности оптимального управления «»(£), всюду плотна
на отрезке [£0, Т]. Поэтому предыдущее неравенство справедливо для всех
t E[t0, Т], в которых ut(t) непрерывно:
H(xt(t), v, t, ф(1), оо) ^ H(xt(t),\(t), t, </>(*), oo) Vu <E К
Поскольку при v = ut(t)e V здесь получаем равенство, то
max H(xt(t), «, *, V>(<). «0) = Я(я^(*), 4(i)> *, V>(<), «о) (64)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
419
во всех точках непрерывности ut(t).
Далее, докажем, что
aigi(x0t,xt(T))=0, г = \,...,т. (65)
Для тех номеров г, l^i^m, для которых ^(¾.) Х*(Т)) = 0,
равенства (65), конечно, выполняются. Пусть #4¾.) жДГ)) < 0. Из (25), (26)
тогда следует: #*(%.1 хк(Т)) < О при всех к > ^,, где /¾ достаточно
большое число. Поэтому из формул (18), (34) получаем aifc = а.к (N) = 0 для
всех к ^ /¾. Тогда lim aifc(-ZV) = аг(7\Г) = 0 для каждого N > 1. Следова-
fc —* оо
тельно, lim aAN) = а{ = О для тех номеров г, 1 < г < т, для которых
JV-» оо
#4¾.) xt(T)) < 0. Равенства (65) доказаны.
Соотношения (59)-(61), (63)-(65), составляющие основное
содержание теоремы 2.1, установлены. Тем самым теорема 2.1 полностью
доказана для случая, когда задача (2.1)-(2.4) имеет единственное решение
(%.> ""*(*)> £*(*))• Общий случай, когда задача (2.1)-(2.4) имеет более чем
одно решение, легко сводится к рассмотренному случаю. А именно, пусть
(%о ""*(*)> ж*(*)) 0ДН0 из решений задачи (2.1)-(2.4). Введем новую
фазовую координату xn+l и к системе (2.2) добавим еще одно уравнение
i» + 1(*) = l«(*)-4(*)l = /"+1(u(*)>*)> t0^t^T, x»+l(t0) = xS+l. (66)
Введем функцию
Jl(x0,x0^l,u(-)) = ]f0(x(t),u(t),t)dt+g0(x0,x(T)) + (x"+i(t0)r +
+ К - %|2 = $ f°(x(t), u(t), t)dt + <7°0*b, я(П zn+4*o)), (67)
где gf(x,xn + l,y) = g°(x,y) + (xn + l)2 + \x — x0t\2. Рассмотрим задачу
минимизации функции (67) при условиях (2.2)-(2.4), (66). Нетрудно
видеть, что JAxq, x^ + l,u(-)) > J(x0,u(-)) ^ Jt для всех допустимых
наборов (¾. а$+\ и(-), ж(-), хп+1(-)) задачи (67), (2.2)-(2.4), (66), для которых
Хофх^, х£+х^0, «(-)^Ч(О- В то же время J,(^, 0, u,(-)) = J(av, 4.(0) =
= Jt. Это значит, что функция (67) при условиях (2.2)-(2.4), (66)
достигает своей нижней грани на единственном допустимом наборе (%, x£t+l =
= 0,и,(-),х,(-),х,п+[(-) = 0). Следовательно, для задачи (67), (2.2)-(2.4),
(66) справедлив принцип максимума. Конечно, для полной строгости
надо оговорить, что функция fn+l(u, t) = \u — ut(t)\, находящаяся в правой
части уравнения (66), необязательно непрерывна по t е [^>, Т] и, строго
говоря, не удовлетворяет условиям теоремы 2.1. Но, тем не менее, благодаря
тому, что fn + l(u, t) кусочно-непрерывна по t, не зависит от х,
удовлетворяет условию (1), нетрудно проследить, что все вышеприведенные
рассуждения, приведшие к соотношениям (59)-(61), (63)-(65), сохраняют силу
и для задачи (67), (2.2)-(2.4), (66). В этой задаче функция Гамильтона —
Понтрягина имеет вид
Я,(в, хп+\ и, t, ф, фп + 1, Оо) = -Оо№, и, t) + (ф, f(x, и, t)) +
+ Фп+iW - ч(*)1 = н(х> ""> *» $> <h) + Фп+А» - иЛ*)\-
420
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Согласно уже доказанному случаю принципа максимума найдутся числа
Oq, о,, ..., as и вектор-функция (V40) V\,+i(0)> *о ^ * ^ Т, такие, что
0=(0,,,0,,...,0,)^0, 0(,^0, о,^0, ...,от>0,
^(0 = -Я,ЛаЦ0,<+40, МО, *,V40,V<n+i(0, <*(,) =
= -Я,(^(0,ч(0,*,^(0,Оо), to^t^T,
4>n + l(t) = -Hlx„+l=0, t0^t^T;
условие максимума
max Я,(аЦО, К+ 40, «, *, V40, V>„+i(0, %) =
= ^(0,^+40,4(0,^(0,^+1(0,¾)
выполняется во всех точках непрерывности ut(t); справедливы условия
трансверсальности
V'(4o)^g?^^,^+44o)=o,^4r))+EoJgi(^,^r))=8;(^'2(r)'a),
^„+i(<o) = ao^"+i + Е а,-^'п+1 =0,
з = 1
^(Г)=-Оо<(^, <+ 4*о)=0, ^(Г))-Ёа^(^, ^))=-¾¾^^
Vn + i(T) = -Oo^+,(^aC+4*o) = 0, ^(Г)) -Е а.^„+1(^, я,(Т)) = 0
3 = 1
и условия дополняющей нежесткости
а^Д^ч жн,(Т)) = 0, г = 1,...,т.
Из этих условий следует, что ^n + ,(t) = 0. Учитывая это равенство в
полученных условиях, снова придем к соотношениям (59)-(61), (63)-(65) и в
том случае, когда в задаче (2.1)-(2.4) оптимальное решение не
единственно. Теорема 2.1 доказана. □
2. Теорема 2.2 доказывается аналогично теореме 2.1, поэтому мы здесь
наметим лишь схему доказательства. Будем предполагать, что условие (1)
выполнено при всех t gR. Сначала рассмотрим случай, когда задача (2.37)-
(2.40) имеет единственное решение (а^, ut(t), xt(t), t0t, Tt), t0t < Tt.
Доопределим ut(t) = ut(t0t + 0) при t < i0*. 4(0 - иЛт* ~ °) ПРИ * > т*- Как
и выше, все рациональные точки, принадлежащие интервалу (£0*, X), в
которых управление ut(t) непрерывно, занумеруем каким-либо образом в
виде последовательности *,, *2, ...,*,,... В множестве V выберем
некоторое счетное всюду плотное множество точек vu v2,..., vp,... Зафиксируем
произвольный номер N > 1 и для каждого I = 1, 2,..., N выберем точки
*|Р € (*о*> Т„), р = 1,.. .,N + 1, и матрицу £ = {£1р}, удовлетворяющие
условиям (12), (12.А). По аналогии с (14)-(17) рассмотрим следующую
конечномерную аппроксимацию задачи (2.37)-(2.40):
ЛгК. £. *о> Т) = ^(¾. «О, 0>ж(-)> *о, г) =
= X /О(я!(0, «(*, О, 0<** + ^(¾. я(Т), t0, Т) - inf, (68)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
421
x(t) = f(x(t),u(t,0,t), t0^t^T, x(t0)=x0, (69)
д'(яь,я!(Г)Л.Г)<0, i = l,...,m,
gi(x0,x(T),t0,T) = 0, i=m+l,,..,s,
u(tf) = i4. **,<*<*«, + £*,, U^^TV, (71)
1 u,(t) для других teR.
Так как уравнение ut(t) кусочно-непрерывно на отрезке [t0t, TJ, то
найдутся столь малые положительные числа At0JV, ATN, что t^ + AtpN < Tt — ATN
и на отрезках [t0t, t0t + At0N], [Tt - ATN, TJ управление ut(t)
непрерывно и эти отрезки не содержат точек {tlp}, I = I,. .., N, р = 1,..., N + 1.
Задачу (68)-(71) будем рассматривать при дополнительных ограничениях
(x0,£,t0,T)eU0 = {\x0-x0t\^l, 0^$lp^dN, l,p = l,...,N,
\t0-t0t\^At0N, |Т-Т,|<ДТ„}. (72)
Любой набор (^, £, t0, Г), допустимый в задаче (68)-(72), порождает
допустимый набор (x0,u(t) = u(t,^), x(t), t0, Т) задачи (2.37)-(2.40), причем
значения целевых функций в обеих задачах на таких наборах совпадают. В
то же время оптимальное решение (av, ut(t), xt(t), t0t, Tt) задачи (2.37)-
(2.40) соответствует допустимому набору (av, |t = 0, t0t, Tt) задачи (68)-
(72). Рассуждая также, как в задаче (14)-(17), отсюда заключаем, что
набор (%,, £„ = 0, t0t, TJ является единственным решением задачи (68)-(72),
причем JN(xo„ £„ t0t, TJ = J*. __
Применяя к задаче (68)-(72) метод штрафных функции, придем к задаче
¢,(¾. $, t0, Т) = ^(¾. £, t0, Т) + к £ Ш*о, £, «о, Т)? =
= \ f°(x(t), u{t, О, t)dt + /(¾. х(Т), to, Т) +
+ kJ2(g?(x0,x(T),t0,T)y^ml (73)
i = i
x(t) = f(x(t),u(t,0,t), to^t^T, x(t0) = x0 (74)
(xo,t,to,T)€U0, (75)
где по аналогии с (18) обозначено ^(^£,^,^) = ^(¾. x(T,u(-,£),
3¾) to), t0, I ),
Тч Г max{0; д\х,у,Ц, Г)}, г = 1,..., m,
ft(^tt^' ,-U'(*ttA>,n «=m+l,...,e.
, При сделанных предположениях относительно функции f(x,u,t) в силу
теоремы 1.1 решение задач Коши (69), (74) существует на любом конечном
отрезке [а, Ъ] и единственно для всех (¾) £, t0), 1¾ — %J ^ 1, 0^ Л ^ dN,
|t0-t0J < At0N. Зафиксируем какие-либо а, Ь так, чтобы а< t0t < Tt< Ъ, и все
управления u(t, £) и траектории x(t) = x(t,u(-, £), ¾, t0) в задачах (68)-
(72), (73)-(75) будем рассматривать лишь при t е [а, Ъ]. Величины At0N,
422
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
ATN в (72) можем считать столь малыми, что At0N < t0t — a, ATN <Ъ — Tt.
Справедливы неравенства:
sup |u(t,£)|< sup k(i)|+ max |«|=clw, (76)
a<Zt<Zb a^t^b UP^JV
max \x(t, u(-, O, Xq, t0)\ < max \xt(t)\ + ^(1 + At0N + dN) = ^,(77)
a^ t ^ о a^ t ^ о
(79)
(80)
(81)
max |as(*, u(-, $), Xq, t0) - xt(t)\ ^ ^(1¾ - %,| + |t0 - t0J + |£|),
1^1 = , max |^,p|,
max |as(*, u(-, $ + A$), 3¾ + Дж0, t0 + Д*0) - x(t, u(-, $), Xq, t0)\ ^
^c^dAxol + lAQ + lAtl),
\x(t0 + At0,u(-, £ + A$),x0 + Ax0, t0 + At0)-x(t0,u(-,$),x0, t0)|<
<<™(|Д<ч,1 + |ДА)1 + |Д£1).
\x(T + AT, u{-, £ + ДО, 3¾ + Axa, t0 + At0) - x(T, u(-, $), %, t0)\ <:
< Сб^(|Accbl + |At0| + |AT| + |A<e |),
\x(t,u(;$),x0,t0)~x(T,u(-,$),x0,t0)\^c7N\t -t\, t, т € [a, b], (82)
где через ciN обозначаются положительные постоянные, не зависящие
от Дай, Д*0, ДГ, Д£, но, вообще говоря, зависящие от N; в (76)-
(82^ предполагается, что (xq, £, t0, Г), (¾ + Axq, £ + Д£, t0 + At0, Т +
+ AT) € U0. Оценка (76) вытекает из определения u(t, £) (см. (71)),
(77) является следствием (78), оценки (78), (79) получаются, как и
аналогичные (11), (24), с помощью леммы 1. При оценке интегралов вида
% + Ai0 Г+ДГ
$ /(z(*»«(-»0»a\)»A))»u(*,0»*)rf*. S /(в(*»«(•» 0|Эв»*о)»«(*»£)»*)<**.
t
§f (х(6,и(-, $),x0,t0),u(d,£),6)dd, возникающих при доказательстве нера-
т
венств (80)-(82), нужно иметь в виду, что здесь аргументы
непрерывной функции f(x,u,t) в силу оценок (76), (77) принадлежат
компактному множеству QN = {(х, и, t): \х\ ^ сш, \и\ ^ сш, t е [а, Ь]} и поэтому
sup {/(ж, и, t)\< оо.
Вернемся к задаче (73)-(75). Из оценок (76)-(82) следует, что функция
Фк(х0, £, t0, Т) непрерывна на компактном множестве U0 и в силу
теоремы 2.1.1 задача (73)-(75) при каждом фиксированном к, N имеет хотя бы
одно решение (:%,£fc, t0k, Тк) € U0. Нетрудно проверить, что здесь
выполнены все условия теорем 5.15.1, 5.15.2, из которых следует
lim х0к = Xq,, lim ^ = ¢, = 0, lim t0k'= t0t, lim Tk = T„, (83)
к —i оо к —* оо к —» оо к —» оо
так как задача (68)-(72) имеет единственное решение (:%, £„ = 0, t0t, Tt).
Оптимальную траекторию x(t, и(-, £к),:%, tgk), t0k ^ tTk, задачи (73)-(75)
для краткости будем обозначать через xk(t). Из (83), оценки (78) при £ = $к,
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
423
хо = хок< *о = *ок и оценок (80)-(82) при £ = 0, 3¾ = :¾.. t0 = t0t, Г = Г„
А$ = $к,Ах0 = х0к- хь, Д*0 = t0k - t0t, ДГ = Тк - Tt имеем
lim max 1^(4)-^(4)1=0, \im xk(t0k)=xt(t0t), lim xk(Tk)=xt(Tt). (84)
к—>oo a^i^o fc—>oo fc—>oo
Из (83) следует, что |^-а^|<1, \$k\<dN, \t0k-tj < At0N, \Tk-Tt\<ATN
Vfc ^ ^, т. e. (¾. $k, t0k, Tfc)€int XJu,k>K
Решению (:%, $k, t0k, Tk) задачи (73)-(75) дадим приращение (Axq,
Д£,Д*0,ДГ) такое, что (¾ + Д^, £к + Д£, t0k + At0, Tfc + ДГ) € (70.
Тогда оптимальное управление uk(t) = u(t, £к) и траектория xk(t) получает
приращение Au(t) = u(t, £k + A£)-uk(t), Ax(t) = x(t, u(-, £k + Д£), =%,+
+ Д^Ь, *ofc + д*о) - жк(*)- причем
Ax(t)=Af=f(xk(t)+Ax(t), uk(t)+Au(t), t)-f(xk(t), uk(t), t),
a^t^b, (85)
Ax(t0k) = x(t0k, u(-, £k + ДО, хок + ^¾. *ofc + д*о) - x(t0k).
Из оценок (76)-(82) следует, что
тах{ sup \u(t, £к + Д01, sup |«(t, £*)|}<clw,
max{ max \xk(t) + Ax(t)\, max |жА(*)|} ^сш,
max |Дя;(*)| < с4„(|Да*,| + |Д*0| + |Д£|), (86)
K(i0fc + Д*0) + Ax(t0k + At0) - xk(t0k)\ < q,w(|Д^| + |Д*0| + |Д£ I),
К(Гк + ДГ) + Ах(Тк + ДГ) - хк(Тк)\ ^ с^ОД^ + |Д*0| + |ДГ| + |Д£ |).
С учетом оптимальности набора (:%, £к, t0k, Тк) для приращения
функции (73) получим:
0 ^ ДФ, = ¢,(¾ + Да*,, £* + Д£, <о* + Д<о, ^ + ДГ) -
-Ф*(э™, £*, *ofc, Г,)= J Д/°Л + ^,^(¾, я!*(Г,), t0fc, Тк) +
+ Е 2^(%, ^(Гк), t0fc) Гк) • £(¾. хк(Тк), t0k, Тк)) +
« = 1
+ (Дя(Гк), ^(¾. 2=,(¾). t0fc) Тк)+ Е 2^/(¾. 0=,(¾). t0fc) Гк) х
s = 1
х <?;(%,, я!*(Г4), t0fc) Г,)} + At0[-f°(xk(t0k), ut(t0k), t0k) +
+ ^(¾. xk(Tk), t0k, Tk) + E 2kgt(xQk, xk(Tk), t0k, Tk) x
x ^(¾. a*(TJ, t0fc. Tk)] + AT[f°(xk(Tk), ut(Tk), Tk) +
+ (<7,°(%c> 4(Tk), t0k, Tk) + E 2kgt(xQk, xk(Tk), t0k, Tk) x
i = l
x ^(¾. xk(Tk), t0k, Tk),f(xk(Tk),ut(Tk), Tk)) +
+ <7?(%c, *k(Tk), t0k, Tk) + E 2^(¾. M^), t0k, Tk) x
,=х'й(%^к(11), t0fc. Tk)]+Rlk, (87)
424
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
где Д/° = f°(xk(t) + Ax(t), uJt) + Au(t), t) - f°(xk(t), uk(t), t), Rlk =
= о,(|Д^| + |Д£| + |Д£0| + |ДТ|), lim ok(a)/a = 0. Формула (87) обобща-
ет формулу (32) на случай задач с незакрепленным временем и
доказывается аналогично на основе оценок (86) с учетом непрерывности функций
91, 9у, 91, 9т, /'• в частности, при выводе (87) учтено, что uk(t0k) = ut(t0k),
МТк) = щ(Тк),
$ f(xk(t) + Ax(t),uk(t) + Au(t),t)dt =
V = Пхк{10к), ut{t0k),t0k)M0k + ok{\Ax0\ + \MQ\ + \^ |),
Tk + AT
$ f°(xk(t) + &x(t), uk(t) + &u(t), t)dt =
%
= f°(xk(Tk), ut(Tk), Tk)AT + о^Да^ + |Д*0| + |ДГ| + |Д£|),
хк(Тк + ДГ) + Ах(Тк + ДГ) - хк(Тк) =
= (х(Тк + AT, и(; ^ + ДО, %к + Д^о, «о* + А*о)-
~х(Тк, и(-, $к + ДО, Хок + Ляь, «о* + А*о)) + Ах(Тк) =
Тк+АТ
= $ /(а^иЬ^+ДО.а^+Да^+ДА)),
u(t, О + ДО, t)dt + Ах(Тк) = f(xk(Tk), uf(Tk), Г,)ДГ + Ах(Тк)+
+ofc(|A^I + |ДА,| + |ДТ| + |Д£|).
Обозначим
<% = (l + E(2^Ufc, хк(Тк), t0k, Tk)fYl/\
^ = ^2^(¾. xk(Tk),t0k,Tk), * = 1,2,..., в; а4=(оо4,аи,.. .,art).
Нетрудно видеть, что
о<<%<!, 0,^0,....,0^^0, k|2=i>?fc = i. (89)
Для дальнейшего преобразования формулы (87) по аналогии с (36)-(38)
воспользуемся функциями
Я (ж, и, t, ф, ад) = -aof°(x, u,t) + (ф, f(x, и, t)},
1(х,у,^Т,а)=£а{д\х,у,ЬТ) (90)
и сопряженной задачей
i>k(t) = -нАхк(*), uk(t), t, i>k(t), Ooa). * € [o, b],
ЫТк) = ~± o,,^, zfc(Tfc), t0k, TJ^-MMi^iobM). (91>
£=0 y
Существование решения задачи (91) на всем отрезке [о, Ь] и его
единственность доказывается также, как в задаче (37), (38). Справедливо равенство
(фк(Тк), Ьх(Тк)) = i(Mt), f(xk(t) + Да**), uk(t) + Ди(*), t) -
-/(^к(<),^(<),*)}^+(^(^).А^}-(^(<ок)./(^(<ок),^(<ок),<ок)}А<о-
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
425
«о*
+ o^lA^I + |A<e | + |At0| + | АГ|), (92)
которое устанавливается аналогично (40.A) с учетом (85), (91) и равенства
u(t, ^ + ДО, t)dt + Ах, = f(xk(t0k), ut(t0k), t0k)(-At0) + Ах, +
+ 0,(^1 + ^1 + ^1).
Умножим неравенство (87) на (¾¾ > 0 и преобразуем правую часть
полученного выражения с учетом (41.А), (88), (90), (92). Получим
О ^ о^ДФ, = - $ [H(xk(t), uk(t) + Д«(0, t, j)k(t), Oofc) -
«о*
- #(sfc(i), uk(t), t, j,k(t), a0k)]dt +
+ ^,^^^^^^^-^(^)) +
+ At0
+ ДГ
ЖМ*о..), 4(t0fc), t0fc, ^.(i0fc), во.) + %,^|Г^'
-Щхк(тк), 4(tj, rfc, ^(¾). ^)+^^- ^¾ *>»• r*'afc)
+
+
+ 0,(^^1+ |Д^| + |Д*0| + |ДГ|), fc = l,2,... (93)
Так как точка 2fc = (¾. £fc, t0k, Tk) минимума функции Фк(аь, £, *o, т) на
множестве U0 является внутренней точкой этого множества при всех к^к,,
то
= 0 ^-
-О ^
= 0 Ук^. к,. Отсюда и из (93) имеем:
„I, {+ \- 91(Х0к< хк(Ч)< hk' Тк> ак)
Wk\lOk) — Ях
H(xk(t0k), ut(t0k), t0k, фк{10к), а,к) = _^(^,^(|)W,rfc,afc))
Н(хк(Тк), ut(Tk), Тк, МТк), «%,) = 8^^0fc,rfc,afc)) Vfc ^ ^
(94)
Кроме того, рассуждая также, как при выводе неравенства (48), из (93)
получим
Ч + ^° (95)
[H(xk(t), vp, t, V>fc(t), <%) - H(xk(t), ut(t), t, V>fc(0, <%)]
Vfc^Ab, I,p = l,...,JV.
Далее, пользуясь соотношениями (83), (84), (88), (89), рассуждая также,
как при доказательстве теоремы 2.1 (см. текст после формулы (48)),
совершим предельные переходы в (91), (94), (95) сначала при к —» со, затем при
N —> со и получим все утверждения теоремы 2.2. Напоминаем, что теоре-
426
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
ма 2.2 пока доказана в предположении, что задача (2.37)-(2.40) имеет
единственное решение. Если эта задача имеет неединственное решение, то
перейдем к задаче минимизации функции
+ K+T + k-3j2 + (*o-U2 + (r-:z;)2
при условиях (2.38)-(2.40), (66), которая имеет единственное решение;
применим к ней уже доказанное, а затем, учитывая, что оптимальные
ж" + 1(*)=0, •0n + 1(t) = O, убедимся в справедливости теоремы 2.2 в общем
случае.
3. Условие максимума (2.9)
maxH(x(t), v, t, </>(*), %) = H(x(t), u(t), t, </>(*), %) (96)
выше было установлено лишь в точках непрерывности оптимального
управления. В следующей теореме показывается, как можно продолжить это
равенство на весь отрезок [i0, Т], устанавливается непрерывность функции
Я(*) = sup Я(я(*),М, </<(*), «о), te[t0,T], (97)
обсуждаются ее дифференциальные свойства.
Теорема 1. Пусть вычислены все условия теоремы 2.2, пусть
(xq, и(-), х(-), t0, Т) —решение задачи (2.37)-(2.40). Тогда функция (97)
непрерывна на отрезке [t0, Т], причем верхняя грань в (97) реализуется
как при v = u(t + 0), так и при v = u(t — 0) для всех t е [i0, Т] (здесь
по определению принимается, 4mou(t0 — 0) = u(t0+0), и(Т + 0) = и(Т —
— 0)). Если в дополнение к условиям теоремы 2.2 функции /*(х,и, £),
г =0, 1,..., п, имеют частные производные //(ж, и, t), непрерывные по
совокупности аргументов (х,и, t)eEn хЕг хЕ, то функция (97) имеет
левую и правую производные во всех точках t е [i0, Т], причем
^^ = Ht{x{t),u(t±0),t^{t),a0) te[t0,T], (98)
где Ht(x,u,t,^,a0)=—a0ff(x,u,t)+(^,ft(x,u,t)) — частная производная
функции Я по переменной t; производная Jj. ' существует и
непрерывна во всех точках непрерывности оптимального управления и(-).
Доказательство. Из (96), (97) следует
Н(х(т), v, г, ф(т), «о) ^ Я(т) = Н(х(т), и(т), г, ф(т), а,) (99)
во всех точках т 6 (i0, Т), в которых управление и(-) непрерывно. Это
значит, что в точках непрерывности и(-) функция Я(-) непрерывна. Пусть
t 6 (t0, Т] — точка разрыва управления и(-). В силу кусочной
непрерывности и(-) найдется 8 > 0, что и(-) непрерывна во всех точках г 6 [*0, Г],
t — 6 < т < t. Поэтому из (99) при т —» t — 0 имеем
H(x(t), v, t, V>(t), Oq) ^ Я(*-0)=Я(а;(*), u(t-0), t, </>(*), <h) VvEV.
Переходя к верхней грани по v 6 V отсюда получим
H(t)^H(t-0) = H(x(t),u(t-0),t,^(t),o0). (ЮО)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
427
С другой стороны, учитывая включение и(т) 6 V, имеем H(t) ^
^ H(x(t), и(т), t,ijj(t), 0(,), t — 8 < т < t. При т —> t -0 отсюда следует
H(t) ^ H(x(t), u(t -0), t, V>(t), Oo) = Я(* -0).
Сравнивая это неравенство с (100) получаем
H(t) = H(t -0) = H(x(t), u(t -0), i, V(<), «о), (101)
т. е. функция H(t) непрерывна слева в точке t E(t0, T] разрыва и(-). С
учетом (99) заключаем, что равенство (101) справедливо при всех t е (i0, Т].
Аналогично доказывается, что функция H(t) непрерывна справа на
промежутке [£0, Т) и имеет место равенство
H(t) = H(t+0) = H(x(t),u(t+0),t,^(t),a0) \/te[t0,T). (102)
Таким образом, непрерывность функции (97) на отрезке [i0, Т] установлена.
Для изучения дифференциальных свойств функции (97), следуя [44],
введем в рассмотрение так называемую г>-задачу:
jl(^M-)M-),x(-)M0)AA)=]f4x(e)M0),x(0)-(i+v(e))de+
+^(^(0,), х(02), %(^), х(б2)) -»inf,
^ = /(ЗД,ЗД,х(0))(1+«(0)), в^в^в2; £-(6,) = ¾ (104)
Шр. = \+у{в), в^в^в2, Х(01) = Хо- (Ю5)
<74z(0i), ¢(¾). X(0i), Х(02)) < 0. « = 1, • •., т;
(106)
0'(ад,Е(02),х(0,),х№)) = О, « = т + 1,...,в,
управление (w(0), г>(0)), вх ^ 0 ^ 02, кусочно-непрерывно и
и(0)е^ |w(0)|<l/2, 0,<0<02, ..:. (107)
где функции /*(х, и, t), г =0, 1, ..., п, ^"(ж, t/, £, Т), j =0, 1, . .., s, взяты из
исходной задачи (2.37)-(2.40). Так как перечисленные функции от
времени в не зависят, то задача (103)-(107) автономна, что существенно будет
использовано ниже.
Установим связь между задачами (2.37)-(2.40) и (103)-(107). Положим
* = Х(в), *о = Х(0,), Т = Х(в2). Так как \v(6)\ < 1/2, то 1/2 <: *$1 = 1 +
+ v(6) ^ 3/2. Поэтому
l2(s2sl)^x(s2)-x(sl)=]^fLde^l(s2-sl) Уврваб^Л], «i < «2- (108)
Как видим, функция %(0) строго монотонно возрастает на отрезке [0,,¾]
от x(^i)=*o до х{62) = Т. Поэтому существует обратная функция 6 =
= Х-1(*)> определенная на отрезке [t0, Т], строго монотонно
возрастающая от значения в{ до в2. Нетрудно убедиться, что функция х~1(8) также
428
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
удовлетворяет условию вида (108). В самом деле, пусть в{ < s{ < s2 < в2.
Тогда x(s1[) = t, < x(s2) = t2, Sl = x-'(*i) < s2 = X"l(t2) и в силу (108)
x-'(*2)-x-'(*i) = s2-si 6 r2/3 21. Следовательно,
h-h x (s2)-x~ '(si)
f(*2 - *i) < %_1(*2) - x-'(*i) < 2(£2 - *,) \/ty,t2e[t0, T], t^t2.
Отсюда следует, что функция 6 = x~l(t) удовлетворяет условию Липшица.
Тогда она абсолютно непрерывна и почти всюду дифференцируема на [t0, Т]
[393], причем
I <£ <&-'(*) = | 1 = 1 < 2.
dt dx,
l + v(X~l(t))
Пусть (^),^(-),1)(-),^(-)^(-),^,¾) — допустимый процесс задачи (103)—
(107). Положим
x(t) = x(X-l(t)), u(t) = u(X-l(t)), t0^t^T; ^ = ¾. (109)
Пользуясь заменой переменной 0 = x_1(t) в задаче (103)-(107),
нетрудно убедиться, что (xq, «(■), х(-), t0, Т) — допустимый процесс
задачи (2.37)-(2.40) со значением функции (2.37), совпадающим со значением
4(¾. "«(О, v(-), £■(•), х(-), 0и в2). Обратно: пусть (х,, и(-), х(-), t0, Т) какой-
либо допустимый процесс задачи (2.37)-(2.40). Тогда ему соответствует
процесс (xq, и(-), v(-), £•(•), %(•), 0,, в2), где
^ = ¾. х(0) = в, t0 = e^e^e2 = T,
и(в) = и(х(в)), х(в) = х(Х(в)), v(9) = 0,
являющийся допустимым для задачи (103)-(107), причем функции (2.37)
и (103) на соответствующих процессах принимают одинаковые значения.
Из построенных соответствий (109), (ПО) между допустимыми процессами
рассматриваемых задач (2.37)-(2.40) и (103)-(107) следует, что нижние
грани функций (2.37) и (103) совпадают и, зная оптимальный процесс
задачи (103)-(107), по формулам (109) можно построить оптимальный
процесс задачи (2.37)-(2.40) и обратно, имея решение задачи (2.37)-(2.40), по
формулам (ПО) нетрудно восстановить решение задачи (103)-(107). Пусть
(%, и(-), х(-), t0, Т) — решение задачи (2.37)-(2.40). Тогда согласно (110)
5-, = ^, и{в) = и{в), v(6) = 0, х(в) = х(в),
Х(в) = в, 6, = ¾. в2 = Т К }
решение задачи (103)-(107). Применим к этой задаче теорему 2.2. Функции
Понтрягина Я и Я задач (2.37)-(2.40) и (103)-(107) связаны так
Н(х, и, v, х, Ф, Ф0, %) = -(hfix, и, х)(1 + v) +
+ <ф, /(аГ, и, %)(1 +v)> +ф0(1 +v) = (Н(х, и, %, ф, (¾) + ф0)(\ + v)
Я|и = 0 = Я + 4, Я~|Я.0 = Я„ Hx\v = 0 = Ht. (112)
§ 3. ДОКАЗАТЕЛЬСТВО ПРИНЦИПА МАКСИМУМА
429
Для решения (111) задачи (103)-(107) найдутся а=(а^,..., as), ф(в), ф0(в),
ву <.0 ^ в2, такие, что
^ = -Hx(Z(0),Z(0),x(0) = 0^(0),<h), 0^0^в2,
^ = -Ht(x{6), и(в), в, ф(в), оо), в, < в < в2,
sup Н(х(в), w, v, в, ф(в), ф0(в), а0) =
(ш,«)е Vx{|«|£l/2} „
= Н(х(в), и(в), v(6) = 0, в, ф(в), а0) =
= Н(х(в), и(в), в, ф(в), оо) + ф0(в) (114)
во всех точках в е (в{, в2), в которых оптимальное управление (и(в), v(6) =
= 0) непрерывно; остальные утверждения теоремы 2.2 пока нам не
понадобятся. _
Как видно из (112), функция Н зависит от v линейно, поэтому
условие (114) при v=v(6)=0 может реализоваться только тогда, когда
коэффициент при v у функции Н равен нулю. Отсюда и из (114), учитывая, что
sup Я=эир sup H=[s\ipH(x(6), w, в, ф(в), а0)+ф0(в)](1+у)
(w,v)eVx{\v\^i/2) t»ev \v\^[/2 wev
v=0
получаем
8ирН(Цв),ь,в,ф(в),^)+ф0(в)=Н(^(в),и(в),в,ф(в),%)+ф0(в) = 0 (115)
vev
во всех точках в 6 (ву, в2), в которых и(-) непрерывна. Пользуясь уже
доказанной частью настоящей теоремы, можем сказать, что функция
#(0) = sup sup Н(х(в),п),у,в,ф(в),ф0(в),а0)
ше V Н<1/2
непрерывна во всех точках в Е[в{, в2] и в силу (101), (102), (112)
Н(в) = Н(х(в), и(в ±0), в, ф(в), со) + фо(0) У0 е [в{, в2].
Отсюда и из (115) имеем
ф0(в) = - sup Н(х(в), v, в, ф(в), о,,) = -Н(в) =
= -Н(х(в),и(в±0),в,ф(в),%) Чве[ву,в2]. (116)
Как следует из второго уравнения (ИЗ), левая часть равенства (116) имеет
непрерывную производную во всех точках непрерывности и(-), левую и
правую производные во во всех точках в 6 [ви в2], причем
^¾^ = Ht(x(6), и(в±0), в, ф(в), %) V0 6 [в,, в2].
Отсюда, возвращаясь к исходным обозначениям в силу (111), с заменой в
на t, приходим к равенству (98). Теорема 1 доказана. □
Замечание 1. Более тонкие рассуждения показывают [212], что для
всех допустимых процессов, удовлетворяющих необходимым условиям оп-
430
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
тимальности, сформулированным в теореме 2.2 (но, возможно, не
являющихся оптимальными), также справедливы утверждения теоремы 1.
Замечание 2. Условия трансверсальности (2.42), (2.43) с
учетом (97), (101), (102) могут быть записаны в виде
sup H(x(t0), v, t0, V>(t0), <h) = -4(¾. X(T)> to, T, a),
зщН(х(Т),у,Т,ф(Т),а0)=1т(х0,х(Т), t0, T,a). K }
vev
Поскольку замкнутость множества V не предполагается, мы не можем
утверждать, что в точках t разрыва управления и(-) предельные
значения u(t —0), u(t +0) принадлежат множеству V. Поэтому в (97), (117)
в общем случае знак sup нельзя заменить на max. Равенство (98) с
учетом непрерывности обеих частей равенства (101) и второго условия (117)
можно записать в интегральной форме
H(t) = H(x(t), u(t - 0), t, </>(<), oo) =
=- lHt(x(r)Mr),rMr),ao)dr+lT(xo,x(T),t0, T) Vt 6 [t0, T]. (118)
Аналогичное равенство получается при использовании равенств (98), (102)
и второго условия (117).
Замечание 3. Нетрудно убедиться, что теорема 1 и замечания
1, 2 сохраняют силу для задачи (2.1)-(2.4) с закрепленным временем и
задачи (2.37)-(2.40), когда один из моментов t0 или Т закреплены. Для
задачи (2.1)-(2,4) равенство (118) будет иметь вид
т
H(x(t), u(t - 0), t, V>(t), «о) = - X Ht(x(r), и(т), г, ф(т), a^dr +
t
+ H(x(T), u(T), T, ф(Т), oo) Vt e [t0, T].
§ 4. Принцип максимума для задач оптимального
управления с фазовыми ограничениями
1. В этом параграфе мы будем предполагать, что читатель знаком с
элементами теории меры Лебега — Стилтьеса, интеграла Римана — Стилтьеса
в объеме книг [284; 393]. Кратко напомним некоторые сведения из [393],
а также сформулируем и докажем несколько утверждений, необходимых
в дальнейшем. Как известно [393], каждая неубывающая функция r)(t),
а^ t < Ь, порождает меру Лебега — Стилтьеса, причем мера промежутков
[а, /3], [а, (3) (а, /3], (а, (3), принадлежащих отрезку [а, Ь], определяются
следующим образом:
т[а, /3] = 77(/5 +0)-7^-0), т[а, (3) = V((3 - 0) - V(a - 0),
т(а, /3] = 77(/5 +0)- г)(а + 0), т(а, (3) = т^/З - 0) - г](а +0),
где 77(4-0)= lim 77(7-), r](t +0)= lim 77(7"), по определению принимается
г—*t~0 т—» £ + 0
77(а-0) = 77(a), 77(6+0) = 77(6), (2)
§ 4. ПРИНЦИП МАКСИМУМА
431
т(А) — мера множества А е [а, Ь]. В частности, мера точки t равна
m\t} = m[t, t] — rj(t + 0) — rj(t — 0). Функцию r](t), которая порождает
указанную меру m, называют производящей функцией этой меры.
Напомним определение интеграла Римана — Стилтьеса. Поскольку точки t = а,
t = Ь могут иметь положительную меру, то различают интегралы по
промежуткам [a, b], [a, b), (a, b], (а, Ь). Сначала определим интеграл Римана —
Стилтьеса по отрезку [а, Ь] функции /(<), определенной и принимающей
конечные значения при всех t е [а, Ъ]. Возьмем произвольное разбиение
a=t0<tl<...<tn_l<tn = b (3)
отрезка [а, Ь] на элементы [tt_u t{), i = l, ..., п — 1, [t„_ i, Ь], в каждом
таком элементе выберем какую-либо точку £jf составим интегральную сумму
Sn = f(^)rn[t0, t^+j: m^mit^,, t{) + fiUHk-ukl (4)
t = 2
Если при dn = max (t( — ti_l)—*0 суммы (4) стремятся к некоторому преде-
1 ^ г ^п
лу, не зависящему от способа разбиения (3) отрезка [а, Ь] и от выбора точек
£., то этот предел называется интегралом Римана — Стилтьеса функции
/ по мере, порожденной неубывающей функцией r](t), t 6 [а, Ь], и обо-
ъ ъ-о
значается символом ^f(t)drj. Также определяются интегралы J f(t)dr],
ь ь-о а а
J f(t)drj, J f(t)dr] от функции /(*) по промежуткам [а, Ь), (а, Ь], (а, Ь)
соответственно, причем в сумме (4) в первом и последнем слагаемом меры
m[t0,tx), m[tn_x,tn] заменяются на m^,^), m[tn_x,tn) в зависимости от
того, принадлежат t0=a, tn=b промежутку интегрирования или нет. Если /(*)
непрерывна на [а,Ь], то все перечисленные интегралы существуют [393].
Интегралы по разным промежуткам связаны между собой так:
\f(t)dr1 = "]0f(t)dV+f(b)(v(b)-v(b-0)) =
а а
= \ f(t)dV + f(a)(V(a + 0)-V(a)) = "]0f(t)dV +
а+0 а+0
+ №ЫЪ) - V(b - 0)) + f(a)(v(a + 0) - V(a)). (5)
Замечание 1. Из (1) и определения интегралов видно, что мера
Лебега — Стилтьеса на [а, Ь], интеграл Римана — Стилтьеса на зависят от
того, как определена неубывающая функция rj(t) в точках разрыва,
принадлежащих интервалу (а, Ь). Имея это в виду, функцию rj(t) часто считают
непрерывной слева на (а, Ь), переопределяя ее в точках разрыва t 6 (а, Ь)
значением rj(t) = rj(t —0).
Пусть а < с < d ^ Ь. Тогда
\f(t)dr1 = C]0f(t)dV+lf(t)dV+ \ f(t)dV =
а а с d+0
= Х/(*)<й7+Т/(*)<*7 + 5/(*)<*7; (6)
а с + 0 d
аналогично выписываются другие формулы с использованием интегралов
по промежуткам [с, d), (с, d]. Если с = а, d — b, то в (6) по определению
432
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
а + 0
считается $ f{t)dri=f{a)(ri(c+0)-ri(a)), J /(^77 = /(6)(77(6)-77(6-0)),
6-0
и формула (6) превращается в (5), а интегралы по пустым промежуткам
а, а—О), (Ъ+0, Ъ] в (6) опускаются. В (6) подразумевается, что на отрезках
а, с], [с, d], [d, b] мы имеем дело с мерой, которая индуцируется мерой с
исходного отрезка [а, Ъ], заданной с помощью производящей функции r)(t),
а^ t ^ Ь.
Определение 1. Мера т, на [с, d] называется индуцированной
с отрезка [а, Ъ], если для любого измеримого множества А Е [с, d] с мерой
щ(А) множество А, как подмножество отрезка [а, Ь], также измеримо и
его мера т(А) на отрезке [а, Ь] равна тх{А).
Зададимся вопросом: какова производящая функция такой меры на
перечисленных отрезках, например, на [с, d]? Может показаться, что мера
на [с, d] индуцированная с отрезка [а, о], задается производящей функцией
77(0, t 6 [с, d]. Однако тогда мера точки с на отрезке [с, d] будет равна
тх{с} = г](с + 0) — г](с), в то время как на отрезке [а, Ь] эта точка имела
меру 771(0) = 77(0+0)-77(0-0)^771,(0) при 77(с-0)^т7(с). Аналогично, если
?7(а +0) ^77(d), то меры точки t — d на [с, d] и на [а, Ь] будут различными.
Нетрудно убедиться, что производящей функцией индуцированной на [с, d]
меры будет функция
{г](с - 0), t = с,
77(t), te(c,d), (7)
77(d+0), t=d.
d d
Тогда J f(t)dq, взятый из (6), равен \ f(t)dr]v причем имея функцию 77,,
с с
последний интеграл можно уже рассматривать самостоятельно, независимо
от других слагаемых из (6) и независимо от «предыстории» меры на [с, d].
Предлагаем читателю выписать производящие функции для
индуцированной меры на отрезках [а, с], [d, b], учитывая равенства (2). Кстати, если
с = d, d = Ъ, то из (7) с учетом (2) имеем r)Y(t) = r)(t), t е [а, Ь].
Справедливы равенства
И/(*) + 9(t))drj = $ f(t)dri + X <7(i)d77,
а а а
\ f(t)d(rjl+V2) = \ /(t)d77, + X /(*)<*%,
(8)
вытекающие из того, что сумма 77,+773 неубывающих функций 77,772 также
является неубывающей, и из справедливости соответствующих равенств для
интегральных сумм вида (4) для каждого разбиения (3), которое
сохраняется в пределе для интегралов.
Ниже нам понадобятся оценки:
\ f(t)dr, ^\\f\\(r,(b)-r,{a)),
I №dr, ^\\f\\(ri(b)-v(a+0)),
a+0
6-0
X f(t)dr, ^\\f\\(v(b-0)-V(a)),
6-0
(9)
X f(t)dV ^||/||(77(b-0)-77(a+0)),
а+0
§ 4. ПРИНЦИП МАКСИМУМА 433
где II/H = sup |/(t)|. Докажем первое из неравенств (9). Для интегральной
суммы (4) имеем |5„|< 11/11(4(4,-0)47(0)+^(4(^-0)-4(^- 1-0))+т7(Ь)-
t = 2
— v(tn- 1 — 0)) = ||/||(4(^) — v(a))- Отсюда при dn —» 0 получим требуемое.
Остальные неравенства (9) доказываются аналогично.
Теорема 1 (первая теорема Хелли). Пусть 4i(*)> •••>%(*)>•• •
... — последовательность неубывающих функций на отрезке [а, Ь],
supmax{|?7fc(a)|; |4fc(b)|} < с,, <оо, пусть lim %(*) = 77(*) в каждой точке
t 6 [a, b]. Тогда r](t) также не убывает на [а, Ь], и для каждой
непрерывной на [а, Ъ] функции f(t) справедливо равенство
lim \f(t)dVk = \f(t)dV.
к—too
а а
Теорема 2 (вторая теорема Хелли). Пусть ФД*),..., Ф/ь(*)> •■• —
последовательность функций с ограниченным изменением на отрезке
[а, Ъ] такая, что
sup ^fc(t0)l <со<оо, supVeb(**Kci<°°.
n
где t0 какая-либо точка из [а, Ъ], Уаь(Фк) = sup{t] J] |Фк(*г) — Ф&(*г_i)| —
г — 1
полное изменение функции Фк на [а, Ь], q,, с, —некоторые
положительные постоянные. Тогда существует подпоследовательность {Фк (*},
сходящаяся к некоторой функции Ф(£) в каждой точке t е [а, Ь], причем
Ф(£) имеет ограниченное изменение на отрезке [а, Ь].
Заметим, что при сделанных предположениях sup sup |Фк(£)| ^ Cq + с,.
к > 1 ( 6 [а, Ь]
Теорема 2 верна и для функций {%(*)} из теоремы 1, так как всякая
неубывающая на [а, Ь] функция -q(t) имеет ограниченное изменение, причем
Vab(r])^r](b)—r](a). Более общее определение интеграла Римана — Стилтье-
са, более общую формулировку теорем 1, 2, их доказательства читатель
найдет в [284; 393].
Лемма 1. Пусть функция r](t) определена и не убывает на отрезке
[а, Ь], пусть последовательность {tk} е [а, Ъ] и lim tk = t. Если t е (а, Ь],
к —* оо
a^tk<t, к — 1,2,..., то
lim V(tk)= lim 4(t*-0)=Hm фк +0) = V(t -0). (10)
к —t оо к —* оо к —too
£сли t e [a, b), t <tk^b, к = 1,2,..., mo
lim 4(4)= lim rj(tk-0)= lim 4(4+0) = 4(t+0). (11)
к —» оо fc —» оо fc —* 00
Доказательство. Рассмотрим случай te(a,b], a^.tk<t, k =
= 1,2, Возьмем произвольную точку г 6 [а, Ь], т < t. Тогда т < tk < t
Vfc ^ /¾. где &g —достаточно большое число. Так как функция r](t) не
убывает, то 4(т) ^ 4(4 -0) < Ч(**) < Ч(** +0) < Ч(* -0). fc = 1» 2, . .. Учитывая,
что lim rj(tk) = r](t-0), отсюда имеем 4(r)^jim_4(^-°)^ lim4(*fc-0)<
к —* оо к —юо к —> оо
<4(* -0)= lim 4(*fc+°) Vr< t. Переходя здесь к пределу при т-> t -О,
к —> оо
получаем равенства (10). Равенства (11) доказываются аналогично. □
434
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Лемма 2. Пусть {r)Jt)} — последовательность
неубывающих функций на отрезке [a, b], supmax{|?7fc(a)|; |%(Ь)|} ^ Cq < оо, пусть
к> 1
lim rjk(t) = r)(t) в каждой точке t е [а, Ь]. Тогда функция r)(t) не убы-
k —* оо
вает на [а, Ь], причем
*7(*-0)<Jlm_ifc(*-0)< \\mVk(t-0)4v(t)<
fc->oo k->oo
<JJSL%(*+0)< Нт%(* +0)^7?(t+0) Vie [a, b] (12)
k-юа k->oo
(в (12) подразумевается, что в точках t = a, t = Ъ для функций %(*)>
r)(t) по определению выполняются равенства (2)).
Доказательство. Так как ?7к(<)^%(т) t ^. т, то при к —>оо отсюда
имеем r)(t) ^г)(т)< Vt ^ ■?"> т- е- функция rj(t) не убывает на [а, Ь].
Рассмотрим случай, когда а< t <b. Возьмем произвольные точки тр т2 6 [а, Ь],
Г! < t < т2. Тогда
%Ы < Vk(t - 0) < %(*) < %(* +0) < %(^)-
Отсюда переходя к пределу сначала при к —>оо, затем при Т[ —> i —0, т2 —> £ +
+0, приходим к неравенствам (12). Случаи t = аили t—b рассматриваются
аналогично с учетом (2). □
Приведем пример, показывающий, что все указанные в лемме 2 ситуации
возможны.
Пример 1. Пусть числа с1к, с^, ск таковы, что 0 < с1к < ск < с2к <
< 1, к = 1, 2,..., lim ск = с, последовательности {clk}, (¾.} необязательно
к —* оо
сходятся. Положим
'0, te[-l,-f],
kt+ck, te(-cf,1-^)
> 1,
te[l-j^,l], fc = i,2,
'о, te[-i,-{),
cu. *e[—j,0),
сгк, *e(0, ^),
. 1, *e[i.l].
Нетрудно убедиться, что функции ?7ц.(*), %ь(*) не убывают и lim ?7ifc(i) =
fc —* оо
= lim r)2k(t) = r)(t) всюду на [—1, 1], где rj(t)=0 при -1 < t < О, ?7(0) = с,
й —> ОО
7j(t) = 1 при 0 < t ^ 1. Выбирая по разному с, 0 < с < 1, и параметры
clfc,C2fc, можно реализовать все возможные ситуации, допускаемые
неравенствами (12). Отметим, что функции r]2k(t) непрерывны на [—1, 1].
Лемма 3. Пусть функции r]k(t),r](t) удовлетворяют условиям
леммы 2, пусть последовательность {tk} е [a, b], lim tk = t. Если t е
е (а, Ъ], а< £fc < £, к = 1,2, ..., то
fc —> оо
V(t -0) ^ Jim Vk(tk -0) ^ lim Vk(tk -0) < 77(4),
fc-too fc->oo
4(t -0) < Jim_%(ifc) < lim Vk(tk) < 77(t),
fc-too fc->oo
(13)
rj{t -0) < Jim_%(ifc + 0) < Jim *7(** + 0) < 4(*).
fc-юо fc->oo
§ 4. ПРИНЦИП МАКСИМУМА
435
Если t е [a, b), t < £fc < Ь, к = 1,2,..., то
rj{t) < M_rik(tk - 0) < lim %(tfc - 0) < »7(* +0),
t->oo k->oo
4(0<Jim_%(**)< Hm %(**)< ч(*+0), (14)
V(t) < Jim %(** +0) <7ПтГт7(*к + 0) < 4(t +0).
Доказательство. Рассмотрим случай t 6 (a, i], a^tk<t, k =
= 1,2,... Возьмем произвольную точку т, 6 [а, Ь], т{ < t. Тогда т, < tk < t
Vfc ^ ко, и в силу монотонности %(t) тогда ^т,) ^ %(ifc - 0) ^ m(tfc) <
^ %(**: +0) ^ %(*)> к^-кц. Отсюда, переходя к пределу сначала при к —» оо,
затем при т, —> t — 0, получим неравенства (13). Неравенства (14)
доказываются аналогично. D
Лемма 4. Пусть функции %(*)> r)(t) удовлетворяют условиям
леммы 2, пусть последовательность {tk} е [а, Ъ], lim tk = t. Тогда
к —* оо
0 < lim (%(*, +0)- %(ifc - 0)) ^ 77(t +0)- V(t - 0) (15)
fc —»оо
(s (15) подразумевается, что в точках t = a, t = Ь для функций r]k(t),
rj(t) по определению выполняются равенства (2)).
Доказательство. Пусть верхний предел последовательности ak =
= %(*fc+0)_%(*k_0)> к=1,2,... реализуется на подпоследовательности
{ак }, т. е. lim ак= lim ак . Перенумеровав подпоследовательность {ак },
р к—*оо р—*оо я я
можем считать, что lim afc= lim ак для самой последовательности {%} и,
fc —» оо к —»оо
значит, для любой ее подпоследовательности. Подробнее рассмотрим
случай a<t<b. Может оказаться, что у последовательности {tk} существует
подпоследовательность {tk }, a^t^Kt, 1=1, 2, ... Тогда с учетом (13) имеем
lim ак = lim ак ^ lim%(и + 0) - Jim. Vk,(* к, -0) <
< ^7(*) - ^7(* - 0) < 77(t +0)- 77(t - 0). (16)
Если последовательность {tk} содержит подпоследовательность {tk}, для
которой t < tu < b, I = 1, 2,..., то с помощью неравенств (14) аналогично
получаем
limafc= lim ак < r](t +0) - rj(t) < r](t +0) - т?(* - 0). (17)
fc —» оо I —» оо '
Наконец, если последовательность {tk} не содержит указанные выше
подпоследовательности -{Д}, то tk = t Vk^ 1%. Отсюда и из (12) тогда имеем
limafc= lim afc< lim %(i+0) - Jjm_?7fc(i-0)^ ?y(i+0) - ?y(i-0). (18)
к—»оо fc—»оо fc—*оо fc—»оо
Объединяя все возможные случаи (16)-(18), приходим к
неравенству (15). Случаи t = а или t = Ь рассматриваются аналогично с учетом
равенств (2). □
436
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Далее, зафиксируем произвольную непрерывную функцию /(*), t е[а, Ь],
и определим функции
Fk(t)=\f(r)drjk, к = 1,2,...; F(t)=\f(T)dr,, te[a,b], (19)
где функции r]k(t),r}(t) взяты из леммы 2, интегралы в (19) берутся по
индуцированным с отрезка [а, Ь] на [t, b] мерам, порожденным функциями
r]k(t),r}(t), t е[а, b]. Из теоремы 1 вытекает, что lim Fk(a) = F(a). Может
к —»оо
показаться, что
\\mFk(t) = F(t) (20)
к —* оо
и при других t 6 (а, Ь]. Приведем пример, показывающий, что если t —
точка разрыва функции г](т), то равенство (20), вообще говоря, не имеет
места и, более того, предел в левой части (20) может не существовать.
Пример 2. Возьмем функции rjk(t) = ?7lfc(i), t 6 [—1, 1] из примера
1, считая ск = с — 1/2, с1к = 1/4 при четных к, с1к = 1/2 при нечетных к,
с2к = 1/2,к = 1,2,... Пусть f(t)=l,te[-l,l]. Тогда Fk(t)= $ <*% = %(!)-
i
-%(*-0), F(t)=$dQ = ri(l)-ri(t-0). При i=0 имеем Fk(0)= 1 - clfc,
fc = l,2, ...;F(0) = 1. Ясно, что Jim_Ffc(0) = 1/2, lim Ffc(0) = 3/4, lim Ffc(0)
fc_,oo fc->oo fc->oo
не существует.
Лемма 5. Пусть функции ??fc(r), г](т) удовлетворяют условиям
леммы 2, пусть f(t) — произвольная непрерывная функция на [а,Ъ]. Тогда
lim \Fk(t) - F(t)\ = lim $ /(т)<*% - $ /(r)efy
К —i оо к-юо , .
^
<2||/||o07(t+0)-*7(t-0)) Vte[a,b], (21)
г^е ll/llc = max l/(*)l (ttpu t =a или t = b в (21) подразумеваются pa-
t 6 [a, 6]
венства (2)). £сли t = a или t e (a, Ь] точка непрерывности функции
г)(т), mo справедливо равенство (20) (при t = Ъ здесь имеется в виду
непрерывность слева).
Доказательство. Пусть t е (а, Ь]. Положим г\к(т) = г]к(т), г}(т) =
~ ъ ~
= 7j(r) для всех т 6 [*, Ь], и определим функции Ffc(t) = $ /(r)d%, F(t) =
= )f(T)drf. Так как lim ?ffc(r) = г](т) во всех точках т Е [£, Ь], то, применяя
t к-,со
теорему 1 к отрезку [t,b], имеем
lim \Fk(t)-F(t)\=0. (22)
к —* оо
Далее, используя формулы (5) применительно к отрезку [£, Ь], получаем
Fk(t)= \ f(r)dVk+f(t)(Vk(t+0)-Vk(t-0)),
(+0
F(t)= I f(T)drj + f(t)(rj(t+0)-v(t -0)),
(+0
§ 4. ПРИНЦИП МАКСИМУМА
437
Fk(t)= I f(r)dr]k + f(t)(Vk(t+0)-Vk(t)),
t+o
F(t)= \ f(T)dn + f(t)(r,(t+0)-r,(t)).
t+o
Отсюда следуют оценки:
\F(t)-F(t)\=\f(t)\(V(t)-V{t-0)) < ||/||o07(*+0)-*7(t-0)),
l^(*)-^(*)l=l/(*)l(%(*)-%(*-0))<||/||0(%(*+0)-%(*-0)), (23)
к = 1,2,...
Из последнего неравенства и леммы 2 при к —» оо имеем
lim \Fk(t) - Fk(t)\ ^ \\f\\c{ri{t +0)-7,(4- 0)). (24)
к —юо
Переходя к пределу при к —> оо в неравенстве
|^(0-^(01<1^(*)-ВД)1 + 1^(*)-^(*)1 + №)-^(*)1,
с учетом соотношений (22)-(24) получим требуемую оценку (21) при всех
t е(а, Ь]. Справедливость равенства (20) и тем более оценки (21) при t =а,
как уже упоминалось выше, следует из теоремы 1. В точках t Е (а, Ь], в
которых функция г](т) непрерывна, равенство (20) вытекает Непосредственно
из оценки (21). □
Лемма 6. Пусть функции vk(T)>v(T) удовлетворяют условиям
леммы 2, пусть последовательность непрерывных функций {/*(*)}
сходится к f(t) равномерно на [а, Ь], т. е. lim \\fk — f\\c =0. Тогда
k —* оо -
\ h(r)dvk ~ \ f(r)dV < 2||/||c(4(t +0)- V(t - 0)) Vt e [a, b] (25)
lim
k —»oo
(при t =a или t = b в (25) подразумеваются равенства (2)). Если t = а
или t е (а, Ъ] — точка непрерывности функции г](т), то
lim $ А(т)% = $ f(r)dV. (26)
ь
к —* оо
Доказательство. С учетом (8), (9), (19) имеем
lfk(r)dnk-lf{T)dn < lfk(r)dvk-lf(r)dnk
+
+\Fk(t)-F(t)\ < \\fk-f\\c(v(b)-r)(a))+\Fk(t)-F(t)\, к=\, 2,.. .
Отсюда и из леммы 5 следуют соотношения (25), (26). □
Лемма 7. Пусть функцииг]к(т),г](т) удовлетворяют условиям
леммы 2, /(*) —непрерывная функция на [а, Ъ], пусть последовательность
{tk}e[a, Ъ], lim tk = t. Тогда
к —юо
}im\Fk(tk)-F(t)\^3\\f\\c{ri{t+0)-r,(t-0)) Vte[a,b) (27)
к —* ОО
(npw £ = а или t = Ь здесь подразумеваются равенства (2)).
438
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Доказательство. Можем считать, что верхний предел в (27)
реализуется на самой последовательности {\Fk(tk) — F(t)\} и, стало быть, на
любой ее подпоследовательности {\Fk (tk ) — F(t)\}. Пусть a<t <Ь.
Может случиться, что у последовательности {tk} существует
подпоследовательность {tk }, а< tk < t, р = 1, 2,... Тогда с учетом (6), (9) имеем
\Fk(tk)-F(t)\^\Fk(t)-F(t)\+ $ f{r)d%
<
<|^(*)-^(*)1 + Н/11с(ч(*-0)-¾ (Ч-0))- (28)
Из лемм 2, 3 следует, что lim (¾ (t — 0) — -q. (tk - 0)) < lim % (£-0)-
p —>oo p PP p —»oo p
- lim 77t (tb—0)<?7(t) —?7(t—0). Отсюда и из (28) с учетом (21) получим
р —*оо р р
оценку (27). Если последовательность {tk} имеет подпоследовательность
{**>- t<tk ^Ъ, то
\Fk(tk)-F(t)\^\Fk(t)-F(t)\+ $ f(T)dn,
й
^\Fk(t)-F(t)\ + \\f\\c(Vk(tk -0)-^(4-0)). (29)
Из лемм 2, 3 следует, что lim (¾ (tk -0)-¾ (t -0))< rj(t +0)- rj(t -0).
p->oo P P P
Отсюда и из (21), (29) получим оценку (27). Наконец, если
последовательность {tk} не содержит подпоследовательностей {tk } рассмотренных выше
типов, то tk = t Vfc > h^. Тогда \Fh(th) - F(t)\ = fa(i) - F(t)\ Vfc > ^.
Отсюда и из (21) сразу получаем (27). Таким образом, оценка (27)
доказана для всех t 6 (а, Ь). В случае t = а или t = Ь оценка (27) доказывается
аналогично. □
Лемма 8. Пусть функция г](т) не убывает на отрезке [a, b], f(t) —
произвольная непрерывная функция на [а, Ь], Тогда функция F = F(t) =
ь
= J f(T)drj имеет ограниченное изменение на [а, Ь], непрерывна слева
t
во всех точках t е (а, Ь]. Если t е (а, Ь), функция г)(т) непрерывна в
точке r=t, то функция F также непрерывна в точке r=t. Если г)(т)
непрерывна справа в точке t=a, то F непрерывна справа в этой точке.
Доказательство. Пусть {t{} — произвольное разбиение (3) отрезка
[а, Ь]. Тогда
„. *,-о
Е1^(*.)-^(**-1)1 = Е S f(r)dn
<=i
^
<\\f\\c(t(v(ti-o)-v(t{_l-o)) = \\f\\c(v(b-o)-v(a)).
Отсюда следует, что функция F(t) имеет ограниченное изменение на [а, Ь]
и ее полная вариация
Vab(F)^supJ2\F(ti)-F(ti_l)\^
7(ч(Ь-0)-Ч(а)).
Далее, пусть {tk} — произвольная последовательность такая, что {<к}б[а,Ь],
§ 4. ПРИНЦИП МАКСИМУМА
439
t ,ф t, к — 1, 2,. .., lim ifc = t. Если t e (a, b], a< tk < t, к = 1, 2,..., то
к —»oo
|F(tJ-F(t)|= 'Г/(0^7 <||/||о(ч(*-0)ч7(**-0)).Отсюдаииз(10)
следует, что lim F(tk) = F(t). В силу произвольности выбора последова-
к —* оо
тельности {tfc}—» t —0 отсюда заключаем, что функция F непрерывна слева
во всех точках t е (a, b]. t _0
Теперь пусть t е [а, Ь), t <tk^b. Тогда |F(tA) - F(t)| = "$ /(r)dT? <
< \\f\\a(r](tk—0)-r](t -0)), k = \, 2, Отсюда и из (11) при к —>оо имеем
0< Jim_|F(tfc)-F(t)| <: lim |F(ifc)-F(i)| < \\f\\c(v(t +0)-rj(t -0)). Ее-
fc->oo k->oo
ли функция г)(т) непрерывна в точке т = Ь, то rj(t +0) = rj(t —0) = r](t)
и из последних неравенств получим lim F(tk) = F(t). В силу произволь-
к —»оо
ности выбора последовательности {tk}—» t +0 заключаем, что функция F
непрерывна справа во всех точках t 6 [а, Ь) непрерывности функции г](т)
(непрерывности справа в точке t = а). Отсюда и из непрерывности слева
функции F(t) во всех точках t e(a, Ъ] следует, что эта функция непрерывна
во всех точках t е (а, Ъ), в которых г)(т) непрерывна. Лемма 8 доказана. □
2. Рассмотрим задачу оптимального управления с ограничениями на
фазовые координаты в следующей постановке: минимизировать функцию
/(0=0, «(•), х(-), t0, Т) = ] f°(x(t), u{t), t)dt + д^, х(Т), t0, Т) (30)
при условиях
x(t) = f(x(t),u(t),t), t0^t^T, x(t0)=Xo, (31)
д\хо,х(Т),Ь0,Т)^0, i = l,...,m,
g{(xo,x(T),t0,T) = 0, г =m+ l,...,s,
Gl(x(t),t)^0,...,G"(x(t),t)^0, to<t<i; (33)
u = u(t)eVCEr, (34)
где Gj(x, t), J = 1,..., q, — заданные функции переменных x e En, i el;
остальные обозначения те же, что и в задаче (2.37)-(2.40). Как в § 2, 3
будем считать, что допустимое управление в этой задаче также кусочно-
непрерывно, а включение (34) справедливо во всех точках t е [t0, Т], в
которых управление и(-) непрерывно. Как и выше, через Jt будем
обозначать нижнюю грань функции (30) при условиях (31)-(34), предполагая,
что множество допустимых процессов этой задачи непусто.
Предполагается также, что Jt > -оо, и задача (30)-(34) имеет хотя бы одно решение
(xq, и(-), х(-), t0, Т). Следуя [44], задачу (30)-(34) будем рассматривать при
дополнительном условии, что фазовые ограничения (33) согласованы с
концевыми ограничениями (32) в следующем смысле.
Определение 1. Пусть точка zt = (xt, yt, tt, Tt)
удовлетворяет концевым ограничениям (32), т. е. 0*(,zJ<O, г = 1,..., m, g\zt) = 0,
г = m + l,..., s. Говорят, что в точке zt фазовые ограничения (33)
согласованы с концевыми, если существует число е > 0 такое, что множество
{z = (x,y, t, Т): \z-zt\£e, g*{z)^0, i = 1,..., m; д*(г)=0, i = m + l,..., s}
C{z = (x,y,t,T): G*(x,t)<0, G{(y, T)<0, * = 1,..., g>.
440
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Нетрудно видеть, что если в задаче (30)-(34) фазовые ограничения
отсутствуют (q = 0) или функции G{(x,t) непрерывны и G*(xt, tt)<0,
^Чйо ?1) < 0, г = 1,.,,, q, то условие согласования указанных
ограничений в точке zt автоматически выполнено. Заметим, что если условия
согласования фазовых и концевых ограничений не выполняются для концов
какого-либо допустимого процесса задачи (30)-(34), то, добавив к s
ограничениям (32) еще 2q концевых ограничений G^Xq, t0) ¢.0, G*(x(T), Т)<0,
г = 1,..., q, придем к задаче оптимального управления того же вида, но
в которой, как нетрудно проверить, фазовые ограничения уже будут
согласованы с концевыми во всех точках zt = (xq, х(Т), t0, Т) для любого
допустимого процесса (xq, и(-), х(-), t0, Т). Поэтому требуемое ниже
условие согласования фазовых и концевых ограничений в концах оптимального
допустимого процесса не является слишком жестким.
Для формулировки принципа максимума для задачи (30)-(34) нам снова
понадобятся функции
Н(х,и, t,$, Oo) = -aof°(x,u, t) + (^,f(x,u, *)},
1(х,у,1,Т,а)=^а.д1(х,у,1,Т).
Теорема 3 [44]. Пусть функции f3'(x,u,t), j =0,...,п,
д3(х, у, t, Т), j = 0,..., s, G3(x, t), j = 1,..., q, имеют частные
производные f3<, g3xi, g3y,, Gt, i = 1,..., n, g\, g3T и непрерывны вместе с этими
производными по совокупности своих аргументов при х еЕ", уЕЕп,
и е V, t ЕЕ, Т еШ. Пусть (xq, и(-), х(-), t0, Т) —решение задачи (30) —
(34), пусть фазовые ограничения (33) согласованы с концевыми в точке
zt = (xo, х(Т), t0, Т). Тогда необходимо существуют числа а=(ао,..., ая),
вектор-функции ^(t) = (^(t),..., V„(<))- ^(<) = (^Ч*), • • -. ?7*(*)). *о< * <
^ Т, такие, что
1) функции r)3(t) определены всюду на отрезке [t0, Т],
неотрицательны, не убывают, непрерывны слева при всех t е (t0, Т),
постоянны на каждом интервале, принадлежащем множеству {t е (t0, Т):
G3{x(t), t)<0};j = 1,..., q; rj(t0) = 0;
2) (a, V(T)) ^0; (¾ > 0, а, ^ 0,..., ат > 0;
3) функция i>(t) определена всюду на [t0, Т], имеет ограниченное
изменение на [t0, Т], непрерывна слева при всех t е (t0, Т], непрерывна во
всех точках t е (t0, Т), в которых непрерывна функция г)(-),
непрерывна в точке t = t0 справа, если -q(-) непрерывна в этой точке справа,
является решением интегрального уравнения
т
•0(*) = X Нх(х(т), и(т), т, ф(т), Oo)dr -
t
- t ] G1x(x(t, r)eV - 1,(¾. x(T), tQ, Т, а) (35)
г
при всех t E[t0, Т], где $ G*(x(t), т)<к]* —интеграл Римана — Стилтье-
t
са по мере, порожденной функцией ^'(t), t0 ^ t < Т;
4) справедливо равенство
m3xH(x(t),v, t,^(t),Oo) = H(x(t),u(t), t, ^(4).¾) (36)
V € V
§ 4. ПРИНЦИП МАКСИМУМА
441
во всех точках t е (i0, Т], в которых оптимальное управление и(-)
непрерывно;
5) выполнены условия трансверсальности
1>{Ь) = 1х(ъ,х{Т),Ь,Т,а); (37)
Я(я;(<о),и(<о+0)Л,',(яв.я!(Г)Л>Г>а),а0)=-1((аЬ,я!(Г)><0,3;о) (38)
(если в задаче (30)-(34) время t0 закреплено, то условие (38)
отсутствует);
Н(х(Т), и(Т - 0), Т, -1,(¾. s(T), t0) Т, а), a0) = lT(xot s(T), t0, 2] а) (39)
(если s задаче (30)-(34) время Т закреплено, то условие (39)
отсутствует);
6) выполнено условие дополняющей нежесткости
0^((¾. яСГ), «о. Г) = 0, г = 1,,..,т. (40)
Из (35) при t = Т имеем ф{Т) = -^ G*(x(T), Т)(г]\Т)-г]*(Т-0))-
t=l
— ^(¾) ж(Т), t0, Т, а). Как видим, это равенство превращается в условие
трансверсальности (2.41) при t = Т лишь в том случае, когда сумма в
правой части равна нулю. Предлагаем читателю провести сравнительный
анализ остальных утверждений этой теоремы с соответствующими
утверждениями теорем 2.1, 2.2.
Доказательство теоремы 3 проведем при дополнительном
предположении, что вектор-функция f(x,u, t) удовлетворяет условию
Липшица (3.1) при всех t б Е. Оно проводится по той же схеме, как и теоремы 2.1,
2.2, поэтому, опуская повторяющиеся детали из предыдущих доказательств,
мы ниже подробнее остановимся лишь на тех тонкостях, которые связаны
с наличием фазовых ограничений. Пусть (x0t,ut(t), xt(t), t0t, Tt), t0t < Tt,
единственное решение задачи (30)-(34). Для построения конечномерной
аппроксимации задачи (30)-(34) воспользуемся задачей (3.68)-(3.72) с
добавлением к ней фазовых ограничений (33). Как и выше доказываем, что
задача (3.68)-(3.72), (4) имеет единственное решение (xgt, £ф = 0, t0t, Tt).
Применяя метод штрафных функций для учета ограничении (3.70), (4),
придем к задаче:
Фк(хо, £, t0, Т) = I f°(x(t), u(t, О, t)dt + <7°0*b, х(Т), t0, Т) +
ч
+ k1±(gr(x0,x(T),t0,T))2 + k,±](G+(x(t),t))4t->ml, (41)
i = l i = l (0
x(t) = f(x(t),u(t,0,t), t0^t^T; x(t0) = x0, (42)
(x0,^t0,T)eU0 = {\x0-x0t\^l,0^^lp^dN, l,p = l,...,N,
110 - tj < &t0N, | Г - TJ < ATW}; (43)
здесь сохранены все обозначения аналогичной задачи (3.73)-(3.75); Gf =
— max{0; G'}, i = l,...,q.B задаче (41)-(43) штрафной коэффициент к =
= (&,, к%) представляет собой набор из двух независимых параметров ки к^ =
442
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
= 1, 2,...; в дальнейшем нам придется совершить предельные переходы
сначала при fc, —» оо, а затем при к% —» оо.
Оценки (3.76)-(3.82) остаются верными и для задачи (41)-(43).
Поэтому функция Фь(:гь, £, t0, Т) непрерывна на компактном множестве К, и
задача (41)-(43) имеет хотя бы одно решение (:%, £к, t0k, Тк)е U0. Из
теорем 5.15.1, 5.15.2 следует, что
lim x0k = x0t, lim £k = L = О, Hm t0k = t0t, lim Tk = Tt. (44)
к —» оо A: —» оо к —» оо fc —* оо
В (44) подразумевается двойной предельный переход при к — (fc,, fe) —* оо,
поэтому найдется достаточно большой номер к^ такой, что 1¾ — х&\ < 1/2,
\€к\ < dN/2, \t0k - t0t\ < &t9N/2, \Tk - TJ < &TN/2, т. e. (%, £fc, t0k, Tk) e
e int U0 \/k = (ku k^), fc, ^ Kq, k^^-k^. По аналогии с (3.86) для приращения
функции (41) имеем формулу
О ^ ДФк=Ф,(:гЬк+Д:гЬ)^+Д^*0к+Д*0,Тк+ДТ)-Ф(:1Ьк)^)*0к, Тк)=
= ПД/° + Е 2^67+(^(4), *)<<£(**(*)> *)> Дя(*)>]<** + <Да\>, &°(**) +
+ Е 2^+(¾)^¾)} + {&х(Тк), g°y(zk) + Е 2^+(¾)^¾)} +
i=i i=i
+ &t0[-f°(xk(t0k),ut(t0k), t0k) + g°(zk)+± 2kigt(zk)gi(zk)-
i = i
- Е h(Gt{xh{tQk), ^))2] + ДТ[/°К(Тк), ut(Tfc), Tfc) + д%(гк) +
i = i
+ E 2k]9t(zk)g>T(zk) + (g°y(zk) + ± 2k]9+(zk)g<(zk),
i=i i=i
/(¾½). и*(тк), Tk)) +± ЫСПхЛЪ), Tk)ft +
+ ок(|Д^1 + |Д^1 + |Д*о1 + |ДГ|), (45)
где (x0k+&x0,£k+&$,t0k+&t0,Tk+AT)eU0, zk=(x,k,xk(Tk),t0k,Tk), xk(t) =
= x(t, u(; £k), XQk, t0k), t0k^t^ Tk, приращение Ax(t) траектории
системы (42) удовлетворяет тем же условиям (3.84), /S.f°=f°(xk(t)+Ax(t), u(t,
£k + &O,t)-f0(Xk(t)Mt,tk),t), limiok(a)/a =0. Обозначим
a->0
,ть \ 2-1-1/2
<hk
+ ±{2k,gt{zk)f + ± ( J 2fc,^(zfc(i), t)dt\
^ = ^-2^,^(¾)) «'= 1,. •., «;
aik = aok-2h S G+(xk(t),t)dt, i = l,...,q;
A-k = (^Ofc! aifc! ■ • 4 asfc! aifc! ■ • Ч aqk)-
Ясно, что
0 < a,,* < 1, a]k^0,...,amk^ 0, alfc ^0,..., aqk ^ 0,
KI2 = E4 + Esi = i-
i=0 г=1
(46)
(47)
§ 4. ПРИНЦИП МАКСИМУМА
443
Как и в § 3, для дальнейшего преобразования формулы (45) воспользуемся
функциями Н(х, и, £, ф, Oq), 1(х, у, t, Т, а) и сопряженной задачей
ф\{Ь) = ~Hx(xk(t), u(t, Q, t, фк(1), Oofc) +
+ E ^-2^+(^(4), t)G:(xk(t), t), t0k < t < Tk;
A(Tk) = -± aik9;(zk) = -ly(zk, ak), (48)
i=0
где ak = (o^, .,,, ask). Справедливо равенство
(jjk(Tk),Ax(Tk))=i(4k{t),f{xk(t) + Ax{t),u(t,tk+&t),t)-
- f(xk(t), u(t, ^), t))dt + {фк(10к), Ax,) -
- (ФЛ^Ок), f(xk(t0k), иЛ*0к), <0fc)} Д*о -
- $ < Hx(xk(t), u(t, ^), t, фк{1), a^k), Ax(t) >dt +
+ ES%' 2k2Gt(xk(t), t)(G;(xk(t), t), Ax(t))dt +
+ o^IA^I + IA^I + |At0| + | ДГ|), (49)
аналогичное равенствам (3.40.A), (3.92). Умножим (45) на cw > 0 и
преобразуем правую часть полученного выражения с учетом (3.41.А), (3.90),
(46), (49). Получим
0<аокДФк = - Х[Я(я:*(*),«(*,^+ДО.*.^(*),ао*)-
- H(xk(t), u(t, $к), t, V>fc(t), aok)]dt + (Axq, lx(zk, ak) - фк{Ь0к)) +
+ At0[H(xk(t0k), ut(t0k), t0k, ф(Ь0к), o^) + lt(zk, ak) -
i = i
?
+ lT(4, ak) + E h<hk(G?(xk(Tk), Tk))>] +
i = i
+ оЛ(| Дяь1 + |A^ | + |ДА,| + | ДГ|). (50)
Точка (:%, £fc, t0k, T^) минимума функции Фк(жд, £.., t0, T) на множестве t^,
является внутренней точкой этого множества при к = (А:,, к%), к^к^, к^^к^.
Отсюда и из (50) по аналогии с (3.94), (3.95) получаем
^(^)=1(¾.¾).
(51)
Н(хк(Тк)МТк),Тк,фк(Тк),а,к)=^к,ак)-^к2%к(СПхк(Тк),Тк))\
[Я(жк(*), «р> t, V>fc(t), Oofc) - H(xk(t), ut(t), t, фк^), а^к)]
при всех к = (ки к%), А;, ^ А^, А^ ^ /¾.
<0,
■ = *!, + «{
444
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Зафиксируем в (46)-(48), (51) номер к% и перейдем к пределу при А;, —>оо.
Последовательности {Ак = А^}, {^ = %^}. {£fc = £*,/J- {*b* - A^jJ.
{Тк — Тъи} ограничены, поэтому выбирая при необходимости
подпоследовательности, можем считать
V^L А*Л = АК = (°V "О* % = (°Ч> • • •' "«О'
^ = («iV--.,«U), ^^ = %¾. ^2п,£*л = £4 = {£&>. (52)
,11m ^s = 4' ^.^ = ^-
Из (47) и замкнутости (70 следует, что
«Ц^О, a,,. ^0,...,0,^0, \>0, |АА.|=1, (^,^,^,^)6^0- (53)
Нетрудно видеть, что точка (:%, £ь, £0ь, Т. ) является решением задачи
¢,.(¾. £, *0, Г) = X /°(Я!(*), «(*, О, *)Л +^(¾. *(Т), *о, Г)+
+ &>£И^И*),*))2Л-МП1,
i = 1 (о (54)
i(t) = /(a:(*),«(*,0,*), *о<*<т; ж(*о) = ^,
д'(яь,я!(Г), <о, Г)<0, * = 1,...,т,
0<(а*„а:(Т), t0, Г) = 0, *=m + l,...,e, (x0,$,t0,T)eU0.
В самом деле, если к конечномерной задаче (54) при каждом фиксированном
к% применяется метод штрафных функций, учитывая концевые ограничения
S
с помощью штрафов fc, 5Z(g+)2, то придем как раз к задаче (41)-(43). Из
i = i
теорем 5.15.1, 5.15.2 следует, что каждая предельная при fc, —» 00 точка
(%у £V V, ^) последовательности (¾. v £w Ц,., Г^) решений
задачи (41)-(43) будет решением задачи (54). Отсюда же имеем, что
9*(*ок,>хк,(тк,)>Ч'ЧК°> *'= 1,---,т;
0*(%^> а^(Т^), ^, 2^) = 0, *=т+1,...,я,
где ж. (*) — x(t, и(-, |ь), ац, V,) — оптимальная траектория задачи (54).
Из оценок (3.79)-(3.82), из (46), (52) получаем
^llm Чл(Тк>к2) = хК{ТК), Ш^х^{Ь1р + &) = ^(*„ + ¢¢), (5б)
\ ■
№„"«Л = о«. = fc»^ 5 <3;+(^(<), *))<**, * = 1, 2,..., д.
1 ч ,
Здесь, как и в § 3, [а, Ъ] — это какой-либо фиксированный отрезок, а< t0t <
< Tt <Ь. В силу (44), выбирая номера к = (к,, к%) достаточно большими,
можем считать, что а < t0k < Тк < Ь, а< t0k + At0 < Тк + ДТ < Ъ при всех
малых Д£0, ДТ.
§ 4. ПРИНЦИП МАКСИМУМА
445
Рассуждая также, как в § 3, для решения фк(Ь) = фк^(t) задачи (48) и
решения ^ь.(0 задачи
ф\{1) = -Hx(xk;(t), «(*, ^), *, ^(0, 00¾) +
+ Е 2¼¾.. ¢+(¾. (i), 0^К(0, 0,
4<*^TV ^(^) = -^,^), (57)
где 2^ = (^,г,,(Тц),^.тц)' доказываем оценки для ^maxJV^Ol.
max J ^(0-^(01, lVY^(*)-|VV-2(r)l<-4,"lt_rl Vt,ri[a,b],
аналогичные оценкам (3.77)-(3.82), из которых получаем равенства:
lim тах\ф,кН)-ф^)\ = 0, }1тф^(г0^) = фк(^),
lim^ti(T^) = ^(T), lim ф^1р + ф) = фф1р + £&). (58)
Пользуясь (52), (56), (58), непрерывностью функций Н, I, кусочной
непрерывностью ut(t), определением точек tlp, £,*, можем перейти к пределу при
fc, —> оо в соотношениях (51). Получим
^M4) = I*(*va0' (59>
н{хК{г0к), ut(t0ki), *ov Ф^о^), ац) =
= -it(*v %,) + Е *.<ч(^К(Ч)> Ч))2' (6°)
Я(^(^)>Ч(Г^)>Г^>^(^)>а0^)=1т(^>а^)-Е^(^К(^)>Г1.))2>
[Я(Я!Ч(*), ^,4,^(0,^)--^(^(0,4(0.4.^(0,00,,)] <0. (61)
Далее нам нужно перейти к пределу при к^ —» оо в полученных
соотношениях. Убедимся, что
lim =%=%., lim ^ = ^ = 0, lim t0A = i0*> lim 2^ = Tt. (62)
Согласно (44) для любого e > О найдется номер /¾ такой, что
1%с-%.1<£, 1£*1<е) l*ok- *o*l<е> lTfc-TJ<£
для всех к = (A:,, fc,), ky^kQ, к^^-к^. Отсюда следует, что все предельные
при £,-+00 точки (а^., £v iov Т^) последовательности {(¾.. £fc, t0fc, Tfc)}
удовлетворяют неравенствам: |^-%,|<е> |£a-J <е- I*о&, — *о*I < е- 1¾- ^1 <
< е Vfeg ^ fcg. В силу произвольности е > О отсюда получаем равенства (62).
Далее, пользуясь неравенствами (3.78), (3.82) при £ = ^, ^0 = ¾^ *о =
= iov (3.80), (3.81) при x0 = x0t, ¢=^=0, t0 = *o»- т = т*. Д*Ь = %,-=%-
Д£ = ^ - £„ Дto = *оа, - *о*. ДГ = \ ~ Т* с Учетом (62) получим
lim max \x,(t)-xt(t)\ = 0, lim aU*0J = zt(i0J,
lim вЛЗ! ) = ^), lim ^(tIp +^) = ^(^)- (63)
fcj-ЮО ™ ™ /¾ —> oo
446
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Так как фазовые ограничения согласованы с концевыми в точке zt =
= (^, ХЛTt),t0t, Tt), а точка ^ = (^,^.(^),^,^) удовлетворяет
условиям (55) и {zkJ -» zt в силу (62), (63), то £г(^(Ц), Ц) < О,
^{{хк{%), Т )<0, * = 1,..., д, при всех к,^ V Тогда С/(^(Ц), ^,.) = 0,
04^(¾)) ^,) = 0> *' = 1) • • •) 9> и равенства (60) перепишутся в виде
(64)
#К(^), и,(2;), tv -1,(¾., ^), о^) = Zr(*V a,.) Vfc, ^ V
Так как последовательность {АЛ из (52), (53) ограничена, то, выбирая
при необходимости подпоследовательность, можем считать, что
lim A.=AN = (aN,aN), aN = (aQN,..., asN), aN = (a]N, ..., a N),
^°° . , (65)
00^0,...,0^^0, \AN\2=Y1 4v+E 2^ = 1.
i=0 i=l
Объясним появление индекса N в обозначении j4w предельной точки
последовательности {А. }. Напоминаем, что все рассуждения до сих пор мы
проводили при фиксированном N, но для краткости записей зависимость
используемых величин от N явно не подчеркивали. Однако в дальнейшем
нам еще предстоит совершить предельный переход при N —» оо, поэтому
предельные точки всех последовательностей, зависящих от N, мы будем
далее снабжать индексом N.
Для обоснования предельного перехода при к% —» оо задачу (57) удобнее
записать в интегральной форме
\
Фф) = S Hx(xh(r), и(т, $Л, т, фф), а^Лйт -
t
т
- £ $ 2^0оА. max{Gi(xlh(T);0}G:(xlh(T),T)dT-ly(zki,alh), ^«<^. (66)
i = ii
Кроме того, интегралы из второго слагаемого правой части (66) ниже
запишем в виде интеграла Римана — Стилтьеса. С этой целью введем функцию
'О, а^т< iov
<(*) =
= <
$ 2¾^ тах{С?Ч^(т), r);0}dr, Ьщ < t < Tv
S (67)
Ts
S 2¾¾¾ max{G*(^(T),T);0}aV = oiv г^ < т < Ь.
. S
Очевидно, функция r)l(t) непрерывна на отрезке [о, Ь], не убывает,
дифференцируема во всех точках t е [о, Ь], кроме, быть может, точек t = £0ь,
t = 21, причем ее производная
<С0 fo, te[o,i0fc2)u(TvH
d* 1 2^ max{G'(^(*),*);0} *е(Ц,Т(.), < }
§ 4. ПРИНЦИП МАКСИМУМА
447
Кроме того, с учетом условий (53), (56) мы имеем
<(а) = 0^4(*К<(Ь) = а^<1, ^ = 1,2,... (69)
По теореме 2 из последовательности {r)t(t)} можно выбрать
подпоследовательность, сходящуюся к некоторой неубывающей функции ?7w(i) в каждой
точке i 6 [а, Ь]. Не умаляя общности, можем считать, что
Hm v{(t) = Vh(t) Vte[a,b]. (70)
Так как (¾¾} —> *о*> (¾} -> ^- т0 из (67), (70) следует, что
*&(*) = 0 Vte[a,t0J, ^(i) = aiJV Vie(Tt,b], (71)
и поэтому последнее из равенств (65) можно записать в виде
1^|2=Е^ + Е(^(<))2=1, Vte(Tt,b]. (72)
i=0 i=l
Покажем, что функция %(*), t е [a, b], постоянна на каждом
интервале, принадлежащем множеству {t е (t0t, Tt): G{(xt(t), t) < 0}. Это
множество открыто в силу непрерывности функции Gl(xt(t), t) на [t0t, Tt],
поэтому является [393] объединением не более чем счетного множества
интервалов (а^ (ЗЛ. Покажем, что ffN(t) = с\ Vt е (ая /ЗДВозьмем
произвольный отрезок [a, f3] С (ая /¾). Так как G'(xt(t), t) <0 Vt б (ая Д,), то
max G*(a;.(t), t) = -7 <0, а из
(б[а,/3]
Hm max |G'(^(*),*)-G'U(*),*)l=0 (73)
следует, что |G'(a;^(t), t)- G'(a;t(t), t)| < % Vt б [a, 6] Vfc, ^ /¾. Поэтому
G'ix^t), t) < |G'(^(t), t) - G'(xt(t), t)\ + &№), t)) < -\
Vte[a,f3], Vfc^fc,,
и в силу определения (67) функции rj^t) имеем: ^(t) = г}^{а) = const
Vt е [а, /3], Vfc, ^ fcj. Отсюда и из (70) следует, что %(i) = %(ai) v* 6
6 [a, /3]. В силу произвольности выбора отрезка [а, (3] из интервала (а3-, /33)
заключаем, что
^(t) = ^(a) = c; Vie (a,,/3,.)- (74)
Введем функцию
^(*)=< ^(*), шкйь,. <t<Tv (75)
I ^(^) = -^,^), :z;<i<b.
Из (66)-(68) следует, что функция ф^) является решением интегрального
уравнения
я ь
I
£ = 1 (
^(0=X^(^^(-r))^-EX^(^(r),r)^4-^vafc2), a<i<b, (76)
448
Гл. 6, ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
где
Я^т'*)=(о, re[a,4)u(Tvi>], <77>
6 ■ ь drii(r)
a I Gx(x^(t), T)dr]^ — $ G^x^t), т) ^. dr представляет собой интеграл
Римана — Стилтьеса от непрерывной вектор-функции Gx(x.(t),t) по
мере, порожденной функцией г]1(т) из (67). Из (76) с помощью леммы 3.1,
учитывая (62), (63), (69), (77), (3.76), непрерывность функций Нх, G*, 1у
по совокупности своих аргументов, получаем оценку
max |^(t)| <Со„ Vfc > к, (78)
и убеждаемся, что непрерывная функция ф^ имеет ограниченное изменение
на [а, Ь], причем полное ее изменение оценивается так:
Уаъ(Ф„,)<(Ь-а.)[ыр sup sup \Нхкг(т,ф)\ +
+ £sup sup \Gi(x^(T),T)\] = clN (79)
для Vfcj ^ ^; здесь и ниже через cw обозначаются константы, не зависящие
от fcj, но, возможно, зависящие от N. Из (78), (79) и теоремы 2 следует,
что последовательность {ф^(£)} содержит подпоследовательность, которая
всюду на [a, Ь] сходится к некоторой функции фы{Ь) с ограниченным на
[а, Ь] изменением. Можем считать, что
lim ^.(t) = &(*), ШЕ[а,Ъ]. (80)
Из определения (77) функции Н.(т,ф), из соотношений (3.71), (62), (63),
(80) вытекает, что
^ Я^(т, ^(г)) = Я^(г, ^(r)) =
#,(^.(0, Ч.(т), т-, й,(т), Oqjv), г е К*, TJ,
О, г е [a, t0JU(Tt,b] 1 >
SUp |Я^(Г, Vjv(7-))| <
т6[а,Ь]
Пользуясь теоремой Лебега о предельном переходе под знаком интеграла
[393], имеем
Пш\й (rJ(r))dr=\HxN(rJN(r))dr Vte[a,b]. (81.А)
Из (70), (73) и леммы 6 следует
lim \ Gi(xh(r), т)Щ = J СЛ^(т), т«
в точке t = а и во всех точках £ 6 (a, b], в которых % непрерывна. Кроме
§ 4. ПРИНЦИП МАКСИМУМА
449
того, lim ly{\, а^) = ly(z^, aN) в силу (62), (63), (65). Таким образом, из
равенства (76) при fcj —> оо с учетом (80) имеем
<Ы*) = X Н^(т, %{r))dr - ± \ Gi(xt(r), r)d^N - ly(zt, aN) (82)
в точке t = a и во всех точках t е (а, Ь], в которых функция ffN(t) =
— (fpN(t),..., rfjli(t)) непрерывна. Введем функцию
<Ы*) = S HxN(t, JN(r))dr - Е $ G;(xt(r), T)d^N - ly(zt, aN), (83)
совпадающую с правой частью равенства (82). Так как все интегралы в (83)
имеют смысл при всех t 6 [а, Ь], то функция t[)N(t) определена при всех
t е [а, Ь]. Функция ij)N(t) из (80) также определена при всех t е [а, Ъ],
причем, как следует из (82), (83), равенство
<Ы*) = <Ы*) (84)
справедливо при t = а и во всех точках t е [а, Ь], в которых ffN
непрерывна. Так как мощность множества точек разрыва неубывающей функции не
более, чем счетна [14], то можем сказать, что^авенство (84) выполняется
почти всюду на [а, Ъ]. Тогда HxN(t, фм(т)) = HxN(t, фК(т)) почти всюду на
[а, Ь] и, следовательно,
\ HxN(r, jN(T))dr = \ Я^(т, ф„(т)№т V* 6 [а, Ъ).
t t
Отсюда и из (83) имеем
Фм(*)=\нхМ(т, ФАт№т-±\с:(ъ(т),т^-1у(^,ам) V* е[а,Ь]. (85)
Сравнение (85) с (82) показывает, что функция фм в отличие от фм является
решением интегрального уравнения (85) всюду на [а, Ь]. В дополнение к
равенству (84) оценим отклонение значений фм и фм в точках разрыва
функции rfN. Нетрудно убедиться, что
l^(*)-4(*)l<2Cl|^(* +0)-%(* -0)|,
с, = (Е НСЛаЦ*). <)11^,ы)1/2 Vt е [а, Ь]. (86)
В самом деле, из (70), 76), (80), (85) и леммы 6 имеем \i[)N(t) — VwCO
а Ь Ь
= lim |^(*)чЫ*)К Ит Е
<2С1|йД*+0)-^(*-0)| vte
Г 0,
ХЯ^(г,^(г))йг=<
а, Ь]. Заметим, что в силу (81), (84)
te(Z,b],
й
t
r,
l Нх(х^т),и^т),т,^(г),%)(1т, t е [a,t0J.
(87)
450
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Кроме того, с учетом формул (6), (71) мы имеем
$GJK(t),t« =
X, ь т.
= <
te(Tt,b],
т.
(88)
(о.-° т, Ъ Г,
t %, г.+о h.
где для краткости мы обозначили д(т) = G*(xt(r), т), т Е [а, Ь]. Далее при
каждом г, 1 < i < q, в силу (7) для меры на отрезке [t0t, TJ, индуцированной
с отрезка [а, Ь], производящей функцией является
^( V -0)=о, t = t0t,
ч№)={ W). te(t0t,Tt),
^(T, + 0) = aw> * = ГФ; N = 1,2,..
(89)
Переходя с отрезка [а, Ъ] к отрезку [t0t, TJ, равенство (85) с учетом (87)~
(89) можем записать в виде
г,
т
- £ $ЧЧ**Ы, т« - Z^, aw) Vte[t0t,Tj, JV = 1,2,... (90)
t=l (
Сразу заметим, что из (72), (89) следует равенство
KI2 = E4 + E(*ra)2 = i, JV = 1,2,...
г=0 i=l
Докажем, что
lim ^(Ч) = <Ы*о*)-
(91)
(92)
Из (76) при £ = а с учетом (75) имеем
<MW = <Ma> = S Й^ ^(r))dr - £ X G:(xt(r), r)drj{ - 1,(¾. , ah),
i,
= 1 a
1, 2,... При fc,—>oo отсюда и из (26) при t =a, из (62), (63), (65), (70),
(81.А) следует
~ ь ^ ~ i ь
lim ^(^) = Wa)= J Я^т.^т))*-!] X ЗДяДт), r)d^- 1,(¾. aw),
что с учетом (83)-(85), (87)-(90) равносильно (92).
§ 4. ПРИНЦИП МАКСИМУМА
451
Теперь можем перейти к пределу при к% —» оо в равенствах (59), (64). С
учетом (62), (63), (65), (92) и равенств ч(*) = ч(А>*+°) vt < Аь. «*(*) =
= ut(Tt - 0) Vt ^ Tt имеем:
Vh(AJ = '*(**• Mi
H{xt{t0t), 4(V + 0), *o*> '«(«♦! <%). aow) = -'*(«♦! <%)> (93)
Я(^(ГФ), иф(Гф -0), T„ -1,(¾. aN), %N) = IT(^, aw), N = 1, 2,...
Переход к пределу при к%—>оо в неравенстве (61) будет более сложным, так
как у нас нет оснований ожидать, что lim ^. (4+£ie )=,0лг(4)' Покажем, что
fcj—*оо * ^
tonJ^(4+£5)-^(4)l ^3^1^(^+0)-^(^-0)|, ^=1,...,^, (94)
где постоянная су взята из (86). С этой целью воспользуемся
равенствами (76) при t = tlp + £J% и (82) при t = tlp. Будем иметь:
lim |^ (4 + ¢£) - j,N(tlp)\ < lim J^(t, ^(r)) - HxN(t, фм(т№т
+
+ lim
/¾ -KX
<l,+f£
S Н+{т,\{т))<1т
+
+ E lim $ (^(^(г),г)-СЛ^(г),г))^4
*= 1 "2 j if *2
+
X GiUir), r)drj{-\ G:(xt(r), r)dfN
K+$
+
+ J1™, l'»K« ^)-^(¾. Ml-
Четвертое слагаемое из правой части этого неравенства не превышает
правой части (94) в силу леммы 7, а остальные слагаемые равны нулю в
силу (9), (62), (63), (65), (69), (78), (81). Оценка (94) доказана. Из (86), (89),
(94), включений tlp e(t0t, TJ получим*
JimJ^(4+£§)-^(4)l < 5^1^(^+0)-^(^-0)1, I, р=1,..., N. (95)
Далее, пользуясь линейностью функции Н(х, и, t, ф, (¾) по переменной ф,
получим
< 1<ч/°К(4+^)> v 4+£&)-WW4)> v 4)1 +
+ 1(^(4+^)- /К(4+£&). v hp+tk)-7te(4)> vp, tIp))| +
+ 1(^(4 + £&) - ^(4). /U(4)« «p. 4))1-
Первое и второе слагаемые из правой части этого неравенства стремятся к
нулю при fcj —» оо в силу (62), (63), (65), (78), а верхний предел последнего
452
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
слагаемого оценивается сверху величиной из правой части (95),
умноженной на Cj — max{ sup \f(xt(t), vp, t)\; sup \f(xt(t), ut(t), t)\}. Поэтому
l£|a, b] tE[a,l]
lim Bj: 4Ъсус2\щ{11р + 0)-щ{%-0)\, l,p = l,...,N (96)
«2 —> OO л
Аналогично для величины В^ = |Я(а^(*), u^i), i, ^(i), оц)|( = ^ + ^ -
- H(xt(t), ut(t), t, i/jN(t), aoN)\t<=t | получаем
ШхВ14Ъс^\щ{11р + 0)-щ{11р-0)\, l,p=l,...,N. (97)
Кроме того из (61), (75) следует
[H(xt(t), vp, t, il>N(t), Oqjv) - H(xt(t), ut(t), t, il>N(t), a^)]
< Щ + b{ + [Я(^(о, vp, t, фф), ^) -
- H{xK{t), u,(i), t, ^, (i), ^)]|t = J s < -5¾ + -Bv *s = 1. 2,. •.
Отсюда при fcj —» oo с учетом оценок (96), (97) имеем
[Я(жД*), v , t, ф„{Ь), Oqjv) - H(xt(t), ut(t), t, 4N{t), Oqjv)] <
* = К
^10^1^(^ + 0)-^(^-0)1, l,p = l,...,M (98)
Подчеркнем, что постоянные cn Cj в (98) не зависят от N.
Покажем, что
<WCO = 0> i = l,...,m. (99)
Если #'(-0 = 0> то (99) очевидно. Пусть g{(zt) < 0. Так как lim zk = zt,
к — (Ц /¾) —» oo
то lim #(,zfc) = 0(,zJ<O. Поэтому #*(,ztfc)<0 Vfc, ^ ^¾. fc, ^ /¾ при достаточно
к —» oo 4¾
большом номере /¾. Отсюда и из (46) следует, что а^ь =0 Ук{ ^ 1%, к%^
^ Ад, так что lim aik = aiN = 0 и, следовательно, равенство (99) верно и при
g4zt)<0. к^°°
Наконец, остается перейти к пределу при JV—>оо'в соотношениях (65),
(91), (93), (98), (99). Так как \AN\ = 1, то, переходя при необходимости к
подпоследовательности, можем считать, что lim AN = A = (a, а), а—(а0,,,,
N —»оо 4
..., as), a — (ap ..., aq), причем в силу (65)
а0^0,а1^0,...,ат^0, |А|2 = |а|2 + |а]2 = 1. (100)
Функции r)if(t) из (89) не убывают на отрезке [t0t, Tj, ?7лг(*о*) = 0^77аг(*)<
^InC^J — aiN < 1 Vt e[£0*> TJ, iV = 1, 2,..., и согласно теореме 2, выбирая
при необходимости подпоследовательность, можем считать, что
lim vUt) = v{(t) Vie К, Т.], (101)
JV->oo
где ?7г(*) — неубывающая функция, rf(t0i) = 0¢. rf(t) 4 rf(TJ — а{ ^ I, По-
§ 4. ПРИНЦИП МАКСИМУМА
453
ложим rj(t) = (r]l(t),..., rjq(t)). Из (91) следует, что Ёа? + Ыг*12 = 1» так
что набор (a, rj(Tt)) нетривиален. <=о
Кроме того, в силу (74), (101) на любом интервале (а^,/3^),
принадлежащем множеству {£ б [t0t, TJ: G*(a;t(t), t) <0} функция rj^t) принимает
постоянные значения. Функции ^{t) можем считать непрерывными слева
во всех точках t е (t0t, TJ в силу замечания 1.
Функция il>N(t) из (80) имеет ограниченное изменение, поэтому t[)N(t)e
е L"[a, Ь]. Отсюда и из (84) следует, что il>N{t) 6 L"[a, Ь]. Пользуясь
леммой 3.1, из (90) получаем оценку
1^(<)1<[Л°тах(^-и(«о+1)+С1 + тах|гД^,сг)|]-ехр(/1тах(Т,-и)=Сз,
Vte[fo„ TJ, W>N0, (102)
где N0 достаточно большой номер, f°mix = sup \f°(xt(t), ut(t), t)\, /imax =
(е[г„.,г.]
= sup ||/x(a;t(t), ut(t), £)||, постоянная cy взята из (86). Кроме того,
из (90) с помощью леммы 8 и свойств интеграла Лебега заключаем, что
функция i[)N(t) имеет ограниченное изменение и ее полное изменение
оценивается сверху следующим образом
т.
V£WN)<1 sup s\ip\Hx{4{t),ut{t),t,4,n)\dT + Cl=cA VN>N0. (103)
Из (102), (103) и теоремы 2 следует, что из {i/)N(t)} можно выбрать
подпоследовательность, сходящуюся всюду на [t0t, TJ к некоторой функции ф{Ь)
с ограниченным изменением. Можем считать, что
Jim </>„(*) = f(*)> Vie[£0t,Tj. (104)
N—t oo
Перейдем в равенстве (90) к пределу при N —» оо. Пользуясь теоремой
Лебега о предельном переходе под знаком интеграла в первом слагаемом
правой части (90), леммой 5 — во втором слагаемом и равенствами (104),
lim aN — а, получим
JV->oo
${t)= i Hx(xt(T), щ(т), т, ф(т), Oo)dr - £ $ G;(xt(T), t)<V - ly(zt, а)
t г = 1 (
при t = t0t и во всех точках t е (£0*' X] непрерывности функции г](т) =
= (г]1(т),..., r]q(r)). Правую часть этого равенства обозначим через i[)(t) и,
как и в аналогичных равенствах (82)-(85), (90), показываем, что функция
•0(4) определена на [t0t, TJ всюду, удовлетворяет уравнению
г,
^(*) = X #.(^.(0. «*(т), г, ф(т), Oo)dr -
-Е X С,'К(т), т)сЙ7« - 1,(¾. a) Vie[i0t,Tj, (105)
< = i г
и неравенству
|^(t) - -0(*)| < 2Cl|4(* +Q) - 77(* - 0)| Vte[t0t, TJ, (106)
454
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
где постоянная с, взята из аналогичного неравенства (86), причем ф(Ь) =
= if)(t) при t = tQt и во всех точках непрерывности rj(t). Кроме того,
функция т/ЧО непрерывна слева в каждой точке t 6 (t0t, Tt] — это следует из
леммы 8, примененной ко второму слагаемому из правой части (105) и
непрерывности остальных слагаемых. Из (93) при N —» оо имеем:
^(¢).) = 1.(¾. °).
н(хЛ*о*), ч(*о* +0), *о*> '«(^» а). <%) = -'*(*»• а)> (107)
ЯК(ГФ), ч(Гф -0), Г„ -1,(¾. а), £,„) = 1Т(^, а).
Из (99) при N —> оо получаем
0^00 = 0, г = 1,...,т. (108)
Остается совершить предельный переход при N —» оо в неравенстве (98).
Вспомним, что lim tt — t, в силу (3.12), Рассуждая также, как при дока-
i JV-too v
зательстве неравенства (94), устанавливаем, что
111111^(^)-^(4.)100,1^,+0)-^-0)1.
JV—> оо
Отсюда и из (106) следует
JV
lim |<ы*,Р)-</>(*,)!<Sc,!^*, + 0)-??(*,-0)|.
Тогда по аналогии с (96), (97) для величин
BN = \H(x,(t), Vp, t, Vv(*), <^)|( = („ - |ЩаЦ*)» «pi *, Ф(*), ^)1( = (,.
В* = \H(x,(t), 4(t), t, ^N(t), ^)1^ - \H(x,(t), 4(i), t,j)(t), Оо)|; = (|
iV = l,2,...
имеем
max{ lim B^, lim B£} < 5clC2|?7(i,+0) - ??(*, -0)| (109)
JV—> oo JV—> oo
с теми же постоянными с0 с2. Кроме того, из (98) следует
[H(x,(t), « t, </>(*), оо) - H(x,(t), 4(i), i, </>(*), oo)] <
( = (,
< БА + B* + [Я(аЦ*), «p, t, w(<), v) -
- ЩЦ(1), 4(i), t, Vjv(<), «ojv)] < -Bjv + -Вя +
+ 10с1С^М*,р + 0)-^(*«р-0)|, I,p = l,...,JV; iV = l,2,...
Отсюда при N —» oo с помощью леммы 4 и неравенства (109) получим
#(аЦ*|). «р» *i» V»(*i)i ао) - ^(a*(*i). Ч(*|)» *«» V»(*i)i Оо) <
< 20с1С2|77(*( +0)-7,(4,-0)1. (ПО)
Так как функция ??'(<) не убывает и 0<туг(*) < 1, t е [i0t, 2^], то
отрезки [r]i(tl — 0), rji(tl +0)] е [0, 1] не пересекаются, и суммарная длина этих
оо
отрезков не превосходит 1. Это означает, что ряд ^2[i]i(tl +^)~Vi(ti ~0)]
i = i
§ 4. ПРИНЦИП МАКСИМУМА
455
с неотрицательными членами сходится и, следовательно, lim [rj^t, +0)-
l —t oo
— 77*(t, — 0)] = 0, г = 1,,,., q. Зафиксируем произвольное число e > 0. Тогда
найдется номер ^ такой, что
W*«+0)-»7(*«-0)|<e VZ>Z0.
Отсюда и из (110) имеем
Я(^(«|),«р,*|^(*|),ао)-ЯК(*«)»ч(*«).*«.^(*«),а0)<2рс1с^е V?^Z0. (Ill)
Множество точек {£,, Z > L} образует плотное множество на [t0t, 2^].
Поэтому для каждой точки t б[£0„, Tt] непрерывности функций «„(£), ф(Ь)
найдется подпоследовательность {t| } —> t при i/ —*00. Из (111) при I = lv—> 00
получим
#K(i), «р, i, V>(<), Oo) - H(x^t), 4(t), i, V(0. Oo) < 20c, c^.
В силу произвольности e > 0 отсюда имеем
Я(^(*),«Р,*,^(*)»ао)-Яи(*)»ч(*)»*»^(*),ао)<0
во всех точках £ е [t0t, ZJ, в которых и„(£), т/Ч*) непрерывны, и любых г>р
из всюду плотного в V множества точек {vp}, А тогда
Я(аЦт), «, г, V(t), do) - Я(я^(т), цДт), г, ^(т), <%) < О
для всех «еУво все моменты г непрерывности функций u„(£), i>(t).
Однако нам уже известно, что функция •)/>(*) непрерывна слева во всех точках
t е (£0*, 211- Поэтому с помощью предельного перехода при т —> t —б
убеждаемся в справедливости последнего неравенства во всех точках промежутка
(t0!,, ZJ, в которых управление и„(£) непрерывно, невзирая на возможные
разрывы i/)(t). Отсюда следует справедливость равенства (36),
Таким образом, доказаны все утверждения теоремы 3 в предположении,
что задача (30)-(31) имеет единственное решение (:%,"«*(*)> ж*(*)> *о*> ^)-
Если эта задача имеет много решений, то переходим к задаче
J^, яГ >(■),*(■), *п+1(-)Л> Г) =
= 1f°(x(t), u{t), t)rft +^(¾. х(Т), to, Т) +
+ K-^|2 + kn+1|2 + l*o-<oJ2 + (r-2:)2-,inf (112)
при условиях (31)-(34) и
i» + 4*) = l«(*)-4(*)l2, to<f<T, x"+l{to) = a$+l. (113)
Задача (112), (31)-(34), (ИЗ) имеет единственное решение и для нее
справедлив уже доказанный принцип максимума. Далее, рассуждая также,
как в § 3 в аналогичной ситуации, убеждаемся, что в этой задаче
оптимальные ж" + 1(*) = 0, •0n + 1(t) = O и, исключая из рассмотрений переменные
xn + l, V'n + i. убеждаемся в справедливости теоремы 3 в общем случае. □
456
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
Основываясь на теореме 3, по схеме, приведенной в § 2, нетрудно
выписать краевую задачу принципа максимума для задачи (30)-(34). Следует
сказать, что получающаяся при этом краевая задача сложна для
исследования, и методы ее решения пока что разработаны мало [274; 332; 505].
3. Для иллюстрации теоремы 3 рассмотрим
Пример 3 [44, стр. 111]. Пусть требуется минимизировать функцию
1
J(u) = J u(t)dt при условиях: x(t) = tu(t), 0 < £ < 1; х(0) = 0, x(l) =
о
= 0; x(t)^0, t е [0,1]. Эта задача, очевидно, является частным случаем
задачи (30)-(34) при V = Е\ *0 = 0, Г = 1, /° = u, / = tu, G(x) = -x, концы
траекторий закреплены. Так как \x(t)\ = \ ти{т)йт < „t2 sup |u(t)|; то
''■''■' 0 ¢6(0, 1]
\u{r)dT=\^dT=-^p- + \^-dr^-^p-^-U sup |u(t)| Vi>0.
( t t T «6(0, 1]
Отсюда при t —» +0 получаем: J (и) ^ 0 для всех допустимых управлений
u(t). Но J(0) = 0, так что Jt = 0 и u„(t) = 0 —оптимальное управление,
£_(£) = 0 — оптимальная траектория. Функция Н — —а0и + фи\ = и{—а^ +
+ Ьф) достигает максимума на множестве V = Е1 только при — а0 + Щ =0.
Следовательно, ^(t) = ^, 0 < t < 1. Согласно теореме 3 функция ф{Ь)
должна быть определена всюду на [0, 1] и иметь ограниченное изменение,
что возможно лишь только при ао^О. Таким образом, i[)(t) = 0, 0< t <
< 1. Далее, 1(х, у, а) = а{х + а^у и из условия трансверсальности при t0 =
= 0 имеем: ^)(0) = 4(0, 0, а,) = а,. Так как Нх =0, ly = (ц, то интегральное
1
уравнение (35) запишется в виде ^i(t) = Jd?7 — % == r){\) — rj(t — 0) — а^,
t е [0, 1], и, следовательно, i
>(*) =
Тогда можно взять
^1 = ^(1)-^(0)-¾. *=°)
77(1)-77(4-0)-02 = 0, 0<'*<1.
■ ■*=0, . -
V(t)={ А, 0<*<1,
* = 1,
ау—А, о2 = В — .А, где А, В — произвольные числа; лишь бы 0 < А < В < 1,
причем либо А ^0, либо В — А^О. Тогда набор (оп 03,77(1)) ^0, причем
функция 77(t) имеет скачок хотя бы в одном из концов отрезка [0, 1].
Отметим, что в этом примере функция Н = Н(и, t, ф, Og) = 0 и условие
максимума (36) не несет никакой полезной информации, так как оно не
сужает класс допустимых управлений, подозрительных на экстремум.
Оказывается [44], такое вырождение принципа максимума довольно характерно
для задач оптимального управления с фазовыми ограничениями.
Достаточные условия, когда в таких задачах условие максимума (36)
не,вырождается, получены в [44]. ,
4. Сформулируем аналог теоремы 3.1 для задачи (30)-(34).
Теорема 4.;' Пусть в дополнение к условиям теоремы 1
функции /г(ж, и, t), г = 0, 1,..., п, G*(x, t), г = 1,..., q, имеют производные
§ 4. ПРИНЦИП МАКСИМУМА
457
//(ж, и, t), G*(x, t), непрерывные по совокупности аргументов (ж, и, t)e
еЕп xV х Е, пусть (х0) и(-), ж(-), t0, Т) решение задачи (30)-(34). Тогда
функция
H(t) = supH(x(t),4t^(t),av) (114)
определена и принимает конечные значения на [*0, Г], непрерывна слева
при всех t e(t0, Т], причем
Я(*) = Я(*-0) = Я(я;(*))и(*-0))*)^(*),ао) Vte(t0)T]; (115)
непрерывна справа во всех точках непрерывности -ф(-), причем
H(t) = H(t+0) = H(x{t),u{t+0)it,^l)(t),a0) \/te[t0,T); (116)
справедливо равенство
т
H(x(t), u(t - 0), t, </>(*)> «о) = -№(а;(т), и(т), Ъ ф(т), %)dr +
t
+ £ ] G?{x{t), tW + 1,.(¾. x(T), t0, T, a), Vt 6 [i0, Г] (117)
« = i г
(при t = t0 в (117) no определению считается u(t0-~0) = u(t0 + 0)).
Равенство (117) обобщает (3.118) на случай задачи (30)-(34).
Доказательство. Конечность значений функции (114) и ее
непрерывность слева на промежутке (t0, Т], равенства (115), (116)
устанавливаются также как аналогичные утверждения в теореме 3.1. Для
доказательства равенства (117) обратимся к гьзадаче, которая получается из
задачи (3.103)-(3.107) добавлением фазовых ограничений
6УЧЗД,Х(0))<О, 0,<0<02, i = l,...,q. (118)
Пусть (xq, и(-), х(-), tg, Т) —оптимальный процесс задачи (30)-(34). Тогда
согласно формулам (3.111) процесс
(5-, = ¾. и(в) = и(в), «(0)=о, х(в) = х(в), х(0) = о, el = t0,e2 = T) (ii9)
будет оптимальным для задачи (3.103)-(3.107), (118). Нетрудно
проверить, что если фазовые ограничения (33) согласованы с концевыми в
точке z:t = (x0,x(T),t0,T), то для процесса (119) фазовые
ограничения (118) также будут согласованы с концевыми (3.106) в точке zt =
= (¢(0.), ж(02), х(0,), х(02)). Функции Понтрягина Я и Я задач (30)-(34)
и (3.103)-(3.107), (118) связаны посредством тех же формул (3.112). В
силу теоремы 3 для процесса (119) существуют a = (a0,al,...,as), г](в) =
= (г]1(в),..., г,*(6)). 4>(в) = (ФЛв), ■ • -, ФЛО), ФоШ ®у < в < ^ такие, что
ф{в) = { Нх(х(т), и{т), т, ф(т), Oo)dr -
в
-£\о:(Цт),т)^^-1у(К,а) УвЕ^в,), (120)
t = 1 в
458
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
%
Мв) = I #*(z(t), и(т), т, ф(т), a^dr -
в д
-Цо*{х{т),т)<1г,<-1т{К,а) V0e[01,02], (121)
; = 1 в
Я(0) = sup Н(х(в),'ш,ь,в^(в),%(в),а0) =
(w,v)€Vx{\v\ ^1/2}
= Н{х{в), и(в), v(6) = О, 0, ф(в), ф0{в\ а0) =
= Н(х(в), и(в), в, ¢(6), «о) + %(в) (122)
во всех точках 0 е (0,, 02], в которых управление (и(т), v(6) = 0)
непрерывно; функция Н(в) непрерывна слева на промежутке (0,, 02];
W) = ',(*.,«), Ш) = №.,"), (123)
Н{х{ву), и{ву + 0), «(б,) =0, 0„ 1,(¾. a), 1,(¾. а), (¾) -
= Н(х(в1), и(0, + 0), 0„ 2,(¾. а), ао) + 1,(¾. а) = -1^(¾. а) -0, (124)
Я(ж(02), и(в2 - 0), «(^) =0, 02, -1,,(¾. а), -^(¾. а), (¾) =
= Я(5Г(02), и(в2 - 0), 02, -1,(¾. а), ао) - 1:,.(¾. а) = 1^(¾. а) =0; (125)
остальные утверждения теоремы 1 нам явно не понадобятся. Так как г>(0) =
= 0 является внутренней точкой множества \v\ < 1/2, функция Я линейна
по v, то, рассуждая также, как при выводе равенства (3.116), из (122)
получаем
ф0{в) = -Н{х(в), £(0-0),0,^),¾) V0e(0„02]. (126)
Кроме того, из (123), (124) следует
4(0,) = 1,(¾. а) = -Я(5Г(0,), u(0, + 0), 0„ <Ж), «о),
так что^авенство (126) имеет место и при 0 = 0[ (напоминаем, что и(в1 +
+ 0) = и(0! — 0) по определению). Отсюда и из (121) получаем
Н(х(в), и(в -0), 0, V(0), «о) = - { Я,(я(т), и(т), г, V(r), Oo)dr +
в
+ £ { G,(sb(t), t)cU7* + 1,.(¾. £-(¾). 0,, 02), a) V0 е [0„ 02].
t = 1 в
Возвращаясь к исходным обозначениям в силу (119) с заменой 0 на t,
приходим к равенству (117). Теорема 4 доказана. □
Предлагаем читателю сформулировать и доказать варианты теорем 3, 4
для задачи (30)-(34), когда один из моментов t0 или Т или оба эти момента
закреплены.
Другие варианты принципа максимума для задач с фазовыми
ограничениями при различных предположениях о динамике системы, о класса
допустимых управлений читатель найдет, например, в [36-39; 41; 42; 44; 46;
50; 212; 225; 274; 276; 278-280; 332; 358; 380; 429; 430; 505; 578; 587].
§ 5. ПРИНЦИП МАКСИМУМА И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ 459
§ 5. Связь между принципом максимума и
классическим вариационным исчислением
Основной задачей классического вариационного исчисления, как
известно [101; 121; 217; 376; 406; 409; 781], является следующая задача:
среди всех непрерывных кривых х = x(t0), t0 < t < Т, имеющих кусочно-
непрерывные производные x(t) и удовлетворяющих условиям x(t„) е S0,
х(Т) б Slt найти такую, которая доставляет функции (функционалу)
J = ]f°(x(t),x(t))dt
Ч
минимальное значение. Здесь x(t) = (xl(t),.,,, xn(t)), S„ и
S{—заданные множества в Еп. Будем предполагать, что функция f (х, и, t)
непрерывна и имеет непрерывные производные /°, /и°, /°, /u°, /£, /u°u при
(х, и, t)eEn х£" х [t0, оо). Далее, в этом параграфе для простоты мы
ограничимся рассмотрением случая закрепленного левого конца: x(t0) = x0, t0 —
задано, а правый конец х(Т) либо закреплен: х(Т) = xlt Т — задано, либо
свободный: S{ = Еп, Т—задано, либо является подвижным и лежит на
заданной гладкой кривой
S^S,{T)={y е Еп: д{у, Т)=у-<р(Т)=0}, Т е Е={-оо < t < оо}.
Обозначим x(t) — u(t) и запишем рассматриваемую задачу в
эквивалентном виде как задачу оптимального управления:
J (и) = $ f°(x(t), u(t), t)dt -»inf,
i(t) = «(*)» <o^*<^ ^) = ¾. я(Г)е5,(Г).
Для исследования этой задачи воспользуемся принципом максимума Пон-
трягина. Выпишем функцию Гамильтона — Понтрягина
Н(х, и, t, ф, а0) = -aof°(x, и, t) + (ф, и) (1)
и сопряженную систему
ф=~Нх = ^(х,и)1), Оо>0. (2)
Для решения (u(t), x(t)), t0 < t < T, рассматриваемой задачи должно
выполняться необходимое условие
H(x(t), u(t),t, V>(t), Oq)= sup Я(ж(*),и, *,</>(*), О, *o < * < T, (3)
где ф(Ь) — решение системы (2) при и = u(t), х = x(t, и), t0 < t < Т. Так
как в данном случае множество V совпадает со всем^пространством Еп, то
условие (3) может соблюдаться лишь в стационарной точке, т. е.
Я„ = -^/„°(я(*), «(*),*)+ ^(0=0, t0^t^T. Х4)
Отсюда ясно, что Oq^O, так как при ^ = 0 из (4) получаем ф(г) = 0, что
460
Гл. 6. ПРИНЦИП МАКСИМУМА ПОНТРЯГИНА
противоречит теоремам 2.1, 2,2. Следовательно, можно считать, что (¾ = 1.
Тогда соотношения (1)-(4) перепишутся соответственно в виде
H(x,u,t,^) = ~f°(x,u,t) + (^u), (5)
4>(t) = fZ(x(t), u(t),t), <„<*<з; (6)
H(x(t),u(t),t^(t))= sup H(x(t), и, t,^(t)), t0^t^T, (7)
</<(*) = №(*), u(t),t), t0<t<T (8)
Из уравнения (6) имеем: V(*)= 1/х°(а;('г)> '"С'7")) т)<1т + ф(^). С учетом (8)
отсюда получаем t0
f°(x(t),u(t),t)=\fO(x(T),u(T),T)dT + ^(t0), t0<t<T (9)
Уравнение (9) называется уравнением Эйлера в интегральной форме;
здесь u(t) = x(t), t0 < t < Т. Если (9) продифференцировать по *, то
получим уравнение Эйлера классического вариационного исчисления в
дифференциальной форме
^(/„°И*),«(*),*))-Л°И*)»«(*),*)=0, u(t) = x(t), to^t^T.
Далее, необходимым условием для достижения функцией H(x(t),u(t),
t,i/)(t)) максимума при u — u{t) является неположительность следующей
квадратичной формы (теорема 2.2.1):
Е tfuiui(z(iWi),*,V<(*)K,^o
при любых
£=(£l,£2,- ■-,£„), t0^t<T.
Отсюда, учитывая выражение (5) для Н, имеем
£/».„>И*).«(*).*)£«£,>о, $еЕ", to^t^T. (10)
«', 3 = 1
Условие (10) называется необходимым условием Лежандра. В частности,
при п — 1 отсюда имеем
fl{x{t\u{t),t)>0, t0<<<^
Теперь выведем необходимое условие Веиерштрасса. Для этого перепишем
условие (7) с учетом (5), (8) в следующем виде:
О < H(x(t), u(t), t, </>(*)) - H(x(t), v, t, </>(*)) =
= f°(x(t), v, t) - f°(x(t), u(t), t) - (v ~u(t), /°(s(i), u(i), t)). (11)
Это неравенство справедливо при любых v е Еп, t Е [t0, Т], если
(u(t), x(t)), t0< t < T — решение исходной задачи. Введем в рассмотрение
функцию
E(t, х, и, v) = f°(x, v,t)- f°(x, и, t)-(v- и, f°(x, и, *)), (12)
§ 5. ПРИНЦИП МАКСИМУМА И ВАРИАЦИОННОЕ ИСЧИСЛЕНИЕ 461
называемую функцией Вейерштрасса. Известно, что в классическом
вариационном исчислении необходимое условие Вейерштрасса
E(t,x(t),u(t),v)^0, io<t<^ veEn,
является следствием неравенства (11). Далее, из теорем 2.1, 2.3, 3.1 следует
непрерывность функции V(*) и ■"(*)= SUP H(x(t), и, t,ip(t)) на отрезке
[i0, Т]. Поэтому с учетом соотношений (5), (7), (8) имеем
[f2(x(t),u(t),t)]t=0,
[(u(t),f2(x(t),u(t),t))-f°(x(t),u(t),t)]t=0, t0<t<T; l ;
здесь принято обозначение: [г(*)]( =z(t +0)-^(4 —0). Поскольку
равенства (13) выполнены при всех t, t0 < t < Т, то они сохраняют силу, в
частности, и в те моменты t, когда функция x(t) может иметь излом, т. е.
производная x(t) терпит разрыв. Таким образом, если учесть связь u(t) = x(t),
условия (13) превращаются в известные из классического вариационного
исчисления условия Эрдмана — Вейерштрасса в точках излома кривой
x(t),t0^t^T.
Перейдем к рассмотрению условий на правом конце оптимальной кривой
x(t), t0 ¢. t < Т. Если конец х(Т) свободен, то в силу условия (2.26) тогда
ф(Т)=0. Отсюда с учетом выражения (8) имеем
ШТ),и(Т),Т)=0. (14)
Если правый конец х(Т) подвижен, точнее, х(Т) е Sy(T) = {у е Еп:
д3'(у, Т) = у:> -</>з.(Т) = 0, j = 1, ..., п}, то согласно условиям (2.30), (2.41)
существуют постоянные щ, ..., ап такие, что
^(Г) = -£а,0>,ИГ),Г) = -«п
3 = 1
Н(х(Т),и(Т),Т,г1)(Т))=±а.д{(х(Т),Т) =
3 = 1
= -± а].ф.(Т)=£ ф].(Т)ф.(Т) = (ф(Т),ф(Т)).
3=1 3=1
Так как Н(х, и, t, ф) = {ф, u)-f°(x, u,t)n^(t) выражается формулой (8),
то последнее равенство можно переписать так:
f°(x(T), и(Т), Т) + (/°ИП и(Т), Г), ф(Т) - и(Т)) = 0. (15)
Условия (14), (15) при учете связи x(t) = u(t) выражают собой известные в
классическом вариационном исчислении условия трансверсальности для
свободного и соответственно подвижного правого конца.
Таким образом, в случае V = Еп из принципа максимума следуют все
основные необходимые условия, известные в классическом вариационном
исчислении [101; 121; 217; 376; 406; 409; 781]. Однако, если V —замкнутое
множество и V фЕп, то соотношение (4), вообще говоря, не выполняется.
Более того, имеются примеры, когда и условие Вейерштрасса в этом случае
не имеет места ([587, с. 2841). Условие максимума (2.9), являясь
естественным обобщением условия Вейерштрасса из классического вариационного
исчисления, имеет то существенное преимущество перед условием
Вейерштрасса, что оно применимо для любого (в частности, и замкнутого)
множества Уейги для более общих задач. Заметим, что случай замкнутого
множества наиболее интересен в прикладных вопросах, поскольку значения
оптимальных управлений чаще всего лежат на границе V.
ГЛАВА 7
Динамическое программирование
В этой главе мы остановимся на методе динамического программирования, часто
используемом для численного решения задач оптимального управления при наличии фазовых
ограничений, конечномерных задач минимизации специального вида. С помощью динамического
программирования можно также наметить пути решения проблемы синтеза, сформулировать
достаточные условии оптимальности для задач оптимального управления и т. д. Изложение
метода динамического программирования начнем с простейшей схемы Беллмана для задачи
оптимального управления, затем опишем более совершенную и удобную для практики схему
Моисеева, а также обсудим некоторые другие аспекты этого метода [13; 16; 78-81; 92-94;
105-108; 140; 202; 253; 254; 332; 369; 417; 418; 442; 471; 493; 497-499; 517; 541; 614; 616;
620; 643; 674; 719; 724; 737; 744; 753; 754].
§ 1. Схема Беллмана. Проблема синтеза для дискретных систем
1. Рассмотрим следующую задачу оптимального управления:
J(t0, 3¾. «(•)) = Х/0(в(т), и(т), т)йт + ФИГ)) - inf, (1)
х(т) = /(х(т),и(т),т), t0^r^T, x(t0) = x0, (2)
x(t)eG(t), t0^r^T, (3)
и = и(т) 6 V(t), t0 < г < T; и(т) — кусочно-непрерывна; (4)
моменты времени t0, Т будем считать заданными (описание обозначений
см. в § 6.1).
Для приближенного решения этой задачи разобьем отрезок t0 < t % Т
на N частей точками £0 <*,<... < tN_ { < tN = Т, и, приняв эти точки в
качестве узловых, интеграл в (1) заменим квадратурной формулой
прямоугольников, уравнения (2) — разностными уравнениями с помощью явной
схемы Эйлера [59; 74; 89; 481; 635]. В результате придем к следующей
дискретной задаче оптимального управления
и*; Ыо)=£^Дя,-,ч) + Ф(%) -inf, (5)
t=0
xi + i=Fi(xi,ui), г=0,..., iV-1, х0 = х, (6)
xteGt1 i=0,...,N, -(7)
[4)0 = (^.^1.---.^-1):¾6^. i=0,...,N-l, (8)
где F°(x, и) = f°(x, и, tt)(tt+l - tj, F.(x, u) = x + f(x, u, t)(ti+l- *.), G{ =
= G(t.), V. = V(t(). Заметим, что задача (5)-(8) имеет также и
самостоятельный интерес и возникает при описании управляемых дискретных (им-
§ 1. СХЕМА БЕЛЛМАНА
463
пульсных) систем, в которые сигналы управления поступают в дискретные
моменты времени, фазовые координаты также меняются дискретно [106;
202; 602; 750; 751].
Если задать какое-либо дискретное управление [^0 = (^¾) ии ..,, uN_l) и
начальное условие 2¾ = х 6 G0, то система (6) однозначно определяет
соответствующую дискретную траекторию [ж.]0 = [xt(x; [и.]0)]0 = (xq, х{, ,.,, xN).
Зафиксируем некоторое х е G0 и через А0(а;) обозначим множество
управлений [щ]0 таких, что: 1) выполнены условия (8); 2) дискретная траектория
[Х{]0, соответствующая управлению [и{]0 и выбранному начальному
условию Xq = х, удовлетворяет ограничениям (7). Пару ([и{]0, [xt]0), состоящую
из управления и траектории, будем называть допустимой для задачи (5)-(8)
или, короче, допустимой парой, если эта пара удовлетворяет всем
условиям (6)-(8) или, иначе говоря, [щ]0 е Д0(аь)-
Множество Д0(яь) может быть пустым или непустым. Если До(^)=0
при всех х б G0, то условия (6)-(8) несовместны и функция (5) будет
определена на пустом множестве. Поэтому, чтобы задача (5)-(8) имела смысл,
естественно требовать существование хотя бы одной точки х 6 G0, для
которой Д0(ж)т^0. Обозначим Х0 = {х: хе G0, Д0(ж) ф05\. Тогда задача (5)-
(8) может быть сформулирована совсем кратко: минимизировать функцию
10(х, [uj0) при [uj]0 е А0(а;), х е Х0. Положим
Ц= taf inf I0(x, [«,]„).
16¾ К1ое Ао(х)
Допустимую пару ([""/L, [я,*]о) назовем решением задачи (5)-(8), если
10(х£, [«,*]«) = Ц, то [w,*]0 назовем оптимальным управлением, [х1}0 —
оптимальной траекторией задачи (5)-(8).
Как видим, задача (5)-(8) является уже известной нам задачей
минимизации функции п + Nr переменных x,u0,ul,...,uN_l и для ее решения в
принципе могут быть использованы методы, описанные в главах 1-3, 5.
Однако в практических задачах число п + Nr обычно бывает столь большим,
что непосредственное использование методов глав 1-3, 5, вообще говоря,
сильно осложняется: вызывает трудности также и то обстоятельство, что
множества \(х), Х0, на которых минимизируется функция 10(х, [и{]0),
заданы неявно. Для преодоления этих трудностей здесь часто пользуются
методом динамического программирования, с помощью которого задачу (5)-(8)
большого числа переменных удается свести к последовательности
конечного числа задач минимизации функций меньшего числа переменных.
2. Для изложения метода динамического программирования нам
понадобятся следующие вспомогательные задачи:
№ [«,]*) = 1¾¾. щ) + Ф(%) - inf, (9)
i = к
^ + 1 = ^(¾.¾). i = k,...,N-l, хк = х, (10)
чеа„ i = k,...,N, (11)
[ui]k=(uk,uk + l,...,uN_l):uieVt, г = к, ...,JV-1, (12)
где точка х и целое число к фиксированы, х Е Gk, 0 < fc < TV — 1. При
к =0 отсюда получим исходную задачу (5)-(8). Через &.к(х') обозначим
множество всех управлений [ut]k, удовлетворяющих условиям (12) и таких,
464
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
что соответствующая ему траектория [х{]к = (хк = х, xk + l,..., xN) из (10)
удовлетворяет фазовым ограничениям (11). Пару (["«A, (¾^) назовем
допустимой парой для задачи (9)-(12), если [ut]k е &.(х). Допустимую пару
([ui*]fcilX]fc) будем называть решением задачи (9)-(12), если 1к(х,[и?]и) =
= Ik(x)= inf 1к(х,[и{]к); [ui]k назовем оптимальным управлением, [xf]k —
оптимальной траекторией задачи (9)-(12).
Нетрудно видеть, что если Хоф0, то А.к(х)ф0 хотя бы для одного х Е Gk.
Введем функцию
Вк{х)= inf Ux,[Ui]k), к =0,..., N-I,
называемую функцией Беллмана задачи (5)-(8). Область определения
функции Вк(х) представляет собой множество Хк={хЕ Gk: Ак(х)ф0}.
Покажем, что функция Беллмана задачи (5)-(8) удовлетворяет некоторым
рекуррентным соотношениям, называемым уравнением Беллмана.
Теорема 1. Функция Беллмана задачи (5)-(8) необходимо
является решением уравнения
Bk(x)= inf [Fk°(x,u) + Bk + l(Fk(x, и))], хеХк, к =0,..., N-1, (Щ
ue.Dk(x)
где
Вм(х) = Ф(х), xEGN, (14)
Dk(x) —множество всех тех и eVk, для которых существует хотя
бы одно управление [и{]к Е Ак(х) с компонентой ик = и. Верно и
обратное: функция Вк(х), х е Хк, к = 0,..., N — 1, определяемая
условиями (13), (14), является функцией Беллмана задачи (5)-(8).
Доказательство проведем в предположении, что все упоминаемые в
теореме 1 нижние грани конечны.
Необходимость. Пусть Bk(x) = inf Ik(x, [и^А, х Е Хк, к = 0,...
Ак(х)
..., N — 1; Вд(х) =Ф(х), х 6 GN. Покажем, что эти функции удовлетворяют
уравнению (13). Из определения множеств &к(х), Dk(x) видно, что
множества Dk(x) и Дк(а;) оба пусты или непусты одновременно, и
поскольку xk + l =Рк(х,и), то для непустоты этих множеств необходимо и
достаточно, чтобы /S.k + l(Fk(x, и)) ф 0. Справедливость соотношения (13) при
к = N — 1 очевидным образом вытекает из условия BN(x) = Ф(х) и
представления IN_{(x, [ut]N_ [) = F$_ {(х, и)+Ф(Рм__{(х, и)), верного для любого
ueDN_l(x) = AN__l(x) = {u: ueVN_l, xN = FN_l(x,u)eGN, х eGn_{}.
Докажем (13) при к, 0^. к < N — 1. Для этого сначала убедимся в том, что
Вк(х) < inf \Fk°(x,u) + Bk + l(Fk(x,u))], хеХк. "(15)
u£Dt(x)
Возьмем произвольное и Е Dk(x) и с этим управлением «выйдем»
из точки х в момент к. В момент к + 1 придем в точку xk + l =
= Fk(x,u), для которой &к + 1(хк + 1) ф 0. По определению Bk + l(xk + l) =
= inf 7fc + 1(a;fc + 1, [u.]fc + 1) для любого е>0 найдется управление [u?]fc + 1e
eAjk + iK + i) такое, что Bk + l(xk + l)^ I„ + l{xk + l, KE]fc + 1)< Вк .,(a±+1) +
+ е. Поскольку [и{]к = (и, и£ + 1)..., «£_,) 6 Ак(х), то Вк(х) <: Ik(x, [ut]k) =
= Fk°(x, и) + Ik + l(xk + l, K]t + 1) < Fk°(x, и) + Bk + l(xk + l) + е = Fk°(x, и) +
+ Bk + l(Fk(x, и)) + е. В силу произвольности и е Dk(х) и величины е > 0
отсюда следует неравенство (15).
§ 1. СХЕМА БЕЛЛМАНА
465
Теперь покажем, что в (15) на самом деле знак неравенства можно
заменить знаком равенства. По определению inf Ik(x, \и{]к) = Вк(х) для каждого
е > 0 найдется такое управление [vf]k е Дк(я), что Вк(х) < Ik(x, [v?]k) <
< Вк{х) + е. Но [v{]k + l = (««+1I..., vff_l) е Ak + l(Fk(x, ««)), поэтому
Fk°(x, ««) + Вк + l(Fk(x, vl)) < Fk°(x, vl) + Ik + x{Fk{x, ««), Щк +,) =
= h(vAv!]k)^Bk(x)+s.
Так как г>5 6 DJx), то отсюда имеем: inf [Fk°(x, и) + Bk + l(Fk(x, и))] <
u6Dk(x)
< -Bfc(a;) + e, или в силу произвольности е > 0:
inf К°(*,«) +^ + 1(^(¾ «))]<^*И. *eXfc.
Отсюда и из (15) немедленно следует равенство (13).
Достаточность. Пусть функции Вк(х), х е Хк, к = О,..., N — 1,
определены из условий (13), (14). Спрашивается: какое отношение
имеют эти функции к задаче (5)-(8)? Покажем, что при каждом х е Хк
величина Вк(х) равна нижней грани функции (9) при условиях (10)-(12V
Отметим, что условия (13), (14) однозначно определяют функции Вк(х),
х &Хк, к = 0, ...,7V. Это легко доказывается с помощью индукции
последовательным перебором в (13), (14) номеров к =N, TV —1, .. .,0 с учетом того,
что функции Ф(х), Fk°(x, и), Fk(x, и) однозначны и нижняя грань функций
определяется также однозначно. С другой стороны, как было установлено
выше, функции inf Ik(x, [ut]k), х еХк, также являются решением уравне-
ния (13) при условии (1.4). Из единственности решения системы (13), (14)
тогда следует, чтоВк(х)= inf Ik(x, [и{]к), хеХк, к =0, ..., N-1. Теорема 1
доказана. □ Ак(х)
3. Пользуясь условиями (13), (14), можно последовательно определить
функции Вк(х) и их области определения Хк, к = N, N — 1,..., 1,0. А
именно Вм(х) = Ф(х), х е GN = XN— известны. Если известны Вк + 1(х) и Хк + 1,
к ^ N — 1, то для определения Вк(х) нужно решить задачу минимизации
функции у?(х, u)^Fk°(x, u) + Bk + l(Fk(x, и)) переменных u = (ul,..., uT) на
известном множестве Dk(x) = {u: uEVk, Fk(x, u)eXk + l}. Здесь могут быть
использованы методы глав 1-3, 5. Очевидно, функция Вк(х) определена в
точке х тогда и только тогда, когда Dk(x) ф 0. Таким образом, при
определении значений функции Вк(х) одновременно находится и область ее
определения Хк ={х: хе Gk, Dk(x)^0} ={х: хе Gk, Ак(х)ф0}. Так как
Ак(х) ф 0 хотя бы при одном х е Gk, то Хк ф 0, к = N, N — 1, ..., 1^ 0.
Предположим, что нам удалось найти функции Вк(х) из условий (13),
(14) и, кроме того, пусть также известны функции uk(x) 6 Dk{x), х 6 Хк,
к =0,..., N— 1, на которых достигается нижняя грань в правой части (13).
Тогда, оказывается, решения задач (5)-(8) и (9)-(12) выписываются совсем
просто. А именно, оптимальное управление [и*]0 и соответствующая
траектория [х*]0 для задачи (5)-(8) определяются следующим образом: сначала
из условия
inf В0(х) = В0(х$) (16)
х<ЕХ0
находят а£ &Х0, затем последовательно полагают
«о* = «оЮ, ajf = i?oKi«o)i 14 = 11,(^),
x^ = F{(x*,u*), ..., x^ = FN_l(x^_l,u^f_l).
466
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Оптимальное управление [и-]к и траектория [xi]k для задачи (9)-(12)
определяются аналогично:
Хк = Х, uk=uk\Xk)t /чо\
Хк+1= ^к\Хк1 Uk)i • • •' XN = ^N- l\XN- D uN-l)'
Для доказательства этих утверждений введем вспомогательные функции:
11.(х,и) = В{ + 1(Ъ(х,и))-В.(х) + Р°(х,и), i=0,...,N-l. (19)
Очевидно, уравнения Беллмана (13) тогда можно переписать в
эквивалентном виде:
inf Rk(x,u) = Rk(x,uk(x)) = 0, i =0,..., N-I. (20)
Кроме того, с помощью функций Rt(x, и) значение функции (9) на любом
управлении [и{]к е Ак(ж) и х еХк можно выразить формулой
4(^Ки=Е%,ч) + ^(^) (21)
при всех к =0, ,,,, N — 1, В самом деле, учитывая равенство BN(x) = Ф(х),
из (10), (19) имеем еЧ(*п *0= I)Wi(^) " ДЫ +^¾. «*)] =
г ~ к i — к
JV-1
= ВмЫ~Вк(х)+ Е Fi°(xn ^) = 4(^ К]*)--В*(я:). чт0 равносильно (21).
Теорема 2. Пусть найдены функции Вк(х) из (13), (14) и га
области определения Хк, а также функции и = ик(х) хеХк, к =0,..., N — 1,
на которых достигается нижняя грань в уравнении (13) или (20), и
пусть х£ определена условием (16). Тогда оптимальное управление [пг*]0
и траектория [х*]0 для задачи (5)-(8) определяются
соотношениями (16),(17).
Доказательство, Из определения и(х), [и$]0, [а£]0 и
эквивалентности записей уравнения Беллмана (1.3) и (20) имеем
Ri(x:,vi) = Rt(x:,ui(x:))= inf Д. (я?, и) = 0, .=0,....,^-1. (22)
Возьмем произвольные х е Х0, управление [и{]0 ё А0(ж) с соответствующей
траекторией [х{]0 из (6). Так как и. е Д(^), то из уравнения (20) и
определения ut(x) следует
Д^.гО^ inf ^.(0=,.,^) = ^(^,^(0:.))=0, г =0,..., N - 1. (23)
иеВДх,)
С помощью формулы (21) при к =0 с учетом соотношений (16), (22), (23)
N- 1
получаем 10(х, [и{]0) - 70(^*, [<]„) = £ [-^,-(¾. ^) - Ri(xh О] + ^ofa) -
- -В0(а^) ^ 0 для любых х е Х0 и [ut]0 е А0(х), что и требовалось. П
Теорема 3. Пусть известны Вк(х), х е Хк из (13), (14), а также
функции ик(х), на которых достигается нижняя грань в уравнении (13)
(или (20)). Тогда оптимальное управление [и?]к и траектория [х?]к для
задачи (9)-(12) определяются формулами (18).
§ 1. СХЕМА БЕЛЛМАНА
467
Доказательство. Возьмем произвольное управление [щ]к е AJx)
и соответствующую траекторию [х{]к из (10). Очевидно, соотношения (22),
(23) остаются справедливыми и здесь при всех г = к,..., N — 1. Отсюда с
помощью (21) получим
1Лъ KL) - 1Лъ KL) = £ [^-(¾. ч) - ^(я?,«?)] £ о.
i ~ к
что и требовалось. □
4, В теории оптимального управления и ее приложениях важное место
занимает так называемая проблема синтеза, заключающаяся в построении
функции и = ик(х), выражающей собой оптимальное управление при
условии, что в момент к объект находится в точке х фазового пространства.
Такая функция ик(х) называется синтезирующей.
Теорема 3 показывает, что решение уравнения Беллмана (13)
равносильно решению проблемы синтеза для задачи (5)-(8). А именно, функция
ик(х), на которой достигается нижняя грань в (13), является
синтезирующей: если в момент к объект находится в точке х 6 Хк,- то дальнейшее
оптимальное движение объекта определяется условиями: xi + l = F.(x{, и{(х{)),
г = к,..., N — 1, хк = х (если х ф Хк, то Ак(х) = 0— движение с
соблюдением условий (10)-(12) невозможно). Достаточные условия существования
функции Беллмана и синтезирующей функции для задачи (5)-(8) даются в
следующей теореме.
Теорема 4. Пусть множества Gk, к = 0,. <., N, замкнуты,
множества Vk, к =0,..., N — 1, замкнуты и ограничены, функция Fk°(x, и)
полунепрерывна снизу, а функция Fk(x, и) непрерывна по совокупности
аргументов (х, и) при х е Gk, и е Vk, к = 0,..., N - 1, Ф(х)
полунепрерывна снизу на множестве GN. Тогда: 1) множества Хк, к =0, ...,N,
замкнуты, множества Dk(x), k =0,..., N - I, замкнуты и ограничены
равномерно по хе Хк; 2) нижняя грань в правой части (13) достигается
хотя бы при одном и = ик(х) е Dk(x); 3) функция Вк(х) полунепрерывна
снизу на Хк, к = 0,..., N.
Доказательство. По условию GN = XN замкнуто, Ф(х) = BN(x)
полунепрерывна снизу на XN. Сделаем индуктивное предположение: пусть
Хк + 1 замкнуто, Вк + 1(х) полунепрерывна снизу на Хк + 1 при некотором к,
0 < к < N — 1. Докажем, что тогда Хк замкнуто и на Хк справедливы все
утверждения теоремы. Так как Dk(x) = {и: ueVk, Fk(x, и) е Xk + i} = ^4
и Vk ограничено, то Dk(x) ограничено равномерно по х е Хк. докажем
замкнутость Dk(x) при любом фиксированном хеХк. Пусть vm е Dk(x),
т= 1,2..., vm->v, при т-^оо. Это значит, что vm е Vk, Fk(x, vm)eXk + l,
т = 1, 2,. .. Из замкнутости Vk, Хк + 1 и непрерывности Fk(x, v) сразу
имеем: veVk, lim Fk(x,Vm) = Fk(x,v)eXk + l, т. е. v Е Dk(x). Замкнутость
т —* оо
DJx) доказана.
Покажем замкнутость Хк ={х: xeGk, Dk(x) ф 0}. Пусть ут е Хк, т =
= 1,2,..., ут—>У при т —> оо. Из замкнутости Gk следует у б Gk.
Если мы еще покажем, что Dk(y)^0, то это будет означать, что у б Хк,
и замкнутость Хк будет доказана. Так как Dk(ym)^0, то существует
такое vm е Vk, что Fk(ym, vm)eXk + l, т = 1, 2,... В силу компактности
Vm из последовательности {vm} можно выбрать подпоследовательность
{vm } —> v е Vk при р —> оо. Поскольку Хк + 1 замкнуто, Fk(x, и)
непрерывна,'то lim Fk(ym ,vm) = Fk(y, v) eXk + l, т. e. «6 Dk(y). Таким образом,
468
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Далее, функция ip(x, u) = Fk°(x, u)+Bk + l(Fk(x, и)) полунепрерывна снизу
по (х, и) при х б Хк, и 6 Dk(x) — это следует из непрерывности Fk(x, и) и
полунепрерывности снизу Fk°(x, и), Вк + 1(х). Поскольку Dk(x) — замкнутое
ограниченное множество, то в сил_у теоремы 2,1,1 <р(х, и) при каждом
фиксированном х ЕХк достигает своей нижней грани на Dk(x) хотя бы в одной
точке и = ик(х) е Lh(x). Таким образом, Вк(х)= inf ip(x,u) = ip(x,uk(x)),
в силу уравнения Беллмана (13). «ев,»
Остается еще доказать полунепрерывность снизу Вк(х) на Хк. Пусть
х,УтеХк, ут->х при т -» оо, Вк(ут) = ip(ym, ик(ут)). Так как ик(ут) е
6 Dk(ym) 6 Vk, то в силу компактности Vk последовательность \ик(ут), т =
= 1,2,...} имеет хотя бы одну предельную точку v е Vk. Можем
считать, что сама последовательность {ик(ут)} —>v при т—> оо. Поскольку
Fk(x,u) непрерывна, Хк + 1 замкнуто, кроме того, Fk(ym,vk(ym)) £ Хк + 1, то
lim Fk(ym, vk(yj) = Fk(y, v) e Xk + l. Это значит, что v e Dk(x). Тогда
m—*oo
lnLBk(ym) = Jim_ ip(ym, uk(yj) > ip(x, v) ^ inf ip(x, u) = Bk(x).
m —»oo m—too u£Dk(x)
Полунепрерывность Вк(х) на Хк доказана, что и требовалось. □
5. Нетрудно привести примеры задач типа (5)-(8), когда нижняя грань
в (13) или (16) не достигается (см. ниже упражнение 2). В таких задачах,
конечно, приходится пользоваться величинами, лишь приближенно
реализующими нижнюю грань в (13), (16). Но даже в том случае, когда нижняя
грань в (13), (16) достигается, получить точные выражения для функций
Вк(х), ик(х) и точки х£ из (13), (16) часто бывает затруднительно. Поэтому
на практике часто пользуются соотношениями (16), (17) для приближенных
Вк(х), ик(х) и вместо точных управлений [ut]0 и траектории [ж{*]0 получают
какие-то их приближения. Возникает вопрос, насколько отличается
полученное таким образом приближенное решение задачи (5)-(8) от ее точного
решения? Приводимая ниже оценка погрешности дает некоторый ответ на
этот вопрос.
Пусть К{(х) — приближенное значение функции Беллмана Bt(x), г =
= 0,. .., N. По аналогии с (19) введем функцию
SM^^K^^F.^uV-K^ + F^u), г =0,..., N-l, (24)
и, кроме того, положим
sN(x) = Ф(х)-К„(х), xeGN. (25)
Возьмем произвольную допустимую пару [щ]0 = (щ, ии . .., uN_{), [ж{]0 =
= (^,^,...,^-1) задачи (5)-(8). Тогда а^еХ0, К]0еД0(^), u.eD^x.),
i —0, ..., N — 1, Учитывая условие (6), из (24) имеем
S^x., щ) = Ki + l(x{ + l) - К((х,) + Ffte, щ), i=0,...,N-l.
Суммируя эти равенства по г от 0 до N — 1, с помощью (25) получим
формулу
JV-1
^(^KloHE ^(¾. Ui) + SN(XN) + К0(Хо)- (26)
8=0
Если К{(х) = В.(х), то sN(x) = 0, и формула (26) превратится в знакомую
нам формулу (21) при к =0.
§ 1. СХЕМА БЕЛЛМАНА
469
Предположим, что каким-либо образом нам удалось найти некоторое
управление [гГ,]0 и соответствующую ему траекторию [х{]0,
удовлетворяющую условиям (6)-(8), т. е. х0 е Х0, [й{]0 е Д0(зТ0), й, е 1?,(зТ4), г = 0,...
..., N — 1. Согласно (26) тогда
JV-1
7о(% Ыо) = Е 5,(^,, й,) + sN(xN) + К0(х0).
1 = 0
Отсюда и из (26) имеем
-^о(% Ы„) + ^(¾. Ы0) =
if-i _ _ (27)
= Е [-3(3:,, «,) + 5,(3:,, и.)] - sN(xN) + sN(xN) - К0(х0) + К0(^)
для любых 3¾ е Х0, [и{]0 е А0(а^). Учитывая, что х0, 3¾ б Х0, [и,]0 б Дп(жл),
[u,]0 е Д0(аь), (xv и.) е Х,хД.(ж,), перейдем к нижней грани по (¾. [uj0)
сначала в правой части (27), а затем в левой части (27). Тогда получим
неравенства
N- 1 г
0 < 10(х0, Ы„) - # < Е ЗД, «4) - inf inf 5,(¾ «)
,_qL x 6Л, u€B,.(x)
+
+ sn(xn) - inf Мж) + Яо(жо) - i"f -^0(2=). (28)
представляющие собой оценку погрешности, которая будет допущена, если
[гГЛ0, [х.] будут взяты в качестве приближенного решения задачи (5)-(8).
Если К{ (х) = В. (х), i = 0, ...,7V, то 5,.(ж, и) = Л,(ж, u), 3^(3:) = 0.
Кроме того, из (20) следует, что inf R{(x, и) = 0 для всех х S Х{, так что
и eX?t.(i)
inf inf Ri(x, u) = 0. Поэтому при K{(x) = В((х) из (28) получим
i e.Xi и бВ((а;)
О < 70(z0, [й.]0) - 70* < е' Л,(зТ„ й,') + В0(х0) - inf ДДя). (29)
i=0 ло
Из оценки (29) следует, что если определить йЛх) е Д;(ж), х0 е Х0 так,
чтобы RAx, йАх)) было поближе к inf Rt{x, и) = 0, хе Xv а В0(х0)—
и efl.(i)
поближе к ini В0(х), и затем строить управление [гГ,] и траекторию [х.]
следующим образом:
й0 = гГ0(ж0), xl=F0(xotu0)t й1=й1(х1), ..., xN = FN_l(xN_l,uN_l),
то и величина 10(х0, [гГ,]0) - i"0* будет небольшой.
Заметим, что поскольку на практике конструктивное описание множеств
X., Dt(x) часто отсутствует, то в правой части оценки (28) вместо Х{,
D.(x) часто берут G{ и Vt соответственно — такая замена, очевидно,
может привести лишь к увеличению правой части (28). В результате получим
следующую апостериорную оценку погрешности
N- 1
0 < 10(х0, Ыо) - Ц < £ ЗД, и,) - inf inf S(x, и)
j-0 L I €&j u€ v;.(i)
+
+ sN(xN) - inf sN(x) + K0(x0) - inf K0(x). (30)
Конечно, при пользовании оценкой (30) надо помнить, что если правые
части оценок (28), (30) отличаются намного, то оценка (30) может оказаться
слишком грубой.
470
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
6. Оценка (28) полезна также и тем, что она указывает пути получения
достаточных условий оптимальности для задачи (5)-(8).
Теорема 5. Для того чтобы управление [гГг]0 и траектория [х{]0,
удовлетворяющие условиям (6)-(8), были решением задачи (5)-(8),
достаточно, чтобы существовала функция Kt(x), г = 0,..., N такая, что
5,(5Г„й,)= Inf inff 5,(x,u) = 5lmln, .=0,..,JV-1, (31)
sN(xN) = inlsN(x) = sNmlll, К0(х0) = ШК0(х) = К0тЫ, (32)
где функции 5,(а;, и), sN(x) определяются формулами (24), (25).
Доказательство следует из того, что при выполнении условий (31), (32)
правая часть оценки (28) обращается в нуль, и 10(х0, [й.]0) = Ц. П
С помощью оценки (28) нетрудно также получить условия, достаточные
для того, чтобы та или иная последовательность допустимых пар
управлений и траекторий была минимизирующей для задачи (5)-(8).
Теорема 6. Пусть последовательность управлений WimL и
траекторий [xim\Q, т= 1, 2,..., удовлетворяет условиям (6)-(8). Для того
чтобы
Ш 10{Чт,Ыо) = Ц, (33)
т —>оо
достаточно существования функции К{(х), г =0,.. , N, такой, что
Нт S,(z,m,u,J = 5,min, .=0,1,..,JV-1, (34)
т—* оо
!im sN(xNm) = sNmin, lim K0(xqJ = K0min, (35)
m-too m —* оо*
где 5,min, sNmin, K0min определены 8(31),(32). _
Доказательство. В оценку (28) вместо [ц.]0, [х.]0 поставим
соответственно [w™]o. [лт]о и перейдем к пределу при т—> оо. С учетом
условий (34), (35) получим равенство (33). □
Утверждения, аналогичные теоремам 5, 6, доказаны в [253; 417; 418] для
более общих задач, чем задача (5)-(8).
Всякую функцию Кг(х), г =0, .. ., N, удовлетворяющую условиям
теоремы 5 (теоремы 6), назовем функцией Кротова задачи (5)-(8),
соответствующей допустимой паре [и,]р, [ж,]0 [или последовательности допустимых
паР KJo- [xiJo> m = l,2, ...J. ,
Заметим, что если существует хотя бы одна функция Кротова К-(х), г =
=0,. .., N, то функция К{(х)+а(, г =0, ...,7V при любых а{ также является
функцией Кротова. Поэтому без ограничения общности в теоремах 5, 6
можно принять 5,ш1п = 0, г =0,..., N — 1, sN ■= 0, ибо в противном случае
функцию К{(х) заменим новой функцией К{(х) + а., где
аг = 5;т!п + 5, + lmin + . .. + SN_ lmin, г = 1,..., N — 1, oiN = sNm-m.
Таким образом, функция Кротова для допустимой пары ([гГ,]0, [х(]Л или
последовательности ([wim]0, [ж8-т]0), т = 1, 2,..., согласно теоремам 5, 6
удовлетворяет условиям
St{x, и) = К^Шх, и)) - Kt(x) + F,°(x, и) > 0,
ueD((x), хеХ{, i=0,...,N-l, (36)
з„(х) = -Км(х) + Ф(х)>0, xeXN = GN, K0(x)^K0mln, хеХ0, (37)
§ 1. СХЕМА БЕЛЛМАНА
471
причем неравенства (36), (37) должны обратиться в равенства при и = ut,
х = xi или при и = uim, х = х■■ в пределе при т —> оо, г = 0,..., N.
Сравнение соотношений (36), (37) с (13), (14), (16), (20) показывает, что
функция Беллмана всегда является функцией Кротова, а обратное, вообще
говоря, неверно. Заметим также, что с помощью функции Кротова
удается установить оптимальность допустимых пар, не решая проблемы синтеза,
так как согласно условиям (36), (37) функция Кг(х) выбираются с учетом
индивидуальных свойств конкретной допустимой пары управления и
траектории (или последовательности пар), подозрительных на оптимальность.
7. Остановимся на одном специальном классе задач минимизации
функций большого числа переменных, которые с помощью метода динамического
программирования могут быть сведены к последовательности задач
минимизации функций меньшего числа переменных. А именно, пусть требуется
минимизировать функцию
'о(Мо) = 4>К. «1, • • •, «„_,) = JE Л0Ю (38)
при условиях
u{EV{, i =0,..., N- 1, (39)
Ё я1Ы< ь', з = 1,• • •,р, Ё я1Ы = К j = P+\,...,n, (40)
8=0 i=0
где V{ —заданные множества из Er; f°(u), gf(u), и е V{ — заданные
функции, У — заданные числа.
Задачу (38)-(40), оказывается, нетрудно записать в виде задачи (5)-(8).
В самом деле, введем переменные х{, г =0,..., N, как решение системы
з* + 1 = я* + &К)| fc =0,...,^-1, ^ = 0, (41)
где gk{u) = (gyk(u),..., %"(«)), xk = (xlk,..., х£), k =0, ..., TV. Так как из (41)
JV-1
следует, что % = Е 9k(uk)' т0 ясно, что ограничения (40) равносильны
условию *=о
xNeGN = {x: хеЕп, х'^Ы, з = \,...,р; x>' = V, э=р+ 1,.. .,п}. (42)
Таким образом, задача (38)-(40) эквивалентна задаче минимизации
функции (38) при условиях (39), (41), (42) и является частным случаем
задачи (5)-(8) при F°(x,u) = f?(u), Fl(xtu)=x + gt(u), ¢(¢) = 0, G{ = En,
i = 1,..., TV — 1; G0 = {0}, GN определено соотношением (42). Это значит,
что для исследования задачи (38)-(40) может быть применен метод
динамического программирования, изложенный выше. Пользуясь введенными
ранее обозначениями, можем переписать уравнение Беллмана (13), (14)
применительно к задаче (38)-(40):
Bk(x)= Ini №u) + Bk+l(x + gt(u))],
u£Dk{x) (43)
хеХк, к =0,..., N-I, BN(x) = 0.
В том случае, когда ограничения (40) и, следовательно, (42) отсутствуют,
то G^ = E" ив (43) можно положить Dk(x) = Vk, к =0,..., N - 1.
Уравнениями (43) можно пользоваться для решения задачи (38)-(40), как это
показано выше в п. 3. Предлагаем читателю в качестве упражнения
переформулировать теоремы 1-6 применительно к задаче (38)-(40).
472
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Подчеркнем, что в задаче (38)-(40) функция и ограничения имеют весьма
специальный вид—это обстоятельство было весьма существенно для
применения метода динамического программирования. Этот метод применим и
к несколько более общим, чем (38)-(40), задачам — об этом см. подробнее,
например, в [202].
8. Изложенный выше метод динамического программирования является
достаточно эффективным средством решения задач вида (5)-(8) или (38)-
(40) — с его помощью исходная задача сводится к последовательности
вспомогательных и, вообще говоря, более простых задач минимизации
функций меньшего числа переменных для определения Вк(х), ик(х) (см.
условия (13), (14) или (43)). Если эти вспомогательные задачи решены с
достаточно хорошей точностью, то тем самым и в исходной задаче
глобальный минимум функции будет найден с высокой точностью. Далее, метод
динамического программирования позволяет решить важную в
приложениях проблему синтеза. Как показано в п. 6, с помощью этого метода и его
обобщений могут быть получены достаточные условия оптимальности для
дискретных управляемых систем. Кроме того, этот метод дает значительный
выигрыш в объеме вычислений по сравнению с простым перебором
всевозможных допустимых управлений и траекторий, поскольку при определении
Вк(х), ик(х) рассматриваются лишь такие управления, которые переводят
точку хЕ Gk в точку xk + l = F(x,u)eGk + l, а дальнейшее движение из точки
£jt + i осуществляется по оптимальной траектории, при этом неоптимальные
траектории вовсе не рассматриваются. Указанные достоинства метода,
динамического программирования, простота схемы, применимость к задачам
оптимального управления с фазовыми ограничениями делают этот метод
весьма привлекательным, и его широко используют при решении задач
типа (5)-(8) или (38)-(40). Что касается задачи (1)-(4), с которой мы начали
изложение, то можно показать, что при некоторых ограничениях решение
дискретной задачи (5)-(8) при lim max (ti + l — £г) = 0 будет прибли-
N —> оо 0 ^ г ^ iV — 1
жаться в некотором смысле к решению задачи (1)-(4).
Заметим, что поскольку аналитическое выражение для Вк(х), ик(х) при
всех х 6 Хк в общем случае найти не удается, то на практике
приходится ограничиваться приближенным вычислением Вк(х), ик(х) в некоторых
заранее выбранных узловых точках множества Хк. Однако согласно (13)
при вычислении Вк(х) нужно знать значение Bk + l(Fk(x,u)) при
некоторых и, и здесь вполне возможны случаи, когда точка xk + l = Fk(x, и) не
будет принадлежать заранее выбранному множеству узловых точек из Хк + 1
и нужное значение Вк + 1(хк + 1) еще не будет вычислено. Если же мы
захотим вычислить недостающее значение Вк + 1(хк + 1), то здесь могут
понадобиться значения ранее вычисленных функций Bk+2(x),..., BN(x) в новых
дополнительных точках, а для этого в свою очередь придется еще более
расширить множества узловых точек в Хк+2, Хк+2,... и т. д. На
практике в таких случаях недостающее значение Вк + 1(х) получают с помощью
интерполяции по значениям Вк + 1(х) в близлежащих узловых точках, что,
вообще говоря, снижает точность. Заметим также, что принятый выше
способ аппроксимации задачи (1)-(4) с помощью разностной задачи (5)-(8)
довольно груб, поскольку опирается на простейший метод ломаных Эйлера
для интегрирования дифференциальных уравнений и квадратурную
формулу прямоугольников. В следующем параграфе будет описана схема
Моисеева, которая не требует интерполяции и оставляет достаточную свободу при
выборе способа аппроксимации задачи (1)-(4).
§ 1. СХЕМА БЕЛЛМАНА
473
В заключение мы отметим, что метод динамического программирования
относится к классу методов декомпозиции — так называются методы
минимизации, которые позволяют задачи большой размерности свести к
задачам меньшей размерности; о методах декомпозиции см., например, в [222;
470; 746; 747; 759].
Упражнения
1. Найти функцию Беллмана для задачи
JV- 1
'о(Ыо) = £ l{<^,^) + b((^)] + {c,xN)-*M,
г=0
xi + l=Aixi + Ci(ui)> ui^Vv i =0,..., N-I, x0 = a,
где Ai —матрица порядка n x n; C{(u) = (C}(u),..., G"(u)), C/, ^-(u) — функции
переменной и€ V; С£г, ai,c,a—n-мерные векторы, i = 0,..., N — 1. Указание: функцию
Беллмана искать в виде Вк(х) — (фк,х), к = 0,..., N.
2. Найти функцию Беллмана для задачи: 10(и) — $(xi) ~* 'п^ xl=x0 + u, xi е Git г — 0,1;
и£ V0, где Ф(ж) = (1+е-1/1)-1 при х ф 0, Ф(0)=1/2; G0 = {xeEl: \х\ < 1/2}, G{ = Е1;
V0 = {и е Е1: |«| < 1}. Показать, что Х0 = G0, Х{ = Е1, и убедиться, что для этой задачи
нижняя грань в (13), (16) не достигается.
3. Пусть функция Вк(х), х е Хк, к = 0,..., N, удовлетворяет условиям (13), (14), а
функция икт(х) е Dk(x) и точки хот е Х0, го=1,2,..., таковы, что lim R{(x, uim(x)) = 0,
lim В0(х0т) = Ы B0(x). Пусть управление [uim]0 и траектория [xim]Q построены по
правилу: «От = «ОтКт)' ХЫ = ^оОЧОт' Ч)т)> и\т = и1т(х1т)> • • •> xNm = FN- l(xN - 1 т> UN - 1, т)-
Тогда последовательность пар (х0т, [щт]0) — минимизирующая для задачи (5)-(8), т. е.
J™o4(¾. Kmlo) = 7о■ Доказать.
4. Доказать, что последовательность функций uim(x), i = 0,..., N -1, m = 1, 2,..., из
упражнения 3 дает приближенное решение проблемы синтеза для задачи (5)-(8), т. е.
если в момент к система находится в точке it = is Хк, то движение по закону xj+l —
= Fi(xim> uim(xim))> i = к, • ■ ■, N-\; хкт = х, го=1, 2,..., при больших го доставляет функции
Ik(x, [ujj.) значения, близкие к 1к.
5. Для задачи (9)-(12) получить оценку погрешности, аналогичную оценке (28).
6. Вывести уравнения Беллмана и доказать теоремы, аналогичные теоремам 1 -4 для задачи:
ШК1о)= Е F°(xi> ui) + %Ы + ф1О**)-* inf>
i=0
xi + i = Fi(xi>ui)' * =0 JV— 1, хгеСг, и{.еУ0 i = 0,..., JV,
где x, = (*/,.. , *,»), F. = (F/,..., FP), u{ = (u/ <); множества (¾ С В», V, с 25', i =
= 0,..., N, заданы; функции F? (ж, и) определены при x e G{, и e Vi, i = 0,..., N, j = 0,..., n;
функции Ф0(а;), Ф^х) определены при х е G0, х е GN соответственно; г —дискретное время;
момент iV считается заданным, . ...
7. Обобщить оценку (28) и теоремы 5,6 для задачи из упражнения 6.
8. Пусть в задаче (5)-(8) Ff(x, u) = 0, i = 0,..'., N - 1. Покажем, что тогда Вк(х) = Ф(х)
для всех к = 0 N, причем функции Вк(х) при различных к отличаются друг от друга
областями своего определения Хк.
9. Применить метод динамического программирования к задаче минимизации функции
JV — 1
10(щ,ии...,им)= £ /jK>ui + l) + /jv(uJv)
i=0
474
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
при условиях uf е Vt, i = 0,..., N. Указание: ввести функцию
£*(«) = lnf( Ё /(K.«i + i) + /w(«w)).
где нижняя грань берется по всем наборам (ик = и, ик + lt..., uN), и{ е Vit г = к, ■ ■., JV, и
показать, что Вк(и) = inf [fk(u, v)+ Вк + ,(«)], fc =0,..., JV- 1; BN(u) = fN(u).
§ 2. Схема Моисеева
1. Будем рассматривать задачу (1.1)-(1.4). Для приближенного решения
этой задачи, как и раньше, разобьем отрезок ^ ^ t ^ Г на 7V частей точками
*0 <*!<...< tw_! < tN + Т. На множестве G{ = G(t;) возьмем некоторую
дискретную сетку точек 0¾. 6 G{; следуя [497; 498] множество всех точек
выбранной сетки, будем называть шкалой состояний и обозначать через
Ни г = 0,..., N. Шкалы состояний Н( и Я{ + 1 будем называть соседними.
На двух соседних шкалах Н{ и Яг +, возьмем точки х е Нг и у е Н( + 1 и
рассмотрим следующую вспомогательную задачу:
4(я, t/, «(•)) = $7°И*). «(*), *)Л - Inf, (1)
*(*) = /И*). «(*).*). *4<*<*i + i; я(*,)=В, Я!(*, + ,) = У, (2)
x(t)6G(t), *4< *<*, + „ (3)
и = и(-)кусочно-непрерывна и u(t) б У(*)при *е<*^*4 + 1. (4)
Следуя [497; 498], задачу (1)-(4) будем называть элементарной
операцией, соединяющей точки х и у. Через А{(х, у) обозначим
множество всех управлений и = и(-) из (4), для которых соответствующая
траектория х(-) удовлетворяет всем условиям (2), (3). Положим Mt(x, у) =
= inf Ji(x, у, и); если Дг(ж, у) = 0, то Мдж, у) = +оо по определению.
иеД,(:с,у)
Пусть все точки всех соседних шкал попарно соединены
элементарными операциями. Если inf JAx, у, и) достигается на некотором управлении
и{(-) 6 А{(х, у) и соответствующей траектории ^(-), то величина
Т:МЛх^х{ + 1^1) + Ф(х^) (5)
i = 0
выражает собой значение исходной функции (1.1) на управлении и —
= u(t) = u,.(t), ti < t < ti + 1, г =0,..., N— 1, и соответствующей траектории
x(t, u) = x{lt), t{ < £ < ti + 1, г =0,..., TV—1; a;(t0) = ^. при соблюдении всех
ограничений (1.2)-(1.4). Поэтому исходную задачу (1.1)-(1.4) естественно
аппроксимировать задачей отыскания минимума суммы (о) по
всевозможным наборам точек (а^, ж1у,..., xNj ), 2¾. е Я., г = 0,..., N.
Такая аппроксимация задачи (1.1)-(1.4) имеет смысл, конечно, и в том
случае, когда inf JAx, у, и) не достигается при каких-либо х, у, г. Очевид-
ДД*.у)
но, приведенная аппроксимация задачи (1.1)-(1.4) более гибкая и лучше
приспособлена для приближенного решения этой задачи, чем схема из § 1,
ибо здесь представляется свобода в выборе способа разрешения
элементарной операции (1)-(4) и, кроме того, рассмотрение лишь таких траекторий,
§ 2. СХЕМА МОИСЕЕВА
475
концы которых лежат в известных точках соседних шкал, избавляет нас от
необходимости интерполирования. На способах разрешения элементарной
операции мы остановимся ниже.
Описанная аппроксимация задачи (1.1)-(1.4) имеет простой
геометрический смысл. А именно, траекторию xt(t) из (2), на которой достигается
inf JAx, у, и) назовем дугой, соединяющей точки х, у, а числа Mt(x, у) —
длиной этой дуги, г=0, ..., N—1. Дуги, последовательно соединяющие
пары точек xi;j, xi+lj соседних шкал Н{, Hi+l, г=0,..., 7V-1, назовем путем,
соединяющим шкалы Я0 и HN и проходящим через точки Xq, ,xl:j,.. .,xN]- , и
в качестве его длины примем величину (5). Тогда наша задача сведется к
отысканию кратчайшего пути, соединяющего шкалы Я0 и HN.
2. Обозначим
Cfc(s) = inf{ £ М;(х{.,Х; + 1,Ъ + 1) + Ф(хтк)\,
где нижняя грань берется по всем наборам точек (ж^. = х, xk + l, jk+l, ...
..., xNj ), х^ Е Hit i = k,...,N. Иначе говоря, Ск(х) выражает собой
кратчайшее расстояние между фиксированной точкой х е Нк и шкалой HN.
Покажем, что функции Ск(х) удовлетворяют следующим рекуррентным
соотношениям:
Ск(х)= inf {Мк(x,y) + Ck + l(y)}, k=0,...,N-l; СК(х) = Ф(х), (6)
аналогичным условиям (1.13), (1.14). Справедливость (6) при k — N-l
следует из определения CN_y(x), CN(x). Докажем (6) при других к, 0<
< к < N - 1. Для этого сначала убедимся в том, что
Ск(х)£ inf {Мк(х,у) + Ск + 1{у)}, хеНк. (7)
Возьмем произвольное уеНк + 1. По определению Ск + 1(у) для любого
е > О найдется путь, соединяющий точку у со шкалой Я^, длина которого
не превышает Cfc + 1(t/) + e. Если этот путь «удлинить», добавив к нему дугу,
соединяющую точки х и у, то получим путь, соединяющий точку х е Нк со
шкалой HN, длина которого не превышает Мк(х, у) + Ск + 1(у) + е. Поэтому
заведомо Ск(х) ^ Мк(х, у) + Ск + 1(у) + е. В силу произвольности точки уе
6 Нк + 1 и величины е отсюда имеем неравенство (7).
Теперь покажем, что в (7) на самом деле знак неравенства можно
заменить знаком равенства. По определению Ск(х) для любого е>0
найдется путь, соединяющий точку х е Нк со шкалой HN, длина которого не
превосходит Ск(х) + е. Пусть этот путь проходит через точку у€ЕНк + 1.
Ясно, что отрезок этого пути от уе до Я^ не меньше Ск + 1(уг), и
поэтому весь путь от х до Я^ не меньше Мк(х, уе) + Ск + 1(у.).
Следовательно, Мк(х, уе) + Ск + 1(уг) < Ск(х) + е. Так как уе Е Нк + 1, то отсюда
имеем inf {Мк(х, у) + Ск + 1(у)} < Ск(ж) + е, или в силу произвольности е:
»6ЯН1
inf {Мк(х, у) + Ск + 1(у)}^Ск(х). Сравнивая это неравенство с (7), немед-
wetft + i
ленно получаем требуемые соотношения (6).
3. Соотношения (6) могут быть использованы так же, как и уравнение
Беллмана (1.13), (1.14). Опишем порядок работы с этими соотношениями
в предположении, что каждая из шкал состояний Я,, состоит из конечного
476
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
числа точек pt, г = 0,..., N. Заметим, что в этом случае в (6) вместо inf
можно писать min. Функция CN(x) = Ф(х), х Е HN нам известна. Для
вычисления CN_{(x) с помощью элементарных операций соединим попарно все
точки шкал HN_{ и HN. Сравнивая pN_y,pN величин MN_l(x, у)+Ф(у) при
всевозможных xeHn_u yeHN, найдем min[MN_l(x, у)+Ф(у)] = CN_l(x),
y€HN
а также точку y = yN_{(x)EHN, хЕ HN_{, на которой этот минимум
достигается. Если Ск + 1(х) и у = ук + 1(х) Е Нк + 2, хеНк + 1 уже известны, то для
вычисления Ск(х), х Е Нк, соединим элементарными операциями
всевозможные пары точек шкал Нк и Нк.1. Перебором ркрк + 1 величин Мк(х, у) +
+ Ck + i(y) при всех х Е Нк> уеНк + 1 найдем min [Мк(х, у) + Ck + l(y)], а
также точку у = ук(х) Е Нк±1, х Е Нк, на которой этот минимум
достигается, и т. д. для всех к = N, N — 1,..., 1, 0. На вычисление всех Ск(х) в
JV-1
у = ук(х), хЕ Нк, к = 0,..., N— 1, понадобится перебор ]Г} p;pi + 1 величин.
i = 0
Наконец, находим х£ Е Н0 из условия С0(х£)= inf С0(х) —для этого нужно
х € Н0
перебрать еще р0 величин, и определяем последовательно точки х1 = у0{х£),
х£ = y{(xi),,.., x*N = yN_l(xx_l). Путь, проходящий через найденные точки
а^, ж*,..., х^, будет кратчайшим среди всех путей, соединяющих крайние
шкалы Hq, Hn. В самом деле, по определению ук(х), к = 0,..., N — 1, и
х*кЕНк, к = 0,..., N, имеем
Ck(K) = Mk(x*k,x*k + l)+Ck + l(x*k + l), fc = 0,..., TV-1. (8)
Возьмем произвольный путь, соединяющий шкалы Н0 и HN и проходящий
через точки Xq, хи ..., xN, х{ Е Н., i =0,..., N. Так как xk+l Е Нк + 1, то
согласно (6) будем иметь Ск(хк) ^ Мк(хк, xk + l) + Ск+1(хк + 1). Отсюда и
из (8) тогда следует Мк(х*к, x*k + l) + Ck + l(x*k + l)-Ck(x*k) = 0^Mk(xk, хк + 1) +
+ Ск + 1(хк + 1)~ Ск(хк), к = 0,..., N — 1. Просуммируем это неравенство по
к от нуля до N — 1. Получим
£ Mk(x*k,x*k + l) + CN(x*N)-C0(xS)^N-£ Мк(хк, xk + l) + CN(xN) -0,(¾).
i=0 i=0
Но Со{х5) = inf С0(х) < 0,(¾). поэтому £ Мк(х*к, x*k + l) + Ф(х*„) <
^ Е Мк(хк, хк + 1) + Ф(хм) для любых путей, соединяющих шкалы Н0 и HN.
i=0
Таким образом, путь, проходящий через точки з$, х*,..., x*N, в самом
деле кратчайший. Если u,*(t) и £?(*), tt < t < ti + !, представляют собой то
управление и соответствующую траекторию, на которых приближенно
реализуется элементарная операция (1)-(4) при x = xf, у=х$+х, то в качестве
приближенного решения исходной задачи (1.1)-(1.4) можно взять
управление u*(t) = ut(t) и траекторию x*(t) = xt(t), t{ < t < t. + l, г =0,..., N — I.
Аналогично доказывается, что путь, проходящий через точки хк = х Е Нк,
х*к+1 = Ук(х*к)£Нк + 1,..., x^ = yN_l(x*N_l)EHN, является кратчайшим между
точкой х Е Нк и шкалой Н„. Это означает, что функция уЛх) дает нам
приближенное решение проблемы синтеза для задачи (1.1)-(1.4).
Заметим, что определение кратчайшего пути между шкалами Н0 и HN по
JV- 1
описанной схеме потребовало перебора £ P{Pi + i +Ро величин, в то время
> = о
§ 2. СХЕМА МОИСЕЕВА
477
как полный перебор всех путей, как нетрудно видеть, потребовал бы
сравнения р0р{ .,. pN величин. Таким образом, уже при не слишком больших
р., перебор с помощью соотношений (6) по сравнению с полным перебором
дает существенную экономию памяти ЭВМ и машинного времени. Такая
экономия достигается за счет того, что при вычислении Ск(х) из (6)
рассматриваются лишь пути, проходящие через всевозможные точки х 6 Нк и
у е Нк + 1 и соединяющие точки у е Нк + 1 со шкалой HN кратчайшим
образом, и тем самым все некратчайшие пути, соединяющие уЕНк + 1 со шкалой
HN, из рассмотрения полностью исключаются.
4. Для получения более точного решения задачи (1.1)-(1.4) необходимо
взять более густую сетку точек на шкалах и увеличить число шкал. Однако
при этом число перебираемых величин даже при использовании описанной
выше схемы перебора катастрофически быстро растет, и уже при
небольших размерностях векторов х, и становится невозможным решить задачу о
кратчайшем пути за разумное время с помощью самых лучших
современных ЭВМ. В этом случае часто используют прием, известный под названием
метода блуждающих трубок [753]. Суть этого приема заключается в
следующем.
Сначала берут небольшое число шкал с небольшим количеством точек на
них, и по описанной выше схеме поиска находят кратчайший путь 1и
соединяющий крайние шкалы Н0 и HN. Затем уменьшают шаг сетки на каждой
шкале, путь 1{ окружают некоторой «трубкой» из путей, проходящих
вблизи 1{ по точкам новой сетки. Для построения трубки вокруг 1{ на каждой
шкале обычно берут небольшие окрестности точки, через которую проходит
1и и рассматривают пути, проходящие через выбранные точки. С помощью
описанной выше схемы перебора находят кратчайший путь в полученной
трубке; все пути вне этой трубки в переборе пока не участвуют. Таким
образом, получают новый улучшенный путь 12, длина которого не превышает
длину I. Далее, сохраняя прежние шкалы и точки на них, окружают путь
12 новой трубкой и находят следующее приближение 13 и т. д., продолжая
процесс до тех пор, пока трубка не перестает «блуждать» и впервые не
получится равенство 1Я = 13 +,. После этого измельчают сетку на каждой шкале,
окружают путь ls новой трубкой и продолжают поиск кратчайшего пути
описанным приемом блуждающих трубок. Процесс измельчения сетки на
шкалах и поиска кратчайшего пути указанным способом повторяют, пока два
кратчайших пути, полученные после двух последовательных измельчений
сетки, не совпадают с удовлетворительной точностью. Затем увеличивают
число шкал, т. е. сгущают сетку по времени, и повторяют процесс поиска
методом блуждающих трубок с постепенным измельчением сетки на
шкалах состояний до удовлетворительного совпадения двух последовательных
приближений. Попеременно измельчая сетку на шкалах состояния и сетку
по времени, поиск с помощью блуждающих трубок продолжают до
получения приближенного решения исходной задачи с достаточной точностью.
Изменение шагов сеток на шкалах состояния и по времени должно быть
согласованным; например, в случае равномерных сеток эти шаги должны
удовлетворять соотношению |Дж| = о(Д*) [497].
Оказывается, метод блуждающих трубок во многих случаях существенно
сокращает перебор. В то же время следует заметить, что метод блуждающих
трубок позволяет определить, вообще говоря, лишь локально кратчайший
путь между крайними шкалами при фиксированной сетке, поскольку на
каждом шаге в переборе участвуют лишь пути, попавшие в трубку.
478
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
5. Другой подход к поиску кратчайшего пути между шкалами дает
метод локальных вариаций [497; 498; 753]. Этот метод предполагает, что
какой-то путь 1и соединяющий шкалы Я0 и HN уже известен. Для
определения следующего более короткого пути последовательно просматриваются
шкалы Я0, Яи ..., Я^. Допустим, что шкалы Я0,..., Hi _ 1 уже просмотрены
и получен путь 1{ (_р соединяющий шкалу Яд и Я^. Пусть жДЯ,) — точка
пути 1и лежащая на шкале Н{. Выберем на шкале Н. некоторое количество
точек, расположенных близко к точке х{(1{), и переберем пути, проходящие
через эти выбранные точки шкалы Я,, ав остальном совпадающие с путем
1У ;_!• Если среди перебираемых путей найдется путь, имеющий меньшую
длину, чем путь 1{ {_и то его обозначаем через 1и и просмотр шкалы Щ
на этом заканчиваем. Если же длины всех перебираемых путей оказались
не меньше длины l{ i_l> то полагаем 1и = 11<{_{. После определения пути
1и переходим к просмотру следующей шкалы Яг + 1, и т. д. Такой перебор
всех шкал Я0, Яп ..., Я^ закончится получением пути llN = 1^, Если длина
пути 12 меньше длины I, то для пути 12 повторяют описанный выше
просмотр шкал Щ, Н{,..., Щ и находят следующий, путь 13 и т. д. Если же
окажется, что Ц = 1и т. е. путь 1{ улучшить не удалось, то на шкалах берут
более густую сетку точек, а также при необходимости измельчают сетку по
времени и снова просматривают шкалы и т. д.
Метод локальных вариаций описан. Нетрудно видеть, что этот метод
является аналогом метода покоординатного спуска. Поскольку здесь в
переборе участвуют гораздо меньше путей, чем в методе, основанном
на соотношениях (6), или методе блуждающих трубок, то ясно, что
метод локальных вариаций гораздо экономичнее и позволяет увеличить
размерность решаемых задач. С другой стороны, нетрудно привести
примеры задач, когда этим методом не
удается найти даже локально кратчайший
путь между шкалами. На рис. 7.1
приведен такой пример — здесь N = 3, шкалы
Я0, Нх,Н*уНъ состоят соответственно из
точек {А}, {В, С}, {D, Е}, {F}; на дугах,
соединяющих точки соседних шкал,
указаны их длины. Кратчайшим путем,
соединяющим шкалы Я0 и Я3, является путь
ACDF. Если в качестве начального
приближения Z, взять путь ABEF, то
улучшить его методом локальных вариаций не удается. Любопытно также
заметить, что если за 1{ взять путь ABDF, то в зависимости от того, начнем
ли просмотр со шкалы Нх или Я2, придем к кратчайшему пути ACDF или
уже рассмотренному пути ABEF,
Различные модификации метода локальных вариаций, примеры задач, к
которым применялся этот метод, см. в [497; 498; 753].
6. Успех и применение описанных в этом параграфе методов
приближенного решения задачи (1.1)-(1.4) во многом зависит от умения строить
элементарные операции (1)-(4). По существу элементарная операция
представляет собой экстремальную задачу той же трудности, что и исходная
задача. Однако малость отрезка t{ < t ^ ti + l позволяет здесь сделать ряд
упрощающих предположений. Прежде всего, если шаг сетки по времени
достаточно мал, то элементарную операцию строят, исходя из условий (1), (2),
(4), полагая, что дуги траекторий или не нарушают .ограничений (3), или
Рис. 7.1
§ 2. СХЕМА МОИСЕЕВА
479
этим нарушением можно пренебречь. Далее, вместо минимизации
функции (1) при условиях (2), (4) часто ограничиваются построением какого-
либо допустимого управления и соответствующей траектории,
удовлетворяющих условиям (2), (4), и в качестве длины дуги Mt(x, у) тогда берут
значение функции (1) на полученных управлении и траектории.
Во многих задачах полезно задаться каким-либо семейством управлений
u(t) = (4,0,,..., cm), зависящих от параметров с,,..., ст (т ^ п).
Например, это могут быть алгебраические или тригонометрические многочлены с
коэффициентами с,,..., ст или кусочно-постоянные функции со
значениями с,,..., ст и т. д. Значения этих параметров затем можно определить из
следующей системы п уравнений с т неизвестными (т ^ п):
fx(t)dt = j'/(as(t), u(t, с„ . .., cj)dt = у-х, (9)
t, t,
u(t,cl,...,cJeV(tt), t£ < t < t4 + 1I
используя для этого различные методы [59; 74; 89; 635]. Параметры с,,...
..., ст отсюда будут определяться, вообще говоря, неоднозначно, и
свободные параметры можно использовать для минимизации функции (1). Для
упрощения системы (9) дифференциальное уравнение (2) часто заменяют
более простыми уравнениями:
x(t) = f(x,u(t),t) или x(t) = f(^-,u(t), t)
или другими более точными разностными уравнениями; здесь возможно
использование линеаризованной системы:
x(t) = f(x, u(i), t) + (fx(x, u(t), t), x(t) - x).
При решении задачи (1), (2), (4) часто применяется также принцип
максимума в сочетании с различными упрощающими приемами, описанными
выше. Другие способы построения элементарных операций, примеры
решенных конкретных задач см. в [497; 498].
§ 3. Проблема синтеза для систем с непрерывным временем
Продолжим исследование задачи (1.1)-(1.4) с непрерывно меняющимся временем.
Проблема синтеза для задачи (1.1)-(1.4) заключается в построении функции и — и(х, t),
называемой синтезирующей функцией этой задачи и представляющей собой значение оптимального
управления при условии, что в момент t система (1.2) находится в точке х, т. е. x(t) =х.
Умение решать проблему синтеза крайне важно в различных прикладных задачах
оптимального управления. В самом деле, если известна синтезирующая функция и(х, t), то техническое
осуществление оптимального хода процесса может быть произведено по следующей схеме,
называемой схемой с обратной связью; с измерительного прибора, замеряющего в каждый
момент t фазовое состояние x(t), на ЭВМ или какое-либо другое вычислительное
средство подается величина x(t), вычисляется значение управления u(t) = u(x(t), t),^после чего
найденное значение u(t) оптимального управления передается на исполнительный механизм,
непосредственно реализующий требуемое течение управляемого процесса.
1. Проблема синтеза для задачи (1.1)-(1.4) сводится к решению следующей задачи:
определить управление ut(r) = щ(т, x,t), доставляющее функции
J(tlxlu(-)) = Ty0(x(T),u(T),T)dT + <S>(x(T)) (1)
480
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
минимальное значение при условиях
x(r) = f(x(r),u(r),r), t^r^T; x(t) = x, (2)
x(t)£G(t), t^r^T, (3)
и = и(т) e V(t), t < т < T; u(-) — кусочно-непрерывно, (4)
где x — произвольная точка множества G(t), a t— произвольный фиксированный момент
времени, L < t < Т. Заметим, что при t = U задача (1)-(4) превращается в исходную зада-
чу (1.1)-(1.4).
Обозначим через А(х, t) множество всех управлений и(т), t ^ т < Г, удовлетворяющих
условиям (4) и таких, что соответствующая траектория х(т) = х(т, и), t ^ т < Т, системы (2)
определена на всем отрезке [t, Г] и удовлетворяет фазовому ограничению (3). Положим
X(t) = {i:ie Gm, А(ж, t) ф 0}, t < т < Г; Х(Г) = G(T).
Пару (ufr), ж(т)), t < т < Г, назовем допустимой парой
£ -X'(t), и(-) е А(х, t) и х(-) является решением системы (2), соответствующим рассматривае-
: Г, назовем допустимой парой задачи (1)-(4), если x(t) = х е
мому управлению и(-). Аналогично, пару (и(т), х(т)), t0 <т< Г, будем называть допустимой
парой исходной задачи (1.1)-(1.4), если ж(*0) = :¾ е .X'(tQ), u(-) е Д(а^, t0) и выполнены все
соотношения (1.2)-(1.4). Допустимую пару («„(т), жДт)), * < т < Г, задачи (1)-(4) будем
называть решением этой задачи, если J(t, х, ц (.)) = inf J(t, х, и(-)), при этом цД-) назовем
оптимальным управлением, а жД.) — оптимальной траекторией задачи (1)-(4).
Зная оптимальное управление %(r) — ut(T, х, t) задачи (1)-(4) при всех тех (х, t), же G(t),
t0^.t<T, при которых эта задача имеет решение, нетрудно получить синтезирующую
функцию задачи (1.1)-(1.4): достаточно положить и(х, t) = ut(t,x, t). Однако получить явное
аналитическое выражение для оптимального управления и„(т, х, t) задачи (1)-(4) удается лишь
в редких случаях. Поэтому желательно иметь другие подходы к решению проблемы синтеза.
Вспомним, что при решении проблемы синтеза для дискретных систем важную роль играло
уравнение Беллмана (1.13), (1.14). Оказывается, аналогичное уравнение может быть получено
и для задачи (1)-(4). Введем функцию
B(x,t)— inf J(t,x,u(-)),
А(х, t)
называемую функцией Беллмана для задачи (1.1)-(1.4). Если задача (1.1)-(1.4)
удовлетворяет некоторым ограничениям и функция В(х, t) непрерывно дифференцируема, то можно
показать, что функция Беллмана удовлетворяет следующим условиям, называемым
уравнением Беллмана задачи (1.1)-(1.4):
inf [(Вх(х, t), f(x, «,*)> + Bt(x, t) + f°(x, «,*)] = 0,
u£ (I' ' xeX(t), to^t<T, (5)
В(х,Т) = Ф(х), xeX(T)=G(T), (6)
где Bx = (Bx\,,,., В „), Bxt, Bt —частные производные функции B(x, t), a D(x, t) —
множество всех тех и е V(t), для которых существует хотя бы одно управление и(-) е А(х, t) со
значением u(t)~u(t —0) — и.
Приведем эвристические соображения, из которых следуют соотношения (5), (6). С этой
целью воспроизведем уравнения (1.13), (1.14):
inf [Bk+l(Fk(x,u))-Bk(x) + Fk°(x,u)} = 0, xeXk, k=0,...,N-\, (7)
U£ (I' ' В„(х)=Ф(х), xeXN=GN. (8)
Вспомним также обозначения, связывающие задачи (1.1)-(1.4) и (1.5)-(1.8)
Fk°(x, u)-(tk + l- tk)f°(x, и, tk), Fk(x, u) = x + (tk + l- tk)f(x, u, tk)
и подставим их в (7), (8). Исключим из этих обозначений и соотношений (7), (8) индекс к,
приняв tk=t, At=tk+l-tk, tN=T, Bk(x)=B(x,t), Bk+l(y)=B(y,t+At), Dk(x)^D(x,t),
Xk=X(t). Тогда соотношения (7), (8) могут быть переписаны в следующей безындексной
форме:
inf [В(х + Atf(x, и, t), t +At)-B(x, t) + Atf°(x,u, t)]~0,
"6В(Ч*> xeX(t), to^t^T,
В(х,Т) = Ф(х), xeX(T)=G(T).
Если теперь поделим первое из этих равенств на At и совершим формальный предельный
переход при At—> 0, то придем к соотношениям (5), (6). Подчеркнем, что приведенные рас-
§ 3. ПРОБЛЕМА СИНТЕЗА
481
суждения никоим образом не претендуют на какую-либо строгость м могут служить лишь
наводящими соображениями при получении соотношений (5), (6). Аналогичным образом можно
было бы «вывести» эти соотношения, опираясь на уравнения (2.6).
Заметим, что уравнение (5) является дифференциальным уравнением в частных
производных первого порядка, левая часть которого осложнена взятием нижней грани, и вопросы
существования и единственности решения задачи (5), (6), свойства ее решения в настоящее время
исследованы слабо [419; 754]. Задача (5), (6) здесь нас будет интересовать с точки зрения
решения проблемы синтеза.
Под решением задачи (5), (6) мы будем понимать функцию В(х, t), которая определена
и непрерывна при всех (х, t), х е X(t), tg < t < Г, обладает кусочно-непрерывными
частными производными Вх, Bt и удовлетворяет уравнению (5) всюду, где существуют эти
производные, удовлетворяет условию (6) и, кроме того, для любой допустимой пары (и(-), х(-))
задачи (1)-(4) при всех xeX(t), tg^tKT, функция В(х(т), т) переменной т имеет кусочно-
непрерывную производную (или В(х(т), т) абсолютно непрерывна) на отрезке [t, Г].
Теорема 1. Пусть В(х, t) —решение задачи (5), (6) и, кроме того, пусть нижняя
грань в левой части (5) достигается на кусочно непрерывной функции и(х, t) е D(x, t),
х eX(t), t0^ t < Г. Тогда u(x, t) — синтезирующая функция задачи (1.1)-(1.4).
Доказательство. Возьмем произвольные t, t0 ^ t < Т, и xeX(t). Пусть жДт),
*о ^ т ^ Т, является решением задачи Коши
x(T) = f(x(r),u(x(T),T),T), tQ^r^T; x(t)-x,
и пусть жДт) е Х(т) при всех т е [t, Г]. Положим %(т) = uix^r), т), tQ ^ т < Т. Ясно, что
ut(-) е А(ж, i) и (%(■), xt(-))— допустимая пара задачи (1)-(4). Для доказательства теоремы
достаточно показать, что пара («„(•)> xt(-)) является решением задачи (1)-(4).
Сначала покажем, что для любой допустимой пары (и(-),х(-)) задачи (1)-(4) справедлива
формула
J(t, х, «(•)) = J Щх(т), и(т), r)dr + В(х, t), (9)
где (
Щх, и, t) = (Вх(х, t), f(x, и, t)) + Bt(x, t) + f°(x, и, t). (10)
В самом деле, по условию функция В(х(т), т) переменной т непрерывна и имеет кусочно-
непрерывную производную. Тогда в силу уравнения (2) имеем
dB(x{r), т) = Щх(Л и(т)( т) _ /0(х(т)] и(т)( т)
всюду на [t, Г], за исключением, быть может, конечного числа точек. Интегрируя это
тождество по т на [t, Г], с учетом условия (6) получим
г т
Ф(х(Т)) - В(х, t)=] Щх(т), и(т), т)йт - J /°(х(т), и(т), r)dr,
t t
что равносильно (9). Заметим, что формула (9) является аналогом формулы (1.2П.
Уравнение (5) с помощью функции (10) можно переписать в виде inf R(x,u, т)=0.
Отсюда и из определения функции и(х, т) имеем ие£>(х,т)
R(x,u(x, т),т) = 0= inf Щх, и, т) ^ R(x, и, т) (11)
и £D{x,t)
для всех ueD(x,r), хеХ(т), t^r^T. Если (и(-), х(-))— допустимая пара задачи (1)-(4),
то х(т) еХ(т), и(т) = и(т + 0) = иеО(х(т),т), t ^ т < Г. Поэтому из (11) получаем
Д(хДт), u(xt(r)), т) = Д(хДт), ч(т), г) = 0 < R(x(r), и{т), т), (12)
t < т< Г, для любой допустимой пары задачи (1)-(4). Отсюда и из формулы (9) с учетом
условия xt(t) = x(t) = х имеем
J(t, х, и(-)) - J(t, х, ut(-)) = J R(x(t), u(t), r)dr > 0 (13)
для всех допустимых пар (и(-), х(-)) задачи (1)-(4).
Из (9), (12), (13) следует, что
J(t, х, и(-)) = inf J(t, х, «(•)) = В(х, t).
Д(ГЕ, ()
482
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Тем самым доказано, что функция В(х, t), определяемая соотношениями (5), (6), в самом деле
является функцией Беллмана задачи (1.1)-(1.4), и функция и(х, t), на которой достигается
нижняя грань в левой части (5), является синтезирующей для этой задачи. D
С помощью функций В(х, t), и(х, t) нетрудно получить решение и для исходной
задачи (1.1)-(1.4). А именно, верна
Теорема 2. Пусть В(х, t) —решение задачи (5), (6) и пусть нижняя грань в левой
части СЪ) достигается на кусочно-непрерывной функции и(х, t). Кроме того, пусть точка
x£eX(t0) определена из условия
B(^,t0)= Ы B(x,t0), ..(1.4)
x£X(t0)
а пара ("*(•)> х*('))> г&е ХЛ') —решение задачи Коши
x(T) = f(x(T),u(x(r),T),T), *0<т<Г; x(t0) = x*,
и uJt) = u(xt(r),r), является допустимой парой задачи (1.1)-(1.4). Тогда пара
(«„(•), xt(-)) является решением задачи (1.1)-(1.4), т. е.
J(h,^, «»(•))= jnf jnf J(tQ, x, u(.)) = Jt.
Доказательство. Возьмем произвольную допустимую пару (и(т), х(т)), t0 < т ^ Г,
x(t0) = xq е X(t0) задачи (1.1)-(1.4). Из формулы (9) и неравенств (12) при t = t0 с учетом
условия (14) имеем
г
J(t0, Xq, u-))-J(t0, x*,ut(-))= J Щх(т), u(t), T)dr+jB(^, у- inf B(x, t„) > 0,
что и требовалось доказать. D
2. Таким образом согласно теореме 1 для решения рассматриваемой проблемы синтеза
достаточно найти решение задачи (5), (6). Возникает вопрос, как же решить задачу (5), (6)?
Прежде всего заметим, что удобное для работы конструктивное описание множеств X(t),
D(x, t), входящих в формулировку задачи (5), (6), часто отсутствует, и поэтому на практике
вместо задачи (5), (6) обычно пользуются следующей более конструктивной задачей:
inf [(Вх(х, t), f(x, и, t)) + Bt(x, t) + f°(x,u, t)] = 0,
ue ( ' xeG(t), t0^t<T, (15)
в(х,т) = Ф(х), xeG(T),
получающейся из (5), (6) заменой D(x, t), X(t) на V(t), G(t) соответственно. Конечно,
здесь надо помнить, что задача (15) может и не иметь решения, в то время как задача (5), (6)
может оказаться разрешимой.
Наиболее удобными и эффективными при решении задачи (5), (6) или задачи (15), по-
видимому, являются методы, изложенные выше в § 1, 2, — рекуррентные соотношения (1.13),
(1.14) и (2.6) по существу представляют собой некоторую дискретную аппроксимацию
задач (5), (6) и (15), а функции Вк(х), Ск(х) являются приближенным значением для В(х, tk).
Существуют и другие методы решения таких задач. В прикладных задачах часто удается
получить явное выражение и = и(х, t, Вх) для точки и, в которой достигается нижняя грань
Ы} [(Bx,f(x,u,t)) + f°(x,u,t)]
ue V(t)
при фиксированных значениях параметров (х, t, Вх). Подставив такое и = и(х, t, Вх) в (15),
приходим к следующей задаче Коши:
Bt+[(Bx,f(x,u,t)) + f°(x,u,t)]\u = u{XttiBJ = 0,
xeG(t), t0^t<r, в(х,Т) = Ф(х), xeG(T)
для нелинейного уравнения с частными производными первого порядка. Для численного
решения задачи Коши пользуются известным арсеналом методов — разностными методами, методом
характеристик, методом прямых, методом коллокации и т. п. [59; 74; 89; 481; 635].
Иногда удается найти решение В(х, t) задачи (15) в виде многочлена по переменным х1,...
..., хп с неопределенными коэффициентами, зависящими от времени:
*(*.*)= Е Е ••• Е Ф^..Л{Щх^.,.(х"у».
§ 3. ПРОБЛЕМА СИНТЕЗА
483
Если подставим это выражение для В(х, t) в (15), то для определения коэффициентов
ф{ t (t) получим дифференциальное уравнение следующего вида
Bt(x,t)= Е ... Е ^...^(0(^...0=-)^ =
i,=0 i„=0 ' " (16)
= inf, F(V>o...0(*), -...^,,.. m(t);xl...xn,u, t), xeG(t), t0^t^T,
с начальным условием
E •■• E Ф:.л(Т)(х1у>...(х»У»=Ф(х), xeG(T). (17)
г,=0 i„=0
Если Ф(х), inf F, в свою очередь, являются многочленами относительно х1.. .хп, то,
приравняв коэффициенты при одинаковых степенях в (16), (17), получим задачу Коши для системы
обыкновенных дифференциальных уравнений относительно ф1 г. (t), записанной в
нормальной форме Коши. Далее, здесь можно использовать различные численные методы решения
задачи Коши, такие, как методы Эйлера, Адамса, Рунге — Кутта и т. д. [59; 74; 89; 481; 635].
Если Ф(х) или inf F не являются многочленами относительно х',..., хп, то условия (16),
(17) не могут быть, вообще говоря, удовлетворены во всей области G(t), t0 < t ^ Г, ни при
каком выборе N = (ml + 1)... (mn + 1) коэффициентов ф. я (t). В этом случае в [417]
предлагается задать в области G(t) N кривых .£[(t),..., £jv(t) и рекомендуется определять
ф{ i (t) из условия удовлетворения равенств (16), (17) не всюдув G(t), а лишь на этих
кривых. Этот подход перекликается с известными методами коллокаций и интегральных
соотношений и приводит к задаче Коши для системы обыкновенных дифференциальных уравнений,
не разрешенных относительно производной ф{ i (t) (отметим, что эти производные в
уравнение будут входить линейно). Кривые £[(t),..., (N(t) обычно выбирают так, чтобы они имели
достаточно простое аналитическое выражение (например, семейство прямых, параллельных
осям координат, семейство парабол и т. п.) и задавали достаточно густую сетку в области
G(t), <o<t<r.
Для иллюстрации вышесказанного приведем пример.
Пример 1. Пусть требуется минимизировать функцию
г
J(u) = J u2(t)dt + Хх2(Т), А = const > О,
О
при условиях х = u(t), х(0) = хп, и = u(t) — кусочно-непрерывная функция; числа Т, Xq
заданы. Здесь G(t) = El, V(t) = £\0<t<T.
Задача (15) в рассматриваемом случае имеет вид
infi[BI(x, t)u + Bt(x, t) + u2] = 0, хеЕ1, O^t^T, (18)
ueS' B(x, T) = \x2, хеЕ1. (19)
Нижняя грань в (18) достигается при и = —BJ1, поэтому уравнение (18) перепишется так:
Bt(x,t)-B2(x,t)/4 = 0, хеЕ1, O^t^T. (20)
Функцию В(х, t) будем искать в виде многочлена
В(х, t) = ф0(г) + ф{(г)х + ф2(г)х2
переменной х. Подставим это выражение в (19), (20); получим
ф0 + ф\х + ф2х2-(ф1+2ф2х)2/4 = 0, хеЕ1, O^t^T,
Ф0(Т) + ф1(Т)х + ф2(Т)х2^\х2, хеЕ1.
Приравнивая коэффициенты при одинаковых степенях х, придем к следующей задаче Коши:
ф0-ф2/4 = 0, ^1--01^=0, ф2-ф% = 0, O^t^T,
ф0(Т) = 0, Vi(r) = 0, V2(r) = A.
Отсюда находим
^0(Г) = ^(Г) = о, ф2(1)= 1-A(At_r).
484
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
2
0^ t < Т.
Таким образом, функция Беллмана здесь имеет вид
B(x,t)= jwt_r);
синтезирующей является функция
u(X]t) = _^ = __Ax__] xeEi
3. Предположим, что с помощью того или иного метода нам удалось получить некоторое
приближенное решение В(х, t) задачи (5), (6) или (15). Если это решение получено разностным
методом (например, методами § 1, 2) на какой-то дискретной сетке точек, то доопределим ее
(например, интерполяцией или с помощью сплайнов) во всех точках области G(t), 0^ t ^ Г,
до некоторой непрерывной кусочно-гладкой функции В(х, t). Тогда функцию и = и(х, t), на
которой реализуется точная или приближенная нижняя грань функции R(x, и, t) из (10) на
множестве D(x, t) или V(t), можем принять в качестве приближенного решения проблемы
синтеза для задачи (1.1)-(1.4). Это значит, что приближенное решение (й(-), £(■)) задачи (1)-
(4) будем определять из условий
х(г) = /(х(т),и(х(т),т),т), t^r^T, х(Г) = х,
x(r)eG(r), й(т) = и(ж(т),т), t^r^T.
Приближенное решение исходной задачи (1.1)-(1.4) находится аналогично: сначала
определяем точку х0, на которой точно или приближенно реализуется нижняя грань функции
В(х, t0) на множестве Х^) или G(t0), а затем решая задачу (21) при t = U, х = х0, находим
траекторию х(т) и управление й(т) = и(х(т)), t0 ^ т < Г. Найденную пару (й(-), х(-)) примем
за приближенное решение задачи (1.1)-(1.4). Спрашивается, какая при этом будет допущена
погрешность? Приводимая ниже оценка погрешности дает некоторый ответ на этот вопрос.
Пусть К(х, t) — какая-либо функция, которая определена и непрерывна при всех x€X(t),
t0 < t < Г, обладает кусочно-непрерывными производными Кх, Kt и такова, что для любой
допустимой пары (и(-), х(-)), задачи (1)-(4) при всех xeX(t), tg< t < Г, функция К(х(т), т)
переменной т — кусочно-гладкая (или абсолютно непрерывная) на [t, Г]. На практике в
качестве функции К(х, t) обычно берут какое-либо приближенное решение В(х, t) задачи (5),
(6) или (15).
По аналогии с (10) введем функцию
S(x, и, t) = (Кх(х, t), f(x, и, t)) + Kt(x, t) + f(x, и, i),
xeX(t), t0^t^T,
и, кроме того, положим
s(x, Т) = Ф(х)-К(х, Г), xeG(T). (23)
Возьмем произвольную допустимую пару (и(-), х(-)) задачи (1)-(4). В силу уравнения (2) тогда
имеем
dK^hT> = S(x(t), u(t), г) - /°(x(r), u(t), r), i0 < г < Т.
Учитывая непрерывность и кусочно-гладкую функцию К(х(т), т), проинтегрируем это
тождество по т от t до Г. Получим формулу
J(t, х, «(•)) = J S(x(t), u(t), r)dr + s(x(T), T) + K(x, t). (24)
Если K(x, t) = B(x, t), то S(x, u, t) = R(x, и, r), s(x, T) = 0, и эта формула превратится в
выведенную выше формулу (9).
Предположим, что каким-то образом мы получили пару (й(т), х(т)), t <т ^ Г,
удовлетворяющую условиям (3), (4) и уравнению (2) с начальным условием x(t) = x&X(t). Согласно (24)
тогда
г
J(t, х, й(-)) - J(t, х, «(•)) = J[S(x(t), й(т), г) - S(x(t), и(т), r)]dr +
+ [s(x(T),T)-S(x(T),T)} + [K(x,t)-K(x,t)] (25)
для любой допустимой пары (и(-), х(Л) задачи П)-(4). Из (25) уже нетрудно получить
требуемые оценки погрешности для задач (1)-(4) и (1.1)-(1.4). Обозначим
Smi„(T)= Inf. Inf. S(x,u,r), smln= infпМх,Т), Kmln(t)= inf■ K(x,t). (26)
§ 3. ПРОБЛЕМА СИНТЕЗА
485
Пусть (и(-),х(-)) — некоторая допустимая пара задачи (1) — (4), которую мы хотим взять
в качестве приближенного решения этой задачи. Учитывая, что для любой допустимой пары
(и(-), х(Л) задачи (1)-(4) имеют место включения x(t) = xeX(t), u(-)e Д(ж, t), х(т)е Х(т),
и(т) £ D(x(t), т), t ^ т< Г, из (25), (26) получим требуемую оценку погрешности:
О < J(t, х, й(-)) - inf J(t, х, и(-)) <
г д<^> (27)
< J [S(x(r), й(т), г) - Smin(r)]dr + [s(x(T), Т) - smin] + [К(х, t) - Kmin(t)]. ( >
t
Если же (й(т),х(т)), t0^r^ T,—допустимая пара задачи (1.1)-(1.4), x(t0) = x0, которая
берется за приближенное решение этой задачи, то из (25), (26) имеем такую оценку
погрешности:
0< J(t0,x0,u(-))- inf inf J(t0,x, u(-))<
T x<EX(t0)u(-)<EA(x,t0)
< S [S(£(r), ff(r), r) - Smin(T)]dr + [s(x(T), T) - smin] + K(x0, ^) - Kmln(tQ). (2 }
to
Если K(x, t) = B(x, t), то S(x, u,t) = R(x, u, t), s(x, Г) = 0 и, кроме того, из (11) следует,
что inf R(x, и, t) = 0 при всех х eX(t), так что inf inf R(x, и, t) = 0. Поэтому
u<=D(x,t) ч ' ч xeX(t)ueD(x,t) ч '
при К(х, t)= В(х, t) из (27), (28) соответственно получим
0«J(t, х, «(■))- inf J(t,x,«(-)Kjfl(2(T),ff(T),T)«»r+B(x,t)- inf B(x, t), (29)
и(')€Д(х, () j l€A(()
0< J(t0,x0,u(-))- inf inf J(t0,x,u(-)) <
x£X(t0)u(-)£&(x,t0)
«C J Д(*(т), U(r),r)dr+B(x0> t0)- inf B(x, t0). (30)
t0 '"I'd)
Из оценок (29), (30) следует, что если определить й(х, t) е А(ж, t), хе Jf(t) так, чтобы
Л(ж, й(х, t), t) было поближе к inf R(x,u,t), В(х, t) — поближе к inf В(х, t), и затем
А(х, t) x'&X(t)
найти пару (й(т), х(т)) из следующих условий
х(т) = f(x(r), й(х(т),т)т), x{r)eG{r), t^r^T, x(t) = x, й(т) = й(х(т),т),
то величина J(t, х,й(-)) (в случае задачи (1.1)-(1.4) — величина ./(¾. х0, й(-))) будет мало
отличаться от искомого оптимального значения, а функция й(х, t) будет хорошим
приближением для синтезирующей функции. Заметим, что оценки (28), (30) являются аналогами
оценок (1.28) и (1.29).
Заметим также, что в приложениях могут оказаться удобнее более грубые оценки,
получающиеся из (26)-(30) при замене неконструктивно определенных множеств А(х, t), X(t) на
множества V(t), G(t) соответственно.
Упражнения
г
1. Решить проблему синтеза для задачи минимизации функции J(xq,u(-))= \(x2(t)+u2(t))dt
о
при условиях x(t)=-x(t)+u(t), х(0)=хо; здесь G(t)=El, V(t)=El при всех te[0, Г].
2. Решить проблему синтеза для задачи минимизации функции J(xq, и(-) = ж2(1) при
условиях x(t) = u(t), 0^ t<l, х(0) = хо, u(t)eV = {ueEl: o«;u<l}, x(t)eG(t) = El при
0 ^ t ^ 1. Показать, что в этой задаче синтезирующих функций бесконечно много. Убедиться,
например, что синтезирующими являются функции
. ^. / 0, х^О, ( 0, х> i-1,
U(X't)={l, *<0, ИЛИ ^*) = {1, x^t-l.
3. Решить проблему синтеза для задачи минимизации функций
J(x0,u(.)) = x2(T) или J(XQ,u(-))=lx2(t)dt
О
486
Гл. 7, ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
при условиях x(t) = u(t}, Q< t < Г; х(0) = 2¾. и(*)€Щ£)=^м€ Е1:. —1 < и < 1}, x(.t) €
£ G(£) = В1, 0< t < Т. Будет ,яи я этих задачах синтезирующая функция единственной?
4. Написать уравнения Беллмана (5), |6) для задачи (быстродействия;
..7,(¾. %,, <,))-= Г - 40 -♦ inf, a\(i) =/(^(t), u(t), t), .¾ < t < 2J
x(t0) = 2¾. x[T) = аЗ[., 4/(-) —кусочно-непрерывна и принадлежит множеству У С Ег, t ^ i0.
5. Показать, что функция Веллмана для задачи из примера 6J2.4 ие является непрерывно
дифференцируемой.
6. найти функцию Беллмана для задачи
,Л(\,щМ-Ш = ШФ)М*)) +*(«(*). t)]dt + (с, *(Г)) -► inf,
%
x(t)-=A(t)<B(t) + C(t)u{t) *;f(t), -t0^t^T, x\t0) = x0, ,'(31)
u,-=u(t) eV'(t), u'(-)— кусочно-непрерывна, (32)
считая известными моменты времени tg, Г, матрицы A(t), C(t) порядка пхп unxr
соответственно, n-мерные вектор-функции a(t), f(t), скалярную функцию b(u, t), n-мерные векторы
с, Xq и множества V,(t) е Е , it0 < t < Т. Указание; пользуясь уравнениями (5), (6) искать
функцию B(w, ф^вшиде 'B!(as, i;) = ,(^(t), ж) —многочлена первой степени относительно
переменных х = (х ,.,., хп).
7. Исследовать уравнения ч(5,), (6) для задачи минимизации функции
г
J(t0,:x0,u(-)) = al \ x2,(t)dt + а2х2(Т), alt а2 = const^0,
-¾
при условиях (31), (32). Рассмотреть случаи V(t) = Ет, V(t) = {и е Вг: |и| < 1}, V(t) =
= {и = (и , .. ., ит): —Ч ^ и1 ^ 1, i — 1, . .., г}.
§ 4. Достаточные условия оптимальности
При решении задач оптимального управлении часто возникает следующий вопрос: будут
ли на самом деле оптимальными те управления и соответствующие им траектории, которые
найдены с помощью какихглибо точных или приближенных методов? Такой вопрос, например,
естественно возникает, тогда управление и траектория найдены из краевой-задачи принципа
максимума, поскольку принцип максимума выражает собой необходимое условие
оптимальности, не являясь, в общем случае, достаточным для оптимальности. Один из подходов, с
помощью которого можно получить достаточные условия оптимальности, связан с методом
динамического программирования [105; 140; 202; 253; 254; 417; 418; 616]. Этот подход уже
был использован в § 1 для получения достаточных условий в дискретных системах. Покажем
возможности этого подхода для задач оптимального управления с непрерывно меняющимся
временем.
1. Начнем с рассмотрения задачи (1.1)-(1.4) с закрепленным временем. Будем пользоваться
обозначениями и некоторыми формулами из § 3. Согласно (3.24) и (3.28) для каждой
допустимой пары (u(t), x{t)), t0 < t < Г, x(t0) = x0, задачи (1.1)-(1.4) справедливы формула
' w
J(tQ, x0, й(-)) = ] S(x(t), u(t), t)dt + s(x(T), T) + K(xQ, t0) (1)
и оценка Ч
O^J(t0,x0,H(-))-J^\[S(x(t),u(t),t)-Smln(t)]dt +
+ Hx(T),T)-Sm.m} + [K(x0,t0)-Kmin(t0)], -(2)
Где
S(x, u, t) = (Kx(x, t), f(x, u, t)) + Kt(x, t) + f°(x, u, t), (3)
S(x, T) = Ф(х) - K(x, Г), (4)
^K^W^to^'"'^' s-=JnV(3:'r)' (5)
*-<*> = .¾ KiX' 4)' J* = .е%ыА W J(t°' X' U('));
§ 4. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
487
остальные обозначения см. в § 3. Напомним, что для справедливости соотношений (1), (2)
достаточно было, чтобы функция К(х, t) была определена и непрерывна при всех х е G(t),
t е [t0, Г], обладала кусочно-непрерывными производными К , Kt, а функция К(х(т), т)
переменной т для любой допустимой пары (14(1-),,3:(-)) задачи (1. 1)-(1.4)- была, непрерывной и
куеочночтшдкой на отрезке [t0, Г].
Теорема 1. Для того чтобы допустимая пара ('w(t'), aT(t))y t0^ti% Г, ж(*о)=жд,
задачи (1.1)-(1.4) была решением этой задачи, достаточно существования функции К(х, t),
для которой формула (1) верна для любой допустимой пары задачи (1.1)-(1.4) и
s(a?(t),u(t),t) = smin(t), t0^t^r; (6)
s(x(Г), Г) =-W К(х0, ^) =¾^¾¾ (7)
где S(x, и, t), s(x, t), Smin(t), smin, Kmin(t) определяются (3)-(5).
Доказательство этой теоремы следует из того, что при выполнении условий (6), (7) правая
часть оценки (2) обращается в нуль и J(t0, х0, й(-)) = Jt. О
С помощью оценки (2) нетрудно также получить условия, достаточные для того, чтобы та
или иная последовательность допустимых управлений! и. траекторий, была минимизирующей
для задачи (1.1)-(1.4).
Теорема 2. Для того чтобы некоторая последовательность (um(t )\ xm(t)), t0^t^
^ Г, osm(t0) — xOm, m= 1,2,..., допустимых пар-задачи (1.1)-(1,.4)5 была'минимизирующей,
достаточно существования функции К(х, t), для которой формула (1) верна для любой
допустимой пары задачи (1.1)-(1.4) и
Ita f S(xm(t),um(t),t)dt = J Smln(t)dt„ (8)
m —* 00 . ,
Jim^ s(xm(T), T) = Smin, Jim^ K(^m, t0) = ATmin(t0) (9)
Доказательство. В оценке (2) вместо u(t), x(t) подставим ит(Л), xm(t) и перейдем
к пределу при т -* оо. С учетом условий (8), (9) получим lim J(io„%m, ит(')) = ^*> ЧТ0 и
требовалось. D
Чтобы пользоваться приведенными в теоремах 1, 2 достаточными условиями оптимальности,
нужно знать функцию К(х, t), с помощью которой строятся функции (3)-(5). Как найти такую
функцию К(х, t), каким условиям она удовлетворяет?
Всякую функцию К(х, t), удовлетворяющую условиям теоремы- 1' [теоремы 2], назовем
функцией Кротова задачи (1.1)-(1.4), соответствующей допустимой.паре (u(t)]x(t)), ^ ^
•g t ^ Г [или последовательности ("m(*), xm(t)) допустимых пар].
Заметим, что если существует какая-либо функция Кротова К(х, t)j то функцией
Кротова является также функции К(х, t) — К(х, t) + a(t), где a(t) — произвольная
непрерывная, кусочно-гладкая (или абсолютно непрерывная) на (¾. Г] функция. В частности, если
t _
a(t) - - J Sm[n(r)dr + smin, то функции S(x,u,t), s(x,T), построенные по формулам (3),
г _
(4) с заменой К на К = К + а, таковы, что S(x, и, t) - S(x,uj,t)t- Smin(t), s(x, Т) =
= s(x, Г)-smin и, следовательно, inf inf S(x,u,t)^0,.t0^.t'4l', inf s(x, T)=0,
v '^niin X€X(t)ueD(x,t) u xeX(T)
a inf K(x, t0) = Kmin(t0) + a(t0) отличается от Kmin(tQ) на постоянную a(t0). Поэтому в
теоремах 1, 2 без ограничения общности можем принять Sm!n(t) =0, smin = 0.
С учетом этого замечания заключаем, что функция Кротова, соответствующая допустимой
паре (u(t), x(t)) или последовательности (um(t), xm(t)) допустимых пар задачи (1.1)-(1.4),
согласно теоремам 1, 2 удовлетворяет условиям
S(x, и, t) = (Кх(х, t), f(x, и, t)) + Kt (х, t) + f°(x, и, t) Js 0, (10)
ueD(x,t), xeX(t), t0^t,^T;
з(х,Т) = Ф(х)-К(х,Т)?о, xeX(T), K{x,t0)>Kmin(t0), xeX(t0), (ii)
причем неравенства (10), (11) должны обратиться в равенства при u = u(t), x = x(t) или при
и = um(t), х = х (t) в пределе при m —> 00.
Задача (10), (11) для определения функции Кротова несколько: необычна тем, что, во-
первых, здесь мы имеем дело не с дифференциальным уравнением; а< с дифференциальным
неравенством (10) в частных производных, во-вторых, начальное условие при t = T также за-
488
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
дано в виде неравенства и, наконец, задача (10), (11) тесно связана с конкретной допустимой
парой (и(-),х(-)) или последовательностью (ит(-), хт(-)) допустимых пар, подозреваемых на
оптимальность.
Сравнение соотношений (10), (11) с (3.5), (3.6), (3.14) показывает, что функция Беллмана
всегда является функцией Кротова. С другой стороны, функция Кротова определяется из более
широких условии (10), (11), и она может существовать даже тогда, когда функция Беллмана
не существует.
В тех случаях, когда отсутствует удобное для работы конструктивное описание множеств
D(x, t), X(t), функцию Кротова можно попытаться определить из условий, получающихся
из (10), (11) при замене D(x, t), X(t) на V(t), G(t) соответственно.
Проиллюстрируем вышесказанное на примерах. ,
Пример 1. Пусть требуется минимизировать функцию J(u(-))= \(x2(t) — u(t))dt при
о
условиях x(t) = u(t), ж(0) = ж(1) = 0, u(t)e V(t) = {ueEl; |u| < 1}, 0^ t ^ 1.
Здесь фазовые ограничения С?(*)такие: G(0) = G(1) = {0}, G(t) = Е1, 0 < t < 1. Очевидно
пара (u(t) = 0, x(t) = 0) является допустимой для этой задачи. Покажем, что она является
решением задачи. Для этого возьмем функцию К(х, t) = х. Тогда
S(x, и, t) = х2 ^0=S(x(t), ff(t), t) = Smln(t),
s(x, \)=-x=0=s(x(\), 1)= inf s(x, 1), K(x,0)=x=0=K(x(0),0)= inf K(x,0).
v ' xsG(l) xSG(0)
Кроме того, ясно, что формула (1) здесь будет верна для любой допустимой пары. Согласно
теореме 1 тогда пара (u(t) = 0, x(t)=0) оптимальна. Предлагаем читателю найти функцию
Беллмана и синтезирующую функцию этой задачи. {
Пример 2. Пусть требуется минимизировать функцию J(u(-))= \(x2(t) — u2(t))dt при
0
условиях x(t) = u(t), ж(0) = 0, u(t) е V(t) = {и е Е': \и\ ^ 1}, 0 < t ^ 1.
Здесь фазовые ограничения Git) такие: G(0) = {0}, G(t) = El, 0 < t < 1. Возьмем
последовательность пар функций (um(-), хт(-)), где
P-<-t<P+J- [ t-JL Р < + < Р | 1
т<-г^т + 2т> х (t)=) т' т^1^ т^2т'
-1 P- + J-<t <£- + ± 1 _* + £±i P- + -L <t<P- + ±
р = 0, 1,...,т- 1, т-1,2,...
Нетрудно проверить, что пара (ит(-), хт(-)) допустима для рассматриваемой задачи при
всех т= 1,2,... Покажем, что последовательность этих пар является
минимизирующей. Для этого возьмем функцию К(х, t) = t — 1. Тогда S(x, и, t) = х2 + 1 — и2 > 0 =
= min min S^u, t) = lim S(xm(t),um(t),t), s(x,l) = —K(x,\) = 0 = inf K(x, 1) =
г625'|и1<' m->oo i S S1
= lim s(x(\), 1), K(x,0) = -1 = inf K(x,0)= lim К(хт(0),0). Согласно теореме 2
m —* oo x e G(0) m —> oo
последовательность (um(-), xm(-)) будет минимизирующей: lim (um(0) = —1 = J*.
Заметим, что в этом примере inf J (и) = -1 не достигается ни на какой допустимой паре. В
самом деле, если x2(t) = 0, то в силу уравнения x = u(t) = 0n J(0) = 0>— 1. Если же x2(t)^kQ,
то J(u) > — \ u2(t)dt ^ —1. Таким образом, J(u(-) > —1 для всех допустимых управлений и
о
траекторий. В этой задаче мы имеем дело с так называемым скользящим режимом [57; 132;
212; 253; 254; 417; 418; 716]. Предлагаем читателю найти функцию Беллмана и приближенную
синтезирующую функцию этой задачи.
2. Перейдем к рассмотрению следующей задачи оптимального управления с
незакрепленным временем: минимизировать функцию
J(t0, Т, ^, и(-)) = \ f>(x(t), u(t), t)dt +Ф(я(Т), Т) (12)
«о
при условиях
==(*) = /И*), u(t),t), tQ^t^T; x(t0) = xQ, (13)
§ 4. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
489
x(t)eG(t), tg<t<T; и(Г)б5,(Г)Сб(Т), (14)
и = u(t) е V(t), u(t)— кусочно-непрерывна, tg < t < Т, (15)
где моменты tg, Т, в отличие от задачи (1.1)-(1.4), неизвестные и таковы, что
t0ee0, гев,; (16)
"о> "i —некоторые множества на числовой оси —оо< t <оо; остальные обозначения см. в § 6.1.
В частности, если /° = 1, ФеО, то задача (12)-(16) превратится в задачу быстродействия.
Всюду ниже будем предполагать, что tg < Т.
Через А(х, t, Т) обозначим множество всех управлений и(-), определенных на
отрезке [t0, Т], удовлетворяющих условиям (15) и таких, что траектория системы х(т) =
= /(ж(т), и(т), т), x(t) = ig G(t) также определена на отрезке [t, Т], причем х(т) е С?(т),
t ^ т < Т, ж(Т) 6 SX(T). Положим X(t, Т) = {х: х е G(t), А{х, t, Т) ф 0} при t < Т;
Х(Т, Т) = Sy(T). Введем также множество D(x, t, Т) всех тех и е V(t), для которых
существует хотя бы одно управление и(т) е А(х, t, Т) со значением u(t) = u(t +0) = и.
Пару (u(t),x(t)) назовем допустимой парой задачи (12)-(16), если функции u(t),x(t)
определены на каком-либо отрезке [t0, Т], где tg е в0, Те в{, и такие, что ж(*о) = а^ е G(tg),
м(')еД(^, tg, Т), х(-) — траектория системы (13). Если (u(r), х(т)), tn^r ^ т, является
допустимой парой задачи (12)-(16), то и(-) eA(x(t), t, Т), x(t)eX(t,T), u(t)eD(x(t), t,T)
для всех t, tg ^ t < Т.
Моменты времени tg eOQt T* ев{ и допустимую пару (ut(t), xt(t)), определенную на
отрезке [tg, Т*], назовем решением задачи (12)-(16), если
Скажем, что последовательности моментов {tg } £ бд, {Tm} е 0[ и допустимых пар
(um(t), ж (t)), определенных на отрезке [tgm, ZL], являются минимизирующими для
задачи (12)-(Тб), если Jlm^ J(tgm, Tm, zm(tgm), «„(•)) = Jt.
Для формулировки достаточных условий оптимальности снова воспользуемся функциями
S(x, и, t), s(x, Т), определяемыми равенствами (3), (4), причем для случая рассматриваемой
задачи (12)-(16) в (4) вместо Ф(х) будем брать Ф(х, Т). Будем считать, что функции К(х, t)
такова, что формула (1) остается верной для любых допустимых пар задачи (12)-(16) ^для
этого достаточно, чтобы функция К(х, у) была определена и непрерывна при всех х е G(t),
t е [inf 0О, sup б[], обладала кусочно-непрерывными /Г., Kv а функция K(x(t), t) переменной
t для любой допустимой пары (u(t), x(t)), t0^.t < TJ задачи (12)-(16) была кусочно-гладкой
на отрезке [U, Т].
Пусть (u„(t)i ж*(*)) и ("(*)] ж(*)) — какие-либо допустимые пары задачи (12)-(16),
определенные на отрезках [tg*, Т*] и [tg, Т] соответственно. Тогда из формулы (1) получим
J(tg*, Г*, М*о*), 4,(-)W(<b> Т> *(*о)> «(•))= S «К(0. «*(*), *)«**- JS(*(0. «(О. *)«**+
«о* 'о
+ [s(xt(T*), Г*) - в(я(Г), Т)] + [Щ^(*0*), t0*) - K(x(tQ), to)]. (17)
Обозначим
г
Smln= inf inf ? inf inf S(x,u,t)dt,
mln «„64,769, 4хбХ(«,Т)«бВ(^«,Т) (18)
Sm,= inf inf S(X, T), Kgmln= inf inf inf K(X, tg).
mln T6e,x6S,(r) v " 0mln е0бв0Гбв, xSx(f0,r) ^
Учитывая, что для любой допустимой пары (u(t), x(t)), tg ^ t ^ Т, задачи (12)-(16)
имеют место включения u(t) е D(x(t), t, Т), x(t)el((, Т) при всех t, tg ^ t < Т, и «(■) е
еД(*0Ь),%,Т), a(t0)eX(tg,T), ж(Т)еХ(т,Т) = 51(Т), t0ee0, те»,, из (17), (18)
получим следующие неравенства:
О < J(t*,T*,xt(t^),ut(-))-Jt ^ J S(xt(t), 4(t), t)dt-Smln +
^ +KMT*),T*)-Sm]n]+[^K(to*),to*)-K-0mln]. (19)
Неравенства (19) обобщают формулу (2) на случай задач оптимального управления с
незакрепленным временем и представляют собой оценку погрешности, которая будет допущена,
490
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
если допустимую пару (цД£), ж*(*))> *о < * < Т*, задачи (12)-(16) возьмем за приближенное
решение этой задачи. Оценка (19) станет более конструктивной, если в формулах (18),
определяющих величины Smln, smin, -Komin' множества £>(ж, t, Т), X(t, Т) заменим на V(t), G(t)
соответственно.
Опираясь на оценку (19), сформулируем теперь достаточные условия оптимальности для
задачи (12)-(16).
Теорема 3. Для того чтобы допустимая пара (u„(t), xt(t)), t£ ^ t < Т*,
задачи (12)-(16) была решением этой задачи, достаточно существования функции К(х, t),
для которой формула (1) верна для любой допустимой пары задачи (12)-т(16) и
] S(xt(t), 4(t), *)dt = Smin, (20)
Ч
s(xt(T*),T*)^smla, Щ^(<ьФ),<Ь*) = -КЬш1п- (21)
Доказательство. При выполнении условий (20), (21) правая часть оценки (19)
обращается в нуль, откуда и следует утверждение теоремы. О
Теорема 4. Для того чтобы некоторая последовательность (um(t), &m(t)), t0m <
^ t ^ Тт, т = 1, 2..., допустимых пар задачи (12)-(16) была минимизирующей для этой
задачи, достаточно существования функции К(х, t), для которой формула (1) верна для
любой допустимой пары задачи (12)-(16) и
т
Jlm^ J S(xm(t),um(t),t)dt = Smln, (22)
'От
lim S(zm(Tm),Tm) = Smin, limK(xm(t0m),t0m) = K0mln. (23)
lib —* LaJ lib —t tXJ
Доказательство. В оценке (19) вместо ut(t), xt(t), t^, T* подставим соответственно
um(t), xm(t), t0m, Tm и перейдем к пределу при m—too. С учетом условий (22), (23) получим
утверждение теоремы. О
Предлагаем читателю самостоятельно выписать условия, аналогичные условиям (10), (11),
для определения функции Кротова К(х, t) для задачи (12)-(16).
Пример 3. Требуется наибыстрейшим образом перевести точку (х, у) е Е2 из начала
координат (0,0) в точку (1,0), предполагая, что движение точки подчиняется условиям x(t) —
=-y2(t) + u2(t), y(t) = u(t), u(t)eV(t) = {ueEl: |u|<i}, °<* < T-
Здесь G(0) = {(0,0)}, G(t) = E2 при 0 < t ^ T, ^(T) = {(1,0)}, 0o={io=O}, в{={Т:
>0}, /° = 1, Ф = 0, J(T,u(t)) = T.
Пусть Tm — корень уравнения (T - 1)3 = 12(T - 1) — m~2, расположенный в пределах
1 < Т < 1 + т~2/3, т = 1, 2,... Положим
«т(*);
в в 1 Т + 1
р = 0, 1,..., т-1, т = 1, 2,... Через (am(t), J/m(£)), 0< t ^ Tm, обозначим траекторию точки,
соответствующую управлению «„,(•) и начальным условиям жт(0) = ym(0) = 0. Нетрудно ви-
Wiiib,'4Toaim(rm) = l,»m(rm) = 0,(l-m-4/3)t^a!m(t)<t,0<»Ifl(t)<m-2/3npH0<t<rm,
m-=:1,, 2,...
Покажем, что lim Т = 1 = Т* — оптимальное время. Для этого возьмем функцию
m-»oo т .
Щя, J/, *)) = —ж. Тогда
^(ж, у, и, t) = у2-и2 + 1, inf inf S(x,y,u,t)=0
т т т т
при всех t>0, 5т1п=0, f S(zm(i),,/m(i),Um(i),t)di= \у2т(№- \(u2m(t)-\)dt= \y2m(t)dt^
-+0= Smin при т-*оо; s(s, у, T)=-tf(s, у, T)=-as=-°l при (ж, i^eS^T), s(xm(Tm), ym(TJ,
rm)=~l=«min, #(*> J/, 0)=0 при (x, y)eG(0), K(xm(0), j/m(0), 0)=0=¾^. m=l, 2,...
§ 4. ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
491
Кроме того, очевидно, формула (1) для данной задачи будет справедлива при всех
допустимых («(•), ?/(-), «(•))• Таким образом, для последовательностей {Тт}, {(a;m(t), j/„(t), "m(*))}>
0<< < Тт, все условия теоремы 4 выполнены. Следовательно» lim J(Tm,um(-))= lim Тт =
771 —Ъ ОО 771 —^ ОО
= 1 —оптимальное время. Остается заметить, что в рассмотренной задаче inf J(T, и) = 1 не
достигается — здесь, как и в примере 2, мы имеем дело со скользящим режимом.
3. Ниже приведем еще одно достаточное условие оптимальности, касающееся задачи
быстродействия.
Теорема 5. Пусть в задаче (12)-(16) /° = 1, Ф = 0, в0 = (¾}. т. е. начальный
момент tu закреплен; в, = {Т: Т ^ tg}. Пусть имеется некоторая последовательность
(um(t),xm(t)), t0^.t^Tm, 711=1,2,..., допустимых пар рассматриваемой задачи
быстродействия, причем lim Тт = Т*, Тогда для того чтобы Т* было оптимальным временем,
достаточно существования функции К(х, t), для которой формула (1) верна для любой
допустимой пары и, кроме того,
lim J S(*m(t), um(t), t)dt < J Smln(t, T)dt + T*-T (24)
m —* oo , .
для любого T, ^ < T < T*,
lim s(xm(Tm)} Tm) = smin) lim К (^), i0) = K0mln, (25)
где
Для получения формулировки достаточного условия оптимальности для фиксированной
допустимой пары (ut(t), xt( t)), t0^t <Т*, в этой теореме надо принять Tm = T*, um(t) — ut(t),
xm(t) = xt(t), m = 1, 2,..., и в (24), (25) всюду опустить знак lim.
Доказательство. Пусть вопреки утверждению теоремы Т* не является оптимальным
временем. Тогда существуют момент Т, t0^T < Т*, и допустимая пара (u(t), x(t)), tg <
^t ^Т. В формуле (17) вместо tg ■ r*i ("*(*)> ж*(*))> *о ^ * ^ т*< пРимем соответственно
U, Т , (um(t), xm(t)), t0 < t <Tm, и перейдем к пределу при т—»оо. С учетом условий (24),
(25) будем иметь
Jirn^ .7(¼. Tm, ^(¼). um(-)) - .7(¼. T, =:(¾). «(•)) = T* - T <
< lim \ S(xm(t),um(t),t)dt-\ S(x(t),u(t),t)dt<T*-T.
m—*oof t
ч [o
Полученное противоречивое неравенство доказывает теорему. □
Пример 4. Пусть требуется наибыстрейшим образом перевести точку (ж, у) е .Е2 из
положения (1,0) в начало координат (0,0), предполагая, что движение точки подчиняется
условиям x(t) = y(t), y(t) = u(t), u(t)eV(t) = {ueEl; \и\ < 1}, 0<t < Т.
Здесь G(0) = {(1,0)}, G(t)sE2 приО<*<Т, S1(T) = {(0, 0)}, 0Q={to = O}, 6»1 = {T^0}.
В примере 6.2.4 с помощью принципа максимума была найдена допустимая пара
К(*)> &(*), «*(*)). 0 < * < Т* =2, где
U*(t)=tl, l<t<2, *'(t)-\(i-2)V2, l<t<2, ft(t)-l *-2, t<*<2.
Покажем, что эта пара является решением рассматриваемой задачи быстродействия.
Возьмем функцию К(х, y,t) = x — (t - \)у. Тогда S(x, y,u,t) = Кху + Куи + Кt + 1 = -(t -
- l)u + 1, Smin(i, T)= lnf inf S(a;, y, u, t) = -\t - 1| + 1 при всех T и Т ^ 0,
(ге, у) е S21"| sj 1
s(xAt), г/*(*), «*(*), t) = -|t -1| + 1; J s(xt(t), yt(t),ut(t), t)dt - I smln(t, T)dt = Jo -
о or
-It - \\)dt <2- T = T* -T для всех T, 0<T< T* = 2; 3(^,1/^) = -^(2:,1/^) = 0 при
(¾ 1/)6^(^,.(^(^) ,1/,(^),^)=^:^(0=,1/, 0)=1 при(ж,г/)ес(0)=х(0,т) = {(1,0)},
^K(0),%(0),0)=l=-K'omi„-
492
Гл. 7. ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ
Кроме того, очевидно, формула (1) для данной задачи будет справедлива при всех
допустимых управлениях и траекториях. В силу теоремы 5 момент Т* = 2 и пара (xt(-), yt(-), "*(•))
являются оптимальными. Заметим, что функция Беллмана в этой задаче имеет разрывы первой
производной именно на оптимальной траектории [105; 587], в то время как функция Кротова
К(х, t) является просто многочленом.
В заключение упомянем, что функции Беллмана, Кротова тесно связаны с функцией
Ляпунова, широко используемой в теории устойчивости [328].
Упражнения
г
1. Рассмотреть задачу минимизации функции J(u(-)) = \(u2(t) — x2(t))dt при условиях
0
ж(0) = ж(Т) = 0. Показать, что пара (u„(t) = 0, xt(t)=0) является оптимальной при 0< Т < w.
Указание: функцию Кротова искать в виде К(х, t) = ij)(t)x .
2. С помощью принципа максимума найти подозрительные на оптимальность управления и
траектории, а затем доказать их оптимальность для следующей задачи быстродействия:
наибыстрейшим образом перевести точку (а^, %) из заданного состояния в начало координат (0, 0),
предполагая, что движение точки подчиняется одному из следующих условий:
а) x(t) = y(t), y(t) = u(t), u(t)eV(t) = {ueEl: |u| < П, 0< t ^ Т;
б) x(t) = y(t), y\t) = ~x(t) + u(t), u(t)e V(t) = {ue.E': |uKl}, 0<t <T;
B)i(() = s(()+u(t),j(t)=-i(t)+«(t),(B((),»(t))ey(t) = {K«)s£2: |u|<l,H<l},
0^t<T. Указание: функцию Кротова искать в виде К (х, t) = ij)y{t)x + V>2( t)y.
3. Перевести точку (х, у, z) е Е3 из начала координат (0, 0, 0) в точку (а, 0,0) быстрейшим
образом, если x(t) = y(t), y(t) = z(t), z(t) = u(t), u(t) e V(t) = {u eEl: |u|<l}, 0<t<T;
a= const. Показать, что оптимальное время Т* = (32|а|)'/3. Указание: функцию Кротова
искать в виде К(х, t) = ф{^)х + V>2(*)j/ + ^з(*)2.
4. Рассмотреть задачу минимизаций функции
.7(¼. Т, хо, «(•))= J f(x(t),u(t), t)dt +Ф0И<о), <о) + ФИТ), Т)
«о
при условиях (13)-(16). Для этой задачи сформулировать и доказать теоремы, аналогичные
теоремам 1-4.
Часть II
МИНИМИЗАЦИЯ В ФУНКЦИОНАЛЬНЫХ
ПРОСТРАНСТВАХ. РЕГУЛЯРИЗАЦИЯ.
АППРОКСИМАЦИЯ
ГЛАВА 8
Методы минимизации в функциональных пространствах
В части I книги мы занимались задачами минимизации функций конечного числа
переменных и задачами оптимального управления процессами, описываемыми системами
обыкновенных дифференциальных уравнений, Наряду с этими задачами большой интерес для
практики представляют задачи оптимального управления процессами, описываемыми уравнениями с
частными производными, интегро-дифференциальными уравнениями, задачи наилучшего
приближения функций и др. Оказывается, все перечисленные задачи можно трактовать как
экстремальные задачи в подходящим образом выбранных функциональных пространствах, и для
исследования этих задач использовать аппарат и методы функционального анализа. Такая
трактовка позволяет выявить общие закономерности, присущие широким классам экстремальных
задач, создавать и исследовать общие методы решения таких задач. Эти проблемы, а также
вопросы аппроксимации и регуляризации экстремальных задач в функциональных пространствах
составляют основное содержание части II книги.
В главе 8 мы кратко остановимся на элементах теории экстремальных задач в
гильбертовых и банаховых пространствах, на методах их решения, рассмотрим некоторые классы задач
оптимального управления процессами, описываемыми обыкновенными дифференциальными
уравнениями и уравнениями с частными производными. Определение многих понятий,
характеризующих задачи оптимизации (локальный и глобальный минимум, верхняя и нижняя грань
функции, минимизирующая последовательность и т. п.), многих понятий выпуклого анализа
(выпуклое множество, выпуклая функция, проекция точки, субградиент и т. п.) получаются
из определений, приведенных в главах I, 2, 4, нужно лишь в них подточкой теперь понимать
элементы рассматриваемых банаховых и гильбертовых пространств, а вместо |u|, (u,v)
понимать соответственно норму, скалярное произведение в этих пространствах. Поэтому мы здесь,
как правило, не будем заново воспроизводить определения таких понятий и ограничимся
ссылками на часть I книги. Многие теоремы, справедливые в конечномерных пространствах, без
изменений остаются справедливыми и в бесконечномерных функциональных пространствах, и
в таких случаях на соответствующее утверждение мы будем ссылаться в его прежней
формулировке, указывая в контексте, о каком пространстве теперь идет речь. Следует предупредить
неопытного читателя, что имеется немало утверждений, справедливых лишь в
конечномерных пространствах, и их обобщение на бесконечномерные пространства требует
определенной аккуратности и осторожности, В таких случаях мы будем приводить точные формулировки
соответствующих утверждений, иллюстрировать их примерами и контрпримерами,
Напомним, что в главах 6, 7 мы уже рассматривали задачи оптимального управления, в
которых управление принадлежит бесконечномерному функциональному пространству, но
значения фазовой траектории в каждый фиксированный момент времени являются точкой
конечномерного пространства, В задачах оптимального управления процессами, описываемыми
уравнениями с частными производными, значения траекторий будут элементами
бесконечномерных функциональных пространств. Для сохранения связи с главами 6, 7 мы далее в
основном будем придерживаться обозначений из этих глав: целевую функцию (функционал)
будем обозначать через J(u), множество, на котором ищется экстремум этой функции
—через U, элементы множества U—через и, фазовые траектории — через х, пространственную
переменную — через s, а время, как обычно, будем обозначать через t.
Для понимания содержания излагаемого ниже материала достаточно знания начальных глав
функционального анализа и элементов теории функций действительных переменных [258; 350;
357; 371; 393; 444; 705; 768]. Впрочем, заметим, что рассмотрение конкретных классов задач
оптимального управления в главах 8-10 в основном ведется в терминах, связанных с этими
задачами, и для понимания не требует знания элементов функционального анализа.
494
Гл. 8, МЕТОДЫ МИНИМИЗАЦИИ
§ 1. Предварительные сведения. Обозначения
Здесь мы не будем приводить определения линейных, метрических,
нормированных, банаховых и гильбертовых пространств — эти определения, а
также основные свойства этих пространств читатель может найти в [393].
Ограничимся рассмотрением лишь вещественных банаховых и
гильбертовых пространств, не оговаривая этого в дальнейшем. Элементы этих
пространств часто будем называть точкой или вектором. Норму элемента в
банаховом пространстве В будем обозначать через ||w||B, скалярное
произведение двух элементов и, v из гильбертова пространства Н — через {и, v)H.
Напоминаем, что всякое гильбертово пространство Н является банаховым
пространством с нормой ||и||я = ((■", ^)я)1/2- Во всяком банаховом
пространстве В можно ввести метрику, взяв в качестве расстояния р(и, v) между
точками u,v Е В величину р(и, v) — \\и — v\\B. В тех случаях, когда ясно, о
каком банаховом или гильбертовом пространстве идет речь, знаки В и Н
в обозначениях ||и||в, (с, и)н будем опускать и писать просто ||и||, (с,и).
Всюду ниже такие понятия, как ограниченность, сходимость, замкнутость,
полунепрерывность сверху или снизу, компактность, будут пониматься в
сильном смысле, т. е. в смысле нормы или метрики рассматриваемых
банаховых пространств. Если эти понятия будут употребляться в слабом
смысле, то будем говорить о слабой сходимости, слабой замкнутости, слабой
полунепрерывности сверху или снизу, слабой компактности. Определение
некоторых из этих понятий мы приведем и кратко поясним ниже по мере
необходимости.
Кратко остановимся на понятии отображения. Пусть X и Y — два
произвольных множества. Говорят, что на X определено отображение, если
каждому элементу х Е X поставлен в соответствие некоторый однозначно
определяемый элемент yEY. Для обозначения отображения F из X в У
часто пользуются записью y = F(x) или y = Fx или F: X —» Y. В зависимости
от того, какова природа множеств X и Y, вместо общего термина
«отображение» в соответствии с установившимися традициями часто
употребляются термины «функция», «функционал», «оператор» и т. д. В частности, если
Y представляет собой множество на числовой оси Е\ то отображение F:
X —> Е1 часто называют функцией. В классическом вариационном
исчислении, когда в роли X выступают различные функциональные пространства,
вместо термина «функция» часто употребляют термин «функционал». Мы
ниже будем отождествлять термины «функция» и «функционал» — это
позволит нам без изменения формулировок пользоваться многими
определениями и теоремами из части I и в тех случаях, когда X представляет собой
множество из метрического или банахова пространства.
Через В* будем обозначать пространство, сопряженное к банахову
пространству В. Напоминаем, что В* состоит из линейных ограниченных
функций (функционалов), определенных на В. Значение линейной
функции с е В* в точке иЕВ будем обозначать через (с, и)в или (с,и). По
определению, линейная ограниченная функция с такова, что
(с, аи + j3v) = а (с, и) + {3(с, v), \(с, и)\ < М||и||
при всех u,vEB и всех вещественных числах а, (3; М — неотрицательная
постоянная, зависящая от функции с, но не зависящая от иЕВ.
Сопряженное пространство В* само является банаховым с нормой ||с||в. = sup(c, и)в,
§ 1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ. ОБОЗНАЧЕНИЯ
495
где верхняя грань берется по единичному шару \\и\\в < 1. Отсюда следует,
что \(с, и)в\ < ||с||в.||и||в при всех и 6 В, с 6 В*.
Если Н — гильбертово пространство, то для всякой линейной
ограниченной функции на Н найдется элемент с е Н такой, что значение этой
функции в любой точке и Е Н можно представить в виде скалярного
произведения (с, и)н [393]. Поэтому пространство Н*, сопряженное к гильбертову
пространству Н, можно отождествить с самим Н, причем такое
отождествление будет изометричным, т. е. ||с||я. = sup (с, и)н = \\с\\н. Последнее
равенство вытекает из неравенства Коши — Буняковского
\(и,v)h\^ HlffNIff, u,veH.
Гиперплоскостью в банаховом пространстве В называют множество
Г={и: (с, и) = 7},
где с ф О— фиксированный элемент из В*, называемый нормальным
вектором гиперплоскости, а 7 — некоторое вещественное число.
Если X и Y — два банаховых пространства, то прямое произведение
В = X х Y также является банаховым пространством с нормой ||u||B =
= ||ж||;г + \\у\\у элемента и = (х, у) 6 В, и сопряженное к В пространство
В* представимо в виде В* = Х* х Y*.
В банаховых пространствах наряду с понятием сходимости по норме или,
как еще говорят, сильной сходимости, важную роль играет понятие слабой
сходимости. Напомним
Определение 1. Говорят, что последовательность {ик} из банахова
пространства В сходится к точке ие В слабо в В, если
lim (с, ик) — (с, и) при всех с е В*.-
к —»оо
Если последовательность {ик} сходится к точке и сильно в В, т. е.
lim ||ufc — -it|| =0, то {ик} сходится к той же точке также и слабо в В,
к —* оо
так как
\(с,ик)-(с,и)\ = \(с,ик-и)\^\\с\\в\\ик-и\\->0
при к —> оо. Обратное неверно: из слабой сходимости последовательности,
вообще говоря, не следует ее сильная сходимость.
Пример 1. Пусть Н — гильбертово пространство, пусть {еЛ —
некоторая бесконечная ортонормированная система в Н, т. е. (е(,е^)=0
при И ф к и (ек) еЛ = 1, где г, к = 1,2, Возьмем произвольный
элемент с е Н* = Н. Тогда числа ск = (с, ек), к = 1,2,..., представляют
собой коэффициенты Фурье элемента с по системе {ек}. Согласно неравен-
оо оо
ству Бесселя ([393], стр. 151) J2 с1 ^ Нс112> т- е- РЯД 12 с1 сходится. Тогда
lim ск = lim (с, ек) =0 = (с, 0) при всех с еН. Это значит, что последова-
к —»оо к —» оо
тельность {ек} слабо в Н сходится к нулю. Однако ||efc — em||2 =2 при любых
к ф т, поэтому последовательность \ек} не является фундаментальной в
Н и не может сильно сходиться в Н.
В частности, пусть Н = L2[a, b] — пространство Лебега функций и —
ГЬ ч 1/2
J \u(t)\2dt J и со скалярным произ-
496
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
ведением (и, v)Li = $u(i)i>(i)cft. Тогда ортонормированные системы \ек =
а
= V^sin ^¾^}. Ь = V^cos ^¾^} слабо в L,[o, Ь] сходятся
к нулю, т. е. J c(t)efc(t)dt —>0при fc —>оо для любой функции c(t)eL2[a, Ъ].
а
Так как сопряженное пространство В* само является банаховым, то
в свою очередь можно рассматривать второе сопряженное пространство
(В*)* = В**, состоящее из линейных ограниченных функций на В*.
Каждому элементу и Е В можно поставить в соответствие линейную
ограниченную функцию (с, и) переменной с е В*, т. е, некоторый элемент из В**.
Оказывается, это соответствие таково, что норма \\и\\в совпадает с нормой
порожденной им функции (с, и), сЕ В*. Поэтому, отождествляя элемент из
В с порожденной им функцией из В**, получаем изометричное вложение
пространства В в пространство В**. В общем случае указанное вложение
В С В** является строгим, т. е. возможно, что В фВ**. В тех случаях,
когда это вложение таково, что В = В**, банахово пространство В называется
рефлексивным. Всякое гильбертово пространство Я рефлексивно, так как
Я = Я* = Я** [393; 705].
Отображение A: X—>Y, где X, Y — банаховы пространства, называют
линейным оператором, если А(ах+/Зу)—аАх+/ЗАу для всех х, уЕХ и всех
вещественных чисел а, (3. Линейный оператор A: X—>Y называется
ограниченным, если существует постоянная М^О такая, что ||.Aa;||y<M||a;|L
для всех х Е X. Если для каждого линейного ограниченного оператора А
определить норму \\А\\= sup ||Аж||г, то линейное пространство таких ОПе-
раторов превращается в банахово пространство, которое принято
обозначать через С(Х—>Y). Для каждого оператора A EC{X~-*Y) равенство
(с, Ах) = (А*с, х), хЕХ, ceY*
однозначно определяет оператор А* Е (Y* -» X*), называемый
сопряженным к оператору А. Можно показать, что \\А*\\ = \\А\\ [393; 705].
Если X = Y = H — гильбертово пространство, то Я = Я* = Я** и при
каждом А Е£(Н -^Н) сопряженный оператор А*, определяемый равенством
(Аи, v)H = (и, A*v)H, также действует из Я в Я. Поэтому здесь возможно
равенство А = А* — такой оператор А называют самосопряженным.
Приведем определения и обозначения некоторых конкретных банаховых
и гильбертовых пространств, которые нам понадобятся в дальнейшем.
В конечномерном линейном вещественном пространстве R" точек и =
= (и1,..., ип) наряду с евклидовой нормой |и| = ( X} \и'\2) могут быть
введены различные другие нормы. Например, полагая \и\р= (X) \и'\Р)
при 1^р<оо или \и\ = max \и{\, получим различные банаховы простран-
°° 1 ^ i ^ п
ства Лр", 1 ^ р ^ оо. Пространства Щ и Щ, где p~l + q~l = 1 при 1 <р < оо,
q = 1 при р = оо и q = оо при р = 1, являются взаимно сопряженными. В
частности, (Щ)* = Щ = Еп. Заметим, что все нормы в Rn эквивалентны,
т. е. если ||и||г и ||u|L — какие-либо две нормы в Rn, то найдутся числа
с,, ь, > 0 такие, что cjfu^ ^ ||и||д < cju^ при всех и Е Rn. Заметим так-
§ I. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ. ОБОЗНАЧЕНИЯ
497
же, что в любом конечномерном банаховом пространстве понятия сильной
и слабой сходимости равносильны.
Через 1р, 1 ^ р < оо, будем обозначать банахово пространство последо-
(ОО V 1/р
У2 \ик\р)
В случае р = оо под 1Ж понимают банахово пространство
последовательностей и = (и1,.. ик,...) с конечной нормой Hull. = sup|u*|. Можно
к
показать, что lim ||u||, = ||u||, для всех и 6 1^. Сопряженным для I ,
р —»оо р °°
1 ^ р < оо, пространством является пространство lq, где р, q связаны
равенством р'1 + q~l = 1 при 1 < р < оо и q = +оо при р = 1. Описание
сопряженного к 1Ж пространства см. в [258; 371]. Пространство 1р при 1 <р < оо
рефлексивно. Пространство ^ является гильбертовым со скалярным произ-
оо
ведением (и, v), = ]П uivi и с нормой ||и||, =((и, и))1/2.
< = i
Пусть G — некоторое фиксированное измеримое по Лебегу множество
из евклидова пространства Еп. Через Lrp(G), где 1 < р < оо, г — целое
положительное число, будем обозначать банахово пространство измеримых
вектор-функций и = u(t) = (ul(t),..., ur(t)), t e G, с конечной нормой
Nlp = ($M*)IW*)1/P-
/ G
Если p = oo, то через L^(G) будем обозначать банахово пространство
ограниченных измеримых вектор-функций u = u(t) = (ul(t),..., ur(t)) с нормой
\\u\\L = ess sup|u(t)|Br = inf sup |v(t)|Br,
feG " feG
где v = v( t) пробегает множество всех измеримых вектор-функций,
совпадающих с u(t) почти всюду на G. Можно показать, что lim }|mL = ||u|L для
р —» ОО Р °°
всех и е L00(G). Если г = 1, то вместо LTp(G) будем писать просто Lp(G),
1 ^ р ^+оо. Если р = 2, то пространство Ll{G) является гильбертовым
пространством со скалярным произведением
(и, „) = $<u(i), v(t))E,dt = \(± u'(*K(*)W
2 G G4i=l 7
тогда ||t*Ц2, — (""> u)l • Пространство LTp{G) при 1 <p < оо является
рефлексивным, а при p = 1 ир = оо оно нерефлексивно. Сопряженным для L^(G),
1 < р < оо, является пространство LTq(G), где 1 < q < оо, p_1 + q~l = 1, для
L[(G) сопряженным является пространство L^(G); описание
сопряженного пространства для L^G) см. в [258; 371].
Через C(G) будем обозначать банахово пространство непрерывных на
замкнутом множестве G функций с нормой ||u||c = max |u(t)|; это простран-
t £ G
ство нерефлексивно; описание сопряженного к нему пространства см. в
[258; 371].
Пусть множество G из Еп имеет непустую внутренность. Через C°°(G)
будем обозначать множество функций, бесконечно дифференцируемых на
множестве G. Говорят, что функция /(s) = /(sn ..., sn) eL{(G) имеет
обобщенную производную ^/(s)/^ =fs(s) по переменной s4 в G, если fs(s)E
498
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
ELn(G) n\ip(s)fs (s)ds=—\ips(s)f(s)ds для любой функции tp(s)E C°°(G),
G G
обращающейся в нуль в некоторой приграничной полосе множества G;
здесь ips (s) — частная производная p(s) по переменной s{ [441; 492; 648].
Через Hl(G) (или W2l(G)) принято обозначать гильбертово пространство
функций f(s)EL2(G), обладающих обобщенными производными fa(s)E
Е L2(G) по всем переменным s,,..., sn, причем скалярное произведение в
этом пространстве определяется так:
(f,9)H> = l(f(s)9(s)+tLt(s)9Si(s))ds,
а норма имеет вид ||/||я, =((/,/>я01/2-
Через Hm(G) (или W2m(G)) обозначают гильбертово пространство
функций f(s) Е L2(G), обладающих всеми обобщенными частными
производными до порядка т включительно, принадлежащими L2(G); скалярное
произведение в Hm(G) определяется равенством
а норма имеет вид ||/||я- = ((/,/>я™)1/2 [492; 648; 649].
Ниже нам понадобятся пространства H™(G), m^ 1, представляющие
собой обобщение пространств Hm(G) на случай r-мерных вектор-функций.
Приведем соответствующие определения для случая, когда G = [а, b] = {t е
ЕЕ1: а< t < Ъ}, а< Ъ. Через Н™[а, Ъ] обозначим гильбертово пространство
вектор-функций и = u(t) = (ul(t),..., ur(t)) Е L2[a, b], обладающих
обобщит fd'uUt) а1иг<г)\ . ,
щенными производными ■ \ > — I — f '■,..., — > ' ), г = 1,..., т,
принадлежащими ЬЦа, Ь]; скалярное произведение в этом пространстве
определяется равенством
(u, v)Hr = J (<„(*), v(t))E, + £ (¾^. ^>.')*'
норма равна
Удобно считать, что Н°[а, Ъ] = ЬЦа, Ъ]. Можно показать [95; 535; 649],
что если u(t) Е Н™[а, Ъ], m ^ 1, то u(t), u£t ',.,., ту{ ' представляют
собой абсолютно непрерывные вектор-функции на отрезке [а, Ь].
При г = 1 пространство Д.т[а, Ь], как и выше, будем обозначать просто
Нт[а,Ь]. Подпространство функций из Нт[а,Ь\ со свойством "W- = 0<
■ "\ ' = 0, г = 1,..., т — 1, будем обозначать через Я0т[а, Ь].
Подпространство Я0т[а, Ь] замкнуто в Нт[а, Ъ] и поэтому само является
гильбертовым пространством. В Я0т[а, Ъ] наряду со скалярным произведением и
нормой, индуцированными из Нт[а, Ъ], можно ввести скалярное произведение
(и, v)H„ = \ dtA' dtA'dt и норму |Н|Я„ = (И dtA ') dt\ , эквива-
а а
лентную норме ||и||я™, т. е. сЛиЦд-™ < НЧ'я™ ^ ||и||я™, с, = const > 0.
§ 1. ПРЕДВАРИТЕЛЬНЫЕ СВЕДЕНИЯ. ОБОЗНАЧЕНИЯ 499
Пополнение LJa, Ь] в норме sup ',, ,,2 обозначают через
¥>eff04a,b] ]]Пно
Н~1[а, Ь]. Можно показать [458; 557], что получающееся гильбертово
пространство Н~1[а, Ъ] изометрично пространству (Щ[а, Ь])*, поэтому можно
считать, что Н~1[а, Ъ] = (Щ[а, Ь])*. Пространство Н~1[а, Ъ] состоит из
обобщенных функции (распределений), являющихся производными функций из
L2[a, b] в смысле обобщенных функций (например, известная 5-функция
Дирака, являющаяся производной функции скачка Хевисаида, принадлежит
Н-1[а, Ь]).
Пусть Q = Gx{0<£< Г}, GCEn, Т — заданное положительное число.
Через Hm'q(Q) будем обозначать пространство функций f(s, t) е L2(Q),
обладающих обобщенными частными производными г—J) ' > eL2(Q);
д* f(s f) ' " ' S""
0^ i{ + .. , + гп < m, —J'v !J' EL2(Q), г = 1,..., q; это пространство является
гильбертовым со скалярным произведением
(/, я)ш*< = ?(/(', *), 9(; t))H,dt + ft ± ^n^dldsdt
0 Q i = l m m
и нормой \\f\\H*t = ((/, g)H^)l/2.
При постановках краевых задач для уравнении с частными производными
и связанных с ними задач оптимального управления важное значение имеет
понятие следа функции, обобщающее понятие значения функции для
классов разрывных функций. Мы здесь ограничимся следующим определением
(более общие определения см. в [95; 492]).
Определение 2. Пусть Q = {(s, t): 0 ^ s < I, 0 < t ¢. T} и пусть
функция z = z(s, t) Е Ln(Q). Функция g(a)eLl[0, I] называется следом
функции z(s, t) при t = т, если для любого е > 0 найдется число 8 > 0
такое, что для почти всех t 6 [0, Т], для которых \t — т\ < 8, имеет место
неравенство (
S \z(s, t)-g(s)\ds <е.
о
Если след функции z(s, t) при t =т существует, то его будем
обозначать через z(s, т), О < s < I, или z(-, т). Аналогично определяется след
z(s, ■) = z(s, t), О < t < Т, при каждом фиксированном s е [О, I]. Можно
показать, что если след функции существует, то он определяется
единственным образом.
Если функция z(s, t) непрерывна на Q, то след z(-, t) этой функции при
каждом t е [О, Т] совпадает со значением этой функции, представляющим
собой функцию z(s, t) переменной s е [О, I] при фиксированном t.
Пусть z = z(s, t)eLl(Q). Напоминаем, что под элементом из L{(Q)
понимается не одна функция, а класс эквивалентных функций, т. е. функций,
отличающихся друг от друга на множестве нулевой меры. Поскольку
двумерная мера множества UT = {(s, t): О ^ s ^ I, t = т} равна нулю, то
эквивалентные функции на этом множестве могут принимать произвольные
значения или даже могут быть не определены. Поэтому говорить о
значениях функции z(s, t)e L{(Q) при фиксированном t или s не имеет смысла,
а введенное выше понятие следа функции естественным образом обобщает
понятие значения функции для функций из L{(Q).
Однако в общем случае нельзя ожидать, что функция из L{(Q) будет
иметь след при всех значениях t 6 [О,Т] или s 6 [О, I].
500
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Пример 2. Пусть z(s, t) = 0 при 0^ s^ I, Т/(2к) < t < T/(2fc-l),
fc = 1, 2,..., z(s, t) = 1 при 0 < s ^ I; T/(2k + 1) < t ^ T/(2k), к = 1., 2,...
Эта функция принадлежит L[(Q), но при t =0 не имеет следа.
Для того чтобы функция z~z(s, t)eLl(Q) имела след при всех t б[0, Т],
на нее нужно наложить дополнительные ограничения. Например, функция
z(s, t)ELl(Q), обладающая обобщенной производной zt(s, t)eL1(Q),
имеет след при каждом t е [О, Т], и ее можно изменить на множестве двумерной
меры нуль так, что она при всех t е [О, Т] будет иметь значения,
совпадающие со следом почти всюду на отрезке 0^ s < I. Замечательно то, что в этом
случае справедлива формула, обобщающая формулу Ньютона — Лейбница:
I,
J zt(s, t)dt = z(s, b) — z(s, a),
a
где z(s, b), z(s, a), 0 ^ s ^. I, — следы функции z(s, t) при t = b и t = a
соответственно; a, b — любые числа из отрезка 0^ t < Т, причем в
формуле равенство имеет место для почти всех s б [0, /]. Если дополнительно
известно, что z(s, t), zt(s, t)e Lp(Q), 1 ^ p < oo, то следы такой функции
принадлежат Lp[0, I] и непрерывны по t в метрике Lp[0, I], т. е.
lim J \z(s, t) - z(s, r)\pds =0
f->T 0
при всех г € [О, Т]. В частности, если z(s, t) € Hl(Q), то такая функция
имеет следы z{<, t)e L2[0, I] при всех t 6 [О, Т] и z(s, •) е L2[0, Т] при всех
s 6 [О, I], причем указанные следы непрерывно зависят в метрике L2[0, I] и
LJ0, Г] соответственно [492; 648; 649].
Если для функции z(s, t) 6 L2(Q) существует последовательность
izk(s, *)} 6 C°°(Q) такая, что
lim ess sup J |.zfc(s, t) - z(s, t)\2ds =0,
k-,°° f€[0, T] 0
то z(s, t) также имеет след z(-, t)e L2[0, l] при каждом t e [О, T], причем
существует эквивалентная функция, значения которой совпадают со следом
z(-, t) при всех t е [О, Г] [95; 492].
Остальные обозначения, определения и факты из функционального
анализа будем приводить ниже по мере надобности.
§ 2. Теорема Вейерштрасса в функциональных пространствах
1. Пусть U — некоторое множество, a J(u) — функция, определенная на
этом множестве и принимающая на нем конечные вещественные значения.
Для обозначения задачи минимизации [максимизации] функции J(u) на
множестве U, как и выше, будем пользоваться следующей краткой
символической записью:
J(u)->inf, u£U [J(u)->sup, u€U]. (1)
Воспроизведем определения некоторых понятий, которые в главах 1, 2
были введены для задачи (1), когда множество U принадлежит
конечномерному пространству Еп. Функция J(u) называется ограниченной снизу
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 501
сверху] на множестве U, если существует число А такое, что J(u) ^ А
J(u) < А] для всех ueU. Функция J(uj не ограничена снизу [сверху] на
U, если существует последовательность {ик} Е U, для которой lim J(uk) =
к —»оо
= —оо [ lim /(¾) = +оо],
к —»оо
Пусть функция J(u) ограничена снизу [сверху] на4 U. Тогда существует
число а называемое нижней [верхней] гранью функции J (и) на множестве
U и обладающее свойствами: 1) J(u) ^ a [J(u) ^ а] при всех и Е (7; 2) для
любого е > 0 найдется точка ив Е U, для которой J(u6) < а+е [ J{uE) > а— е].
Если J(u) не ограничена снизу [сверху], то в качестве нижней [верхней]
грани J(u) на U, по определению, принимают а=— оо [а = +оо]. Нижнюю
[верхнюю] грань J(u) на U будем обозначать
inf J(u)~Jt [sup J(u) = J*].
Если Jt > —оо [ J* < оо], то можно ввести множества
U, = {ue U: J(u) = JJ [U* = {и е U: J (и) = J*}].
Если Ut^0 [U* фОИ\, то говорят, что нижняя [верхняя] грань в задаче (1)
достигается, а точки ut 6 (7„ [u* 6 J7*] называются точками минимума
[максимума] функции J(u) на С/.
Последовательность {uk} е U называют минимизирующей
[максимизирующей] для функции J(u) на множестве U, если
lim J(uk) = Jt [lim JK) = J*].
к —»oo A; —»oo
Поскольку задача максимизации J {и) —» sup, uE U равносильна задаче
минимизации (—J(u))—»inf, uEU, поэтому в дальнейшем мы будем
рассматривать, в основном, задачи минимизации.
Как и в главе 2, теоремами Вейерштрасса будем называть теоремы,
содержащие утверждение о достижении нижней грани некоторой функции на
каком-либо множестве.
2. Сначала приведем теорему Вейерштрасса, обобщающую теорему 2.1.1
на случай метрических пространств. Для ее формулировки нам
понадобятся понятия компактного множества и полунепрерывности снизу функции
в метрическом пространстве. Напоминаем [371; 393; 705], что множество
М называется метрическим пространством, если каждой паре элементов
u,vEM соответствует вещественное число р(и, v), называемое
расстоянием между элементами и и v, которое удовлетворяет условиям (аксиомам):
П р(и, v)^0 Vu, veM, причем р{и, v)=0 тогда и только тогда, когда и = v,
2) р(и, v) = p(v, и) \/и, v Е М; 3) р(и, v) < р(и, w) + p(w, v) Vu, v, w E M.
Такая функция p: M x M —> E называется метрикой.
Каждое банахово (и гильбертово) пространство В является линейным
метрическим пространством с метрикой р(и, v) = \\и — v\\B. Однако не
каждое метрическое пространство М линейно. Множество О (и, е) = {v Е М:
p(v, и) < е} называется е-окрестностью точки и. Точка иЕМ
называется предельной точкой множества U С М, если любая окрестность точки
и содержит хотя бы одну точку из U, отличную от и. Говорят, что
последовательность точек {ик}, ик Е М, к = 1, 2,..., сходится к точке и, если
lim р(ик,и) = 0. Точка и является предельной точкой множества U то-
к —»оо
гда и только тогда, когда существует последовательность {ик} Е U, ик ф и,
502
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
к = 1, 2,..., сходящаяся к и. Множество U называется замкнутым, если
оно содержит все свои предельные точки. Множество U замкнуто тогда и
только тогда, если любая точка и, к которой сходится хотя бы одна
последовательность {wfc}6 U, принадлежит самому множеству U.
Множество U называется ограниченным, если существует шар S(uq, R) = {и е М:
р(и, г*о)< R} радиуса R с центром в точке г% е М, такой, что U С £(¾ R).
Определение 1. Множество U из метрического пространства М
называется относительно компактным в метрике этого пространства,
если из любой последовательности {%} 6 U можно выбрать хотя бы одну
подпоследовательность (¾ }, которая сходится к некоторой точке v Е М.
Если при этом любая такая точка v принадлежит самому множеству U', то
такое множество U называется компактным в М.
Компактное множество замкнуто, а относительно компактное множество
необязательно замкнуто. Если множество U относительно компактно, то
его замыкание U, которое получается присоединением к U всех его
предельных точек, компактно.
Определение 2, Функцию J (и), определенную на множестве U из
метрического пространства М, называют полунепрерывной снизу [сверху]
в точке и 6 U, если для любой последовательности \uk} € U, сходящейся к
точке и, имеет место неравенство
Jim_ J(uk)^ J (и) \limJ(uk)^J(u)}. (2)
к-too Lfc->oo J
Функция J(u) называется полунепрерывной снизу [сверху] на множестве
U, если она полунепрерывна снизу [сверху] в каждой точке ueU. Функция
J (и) называется непрерывной в точке ueU [на множестве U], если она
полунепрерывна снизу и сверху в точке и [на множестве U].
Определение 3, Говорят, что последовательность {ик} 6 М
сходится ко множеству U СМ, если lim р(ик, (7) = 0, где р(и, U)= inf р(и, v) —
к —»оо не U
расстояние от точки и до множества U.
Заметим, что определение 1, 2, 3 обобщают соответствующие
определения 2.1.1, 2.1.3, 1.1.5 на случай метрических пространств. Нетрудно
убедиться, что леммы 2.1,1, 2.1.2 сохраняют силу и в метрических
пространствах. Справедлива
Теорема 1, Пусть U — компактное множество из
метрического пространства М, функция J (и) определена и полунепрерывна снизу
на U'. Тогда Jt = inf J (и) > —оо, множество и^ = {и е U; J (и) = J„}
непусто, компактно и любая минимизирующая последовательность {ик}
сходится ко множеству Ut.
Эта теорема доказывается так же, как и аналогичная теорема 2.1.1.
Для применения теоремы 1 к конкретным задачам минимизации полезно
иметь критерии компактности и относительной компактности в наиболее
часто встречающихся в приложениях функциональных пространствах.
Например, в пространствах C(G), Lp(G), 1 <р<оо, где G — ограниченное
замкнутое множество из Еп, критерий компактности может быть
сформулирован следующим образом.
Теорема 2. Замкнутое множество U в пространствах C(G),
Lp(G), 1 < р < оо, компактно тогда и только тогда, когда
1) множество U равномерно ограничено, т. е. sup ||u|| < оо;
ue£/
§ 2. ТЕОРЕМА ВЕИЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 503
2) множество U равностепенно непрерывно, т. е. для любого е > 0
найдется число 8 > 0 такое, что sup \\u(t + At) — u(t)\\ < e для всех t,
ue£/ ч
t + At e G, |Д£| < 6; здесь \\u\\ означает норму пространства C(G) или
Lp(G), 1<р<оо.
Если в сформулированной теореме откажемся от требования замкнутости
множества U, то получим критерий относительной компактности в
указанных пространствах; доказательство этого утверждения в C(G) см.,
например, [371; 393; 705] (теорема Арцела), в Lp(G), Up <оо, см. в [371; 492;
648]. Критерии относительной компактности и компактности в различных
других функциональных пространствах читатель может найти в [95; 258;
393; 535; 648; 649; 772]; некоторые такие критерии будут обсуждаться
ниже в § 2.2.
В евклидовом пространстве Еп множество компактно тогда и только
тогда, когда оно замкнуто и ограничено. Доказательство этого факта
существенно опирается на известную теорему Больцано — Веиерштрасса, согласно
которой из любой ограниченной последовательности (¾} еЕп можно
выбрать хотя бы одну сходящуюся подпоследовательность. Однако такая
теорема в метрических пространствах, вообще говоря, неверна. По этой причине,
оказывается, в метрических пространствах замкнутости и ограниченности
множества, вообще говоря, недостаточно для его компактности.
Пример 1. Пусть Я — гильбертово пространство, S{ = {и е Я:
\\и\\ < 1} — единичный шар в Я, пусть {ек} — некоторая бесконечная орто-
нормированная система в Я. Из последовательности {ek}ES{ невозможно
выбрать подпоследовательность, сходящуюся к какой-нибудь точке в
метрике Я. В самом деле, если бы такая последовательность {ек } существовала,
то она была бы фундаментальной в Я [393; 705]. Однако \ек — ет||2 = 2
Угпу^к, и последовательность {ек} не может иметь ни одной
фундаментальной подпоследовательности. Это означает, что шар в любом
бесконечномерном гильбертовом пространстве Я не может быть компактным в метрике
Я.
Пример 2. Пусть U = {u = u(t) eL2[0, 1]: \u(t)\ < 1 почти всюду
на [0, 1]}. Это множество не является компактным в метрике L2[0, 1]. В
самом деле, возьмем последовательность ик = sinжЫ, 0 < t ^. 1, к = 1, 2,. ..
...В примере 1.1 было замечено, что {wfc}-»0 слабо в L2[0, 1]. Однако
1
\\и, - и ||2Г = Г I sin ivkt — sin 7rmi \2dt = 1 ( Vfc ф т, поэтому из {ик} нельзя
выбрать подпоследовательность, которая по норме L2[0, 1] сходилась бы к
нулю. Следовательно, U некомпактно в метрике L2[0, 1].
Пример 3. Множество U = {u = u(t)eC[0, 1]; |u(t)|< 1, 0< i <.1} —
шар в С[0, 1] — некомпактно в метрике С[0, 1], Это может быть доказано с
помощью тех же рассуждений, которые проводились в предыдущем
примере, с учетом того, что из сходимости в метрике С[0, 1 ] следует сходимость
в метрике L2[0, 1],
3. Заметим, что множества, подобные рассмотренным в примерах 1-3,
часто встречаются в прикладных задачах оптимального управления.
Отсутствие свойства компактности этих множеств не позволяет применять
теорему 1 для доказательства существования оптимального управления в таких
задачах. Поэтому желательно иметь такие теоремы Веиерштрасса в
банаховых и гильбертовых пространствах, которые не требуют компактности
504
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
множества в метрике этих пространств. Для формулировки таких теорем
введем несколько понятий, связанных с понятием слабой сходимости в
банаховом пространстве.
Определение 4. Множество U из банахова пространства В
называется относительно слабо компактным, если из любой
последовательности (¾} е U можно выбрать хотя бы одну подпоследовательность {ик },
которая слабо в В сходится к некоторой точке v 6 U. Если при этом такая
точка v принадлежит самому множеству U, то такое множество называется
слабо компактным.
Определение 5, Функцию J (и), определенную на некотором
множестве U из банахова пространства В, называют слабо полунепрерывной
снизу [сверху] в точке ueU, если для любой последовательности (¾} е U,
которая слабо в В сходится к точке и, имеет место неравенство (2).
Функция J(u) называется слабо полунепрерывной снизу [сверху] на
множестве U, если она слабо полунепрерывной снизу [сверху] в каждой точке
и е U. Функция J(u) называется слабо непрерывной в точке и е U [на
множестве U], если она слабо полунепрерывна снизу и сверху в точке и
[на множестве U].
Пример 4. Функция J(u) = (с, и), иЕВ, где с — фиксированный
элемент из сопряженного пространства J3*, слабо непрерывна на J3, что
вытекает непосредственно из определения слабой сходимости.
Пример 5. Функция ./(^) = IMItf слабо полунепрерывна снизу во всех
точках гильбертова пространства Н. В самом деле, пусть (¾} произвольная
последовательность из Н, слабо сходящаяся к точке и. Тогда
J(uk) = \\uk ||2 = \\(uk - и) + и\\2 = ||ufc - и\\2 + 2(¾ ик-и) + \\и\\2 >
^ 2(¾ ик — и) + \\и\\2, к = 1, 2,...
Отсюда, учитывая, что lim (и, ик — и) = 0 по определению слабой сходимо-
к —»оо
сти, получаем: lim 11¾||2 > \\и\\2. Это означает, что функция J(u) = \\и\\2н
к —* оо
слабо полунепрерывна снизу на Н. Отметим, что последнее неравенство
может быть строгим. А именно, возьмем vk = и + ек, к = 1, 2,..., где {еЛ —
какая-либо бесконечная ортонормированная система из Н. Так как {ек}^0
слабо в Н (пример 1.1), то {vk} —> и слабо в Н. Кроме того,
1Ы12 = И2 +2(¾ ек) + \\ек\\2 = \\и\\2 + 2(¾ ек) + 1, к = 1, 2,...,
так что lim \\vk\\2 = \\и\\2 + 1 > ||u||2 Vu е Н. Это означает, что функция
к —»оо
J(u) = \\и\\2н не является слабо полунепрерывной сверху и, тем более, слабо
непрерывной ни в одной точке пространства Н.
Пример 6. Функция ./(^) = -1141^ слабо полунепрерывна сверху
на Н, то она не будет слабо полунепрерывной снизу и, тем более, слабо
непрерывной ни в одной точке Н.
Из примеров 5, 6 следует, что функция может быть сильно (в метрике
Н) непрерывной, но она необязательно слабо полунепрерывна снизу или
сверху и, тем более, слабо непрерывна. Более того, нетрудно понять, что
всякая слабо полунепрерывная снизу [сверху] функция сильно
полунепрерывна снизу [сверху], слабо непрерывная функция — сильно непрерывна.
В самом деле, поскольку из сильной сходимости последовательности
вытекает ее слабая сходимость, то множество 0{(и) слабо сходящихся к точке
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 505
и последовательностей гораздо богаче множества 02(и)
последовательностей, сильно сходящихся к этой же точке. Поэтому неудивительно, что то
из неравенств (2), которое выполняется на более богатом множестве Ох(и),
тем более будет выполняться на его подмножестве 02(и), что как раз и
означает, что из слабой полунепрерывности снизу [сверху] функций следует ее
сильная полунепрерывность снизу [сверху], а из слабой непрерывности —
ее сильная непрерывность.
Далее, сформулируем один важный критерий относительно слабой
компактности множеств в рефлексивных банаховых пространствах.
Теорема 3. Множество U из рефлексивного банахова
пространства В относительно слабо компактно тогда и только тогда, когда
оно ограничено (в метрике В ).
Эта теорема представляет собой обобщение конечномерной теоремы
Больцано — Вейерштрасса, Ее доказательство см. в [705, стр. 210].
Пример 7. В бесконечномерном гильбертовом пространстве Н
рассмотрим единичный шар S{={uE U: ||u|| ^ 1}, Выше мы выяснили (пример
1), что шар не является компактным в метрике Н, Покажем, что шар Sy
слабо компактен. Возьмем произвольную последовательность {uk} 6 S{. Так как
||ufc|| < 1, к = 1, 2,,,., то согласно теореме 3 из {ик} можно выбрать
подпоследовательность {ик }, которая слабо сходится к некоторой точке v 6 Н.
Отсюда с учетом слабой полунепрерывности снизу .функции g(u) = \\и\\2
(пример 5) имеем: g(v) = \\v\\2 ^ lim 11¾ ||2^ lim \\ик ||2^1. Это означает,
т—* оо т т—юо т
что щей1,, Слабая компактность единичного шара в Н установлена.
Из теоремы 3 следует, что открытый шар {иеН: ||и||<1} и сфера {иеН:
||u|| = l} относительно слабо компактны, но не являются слабо компактными.
Другие примеры слабо компактных множеств и слабо полунепрерывных
снизу функций будут приведены ниже. Сейчас сформулируем и докажем
другой, так называемый слабый вариант теоремы Вейерштрасса,
Теорема 4, Пусть U — слабо компактное множество из банахова
пространства В, функция J (и) определена и слабо полунепрерывна
снизу на U. Тогда J4 = im J(u) > —оо, множество Ut = {uE U: J {и) = Jt}
непусто, слабо компактно.
Доказательство. Возьмем произвольную минимизирующую
последовательность {иЛ: uk е U, к = 1, 2,..,, lim J(uk) = J4, Так как U — слабо
к —» оо
компактное множество, то {иЛ имеет хотя бы одну подпоследовательность,
слабо сходящуюся к некоторой точке из U. Пусть ut е U — одна из таких
точек и пусть подпоследовательность {ик } слабо сходится к u„. Пользуясь
определением нижней грани и слабой полунепрерывностыо снизу функции
J(u), имеем
J, < JM < JiHL J(uk ) = }im J(uk) = J*,
m —* oo m к —» оо
т. e. J(uJ = J4, Отсюда следует, что J4 > -оо, u4 е Ut, т. е. Ut ф 0. Покажем,
что множество Ut слабо компактно. Возьмем произвольную
последовательность {vk} е Ut. Так как {vk} е U — слабо компактное множество, то
существует подпоследовательность {vk }, слабо сходящаяся к некоторой точке
v.e U. Но J(vk) = Jt, к = 1,2,,.,, поэтому lim J(vk) = J4, т, е. {vk} — мини-
к —* оо
мизирующая последовательность. Из вышедоказанного следует, что г>4 б Ut.
Это значит, что множество Ut слабо компактно. Теорема 4 доказана.
506
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
4. Для удобства пользования теоремой 4 желательно иметь набор
сравнительно легко проверяемых достаточных условий слабой компактности
множеств и слабой полунепрерывности снизу функций в банаховых
пространствах. Приведем несколько таких условий. Для их формулировки нам
понадобятся понятия выпуклого множества, выпуклой функции, которые
в банаховых пространствах определяются дословно также, как в
соответствующих определениях 4,1.1, 4.2,1, Кроме того, ниже нам понадобится
следующая важная
Теорема 5 (Мазур). Если последовательность {ик} из
банахова пространства В сходится к точке и слабо в В, то существует
последовательность {vk} выпуклых комбинаций точек {ик}, т. е,
к к
^ = 1)¾¾) Еак = 1. "fci^O, «'= 1,,..., ft,
i=l г=1
такая, что {vk} сходится сильно в В к той же точке и.
Доказательство этой теоремы см,, например, в [357, стр. 173],
Теорема 6. Всякое выпуклое замкнутое ограниченное множество
U из рефлексивного банахова пространства, В слабо компактно.
Доказательство. Пусть {ик} — произвольная последовательность
из U, Так как по условию множество U ограничено (в метрике В), то
последовательность {ик} ограничена и по теореме 3 найдется
подпоследовательность {ик }, которая слабо сходится к некоторой точке v 6 В. В силу
теоремы 5 тогда найдется последовательность {vk } выпуклых комбинаций
точек ик , т = 1, 2,,,,, которая сильно сходится к той же точке v. Однако
vk е U, "т = 1, 2,..,, в силу выпуклости U. Из сильной сходимости {vk } к
v и сильной (в метрике J3) замкнутости U следует, что vEU. Это означает,
что множество U слабо компактно. □
Приведем пример, показывающий, что в теоремах 3, 6 требование
рефлексивности пространства существенно.
Пример 8, Рассмотрим множество St = {u = u(t)ELl[— 1, 1]: ||u||£ =
i
= $ \u(t)\dt < 1} — единичный шар в банаховом пространстве ЬЛ[-\, 1],
-1
Сопряженное к L, [-1,,1] пространство' совпадает (изометрично) с
пространством £„,[—1, 1] и значение произвольного линейного непрерывного
функционала с = с(£) 6 L^—l, 1] на элементе и■ = u(t) 6 L{[— 1, 1] равно
1
(с, и) = J c(t)u(t)dt. Возьмем последовательность
-1
ик =UJb(*)'='
' - ' 1*1 <, 1,, ft = 1,2,,..
Очевидно, \\uk\\L = 1, ft = 1,2,,,., так что {ик} е S{, Допустим, что
из последовательности {uk(t)} можно выделить подпоследовательность
{ик (£)}, сходящуюся к некоторой функции. v—v(t) слабо в LL[— 1, I]1,.т. е.
1 1
lim J c(t)uk (t)dt= \ c(t)v(t)dt Vc = c(t}eL-00[-l, 1], В частности, для
m~* °° _ i m _i
l i'
c = c(£) = l отсюда имеем: lim $1-¾. (t)dt = l= $ v(t)dt. Это значит,
m —>oo _. m i
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 507
что ||'V'(*)'| > 0 на множестве Е С [—1, 1], имеющем меру mesE > 0. Далее,
воспользуемся неравенством Чебышева:
mes{t: |*| < 1, \v(t)\^ А} < j *\ \v(t)\dt,
-i
справедливым при всех А > О. Это неравенство вытекает из оценки:
1
[\v(t)\dt = I \v(t)\dt+ $ \v(t)\dt^Ames{t:\t\^l,\v(t)\^A}.
-1 {Ht)\>A} {Mt)\<A}
Возьмем число А столь большим, чтобы mes{i: |t| < 1^ \v(t)\ ^ A} <
< -rmesE. Кроме того, выберем число 6 >0 столь малым, чтобы 25 <
< -mesE. Введем множество E^ — EXHt: \t\ < 6}U{t; |t|< 1, \v(t)\ ^ .A}).
Нетрудно видеть, что mesE{ > ^mesE > 0 и \v(t)\ > 0 Vt e Ex.
Определим функцию CqU) следующим образом: c0(t)=v(t) \/t €. Elt ^(4)=0
Vt 'фЕл.. Так как |Co(*)| < A Vt e [—1, 1] и измерима, то ^(t) e LM[-l, 1].
1 :1
Кроме того, \lc0(t)v(t)dt = Iv2(t)dt>О, поэтому lim J c^(t)ufc (t)dt =
-1 is, m-,oo_[
1
= S c0(t)v(t)dt >0, С другой стороны, CQ(t)uk (£) = 0 Vt 6[—1, 1] для всех
номеров к, для которых щг < 8, поэтому lim $c0(iW (£)<й=0. Про-
ZKm m->oo_[ m
тиворечие. Это означает, что из последовательности {ик} 6 S{ невозможно
выбрать подпоследовательность {ик }, слабо сходящуюся к какой-либо
точке из Ly[— 1, 1]. Следовательно, единичный шар в L {[— 1, 1] не является
относительно слабо компактным и, тем более, слабо компактным.
Остается заметить, что Sl — выпуклое замкнутое ограниченное множество из
В = Ll[—l, 1], однако условие рефлексивности пространства В, требуемое
в теоремах 3, 6, здесь не выполнено.
Приведем два примера слабо компактных множеств в пространстве
LT2(G), где G— ограниченное замкнутое множество из Еп.
Пример 9. Пусть V — выпуклое замкнутое множество из Ег, пусть
U = '{и = u(t)E Ll(G); u(it) е V почти всюду на G]. Нетрудно видеть, что
U — выпуклое множество. Убедимся, что U замкнуто в метрике L2(G).
Возьмем произвольную последовательность {uk(t)} 6 U, сходящуюся в
метрике LUG) к некоторой функции u(t)e L^G). Тогда найдется [393,
стр, 388] подпоследовательность {ик (£)}, сходящаяся к той же функции
u(t) почтишсюду на G. Поскольку V — замкнутое множество и ик (t)e V
почти всюду,на G, то при т —>оо отсюда получим u(t)eV почти всюду на
G. Замкнутость множества (/.доказана. Если множество V еще и
ограничено, то U — ограничено в метрике Lr2(G). По теореме 6 тогда множество
U ;слабо компактно в LT2{G).
Пример 10. Пусть U = {ai = u(t)=(ul(t), .. .,ur(t)) е Lr2(G):
а.(*'') :¾ u^t) <Д(£) почти всюду на G, i = 1,..., г}, где a{(t) ^ Д-(t),
г — 1,. ,,.,/г., — заданные функции из L2(G), Покажем, что U замкнуто в
метрике LT2(G), Пусть последовательность {uk(t)} Е U сходится к u — u(t)
по норме LT2(G), Тогда найдется [393, стр, 388] подпоследовательность
{ик (£)}, сходящаяся к той же функции u(t) почти всюду на G, Но
а$) < ulk (£) < «| ;(*) < Д(*) почти всюду на G, г = 1,,,,, г, т = 1, 2, .,.
508
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Отсюда при т —>оо получим a{(t)^и'(t)^. f3{(t) почти всюду на G для всех
г = 1,..., г. Следовательно, u(t) Е U, т. е. U замкнуто в метрике Lr2(G),
Нетрудно видеть, что U выпукло и ограничено в метрике Lr2(G). Согласно
теореме 6 множество U слабо компактно. В метрике LV2{G) эт0
множество, как видно из примера 2, при a{(t) ф /3;(£), г = 1,..., г, не является
компактным.
Приведем один критерий слабой полунепрерывности снизу функции.
Теорема 7. Пусть U — выпуклое множество из банахова
пространства В, Выпуклая на U функция J (и) слабо полунепрерывна
снизу на U тогда и только тогда, когда J (и) сильно (в метрике В )
полунепрерывна снизу на U.
Доказательство, Необходимость, Пусть J (и) слабо
полунепрерывна снизу на U. Возьмем произвольные точку и 6 U и
последовательность {иЛ 6 U, сходящуюся к точке и в метрике J3, Тогда {ик}
сходится к и слабо в J3, и lim J(uk) ^ J (и). Полунепрерывность снизу на
к —* оо
U функции J(u) в метрике В доказана. Заметим, что выпуклость U и J {и)
здесь не использовалась.
Достаточность, Пусть J (и) полунепрерывна снизу на U. Возьмем
произвольную последовательность {ик}е U, слабо в В сходящуюся к точке
ueU. Выбирая при необходимости подпоследовательность, можем считать,
что lim J(uh) = lim J(uk). Из теоремы 5 следует, что точка и принадле-
A-too k->oo
жит замыканию выпуклой оболочки точек {ик, ик + 1, ...}, где к —любое
иксированное натуральное число. Это значит, что для каждого номера
= 1,2,... найдутся целое число т ^ к и вещественные числа аш > 0,
т т
г = к, к +1,..., т, Е аш = 1 такие. что последовательность vk = ]Г) OLkmiu{
г — к г — к
будет сходиться к точке и в метрике J3, т. е. lim \\vk — и\\ —0. Тогда в си-
к —too
лу полунепрерывности снизу J(u) в точке и имеем lim J(vh) ^ J(u). Из
к —* оо
выпуклости J(u) следует (неравенство Йенсена (4.2.2)):
(т \ т
Е ашЧ)^ Е а^КК^Р^Ю* fc = 1,2,...,
i = к ' i = к i^k
однако lim sup J(u;)= lim J(uk), поэтому, переходя к пределу в предыду-
к —* оо ; > г. к —» оо
щем неравенстве, получим
J(u) < lim J(vh) < lim sup J{ui)= lim J(uk) = lim J(uk).
A-too k-,°°t^k к-too k->oo
Слабая полунепрерывность снизу на U функции J(u) доказана. □
Пример 11, Пусть J(u) = ||u|| — норма в банаховом пространстве В.
Так как ||сш + (1 - a)v\\ ^ а||и||+(1 -а)||г>|| при всех и, v еВ, 0< а < 1, то
J (и) выпукла на В. Далее, из неравенства |||uj| — ||w||| ^ \\и — ик\\ следует,
что J (и) = \\и\\ непрерывна в метрике В во всех точках и Е В. Согласно
теореме 7 тогда J(u) = \\и\\ слабо полунепрерывна снизу на В. Из примера
5 следует, что норма в В не будет слабо непрерывной функцией.
Из теорем 4, 6, 7 следует
Теорема 8. Пусть U — выпуклое замкнутое ограниченное
множество из рефлексивного банахова пространства В, функция J (и)
выпукла и полунепрерывна снизу на U. Тогда J4> -оо, множество £/» непусто,
выпукло, замкнуто, ограничено.
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 509
Приведем несколько примеров задач минимизации, показывающих, что
условия теорем 4, 8 не могут быть существенно ослаблены.
Пример 12. Рассмотрим задачу минимизации функции
J(u)=l(x2(t)-u2(t))dt
о
при условиях x(t) = u(t), 0< £< 1; ж(0) = 0, u = u(t)e U = {u(t)eL JO, 1]:
\u(t)\ < 1 почти всюду на [0, 1]}. Как было показано в примере 7,4,2, в
этой задаче функция J (и) не достигает на U своей нижней грани J4 =
= —1. Заметим, что здесь множество слабо компактно (см. примеры 2, 10).
Функция J (и) непрерывна на U в метрике L2[0, 1], но она не является
слабо полунепрерывной снизу. В самом деле, возьмем последовательность
ик = sin irkt, 0 < t < 1, к = 1, 2,..., слабо сходящуюся к нулю. Нетрудно
проверить, что lim J(uk) = -l/2< J(0)=0, т. е. слабой/полунепрерывности
к —»оо
снизу нет.
Пример 13. Рассмотрим задачу минимизации функции
J(u) = J sign^ - t)u(t)dt
о
при u = u(t)e U = {u(t)eC[0, 1]: |u(i)| < 1, 0< t < 1}. Здесь (/ —
единичный шар в С[0, 1]. Нетрудно видеть, что J (и) > —1 при всех и е U, но
lim .7(¾.) = -1, vp,euk = uk(t) = k(t-5) при |*-п|< к' "МО^^С* _ ^
к —* оо
при |* — i| > р fc = 1, 2, ... Следовательно, J4 = -1, но нижняя грань J (и)
на (7 не достигается. Заметим, что здесь J{u) выпукла и непрерывна в
метрике СЮ, 1] и согласно теореме 7 она слабо полунепрерывна снизу на
С[0, 1] (точнее говоря, она даже линейна и слабо непрерывна на С[0, 1]).
Кроме того, множество U выпукло, замкнуто и ограничено в С[0, 1].
Однако пространство С[0, 1] не является рефлексивным и множество U не
будет слабо компактным. Любопытно, что на более широком множестве
кусочно непрерывных функций, удовлетворяющих условию |u(t)|^ 1, или
на единичном шаре из £м[0, 1], рассматриваемая функция достигает своей
нижней грани при ut = sign(t - ^), 0 < t ^ 1.
5. Теоремы 4 и 8 отличаются от теоремы 1 тем, что требования к
множеству U в теоремах 4, 8 ослаблены по сравнению с теоремой 1, но зато
на минимизируемую функцию накладываются более жесткие ограничения.
Действуя в этом же направлении, в частности, отказываясь от
требования ограниченности множества U, можно получить другие теоремы Вейер-
штрасса. Приведем несколько таких теорем.
Теорема 9. Пусть U — выпуклое замкнутое множество из
рефлексивного банахова пространства В, функция J (и) выпукла,
полунепрерывна снизу на U и для некоторой фиксированной точки veU
множество Лебега M(v) = {ие U: J(u) < J(v)} ограничено. Тогда Jt > -оо,
множество U„ = {ue U: J(u) = Jt} выпукло, замкнуто, ограничено.
Доказательство этой теоремы проводится так же, как и
доказательство аналогичной теоремы 2,1.2. А именно, сначала устанавливаем,
что нижняя грань J(u) на U может достигаться лишь в точках множества
M(v). Затем доказываем, что множество M(v) выпукло и замкнуто в
метрике В, Кроме того, M(v) ограничено по условию. Применяя теорему 8 к
задаче: J (и) —s- inf, и е M(v) получаем все утверждения теоремы 9. □
510
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Достаточным для ограниченности множества M(v) является условие
lim J(uk) = +00, которое должно выполняться для любой последовательно-
к —» оо
сти {ик} е U, lim ||ufc || = +00 (ср. с теоремой 2,1.3). К функциям, удовлет-
к —» оо
воряющим последнему условию, относятся сильно выпуклые и равномерно
выпуклые функции. Определения 4.3.1, 4.7,1 этих функций сохраняются и
в банаховом пространстве В, надо лишь в них заменить |гл — г?| на норму
||г*—v\\B. Примером сильно выпуклой функции в гильбертовом пространстве
Н является функция J(u) = \\и\\2н, что следует из тождества (4.3.2),
которое справедливо в любом гильбертовом пространстве. Функция •/("") —IMItf
строго равномерно выпукла на Н при всех 7)2 с модулем выпуклости
/1\7-2
6(t)— ( 2 ) tT. В пространствах Lrp(G) и 1р функция J(u) = \\и\\7 строго
равномерно выпукла на всем пространстве при всех 7 ) Р ) 2 с модулем
выпуклости 6(t)= (2) t7, а при 1 <р<2 эта функция строго
равномерно выпукла при всех у > 1 на любом выпуклом ограниченном множестве из
£;(С)или^[191].
Следует сказать, что не во всяком банаховом пространстве существуют
сильно выпуклые функции. Более того, известно, что (с некоторыми
оговорками) в банаховом пространстве В, в котором существует сильно
выпуклая функция на В, можно ввести скалярное произведение и превратить его
в гильбертово пространство. Не обсуждая возникающие здесь тонкие
вопросы, мы ограничимся рассмотрением сильно выпуклых функций лишь на
выпуклых множествах из гильбертовых пространств. Отметим, что сумма
любой выпуклой функции и сильно [равномерно] выпуклой функции
является сильно [равномерно] выпуклой, так что классы сильно [равномерно]
выпуклых функций в упомянутых пространствах достаточно богаты.
Приведем формулировки теорем Вейерштрасса для сильно выпуклых и
равномерно выпуклых функций, аналогичных теоремам 4.3,1, 4.7.1.
Теорема 10. Пусть U — выпуклое замкнутое множество из
гильбертова пространства Н, а функция J(u) сильно выпукла и
полунепрерывна снизу на U. Тогда:
1) множество Лебега M(v) = {u е U: J (и) < J(v)} выпукло, замкнуто
и ограничено при всех v е U;
2) J4 > —00, Ut ф 0, причем Ut состоит из единственной точки ut;
3) любая минимизирующая последовательность {ик} сходится к
точке % по норме Н, причем
2Х1К - иЖ ^J(uk) ~ -^Ю) к = 1, 2,...
Теорема 11. Пусть U — выпуклое замкнутое множество из
рефлексивного банахова пространства В, функция J (и) равномерно
выпукла и полунепрерывна снизу на U. Тогда:
1) множество Лебега M(v) = {u£ U: J(u)^. J(v)} выпукло, замкнуто
и ограничено при всех v е U;
2) Jt > -00, Ut ф0, причем Ut выпукло, замкнуто и ограничено;
3) если, кроме того, функция J(u) строго равномерно выпукла на U,
то Ut состоит из единственной точки щ и всякая минимизирующая
последовательность {ик} сходится к точке ut по норме В, причем
«(K-uJK-'KWK), fc = l,2,...
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 511
Доказательство теорем 10, 11 полностью аналогично доказательству
теорем 4.3.1, 4.7.1 соответственно. При рассмотрении возникающей по ходу
доказательства задачи: J (и) —» inf, и е M(v) вместо теоремы 2.1.2 здесь
нужно ссылаться на теорему 9.
Теоремы 1,4, 8-11 широко используются в различных приложениях: при
доказательстве существования решения в задачах оптимального
управления, при доказательстве существования элемента наилучшего приближения
в теории приближения функций и т. д. Некоторые из таких приложений
будут рассмотрены ниже. Более тонкие теоремы существования,
учитывающие специфику конкретных классов задач оптимизации, можно найти в
[132; 211; 393; 399; 465; 645; 687; 722] и др.
6. Отдельно остановимся на одном важном классе задач минимизации:
J(u) = ||Au-b|||.-»inf, и£Ц (3)
где А — линейный непрерывный оператор, действующий из гильбертова
пространства Н в гильбертово пространство F, т. е. А е С (Я —» F),
Ъ — заданный элемент из F, U—заданное множество из Н. Функцию
J(u) = \\Au— Ь\\% называют квадратичной. Задача (3) возникает во
многих приложениях, ей посвящена обширная литература (см., например, [459;
496], библиографию к ним). В частности, если А — матрица размера тхп,
U — H = En, к задаче (3) приводит метод наименьших квадратов решения
системы линейных алгебраических уравнений Аи = Ь. Ниже мы увидим, что
многие задачи оптимального управления линейными системами могут быть
записаны в виде задачи (3).
Покажем, что функция J(u) = \\Аи — Ь\\% слабо полунепрерывна снизу на
Н. Этот факт нетрудно установить с помощью теоремы 7, однако мы здесь
приведем для него прямое доказательство. Возьмем произвольную точку
и € Н и произвольную последовательность {ик}, слабо в Н сходящуюся
к этой точке. Покажем, что тогда последовательность {Аик} слабо в F
сходится к точке Аи. С этой целью воспользуемся равенством (Аик, c)F =
= (ик, А*с), справедливым для всех ceF, к = 1,2,..., где А*е£ (F—>Н) —
сопряженный к А оператор. Перейдем в этом равенстве к пределу при
к —» оо. Учитывая, что {ик} —» и слабо в Н, получим
lim (Аик, c)F = llm (А*с, ик)н = (А*с, и)н = (с, Au)F Vc € F.
к —»оо к —* оо
Это означает, что {Аик} —> Аи слабо в F. Тогда {Аик — Ь} —> Аи — Ь
слабо в F. Пользуясь тем, что функция ||/1|| слабо полунепрерывна снизу
(см. пример 5), имеем: lim J(uk) = lim \\Аик - b\\2F ^ \\Au - b\\2F = J(u).
к —> оо к —юо
Слабая полунепрерывность снизу функции J(u) на Н установлена.
Отсюда и из теоремы 4 вытекает
Теорема 12. Пусть U — слабо компактное множество из Н.
Тогда задача (3) имеет хотя бы одно решение, т. е. J, > 0, Ut = {и е U:
J(u)=Jt}^0.
Задачу (3) и теорему 12 проиллюстрируем на примерах задач
оптимального управления.
Пример 14. Рассмотрим задачу:
J(u) = \x(T;u)-b\%„->in{, иеЦ (4)
где х = x(t) = x(t; и) = (xl(t), ...,xn(t)), t0 < t < Г,—решение системы
x(t) = D(t)x(t) + B(t)u(t), t0^t^T; x(t0) = 0, (5)
512
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
t — время, и = u(t) ~ (ul(t),..., ur(t)), t0 < t < Г, моменты t0, Т
заданы, U — заданное множество из LT2[tQ, Т], D(t) = {dl}.(t)}— матрица
размера п х п, B(t) = {Ьу(*)} — матрица размера пх г, d{].(t) е L^[to, Т],
М*) €L^[tQ, Т] (например, db-(t), bi}.(t) — кусочно-непрерывные функции
на [*0, Г]), Ь — заданный вектор из Еп, Согласно теореме 6.1.2 задача
Коши (5) при каждом фиксированном и = u(t) е LT2[t0, Т] имеет, притом
единственное решение x(t; и), t0 < t < Т (см. определение 6.1.1). Поэтому
функция (4) определена при всех и е LT2[t0, Г]. Задача (4), (5) имеет
простой геометрический смысл: среди всех управлений и е U ищется такое,
для которого правый конец х(Т; и) траектории был бы как можно ближе к
заданной точке Ь. Функцию J (и) из (4) часто называют терминальной.
Покажем, что задачу (4), (5) можно представить в виде задачи (3). С этой
целью введем оператор
Аи = х(Т;и), (6)
который каждому управлению и = u(t) е ЬЦЦ, Т] ставит в соответствие
правый конец х(Т; и)еЕп траектории x(t; и). Из единственности решения
задачи Коши (5) следует, что
x(b; аи + {3v)~ ax(t; и) + /3x(t; v)
Vte[t0,T), \/u,veLr2[t0,T], Va,/3€R. ()
Это означает, что оператор А, определенный согласно (6), линейный.
Убедимся, что этот оператор, действующий из гильбертова пространства
H = LT2[t0, Г] в гильбертово пространство F = En, является ограниченным
и, следовательно, непрерывным [393; 705]. В самом деле, из (5) имеем
x(t;u)\= $ 0(т)х(т;и) + В(т)и(т)(1т
й
< Anax X Ыт; u)\dr + Бтах J |и(т)|<*г, to ^ t < Т,
где Dmm= \\D(t)\\L , J3max= ||Б(£)||Л . Отсюда, пользуясь леммой 6.3.1 при
г
4?(t) = \x(t;u)\, a = Dmax, b = J3max$\и(т)\йт, и неравенством Коши — Буня-
ковского получаем оценку <ь
\х{1)и)\Е.<,е^т~^В^\и{г)\а^сЛ\и{1)\Ч^ Vi e[t0,T) (8)
при всех и€ L£[£0, Г]; здесь С0 = ев™»(Т %)Бтаху/Г - t0. Отсюда при t = Т
с учетом (6) имеем
\x(T;u)\ = \\Au\\E„4C0\\u\\L,[toiT]. (9)
Оценка (9) означает, что А — непрерывный оператор, действующий из
H = LT2[t0, Г] в F = En. Таким образом, функция (4) при условиях (5)
представлена в виде J (и) = \\Аи — f\%, и задача (4), (5) сведена к задаче (3).
Отсюда и из теоремы 12 следует, что если множество U слабо компактно в
L£[£0, Г] (см. примеры 9, 10 при G = [t0, Г]), то задача (4), (5) имеет хотя
бы одно решение.
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 513
Пример 15. Рассмотрим задачу
J1(u) = |a;1(T;u)-b1||„-.inf, и е Ц (10)
где ж, = xy(t; и) — решение задачи Коши
xl(t) = D(t)x^(t) + B(t)u(t) + f(t), t0^t^T; xl(t0) = x0, (11)
f(t) = (/'(*), ■ ■ ■, /"(*)) € L%[t0, Г], XQ,be En; остальные обозначения и
предположения те же, что и в примере 14. Очевидно, при /(4) = 0, :¾ =
= 0 задача (10), (11) превращается в задачу (4), (5). Нетрудно видеть, что
решение задачи Коши (11) можно записать в виде
xl(t;u) = x(t;u) + x0(t), to^t^T, (12)
где x(t;u) — решение задачи (5), a ^(i) — решение задачи
^(0=^(4)^(4) + /(4), t0^t^T, x(t0) = x0, (13)
получающейся из (11) при u(t) = 0. Из (6), (12) следует, что х1(Т,и) =
= Аи + Xq(T), и функцию (10) можем представить в виде
J,(u) = \х(Т; и) - Ъ\%„ = \\Аи - Ь\\%.,
где b=bl — x0(T), x(t;u) — решение задачи (5). Таким образом, задача (10),
(11) сведена к задаче (4), (5). Если в (10) множество U слабо
компактно в Ll[t0,T), то из теоремы 12 следует существование решения
задачи (10), (11).
Пример 16. Задача:
J(u)=l\x(t;u)-b{t)\\„dt->mi, иеЦ (14)
щех(Ь;и)— решение задачи Коши (5), Ъ = b(£)€i£[t0, Г], U—заданное
множество из LT2[tQ) Г]; остальные обозначения взяты из задачи (4), (5).
Функцию (14), в отличие от (4), часто называют интегральной. Покажем,
что задачу (14), (5) также можно представить в виде задачи (3). Введем
оператор
Au = x(t;u), t0^t^T, (15)
который каждому управлению и = u(t) е LT2[tQ) Т] ставит в соответствие
траекторию x(t; и) задачи (5). Поскольку x(t; и) непрерывна Hajt0, Г], то
x(t; и) е Lz[t0, Т], и мы можем считать, что оператор (15) действует из
гильбертова пространства Я = L£[£0, Г] в гильбертово пространство F =
= .^2 [*о> Т]. Из равенства (7) следует, что этот оператор линейный. Кроме
того, из неравенства (8) имеем
,т ч1/2
\\Au\\F=(S\x(t;u)\4t) ^CJMI^r,, Cx = {T-t0)C0. (16)
Оценка (16) означает, что A e£(H->F), где H = Lr2[t0, Г], F =L2n[t0, Г].
Таким образом, задача (14), (5) сведена к задаче (3). Если множество U
слабо компактно в L£[i0, Г], то из теоремы 12 следует разрешимость
задачи (14), (5).
514
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Пример 17. Задача:
/,(«)=$ k(i;u)-b,(i)||..di--Mni, иеЦ (17)
где ж, — xy{t\u)—решение задачи Коши (11), b(t) gI2"[L TJ; остальные
обозначения и предположения те же, что и в примерах 14, 15. Пользуясь
представлением решения x{(t;u) в виде (12) и оператором А,
определенным согласно (15), функцию (17) можно представить в виде
т
J,(u) = I \x(t; и) - b(t)\%„dt = \\Аи - Ь\\%,
ч
где Ь — b{t) = bx{t) — x^t), x(t;u) — решение задачи (5), Xq(t) — решение
задачи (13). Таким образом, задача (17), (11) также свелась к задаче (3).
Если множество U слабо компактно в L2[t0, Г], то разрешимость задачи (17),
(11) вытекает из теоремы 12.
Если в задаче (3) оператор А обладает некоторыми дополнительными
свойствами, то в теореме 12 требование на множество U может быть
ослаблено.
Теорема 13. Пусть U — выпуклое замкнутое множество из
гильбертова пространства Н, множество AU значений оператора А на
множестве U замкнуто в Н. Тогда задача (3) имеет хотя бы одно
решение, т. е. Jt > 0, Ut ф 0.
В отличие от теоремы 12 здесь ограниченность множества U не
предполагается, поэтому U необязательно слабо компактно (см. теорему 3).
Доказательство. Так как множество U выпукло, то AU также
выпукло. В самом деле, пусть fuf2eAU. Нам надо показать, что тогда отрезок
[/i,/2] = {/aeF: /,,=0/,+(1-0)^, 0< а <1}€АС/.'Так как/,,/2€ АС/,
то существуют uuu2eU такие, что А.и,=/,, Au2 — f2. Поскольку U
выпукло, то иа = ащ + (1 - а)щ € U Vo € [О, 1]. В силу линейности
оператора А тогда fa=aAul-\-(\-a)Au2=A(aul+(\-a)u2)=Aua, т. е. fa е AU
Vo € [О, 1]. Таким образом, AU — выпуклое замкнутое множество из
гильбертова пространства F. Тогда существует Ьл=РАи(Ь)— проекция точки
Ь на множество A U (см. определение 4.4.1). Этот факт вытекает из
сильной выпуклости функции g(f)=\\f-b\\2F, f е AU и теоремы 10. Так как
ЬА е AU, то bA=Av при некотором v е U-. Кроме того, функция g(f)
дифференцируема и ее производная g'(f)=2(f-b) (подробнее см. § 3). Отсюда
и из теорем 4.2.3, 4.4.1, которые остаются справедливыми в гильбертовых
пространствах, вытекает, что (bA — b, Au—bA) ^0 Vu eU. Тогда
J (и) = \\Au - Ь||2 = ||(Au - ЪА) + (bA- b)\\2 =
= \\Аи-ЪА\\* + 2(ЪА-Ъ,Аи-ЪЛ) + \\ЪЛ-Ь\\>>
>\\bA-b\\2 = \\Av-b\\2 = J(v) VueAU (18)
Это значит, что Jt = inf J (и) = J(v) и, следовательно, v e Ut — {и e U: J(u) =
= Jj. Более того, из (18) следует, что Ut = {и е U: Аи = Av = ЬА}. Теорема
13 доказана.
Для иллюстрации теоремы 13 рассмотрим задачу (4), (5) при U =
= L2[t0, Г]. Тогда множество AU в силу линейности оператора А является
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 515
подпространством в F = Еп. Как известно [192], в Еп всякое
подпространство замкнуто. Таким образом, в задаче (4), (5) при U = L2[t0, Т]
множество A U замкнуто. Отсюда и из теоремы 13 следует, что функция (4) при
условиях (5), U = L2[t0, Т] достигает своей нижней грани хотя бы на одном
управлении. Аналогично доказывается разрешимость задачи (10), (11) при
U = Lr2[t0,T).
Отметим, что задачи (14), (5) и (17), (11) при U = LT2[t0, Т], вообще
говоря, не имеют решения. Покажем это на примере.
Пример If
1
к,
о,
/
1
*€[0,i],
*€(i,l].
kt, t e [0, l),
1, *€(£,1]
:^-^-0 при к -
J(u)= $ \x(t;u)-l\2dt->M, u = u(t)e U = L2[0, 1],
° x(t) = u(t), 0 < t < 1; z(0) = 0.
Очевидно, если u = u(t) = 0, то J(0)>0, если u = u(t)^0, то также J(u)>
> 0, Рассмотрим последовательность
«* = «*(*)=■
Ей соответствуют траектории
a;fc(t) = a;(t;ufc):
i/fc
Следовательно, J(uk)= \ (kt - l)2dt = ^--^0 при к —>оо. Таким образом,
о
последовательность {ик} в этой задаче является минимизирующей, Jt =
=,0, однако нижняя грань не достигается. Остается заметить, что здесь
множество AU не замкнуто в ^ = L2[0, 1]: траектории xk(t) —> 1 в норме
L2[0, 1], но x(t) = 1 не является решением задачи x(t) = u(t), ж(0) = 0 ни
при каком управлении u(t)eL2[0, 1],
7. В различных руководствах по функциональному анализу [258; 348; 3/1; 393; 772]
читатель обнаружит и другие, отличные от приведенных выше, варианты теоремы Вейерштрасса,
основанные на других определениях понятий компактности и полунепрерывное™ функций.
Для того, чтобы облегчить читателю ориентацию в этих вопросах, совершим небольшой
экскурс в топологические пространства. Сначала напомним некоторые определения [371; 393;
772]. . ■ , , ,.,
Определение 6. Пусть .X — некоторое множество. Говорят, что на X задана
топология, если в X выделена система т его подмножеств, удовлетворяющая следующим трем
условиям (аксиомам): 1) 0, X е т; 2) объединение любого числа множеств из т является
множеством из т; 3) пересечение конечного числа множеств из т является множеством из т.
Все множества G £ т называются открытыми; а их дополнения F = X\G — замкнутыми.
Множество X с заданной на нем топологией т называют топологическим пространством и
обозначают через (.X, т).
Заметим, что всякое метрическое пространство М превращается в топологическое
пространство, если открытым Считать всякое множество G С М, которое вместе с каждой своей
точкой и k G содержит и некоторую е-окрестность этой точки.
Определение 7. Пусть (X, т) — топологическое пространство. Окрестностью точки
и&Х называется всякое множество V сХ, содержащее некоторое множество G Ст, которое
в свою, очередь содержит точку и. Окрестностью множества U.cX называется всякое
множество V с X, содержащее множество G С т, которое в свою очередь содержит (7. Точка
и еX называется точкой прикосновения множества U сХ, если каждая окрестность точки
и содержит хотя бы одну точку из U. Совокупность всех точек прикосновения множества
U называется замыканием множества U и обозначается через Uх или просто U. Пусть
U cW сХ. Совокупность всех точек прикосновения множества U, взятых из множества W,
называется замыканием U во множестве W и обозначается через Uw.
Можно показать, что U = Uх тогда и только тогда, когда U — замкнутое множество [393].
516
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Определение 8. Пусть (X, т) — топологическое пространство, U — множество из X.
Точка и е X называется предельной точкой множества U, если каждая окрестность точки и
содержит хотя бы одну точку из U, отличную от точки и,
Определение 9. Пусть (X, т) — топологическое пространство. Говорят, что
последовательность {ик}еХ сходится к точке иеХ в топологии г или, короче, {ик} т-сходится к
точке и, если для любой окрестности G точки и найдется номер N=N(G) такой, что ukeG
при всех fc^JV; точку и называют т-пределом последовательности {ик}. Последовательность
{и^}т-сходится к множеству U, если для любой окрестности G множества U найдется номер
N такой, что ukeG для всех k^N.
Топологическое пространство (X, т) называется отделимым (или хаусдорфовым), если для
любых двух различных точек щ и щ 6 X найдутся окрестность G[ точки щ и окрестность G2
точки «2 такие, что G{ П G2 = 0. В отделимых топологических пространствах всякая
сходящаяся последовательность имеет единственный предел.
Банахово пространство В превращается в топологическое пространство, если в нем
открытые множества ввести как объединение любого числа открытых шаров О (и, е) = {v е В:
Sv — и\\ < е}, где и — произвольная точка из В, е — произвольное положительное число,
веденная таким образом топология называется сильной топологией банахова
пространства В. Сходимость последовательности {ик} к точке и в сильной топологии В эквивалентна
сходимости этой последовательности к той же точке по норме (в метрике) В.
В банаховых пространствах могут быть введены и другие топологии. Для нас наибольший
интерес представляет так называемая слабая топология. Открытыми множествами в слабой
топологии банахова пространства В называются множества, представимые в виде объединения
любого числа множеств вида
G(u, С[, ..., ст, £[, ..., ет) = {veB: \(с0 v) - (с(,и)\ ^е{, г = 1, ..., т}, (19)
где и — произвольная точка из В, т — произвольное натуральное число, с1(..., ст —
произвольные элементы из сопряженного пространства В*, еу ет —произвольные
положительные числа. Заметим, что сходимость последовательности {ик} в слабой топологии В
равносильна слабой сходимости {ик} в смысле определения 1.1,
Следует заметить, что в общем случае топологические пространства могут иметь весьма
замысловатую структуру, в них многие «привычные» представления могут нарушаться. Так,
например, мы «привыкли» к тому, что в метрическом пространстве М точка и является
предельной точкой множества U с М тогда и только тогда, когда существует последовательность
{ик} е U, икфи, к = 1, 2,,.,, которая сходится к точке и в метрике М, Однако в
топологических пространствах это, вообще говоря, не так: предельная точка множества может не быть
т-пределом какой-либо последовательности, принадлежащей этому множеству. Рассмотрим
Пример 19, В пространстве ^ в качестве топологии возьмем слабую топологию,
В этом пространстве возьмем множество U, состоящее из точек ик = V~kek, А: = 1,2
где ек = (0,,,,, 1, 0,,.,) с единицей на к-м месте. Покажем, что точка и = 0 е ^
является предельной точкой множества U в слабой топологии ^ (см, определение 8), Будем
рассуждать от противного: пусть и = 0 не является предельной точкой. Это означает, что
существует окрестность G0 точки и = 0, которая не содержит ни одной точки множества
U, Согласно (19) тогда найдутся натуральное число т, числа еу > 0,,,,, ет > 0,
элементы С[,,.,, ст е £;, такие, что икф G0= G(u = 0, си ,,,, ст, е{,,,., ет) при всех к = 1, 2
= 4sfk>en = mn{eu..ne \>0, Тогда \dl\>.-%, As = 1, 2,. .,
£ 44
:0 = min{e1,..., em}>0. Тогда \c$\ ^,-^, к ■■
/ ч 2 VK
i = l, ..., m, т, e, ||ct-|| = £ ct. ^ 5Z ( "r* ) =+°°- Однако это противоречит условию с{ 6¾.
fc=l fc = lVVA:/ ,
г = 1,..., m. Следовательно, и = 0 — предельная точка множества U, Остается заметить, что
никакая подпоследовательность {цк } е U не, может сходиться слабо в ^ к точке и = 0, так
как {ик } не ограничена в метрике ^.
Отметим, что для множества V = U U{0} точка и = 0 также является предельной и
единственной последовательностью {vk} е V, которая слабо в Ц сходится к точке м = 0и является
стационарной последовательностью vk = 0, к = 1, 2,...
Приведем несколько вариантов теоремы Вейерштрасса в топологических пространствах.
Начнем с формулировки различных определений понятия компактности, общепринятых в
топологии [258; 371; 393; 772].;
Определение 10. Множество U из топологического пространства (X, т) называется
относительно секвенциально компактным, если из любой последовательности (¾} е U
можно выбрать хотя бы одну подпоследовательность, т-сходящуюся к некоторой точке v G X.
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 517
Если при этом любая такая точка v принадлежит самому множеству U, то такое множество
называется секвенциально компактным.
Определение 11. Множество U из топологического пространства (X, т) называется
относительно счетно-компактным, если каждое его бесконечное подмножество имеет хотя
бы одну предельную точку v €Х. Если любая такая точка v принадлежит самому множеству
U, то такое множество называется счетно-компактным.
Определение 12, Система множеств {Ga} из топологического пространства (X, т)
называется покрытием множества U из X, если U e|J Ga. Покрытие {Ga} называется от-
крытым, если все Ga —открытые множества. Если некоторое подсемейство {GLj} покрытия
{Ga} само образует покрытие U, то {Ga«} называется подпокрытием покрытия {Ga}.
Множество U из X называется компактным, если из любого открытого покрытия {Ga}
множества U можно выбрать конечное подпокрытие {Ga , Ga ,..., Ga }, Множество U называется
относительно компактным, если его замыкание Uх компактно.
В метрических пространствах (в частности, в£°ив банаховых пространствах с их сильной
топологией) все три понятия компактности равносильны [371, стр. 43]. Замечательно и то, что
в слабой топологии банаховых пространств эти три понятия компактности также равносильны
(теория Эберлейна — Шмульяна [371], стр. 288-292). В других топологических пространствах
эти понятия, вообще говоря, не будут равносильными, и можно лишь' сказать, что в общем
случае из компактности (определение 12) и секвенциальной компактности (определение 10)
следует счетная компактность [371; 393].
Определение 13. Функция J (и) называется секвенциально полунепрерывной
снизу в точке и€ U, если для любой последовательности {иЛ е U, r-сходящеися к точке и,
справедливо неравенство lim J(uk) ^ J(u). Функция J(u) называется секвенциально ПО-
le —* оо
лунепрерывной снизу на множестве U, если она секвенциально полунепрерывна снизу в
каждой точке u£U.
Теорема 14. Пусть множество U из топологического пространства (X, т)
секвенциально компактно, а функция J(u) определена на множестве U, принимает конечные
значения и секвенциально полунепрерывна снизу на U. Тогда Jt = inf J (и) > —оо,
множество и ={u€U; J(u) = Jt} непусто, секвенциально компактно, и любая минимизирующая
последовательность т-сходится к Ut.
Доказательство этой теоремы аналогично доказательству теоремы 4.
О п р е.д е л е н и е 14. Функция J (и) называется полунепрерывной снизу в точке и е U,
если для любого числа е > 0 найдется окрестность йЕст точки и такая, что J(v) > J (и) - е
для всех v е Ge U U. Функция J(u) называется полунепрерывной снизу на множестве U,
если она полунепрерывна снизу в каждой точке u&U.
Можно доказать, что если U — замкнутое множество, то функция J (и) полунепрерывна
снизу на U тогда и только тогда, когда множество М(с) = {и е U: J (и) ^ с} замкнуто при
каждом с (ср. с леммой 2.1.1).
Теорема 15. Пусть множество U из топологического пространства (Х,т)
компактно (определение 12), а функция J (и) определена на множестве U, принимает
конечные значения и полунепрерывна снизу на U (определение 14). Тогда J^ = inf J (и) > —оо,
множество Ut = {u€ U: J(u) = Jt} непусто, компактно.
Доказательство. На множестве U введем топологию, индуцированную топологией
г пространства (X, г). А именно, открытыми множествами в U назовем все множества вида
GП U, где G Ст. Нетрудно проверить, что все аксиомы топологического пространства здесь
выполняются. Получившееся топологическое пространство обозначим через (Ц г). Множества
М(с) = {ие U: J(u)^c], замкнутые в (X, г), будут замкнутыми и в(Цт), так Что функция
J (и) полунепрерывна снизу на U и в топологии пространства (Цт). Далее заметим, что
произвольное открытое покрытие {G^} множества U в пространстве (X, г), порождает открытое
покрытие {G^ П U} множества U в пространстве (Цт). Поскольку множество U компактно
в (X, г), то из {G^} можно выбрать конечное подпокрытие G^,..., G^. Тогда множества
G, П Ц..., G, П U образуют конечное покрытие множества U в пространстве (Цт). Это
означает, что множество U компактно и в (Цт).
Покажем, что Jt > — оо. Зафиксируем какую-либо числовую последовательность {о^.}-»
-t-oo. Так как множества Ak={u€ U: J(u) ^аЛ замкнуты в силу полунепрерывности
снизу функции J (и), то множества Вк = U \ Аи = {и е U: J(u)> ак}, к = 1, 2,... открыты
в (Цт). Кроме того, произвольная точка v &U будет принадлежать множествам Вк для всех
518
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
номеров к, для которых J(v) > ак. Следовательно, система {Вк} образует открытое покрытие
множества U. В силу компактности U тогда существует конечное подпокрытие Ви ,,.., Вк
множества U., Тогда J (и) ^ min ак > —оо Vu G U, Следовательно, Jt ^ гш'п ак > —оо,
1 < г < т •' 1 < г < т '
Допустим, что функция J(u) не достигает своей нижней грани Jt на множестве U, т. е,
J(u) > Jt Vu G (7. Зафиксируем какую-либо положительную последовательность {ек} —>0. Как
и выше, устанавливаем, что множества Ск = {и е ?7: J(u) > Jt + ек}, к — 1, 2,,.,, образуют
открытое покрытие множества С/. В силу компактности U тогда найдется конечное
подпокрытие CV ,,,,, Cj. множества U. Поэтому J°(u) ^ Jt + min ек = Jt + е, е > 0, Vu е (7,
что противоречит определению нижней грани Jt. Полученное противоречие показывает, что
Ut ф 0. Теорема 15 доказана, D
Читатель, конечно, заметил, что выше при формулировке и доказательстве теорем Вей-
ерштрасса 1, 4, 8-13 этого параграфа мы пользовались понятиями секвенциальной
компактности множества и секвенциальной полунепрерывности снизу функции в соответствующих
топологических пространствах. Это обстоятельство может быть оправдано двумя причинами:
во-первых, проверку секвенциальной компактности множества и секвенциальной
полунепрерывности снизу функции во многих прикладных задачах можно осуществить гораздо проще,
чем других понятий компактности и полунепрерывности снизу, и, во-вторых, для задач
оптимизации, рассматриваемых в метрических и банаховых пространствах с их сильной и слабой
топологией, в которых, как было замечено, все три понятия компактности равносильны;
принятый выше в пп, 2-6 подход не приводит к потере общности.
Упражнения
1 ■•■
1. Показать, что функция J(u)= \ u2(t)dt непрерывна на С[0,1] в метрике С[0, 1], Уста-
о
новить, что на множестве U — {и = u(t) е С[0, 1]: и(0) =0, и(\) = 1} эта функция не достигает
своей нижней грани Jt — 0, Ограничена ли эта функция на и сверху?
2, Пусть J(u)=',j u(t)dt— ii(l), u = u(t)eC[0,1], Доказать, что: 1) эта функция линейна
и непрерывна на'С[0, 1] в метрике этого пространства; 2) на единичном шаре !7 = {u = u(t)e
е С[0, 1]: \u(t)\ < 1,0 < t < 1} эта функция ограничена сверху и снизу, но не достигает на U
ни нижней грани Jt = —2, ни верхней грани J* = 2.
3, Доказать, что в задачах оптимального управления из призеров 14-17 целевые
функции слабо непрерывны на i^c -П* Указание: установить, что если
последовательность {иЛ gLJI^Oi ^1 сходится слабо в iJl^O' -П к функции u = u(t), то последовательности
{x(t; ик)}, {x{(t; u.)} траекторий задач (5), (11) соответственно сходятся к x(t\ и), x{(t; и)
равномерно на [t0, Т].
4. Доказать, что в задачах оптимального управления из примеров 14-17 целевые функции
достигают своей верхней грани на каждом выпуклом замкнутом ограниченном множестве из
5. Выяснить, каким дополнительным условиям должны удовлетворять функции b(t), b{(t)€
ei^I^oi Т], чтобы задачи (14), (5) и (17), (11) были разрешимы на множестве U = L2[t0, Т],
6, Пусть J(u) = j f(u(t))dt. 1) Доказать, что если f(u) непрерывна на Е1, то функция
о
J (и) непрерывна на С[0, 1] в метрике этого пространства,,
2) Доказать, что если \f(u + s) - /(u)| ^C(|u||s| + Is]2) при всех и, s еЕ1, С = const ^0,
то функция J(u) непрерывна на £2(^1 Ч в метрике £21^1 П-
3) Если f(u) полунепрерывна снизу на Е1, то будет ли J (и) полунепрерывной снизу в
метрике С[0, 1] или Ь2[0, 1]?
4) Доказать, что если f(u) выпукла [сильно выпукла] на Е , то J(u) выпукла [сильно
выпукла] на L2[0, 1],
§ 2. ТЕОРЕМА ВЕЙЕРШТРАССА В ФУНКЦИОНАЛЬНЫХ ПРОСТРАНСТВАХ 519
5) Доказать, что если f(u) выпукла и удовлетворяет условию п, 2), то J(u) достигает своей
нижней грани на любом выпуклом замкнутом ограниченном множестве U из L2[0, 1].
7. Доказать, что в рефлексивном банаховом пространстве В шар {и€В; ||u — «q|| $: Я}
слабо компактен.
8. Доказать, что в рефлексивном банаховом пространстве В справедливо равенство ||с||д. =
= max (с, и) при всех с е В*.
HI < 1
9. Доказать, что функция J(u)= \\и— й\\ на любом выпуклом замкнутом множестве U
рефлексивного банахова пространства достигает своей нижней грани (иначе говоря; существует
элемент наилучшего приближения из U рая заданного элемента и е В),.
10. Пусть оператор А€С(В—>F), где В, F—банаховы пространства, В—рефлексивно,
элемент ЬеР задан, U—выпуклое замкнутое ограниченное множество из В. Доказать, что
функция J (и)=\\Аи—b\\2F на множестве U достигает своей нижней грани (ср. с теоремой 12),
11. В пространстве Lr{G), 1 <р<оо, рассмотрим два множества: U{ ={u = u(t)=(u (t);...
...,ur(t))eLrp(G): аД*)-£и'(*);$•$(*) для почти всех t е G, 1 = 1,/.., г}, D"2 = {u = u(t)e
€Lrp(G): ] \u(t)-u(t)\"dt < R"}, где функции й =u(t) € Lrp(G), a.(t), (3{(t) G Lp(G),
г = 1,..., г, и число R > 0 заданы. Доказать, что эти множества слабо компактны в Lp(G),
1 < р < оо, но не компактны в метрике этого пространства. Будут ли эти множества слабо
компактными в L\(G) или ^^(G)? (см. примеры 7, 9, 10).
1
12. Доказать, что функция J(u)= J u*(t)dt не является непрерывной в метрике L2[0,1].
о
Будет ли она полунепрерывной снизу в метрике L2[0, 1]?
1
13. Доказать, что функция J(u)= \ \u(t)\2dt, определенная на Я'[0,1], разрывна в метрике
о
С[0, 1]. Будет ли она полунепрерывной снизу в этой метрике?
14. Пусть Р — линейное нормированное пространство всех алгебраических многочленов на
п п
отрезке [0, 1] с нормой ||u(t)||= max |u(t)|. Положим J(u)= ^ \а{\ для u = u(t)= X) <*j*le
0<<i i=o u j=0
eP. Доказать, что J (и) выпукла на Р, но не является непрерывной на Р. Указание:
рассмотреть последовательность ик = uk(t)= tk - tk+ ', 0:¾ t ^ 1. Будет mJ(u)
полунепрерывной снизу на Р?
15. Пусть J(u) — выпуклая функция на открытом выпуклом множестве U банахова
пространства В, Доказать, что следующие четыре утверждения эквивалентны: 1) J (и)
полунепрерывна сверху в точке v€U в метрике В; 2) J(u) непрерывна в точке v в метрике В; 3^
J(u) ограничена в некоторой окрестности точки v; 4) J(u) ограничена сверху в некоторой
окрестности точки v [233].
§ 3. Дифференцирование. Условия оптимальности
При исследовании экстремальных задач в банаховых пространствах, как
и в случае n-мерного пространства Еп, важную роль играет понятие
производной (градиента) функции.
1. Сначала приведем определение более общего понятия производной
отображения.
Определение 1. Пусть X и Y — два нормированных пространства
и F —отображение, действующее из X в Y и определенное в
окрестности 0(и, 7) = {v е X: \\v - и\\х < 7} точки и. Говорят, что отображение
F дифференцируемо в точке и, если существует линейный непрерывный
оператор F'(u) е С(Х —> Y) такой, что
F(u + h)-F(u) = F'(u)h + a(u, h) Vfr, ||^||х<7. (1)
520
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
где lim M^'ii ' Y = 0. Оператор F'(u) называется производной
(производной Фреше) отображения F в точке и.
Если производная существует, то она определяется однозначно. В самом
деле, если F{(u) и F2(u) — производные отображения F в точке и, то из (1)
имеем
Fl(u)h - F2(u)h = (F;(u) - F2\u))h = ау(щ h) - a2(u, h)
при всех h, \\h\\ < 7, Возьмем произвольный элемент eel, e^O, и
в предыдущем равенстве положим h = te, О < t < t0 = 7/ЦеЦ. Получим
t(F[{u)-F2(u))e = o(t) или (Fl(u)-F2{u))e = ^Y-. Отсюда, учитывая, что
lim ^1=0, имеем F{(u)e = F2(u)e УееХ, Это означает, что Fl(u) = F2(u).
Из (1) следует, что дифференцируемое в точке и отображение
непрерывно в этой точке. Перечислим некоторые простейшие свойства производной:
1) если F(u) = y0 \/и еХ, где у0 — фиксированная точка из У, то F'(u) =
ее 0 УиеХ;
2) если F(u) = Аи, где А Е £(Х -» У), то F'(u) = А \/иеХ;
3) если отображения F и G, действующие из X в У, дифференцируемы
в точке и, то отображение aF + /3G, где а, (3 е Е, также дифференцируемо
в точке и, причем
(aF + /3G)'(u) = aF'(u) + (3G'(u).
Приведем обобщение известной из классического анализа формулы
производной сложной функции [393], Пусть X, Y, Z —три нормированных
пространства, О (и, 7^ — окрестность точки иЕХ, отображение F отображает
окрестность 0(и, j{) в У, у = F(u), 0(у, j2) — окрестность точки у е У, и
отображение G отображает окрестность 0(y,~f2) в ^> Тогда, если
отображение F, дифференцируемое в точке и, a G — дифференцируемо в точке
у, то отображение GF, которое определено в окрестности 0(и, ^),
дифференцируемо в точке и, причем
(GF)'(u) = G'(y)F'(u). (2)
Производная F'(u) отображения F согласно определению 1 является
отображением, действующим из нормированного пространства X в
нормированное пространство У| = С(Х —» У), и, в свою очередь, можно поставить
вопрос о его дифференцируемости.
Определение 2, Пусть отображение F, действующее из X в У,
дифференцируемо в каждой точке некоторой окрестности 0(и, j) = {v еХ:
\\v-u\\x < 7} точки и. Говорят, что отображение дважды
дифференцируемо в точке и, если F'^u) дифференцируемо в этой точке (определение
1), т. е, существует линейный непрерывный оператор F"(u) е С(Х —» У,) =
= С(Х —» С(Х —» У)) такой, что
F'(u + 5) - ^'(«) = *"(v)9 + <*,(«, 5) Vg е X,
„ и ^ ,. 1К(«></)11^ . (3)
1Ы1*<7, wiSo-rar^0-
Оператор ^'(u) называют второй производной отображения F в точке и.
Можно показать, что F"(u) — симметричный оператор, т. е. (F"(u)g)h =
= (F"(u)h)g [768].
§ 3. ДИФФЕРЕНЦИРОВАНИЕ, УСЛОВИЯ ОПТИМАЛЬНОСТИ 521
Аналогично определяются производные третьего и более высокого
порядков [393; 768; 705], В настоящей книге мы ограничимся рассмотрением
лишь первой и второй производных.
Пусть отображение F определено и дважды дифференцируемо в шаре
0(и, 7) = {v Е X: \\v — ull < 7}, причем F"(u) непрерывна в точке и. Тогда
справедлива формула Тейлора [768, стр. 156]:
F(u + h)-F(u) = F'(u)h + l(F"(u)h)h + o(\\h\\2) VfreX, ||fc|Lr<7- (4)
2. Переформулируем определения 1, 2 на случай, когда Х=В —банахово
пространство, Y=El —числовая ось, т. е, отображение F представляет из
себя функцию (функционал), принимающую вещественные значения. Тогда
С(Х—>Y) = £(В—>Е1)=В*— пространство линейных непрерывных
функционалов, определенных на В. Напоминаем, что через (с, и) мы обозначаем
значения линейного функционала сЕВ* на элементе иЕВ. В
рассматриваемом случае определения 1, 2 перепишутся в следующей форме.
Определение 3, Пусть В—банахово пространство, пусть функция
J (и) определена в некоторой 7-окрестности 0(и, 'у) = {v Е В: \\v — и\\ < 7}
точки и. Говорят, что функция J(u) дифференцируема в точке и, если
существует элемент J'(u)EB* такой, что приращение функции J {и) можно
представить в виде
Д7(и) = J(u +h)- J(u) = (J'(u), h) + a(u, h), V/i e B,
11 ||M|x-0 II h ||
Элемент J'(и) называется первой производной (производной Фреше) или
градиентом функции J(u) в точке и,
В том случае, когда В = Н — гильбертово пространство, то Н* = Н и
первая производная J'(u) Е Н, и величина (J'(u), h) превращается в
скалярное произведение в Н.
Определение 4, Пусть В—банахово пространство, функция J (и)
дифференцируема в каждой точке некоторой 7-окрестности О (и, 7) = {v Е
Е В: \\v — и\\ < 7} точки и. Говорят, что функция J (и) дважды
дифференцируема в точке и, если существует линейный непрерывный оператор
J" Е С(В —» В*) такой, что
F'(u + g)- F\u) = F"(u)g + a,(u, g) Vg 6 B,
\\a\\<>v Hm a'("'g)=Q (6)
т<ъ ыно IMI a
Оператор J" называют второй производной функции J(u) в точке и.
Если В = Н — гильбертово пространство, то J" Е С(Н —> Н).
Определение 5, Функция J (и) называется непрерывно
дифференцируемой [дважды непрерывно дифференцируемой) на
множестве U из банахова пространства В, если она дифференцируема
[дважды дифференцируема] во всех точках и Е U и \\J'(u + h) - J'(u)\\B. —>0
[||J"(w + h) - J (и)\\цв->в<)—*®\ ПРИ IIMl ->Q- Множество всех функций,
непрерывно дифференцируемых на U, будем обозначать через CX(U),
дважды непрерывно дифференцируемых на U — через C2(U).
522
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Если J (и) е C2(U), то справедлива формула (4), которая здесь запишется
в виде
J(u + h)-J(u) = (J'(u),h) + ±(J"(u)h,h) + o(\\h\\2), ||Л||<7 (7)
(ср. с формулой (2.2.5)).
Замечание 1. В определении 3 предполагается, что если функция
J (и) дифференцируема в точке и, то она определена в некоторой
окрестности этой точки. Поэтому, говоря о принадлежности функции J (и)
множеству Cl(U), обычно подразумевают существование некоторого открытого
множества If из В, которое содержит U и на котором определена эта
функция. Аналогично, если J (и) е C2(U), то считается, что J'(u)
определена на открытом множестве W, содержащем U.
Замечание 2. Формулы (4), (7) нередко используются для
определения второй производной. Однако при этом надо сознавать, что определение
второй производной из формул (4), (7), вообще говоря, отличается от
определений 2, 4. Рассмотрим
Пример 1. Пусть J(u)=u3 sin - при u^O, J(0)=0. При любом h^O
имеем
J(0 + h)- .7(0) = J(h) = h3 sin i = 0 • h + g0 • h2 + o(\h\2),
так что здесь формула (7) справедлива. Отсюда может показаться, что
функция J (и) имеет производную J"(0), причем J" (0) = 0. Однако нетрудно
убедиться, что у этой функции вторая производная в точке и=0 не существует.
Следуя [768, стр. 161], приведем достаточные условия, когда оба подхода
к определению производной F"(u) совпадают. Пусть при всех u,u + h&
6 0(щ, 'у) = {v Е X: \v — г^| < 7J- выполняется соотношение
F(u + h)- F(u) = ay(u)h + ((^(иЩЪ, + R2(u, h),
где операторы a{(u) e £(X—*Y), o^u) 6 £(X—*£(X—>Y)) ограничены и
непрерывны в 0(uq, 7), (^(и)— симметричный оператор, остаточный член
R2(u, h) обладает следующим свойством: для Ve>0 35>0, что ||-R2(^> Mil ^
< s\\h\\2 Vu, u+h e 0(щ, 7). Тогда отображение F дважды
дифференцируемо в 0(uq, 7) (в смысле определения 2) и F'(u)=al(u), F"(u)—2a2(u).
3. Если функция J(u\ е Cl(U) или C2(U), точка u + theU при всех £,
0< t < 1, то функция f(t) = J(u + th) переменной t принадлежит С"[0, 1]
или С2[0, 1] соответственно, причем, как следует из определений 1-4 и
формулы (2):
f'(t) = (J'(u + th),h), f"(t) = (J"(u + th)h,h), 0<i<l. (8)
Справедливы формулы конечных приращений
1
J(<u+h)-J(u)=l(J'(u+th),h)dt=(J,(u+6lh)th)=-
= (j'(u),h)+^(J"(u+e2h)h,h), о<0,,02<1, (9)
(J'(u + h)- J'(u), h) = (J"(u + 63h)h,h), O<03<1, (10)
J'(u + h)- J'(u)=(\r(u + th)dt)h, (11)
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 523
которые следуют из (8) также, как и аналогичные формулы (2.6.2)-(2.6.5)
(см. ниже упражнение 25). Заметим, что интеграл в правой части (11)
понимается как предел в норме пространства С(В —» В*) интегральных сумм
Римана функции J"(u + th) переменной t 6 [0, 1] (подробности см. в [393,
гл. 10]. В частности, если U — выпуклое множество из банахова
пространства, то формулы (9)-(11) справедливы для всех щи + hEU. Опираясь
на формулу (9), нетрудно убедиться, что лемма 2.6.1 остается верной и в
банаховых пространствах, нужно лишь в определении 2.6.1 класса
функций Cl,l(U) условие Липшица (2.6.6) понимать в смысле неравенства:
|| J'(u) — J'(v)\\„. < L \\и —v\\B \fu, v eU. Свойства выпуклых и сильно
выпуклых функции, описанные в теоремах 4.2.1, 4.2.2, 4.2.4, 4.3.3 и их
доказательства остаются справедливыми и в банаховых пространствах. Критерии
выпуклости и сильной выпуклости функции, составляющие содержание
теорем 4.2.5, 4.4.4, в банаховых пространствах следует переформулировать
несколько иначе.
Теорема 1. Пусть U — выпуклое множество из банахова
пространства В [гильбертова пространства Н], функция J(u)eC2(U) и,
кроме того,
(J"(u)h,h)^0 VheB, VueU (12)
[(J"(u)h,h)Zn\\h\\% VheB, УиеЦ ц = const > 0]. (13)
Тогда функция J (и) выпукла [сильно выпукла] на U.
Если int U Ф 0, то верно и обратное: из выпуклости [сильной
выпуклости] функции J(u) eC2(U) на выпуклом множестве U
необходимо следует условие (12) [условие (13)].
4. Как и в конечномерных экстремальных задачах, с помощью первых
и вторых производных могут быть сформулированы необходимые и
достаточные условия экстремума функций на множествах из банаховых
пространств.
Теорема 2. Пусть функция J {и) задана на банаховом
пространстве В и пусть J(ut) = «/„ = inf J(u). Если J(u) дифференцируема в
точке ut, то необходимо выполняется равенство
ЛЧ).= 0, (14)
а если J (и) дважды непрерывно дифференцируема на В, то необходимо
J'K) = 0. (J"K)e, е)^0, VeeB. (15)
Доказательство. Возьмем произвольный элемент е 6 В и в (5)
положим и = ut, h = te, —оо < t < +оо. Так как в точке минимума Д J(ut) =
= J(ut + te) - J(иХ^-0, то из (5) следует 0< (J'(ut), e)t + o(t) при всех t,
где lim o(t)/t =0. Поделив это неравенство сначала на t >0, затем на t <0,
(->0
и устремив t к нулю, получим (J'(uJ, е) = 0 для всех е ЕВ, что равносильно
условию (14). Если J(u) е С2(В), то из (7) при и = ut, h = te с учетом до-
казанного равенства (14) будем иметь 0 < Д^(ч) = (J"(ut)e, e)-j + o(t2).
Отсюда, деля на t ф 0 и устремляя t —> 0, придем ко второму из
условий (15). □
Как видим, условия (14), (15) представляют собой обобщение известных
необходимых условий безусловного минимума функций конечного числа
переменных (теорема 2.2.1). Нетрудно видеть, что эти условия необходимы не
524
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
только для глобального, но и локального минимума функций на банаховом
пространстве. Отметим, что, в отличие от конечномерных задач (теорема
2.2.2), в банаховых пространствах условия J'(ut) = 0, (j"(ut)e, е) >0, е^О,
не являются достаточными для локального минимума (см. ниже
упражнения 6, 7).
Следующая теорема дает необходимые и достаточные условия минимума
гладких выпуклых функций на выпуклом множестве.
Теорема 3. Пусть U — выпуклое множество из банахова
пространства В, Ut — множество точек минимума функции J(u) на U.
Если в точке ut е Ut функция J(u) дифференцируема, то необходимо
выполняется неравенство
(J'(ut),u-ut)^0 УиеЦ (16)
которое в случае ut е int U превращается в равенство J'fu^) = 0. Если,
кроме того, функция J (и) выпукла на U, то условие (16) является
достаточным для того, чтобы uteUt.
Доказательство этой теоремы проводится так же, как доказательство
аналогичной теоремы 4.2.3.
5. Проиллюстрируем вышесказанное на примерах.
Пример 1. Пусть Н — гильбертово пространство. Тогда функция
J(u) = \\и\\н=(и,и)н дважды дифференцируема во всех точках иеН. В
самом деле
J(u + h)- J(u) = \\и + h\\2H - \\и\\2П = (2и, h)n + (h, h)u V-u, h E H.
Отсюда следует, что J'(u) = 2u. Из формулы (6) тогда имеем J"(u) = 2I,
где I — единичный (тождественный) оператор на Н. Таким образом, J(u) =
= \\и\\% 6С2(Я).
Пример 2. Функция J (и) = \\и\\н = \/(и, и)н дважды
дифференцируема во всех точках и гильбертова пространства, кроме точки и = 0. В самом
деле
J {и + h)— J (и) = \/{и + h,u + h) — \/(и, и) =
у/(U + h,U + h)+ у/(и, U) МИ ' V ' " Г '
где
a(u'h)=\\u+h\\+M + (u>h){}
«II -11« + л||
и«+лц+|1чЛ);"
Отсюда видно, что lim "},"',, ' = 0, так что первая производная J'(u) = тАт,
||л||-.о IIпII г г « \ / ||и||»
ифО. Эту же формулу нетрудно получить по правилу (2)
дифференцирования сложной функции. Аналогично имеем
Это означает, что функция J(u) = \\и\\ дважды дифференцируема на Н при
ифО, причем оператор второй производной J"(u) е С(Н —> Я) действует
7 т" / \ 7 h u(u, h)
на элемент h по правилу: J (u)h = -л—it \ ■
^ J v ' Н ||«||3
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 625
Пример 3. Пусть J(u)= $ f(u(t))dt, где f(u) — функция одной пе-
а
ременной иеЕ\ u = u(t) еС[а, Ь] = В. Покажем, что если f(u)e С2(Е1),
то J(u) е С2(В). Как известно [371, 393], сопряженное к В = С[а, Ь]
пространство В* = (С[а, b])* состоит из функций с ограниченным изменением,
т. е. для каждого элемента д ЕВ* существует функция g = g(t), а^. t < Ь,
ь
имеющая на [а, Ъ] ограниченное изменение, такая, что (д, и)в. = $ u(t)dg,
а
где интеграл понимается в смысле Римана — Стилтьеса (некоторые
определения см. в § 6,4). В частности, если функция g(t) непрерывна и имеет
ь
кусочно-непрерывную производную g'(t), то (д,и)в, = \ u(t)g'(t)dt.
а
Поскольку f(u) е С2(Е1), то
J(u + h)- J(u) = \[f'(u(t))h(t) + \f(u(t))h\t)}dt + a2(u, h), (17)
a
b
где a2(u, h)=\[f(u(t) + e(t)h(t))-f(u(t))]h2(t)dt, 0< 6{t) < 1. Так как
a
f"(u) непрерывна, то при ||fr||c—>0 имеем f"(u(t)+6(t)h(t)) — f(u(t))—>0
равномерно no t e [a, b], так что lim „ "'2 =0. Отсюда и из (17) сле-
дует, что функция J(u) непрерывно дифференцируема во всех точках
ь t
иеВ = С[а, Ъ], причем (J'(u), h)B.= \h(t)dg, где g = g(t)= $ /'(u(r))dr =
a a
= J'(u) e C][a, b]. Кроме того, из (17) вытекает (см. замечание 2)
существование второй производной J"{u), причем
(J"(u)h, h)B. = \(f(u(t))h(t))h(t)dt = \ h(t)(\ f(u(T))h(T)dr).
a a a
Это означает, что оператор второй производной J"(u) действует на элемент
t
h = h(t) по правилу: J"(u)h = $ /"(u(r))^(r)dr б Cl[a, b]. Таким образом,
если f(u)e С\Е% то J(u)eCl\B), а если f(u)e С2(Е]), то J(u)e С2(В).
Пример 4. Рассмотрим функцию
J(u) = \(Au, и)-(Ъ, и), иеН, (18)
где Я — гильбертово пространство, Ае£(Я—>Н), ЪеН. Приращение этой
функции представимо в виде
J(u + h)- J(u) = \({Аи, h) + (и, Ah)) - (b, h) + {(Ah, h) =
= (l(A + A*)u -b,h) + {{Ah, h),
где A* — оператор, сопряженный к оператору А. Отсюда следует, что
J(u)EC2(H) и
J'(u) = \{А + А*)и - Ъ, J"(u) = \(А + А*).
526
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
В частности, если А —самосопряженный оператор, т. е. А* = А, то J'(u) =
= Аи — Ь, J"(u) = А. Если, кроме того, А — неотрицательно определенный,
т. е. (Ah, h) ^ 0 VheH, то J(u) выпукла на Н (теорема 1). Если при
этом множество Ut точек минимума функции (18) на выпуклом
множестве U непусто ('теорема 2.8), то точка ut 6 Ц, тогда и только тогда, когда
(Aut — Ъ, и — uj) ^ 0 \/и 6 U (условие (16)). Если самосопряженный
оператор А является положительно определенным, т. е. (Ah, h)^fx\\h\\2H Vfreff,
fj, = const > 0, то функция (18) сильно выпукла на ff (теорема 1) и на
любом выпуклом замкнутом множестве U из Н достигает своей нижней грани
в единственной точке ut (теорема 2.10), причем если U = Н, то Aut = Ъ.
Последнее равенство лежит в основе метода Ритца [496], сводящего
задачу определения решения операторного уравнения Аи = Ь к поиску точки
минимума функции (18) на ff (см. пример 4.2.4).
Пример 5. Рассмотрим квадратичную функцию
J(u) = \\Au-b\\2F, иеН, (19)
где А е С(Н —> F), Н и F — гильбертовы пространства, Ь е F (см.
задачу (2.3)). Приращение функции (19) представимо в виде
J (и + h)- J(u) = 2(Аи - Ъ, Ah)F + \\Ah\\2F =
= (2A*(Au-b),h)H + (A*Ah,h)H, (20)
где A* 6 C(F —» ff) — оператор, сопряженный к оператору А. Из
формулы (20) следует, что J(u) е С2(Н), причем
J'(u) = 2A*(Au-b), J"(u) = 2A*A (21)
(ср. с формулами из примера 4.2.5). Так как (J"(u)h, h),= (2A*Ah, h)H =
= 2\\Ah\\F ^0 \/h б ff, то функция (19) выпукла на ff (теорема 1). Если
|| A/i Hl^ м11М1я VheH, д = const >0, то функция (19) сильно выпукла на ff
(теорема 1). Если множество Ut точек минимума функции (19) на выпуклом
множестве U непусто (теоремы 2.12, 2.13), то точка ut е Ut тогда и только
тогда, когда
(A*(Aut -Ь),и- ut)H ^0 VueU (22)
Если U = ff, то условие (22) эквивалентно равенству A*(Aut — 6) = 0
(теорема 3).
Пример 6. Рассмотрим функцию
J(u) = \x(T;u)-b\%„, (23)
где х = x(t) = x(t;u) — решение системы
x(t)= D(t)x(t) + B(t)u(t), t0^t^T; x(t0) = 0, (24)
управление u = u(t)eL£[i0, T]; остальные обозначения см. в примере 2.14.
В этом примере было показано, что оператор А, определенный
формулой (2.6)
Аи = х(Т;и), (25)
является линейным непрерывным оператором, действующим из гильбертова
пространства iff = L£[i0, Т] в гильбертово пространство F = Еп, и
функция (23) с помощью этого оператора может быть представлена в виде (19).
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 527
Поэтому, пользуясь результатами примера 5, можем сказать, что
функция (23) выпукла и дважды непрерывно дифференцируема на H = Ll\tQ, Т],
причем ее производные имеют вид (21). Покажем, что оператор А*,
входящий в (21) и сопряженный к оператору (25), каждому элементу ceF =Еп
ставит в соответствие элемент A*cE:H = Ll\tQ, Т] по следующему правилу:
A*c = BT(t)i/)(t;c), i0<i<T, (26)
где ф = V>(*) = Ф(*> с) = (Ф1(*)> • • •> Фп(1)) — решение задачи Коши
</Ч*) = -Ят(*Ж*)> *о<*<Г; ф(Т) = с. (27)
В силу теоремы 6.1.2 задача (27) имеет, притом единственное, решение
при каждом с е Еп, так что оператор (26) определен всюду на -Б".
Очевидно, этот оператор линейный, действует из Еп в ££[£0, Г]. Кроме того, с
учетом (24)-(27) имеем:
(Аи,с)Е„=(х(Т;и), ф(Т;с))= l^(x(t;u), ф^;с))сИ+(х(^;и), ф{10;с)) =
т *
= l({x(t;u), ф{1; c)) + (x(t;u), 4(t;c)))dt =
т
= \({D{t)x{t; и) + B(t)u(t), V>(t; с)) + (x(t;u), -DT(t)V>(t; c)))dt =
*o . ..
= \(u(t),BT(tW(t\c))dt = (u, A*c)L, УпеЯ, ceF.
%
Это означает, что оператор А*, определенный формулой (26), действительно
является сопряженным к оператору (25).
Из (21), (25)( (26) получаем следующее выражение для формулы
градиента функции (23)
J'(u) = 2BT(t)^(t;Au-b), t0^t^T, (28)
где ф^;Аи—Ь) —решение задачи Коши (27) прис=Ап—Ь=х(Т; и)—Ь, т. е.
i>(t) = -DT(t№(t), i0<i<T; ф(Т) = х(Т;и)-Ь. (29)
Таким образом, для вычисления градиента функции (23) в некоторой точке
и = u(t) б ££[*о> Т\ сначала нужно решить задачу Коши (24) и определить
x(t;u), затем подставить полученное значение х(Т;и) в (29) и, решая
задачу Коши (29), определить ф{Ь;Аи — Ъ) и, наконец, по формуле (28)
найти градиент J'(u).
Пользуясь теоремой 3, теперь мы можем сформулировать следующий
критерий оптимальности для задачи минимизации функции (23) на выпуклом
множестве U С L£[t0; Г]: для того, чтобы в точке и = ut е U функция (23)
достигала своей нижней грани на 11, необходимо и достаточно, чтобы
(J'(ut),u-%)=l(BT(^(t;x(T;ut)-b),u(t)~^(t))E'dt >0 УиеЦ (30)
528
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Условие (30) тогда перепишем в виде
min $(BT(i)V(t; х(Т; uj-b), u(t))dt =
u(()et/ j
= l(BT(t№(t;x(T;u>)-b),u>(t))dt. (31)
ч
Если ввести функцию Гамильтона — Понтрягина
H(x,u,t,if>) = (il>,D(t)x + B(t)u),
то условие (31) можно записать в так называемой форме интегрального
принципа минимума:
min $ H(x(t;ut), u(t), t, if>(t; x(T;ut)-b))dt ~
= $ H(x(t; «J, ut(t), t,4(t; x(T; u-)-b))dt
Если множество U имеет вид
U = {u = u(t)e ЩЬ0, T]-. u(t)EV почти всюду на [t0, Г]}, (32)
где V — выпуклое множество из Ег, то из (31) можно получить
min(BT(t)V>(t; х(Т, uj - Ъ), v) = (BT(t)il>(t; х(Т, щ) - Ъ), ut(t))
для почти всех t Е [t0, Т]. Взяв здесь вместо i>(t; х(Т, ut) — b) функцию
(—i/)(t;x(T.,ut) — b)), придем к принципу максимума Понтрягина для
задачи минимизации функции (23) на множестве (32). Заметим, что в главе
6 принцип максимума был доказан для более оощей задачи оптимального
управления без предположения выпуклости множества V. С другой
стороны, условие (31) справедливо для всех Выпуклых множеств U из L^tg, Т],
необязательно имеющих вид (32), и дает не только необходимое, но и
достаточное условие оптимальности.
Вторая производная функции (23) согласно формуле (21) равна J"(u) =
= 2АА*, где операторы А, А* имеют вид (25), (26). Формулу для J (и)
можно записать в несколько иной форме, если воспользоваться известной
формулой Коши
x(t;u)=l Ф(*, T)B(T)u(T)dr, t0^t^T, (33)
для решения задачи (24), где Ф(*, т) — матрица порядка тахта, определяемая
условиями
^11 = £>(*)ф(*,т), *0<*,т^Т; Ф(т,т) = 1, (34)
I — единичная матрица порядка та х та. Из (25), (33) следует, что значение
оператора А на элементе h = h(t)e ££[£0> Т] равно
Ah = х(Т; h) = $ Ф{Ь,'т)В(т)Н(т)е1т. (35)
'о
Далее, с помощью той же матрицы Ф(*, т) можно получить следующее
представление для решения задачи (27)
</>(*; с) = Фт(^*)с, t0^t^T, (36)
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 529
где Фт(*, т) — транспонированная матрица Ф(*, т) (см. упражнение 3).
Из (26), (32) следует
A*c = BT(t)<&T(T,t)c, to^t^T. (37)
С помощью представлений (35), (37) значение оператора J"(u) = 2A*A
на элементе h = h(t) может быть выражено формулой
J"(u)h = 2A*Ah = 2ВТ(*)ФТ(Т; t) $ Ф(Т, т)В{т)к(т)йт =
т 'о
= \2BT(t)<&T(T, t)<£>(T,T)B(r)h(T)dT t0^t^T. (38)
%
Как видим, оператор J"{u) является оператором Фредгольма с
симметричным ядром K(t, т) = 2В^^)Фт(Т, *)Ф(2]т)В(т), i0<i, т<Т. Мы здесь не
будем подробно останавливаться на свойствах матрицы Ф(*, т) (см.
упражнение 3) и выводе формул (33), (36). Заметим лишь, что эти формулы весьма
полезны при теоретическом исследовании задач оптимального управления,
связанных с системой (24), но при численном решении таких задач они
применяются крайне редко из-за трудностей в определении явного
выражения матрицы Ф(*, т) из (34). Для получения приближенного решения задач
Коши (24), (27), (34) могут быть использованы разностные методы [74; 89;
634].
Пример 7. Рассмотрим функцию
J,(u)=|a:,(T;u)-b,||,., (39)
где ж, = £,(*; и) — решение задачи Коши
xx{t)=D{t)xx{t) + B{t)u(t)+f(t), t0<<<^ z(*o) = % (40)
и = u(t)E L^[t0, Т], f(t) е L%[tQ, Т]. Как и в примере 2.15, воспользуемся
представлением решения £,(*;«) задачи (40) в виде суммы
xl(t;u) = x(t;u) + x0(t), t0^t^T, (41)
где x(t;u) — решение задачи (24), а^(£)— решение задачи (2.13): ig(£) =
= D(t)xQ(t) + f(t), x(t0) = xQ, и функцию (39) запишем в виде: J,(u) =
= \х(Т,и)— Ъ\2 = \Аи - Ъ\2, где Ъ = Ъ, - Яо(Т), оператор А определен
согласно (25). Отсюда и из формулы (28) имеем
J,(u) = 2BT(t)V>(t; Аи - Ь) = 2BT(t)i/)(t; Аи + ^(Г) - Ь,) =
= 2BT(t)V>(t;a;,(r;u)-b,))
где ф(Ь\ ж,(Т; и) - Ь,) — решение задачи Коши (27) при с = ж,(Т; и) - Ь,,
и, кроме того, справедливо равенство J," = J"(u) = 2А*А. Нетрудно видеть,
что формулы (35)-(38) сохраняют силу и для функции (39).
Пример 8. Рассмотрим функцию
J(u) = ]\x(t;u)-b(t)\%M, (42)
(0
530
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
где x = x(t;u) — решение задачи Коши (24), b(t)E L%[to, Т], u = u(t)E
е ££[£о> Т]. В примере 2.16 было показано, что оператор А, определенный
формулой (2.15):
Au = x(t;u), t0^t^T, (43)
является линейным непрерывным оператором, действующим из
гильбертова пространства Н = ££[£0> Т] в гильбертово пространство F = L£[£0, Т],
и функция (42) с помощью этого оператора представляется в виде (19).
Отсюда и из примера 5 следует, что J {и) 6 С2(Н), причем ее производные
имеют вид (21). Покажем, что оператор А*, входящий в (21) и
сопряженный к оператору (43), каждому элементу с = c(t) е F = L%[t0, Т] ставит в
соответствие элемент А*с е Н = L£[£0, Т] по следующему правилу:
А*с = Вт(г)ф(1;с), <ь<*<3; (44)
где ф =ф(Ь) = ф(Ь; с) — решение задачи Коши
4(t) = -DT{t)1>(t)-c{t), to^t^T; ф(Т) = 0. (45)
В силу теоремы 6.1.2 задача (45) имеет, притом единственное решение при
каждом с 6 F, так что оператор (44) определен всюду на F. Очевидно, что
этот оператор линейный, действует из F = L%[t0, Т] в Я = .££[*0, Т]- Кроме
того, с учетом (24), (43)-(45) имеем:
г г
(Аи, с)н = l(x(t; и), c(t))dt = l(x(t; и), —0(t; с) - L»T(t)V>(t; c))dt =
Т Т Т
= -(x(t;u)^(t;c)) +l(x(t;u), ф(t■,c))dt-\|(D(t)x(t■,u), ф(Цс))(И =
т % T la
= \{x{t; и) - D(t)x(t;u), ф(Ц c))dt = ](B(t)u(t), фЦ; c))dt =
= \(u(t),BT(W(t;c))dt = (u,A*c)F Vu e Я, ceF.
% -
Это означает, что оператор А*, определенный формулой (44), действительно
является сопряженным к оператору (43).
Из (21), (43), (44) получаем следующее выражение для формулы
градиента функции (42)
J'(u) = 2BT(t№(t;Au-b), to^t^T, '(46)
внешне схожее с (28), ф(Ь\ Аи — Ъ) — решение задачи Коши (45) при с =
= Аи — Ь = x(t; и) — b(t), т. е.
4(t) = -DT(t)il)(t)-x(t;u) + b(t), i0<i<T; ф(Т) = 0. (47)
Таким образом, для вычисления градиента функции (42) сначала нужно
последовательно решить задачи Коши (24) и (47), а затем воспользоваться
формулой (46).
Критерий оптимальности (теорема 3) для задачи минимизации
функции (42) на выпуклом множестве U С Н запишется в том же виде (30)
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 531
или (31), но в качестве ip(t) в этих формулах здесь нужно взять решение
задачи Коши (47) при и = ut. В случае, когда множество U задается
условиями (32), как и в примере 6, нетрудно установить связь между полученным
условием оптимальности (31) и принципом максимума Понтрягина.
Вторая производная функции (42) согласно (21) имеет вид J"(u) = 2A*A,
где операторы А*, А определены равенствами (43), (44). Приведем
формулу для значения J"(u)h оператора J"(u) на элементе h Е Н = L£[i0> Т],
аналогичную (38). Из (33), (43) имеем:
ЛЛ=ХФ(*,0£(ОМО#, to^t^T. (48)
Решение задачи Коши (45) может быть записано в виде
</>(*; с) =$Фт(т, t)c(T)dr, t0^t^T. (49)
(см. упражнение 3). Из (44), (49) следует
А*с = \ Вт(*)Фт(г, t)c(T)dr, *о < i < Т (50)
Тогда значение J"(u)h оператора J"(u) на элементе h е Н — L£[£0, Т)
выражается формулой
Г(и)к=2А*Ак=21Вт(Ь)Фт(т,Ь)(\ф(т,ОВ(ОЩ)^Ут, *0«С*<Т(51)
t .-¾
Квадратичная форма (J"(u)h, h) = 2(Ah, Ah) равна
(J"(u)h, h) = 1(2 J ВЦфЦт, t)(] Ф(г, t)B(t)4t)dt)dT, h(t))E,dt =
¾ * 4
- = 2 J f <ВТ(<)фт(Т) t)(j ф(Т) £)Щ£)ЦО<ц), h(t))drdt =
= 2 П (BT(t)<S>T(r, t) \ Ф(т, 0#(OMO^, h(t)dtdr =
' =2Х(хх<вт(*)Фт(7-,*)Ф(^05(ОМО,М*Ж^)^. (52)
Пример 9. Рассмотрим функцию
7,(10=1 К(*;«)-&,(*)!!.<**, (53)
где xy(t\u) — решение задачи Коши (40), и = u(t) е ЬЦ^, Т].
Пользуясь формулой (41), функцию (53) можем записать в виде (19): J{(u) =
т
= J \x(t;u)- b(t)\%ndt — \\Au- Ъ\\1„, где Ь = b(t)= b{(t)- ^(t), оператор
¾ 2
А определен согласно (43). Отсюда, пользуясь результатами примера 8, из
формулы (46) имеем J'(u) = 2BT(t)^(t; Au — b), где ф(Ь; Аи — Ь) — реше-
532
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
ние задачи Коши (45) при c = c(t) = Au—b(t) = Au+au(t)—bl(t) = xl(t; и)—
— b[(t), t0 < t ^. Т. Вторая производная функции (53) совпадает со второй
производной функции (42); формулы (48)-(52) здесь также сохраняют силу.
Пример 10. Пусть
J(u) *= $ ($ K(t, r)u(r)dr - b(t))2dt, (64)
где K(t,T)eL2(Q), Q = {(*,t): а^т^Ь, c^t^d}, b = b(t) eL2[c, d].
Введем оператор Фредгольма [393; 705]:
i,
Au = $ K(t, T)u(r)dT, с < i < d, (55)
a
действующий из H = L2[a, b] в F = L2[c, d], линейный, непрерывный. Тогда
функцию (54) можем записать в виде (19) и воспользоваться результатами
примера 5. Сопряженный к А оператор А* имеет вид
A*c=\K(t,r)c(t)dt, а^т^Ъ. (56)
о
Этот оператор действует из F в Н, он линейный, непрерывный. Далее,
пользуясь теоремой Фубини, имеем
(Au, c)F=U\ K(t, r)u(r)dT)c(t)dt = й K(t, T)u(r)c(t)drdt =
= Х($1Г(*,т)с(*)л)и(т)Ж-=(Л*с,и)я V-иеЯ, VceF.
a ^ с
Это означает, что оператор (56) является сопряженным к оператору (55).
Из (21), (55), (56) получим следующую формулу для градиента
функции (54):
J'(u)=2A*(Au-b)=2lK(t,T)(\K(t,$)u($)d^-b(t:)\dt, а^т^Ъ.
с а
Вторая производная J"(u) = 2А*А на каждый элемент h е Н
действует по правилу: J"(u)h = 2 ] K(t, т)(\ K(t, £)MOd£ W> а^т^Ъ. Из
теоремы 3 следует, что функция (54) достигает своей нижней грани на
множестве U = L2[a,b] в точке u — u^t) тогда и только тогда, когда
u»(t) является решением интегрального уравнения Фредгольма первого ро-
Ь /d \ а
да Ц lK{t)T)K{t^)dt\u{^)d^ = \K{t,T)b{t)dt, а^т^Ъ.
а \с / с
6. Кратко остановимся на следующей задаче минимизации, когда множество U задается
ограничениями типа равенств и неравенств
J(u)-»inf, ug U-{u€U0: gt(u)^.0, i = 1,..., m; F(u) = 0}, (57)
где U0—заданное множество из банахова пространства В, функции J(u), д{(и), ...,дт(и)
определены и конечны на U0, F —отображение, действующее из В в банахово пространство
Y. Если В = Еп, Y = Е"~т, F(u) = [ т... |, то задача (57) превращается в задачу
математического программирования, которая рассматривалась в главах 2-5.
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 533
В общем случае операторные ограничения F(u) = 0 часто используются, например, в
задачах оптимального управления для учета начально-краевых задач для дифференциальных
уравнений. В частности, задача Коши (24) может быть записана в виде F(u) = 0, где отображение
F:B=Lr2[t0,T]-,Y = H^[t0>T].
Приведем формулировки двух теорем, дающих необходимые условия оптимальности для
задачи (57) [358]. С этой целью введем функцию Лагранжа задачи (57):
С(и, А0, А, с) = А0 J(u) + A lSl (и) + ... + \тдт(и) + (с, F(u)),
где и G U0; А0, A,,..., Ат — вещественные числа, с G Y*. Как и выше, будем пользоваться
обозначениями: J = inf J(u), Ц, = {и е U: J (и) = J^}.
ue и
Теорема 4. Пусть в задаче (57) U0 = B, функции J(u),g{(u),..., gm(u) и
отображения F(u) непрерывны и дифференцируемы в некоторой окрестности точки ut G Щ,,
причем производная F'(u) отображения F непрерывна в точке и^ и образ пространства
В при отображении u—> F'(ut)u замкнут, пусть Jt > —oo, Щ ф 0. Тогда существуют не
равные одновременно нулю множители Лагранжа Ад >0, А| > 0,..., А^, > 0, с* G Y* такие,
что
т
£„K,AS,A\C*) = ASJ'K)+ Е Ajei(4t) + (J"K))V=0l
i = \
AiSiK) = 0, i= 1,..., т.
Если, кроме того, множество значений оператора F'^uJ совпадает с Y и существует
такая точка й"е В, что F'(й^)й = 0,(рДи*),й) <0 для тех г, 1 ^ г ^ т, для которых
5,.(¾) = 0, то Ад > 0 (можно принять Ад = 1).
Теорема 5. Пусть функции J(u), д,(и),..., дт(и) выпуклы на В, Щ —выпуклое
множество из В, а отображение F: В —*Y является аффинным, т. е. F(u) = Аи + щ,
A G С(В —> Y), у0 е Y; пусть J^, > -oo, (¾ ф 0. Тогда для любой точки щ е Ut существуют
не равные одновременно нулю множители Лагранжа Ад > 0, А[ > 0,..., \*т > 0, с* G У*
такие, что
£(«*. А<), л*> с*) = min £(«> К> л*> с*)>
°' иец, °' (58)
K9iM = Q, г = 1,..., m.
Если, кроме того, образ множества U0 при отображении и—> F(и) содержит окрестность
нуля пространства Y и существует точка и G U0 такая, что F(u) = 0, д4(и) < 0, г =
= 1 га, то Ад > 0 (можно принять Ад = 1). В последнем случае условия (58) являются
также и достаточными для того, чтобы % е Ц,.
Теоремы 4, 5 представляют собой обобщения аналогичных конечномерных теорем из § § 2.3,
4.8, 4.9. Другие утверждения, обобщающие правило множителей Лагранжа, теоремы Куна —
Таккера на экстремальные задачи в банаховых пространствах можно найти в [6; 7; 14; 44; 211;
225; 233; 265; 278; 346-348; 366; 393; 434; 435; 465; 486; 604; 605; 638; 672; 673; 690; 699;
748; 780]. Условия оптимальности второго порядка, обобщающие теоремы из § § 2.4, 2.5 на
бесконечномерные пространства, а также условия более высокого порядка были исследованы
в [44].
Напомним, что при доказательстве теорем из §§ 4.8, 4.9 были существенно использованы
теоремы отделимости из § 4.5. Аналогичные теоремы отделимости играют важную роль при
исследовании условий оптимальности в задаче (57) и во многих других вопросах выпуклого
анализа в банаховых пространствах.
Приведем одну из таких теорем [393; 705].
Теорема 6. Пусть М, N — выпуклые множества из банахова пространства В,
причем int М —множество внутренних точек множества М непусто и int М П N = 0.
Тогда существует гиперплоскость (с, и) = 7. разделяющая эти два множества, а также
их замыкания М uN, т. е. (с, и) > 7 > (с, v) Vu G М, Vu G N. При этом, еслиМ, JV имеют
общую граничную точку у, то 7 = (с, у).
В теореме 6 в отличие от аналогичной конечномерной теоремы 4.5.2 требуется условие
int М ф 0. Приведем примеры, показывающие существенность этого условия для
справедливости теоремы 6.
Пример 11. Пусть f7 = {u = (u' u",...)e!^ |un|<7f, га = 1, 2, ...} —«гильбертов
кирпич». Покажем, что это множество не имеет внутренних точек. Возьмем произвольную
точку и = (и1 «",...)£[/. Положим е = (в1 еп,...), где е" = slgn„"" . га =1,2,...;
1 9 °° 9 °° _9 П
2 < а <1. Так как \\е\\г= ]£ |еТ=]С п <оо, то е G Ц. Возьмем точку и + ее, где е>0,
п — 1 п — 1
534
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Для каждого е >0 найдется номер JV = N(e) такой, что |un + een| = \ип\ + еп~~а ^ еп~а > п~1
при всех п> N. Это значит, что и + ее ¢11 при всех е > 0. Таким образом, int U = 0, т. е. U
состоит лишь из граничных точек.
Далее, множество U выпукло. В самом деле, если \ип\ ^ n~l, \vn\ < n~l, п = 1, 2,..., то
\аип + (1 — a)vn\ ^ п~1 при всех п = 1, 2 0 < а < 1. Отсюда следует, что если и, v е (7,
то аи + (1 — а)г> G (7 при всех а, 0^а<1. Выпуклость U доказана.
Геометрические представления о выпуклых множествах «подсказывают» нам гипотезу о
том, что через любую граничную точку выпуклого множества, по-видимому, можно провести
опорную гиперплоскость. В евклидовом пространстве Еп эта гипотеза подтвердилась
(теорема 4.5.1).
Посмотрим, справедлива ли эта гипотеза для «гильбертова кирпича»: Возьмем любую
точку v = (и1 «",...)£ U такую, что \vn\ <п~1, п = 1, 2,... (например, v = 0).
Предположим, что через эту точку можно провести опорную гиперплоскость к множеству U,
т. е. существуют вектор с = (с1, ..., сп,...) ф 0, с е ^, и число 7 такие, что (с, и) ^ 7 при
всех и € U и (с, и) = 7- Так как с ^ 0, то сп ^ 0 для некоторого п > 1. Возьмем вектор
е = (0, ...,0, en = -5iS^£ »»,0, ...)6¾. Так как |ип + еп| = п-1, то« + е£[/,и поэтому
должно выполняться неравенство (с, v + е) ^ 7- Однако (с. и + е) = 7 + (с, е) = 7 + cnen = -у —
- |с"|п-1 - cnvn < 7 - |cn|n_1 + |cn| ■ \vn\ = 7 - |cn|(n-' -Jt>"|) < 7- Противоречие.
Следовательно, множество U и ее граничная точка v неотделимы. Это значит, что не через всякую
граничную точку рассматриваемого множества U можно провести опорную гиперплоскость.
Рассмотренный пример показывает, что условие int М = 0 в теореме 6 существенно.
Любопытно заметить, что через любую точку w = (wl wn,...), имеющую хотя бы одну
координату wn, \wn\ = п~1, можно провести опорную гиперплоскость к «гильбертову
кирпичу». Достаточно взять с = (0 0, сп = — signtun, 0,...), 7 = — п~1, и получим (с,ш) = 7,
(с, и) = ~ип sign w~n ^ -|un| ^ 7 Аля всех u€U.
Пример 12. Пусть U = {и = u(t) е L2[0, 1]: \u(t)\ < 1* почти вСюду на [0,1]}.
Покажем, что множество U не имеет внутренних точек в L2[0, 1]. Возьмем любую функцию
u = u(t)eU. Положим efc(t) = fc'/4 при0< t < -г, efc(t) = 0 при т- < i < 1, fc = 1, 2,... Ясно,
что u(t) + ek(t) = uk(t) ф U при всех к > 16, так как |"fc(*)| > |efc(t)| - |u(*)| > 2- 1 = 1 при
почти всех t, 0 < t < -г, к > 16. В то же время ||ufc(£) - "(*)lli, = ||ек(*)||£ = fc-1/2—> 0 при
к —> оо. Это значит, что множество U не имеет внутренних точек. Очевидно, множество U
выпукло. Покажем, что не через всякую точку из U можно провести опорную к U
гиперплоскость. Возьмем, например, v — v(t) = 0. Допустим, что существует c = c(J)£L2[0, 1], c(t)^0,
1
что (с, u)L = \c(t)u(t)dt ^ (с, и) = 0 для всех u е (7. Возьмем «q = «(,(*) = — sign c(t). Ясно,
что «о G U, поэтому должно быть (с, Uq) ^ 0. Однако, (с, «,,) = -$ |c(t)|dt < 0. Противоре-
0
чие. Следовательно, множество U и точка v = 0 не могут быть отделены гиперплоскостью
(см. упражнение 16).
Приведем формулировку еще одной теоремы об отделимости выпуклого множества и
точки [705].
Теорема 7. Пусть М — выпуклое замкнутое множество из банахова пространства
В, точка у не принадлежит М. Тогда множество М и точка у сильно отделимы.
7. Как видим, многие важные понятия теории экстремальных задач (градиент, выпуклое
множество, выпуклая функция, отделяющая гиперплоскость и т. д.) представляют собой
естественное обобщение соответствующих понятий, введенных для конечномерных евклидовых
пространств Еп. Поэтому неудивительно, что многие утверждения, сформулированные и
доказанные в главах 2, 4 для пространства Еп, остаются верными и в любых гильбертовых или
банаховых пространствах. Однако, как показывают теорема 6 и примеры 11, 12, такая
аналогия имеет место далеко не всегда: имеется немало утверждений, справедливых в Еп, но не
имеющих аналога в общих банаховых и гильбертовых пространствах. Это значит, что
теоремами, приведенными в главах 2, 4, можно пользоваться при исследовании экстремальных задач
в конкретных банаховых или гильбертовых пространствах лишь после тщательной проверки
того, что они верны и в рассматриваемом пространстве. ' '
Еще раз возвращаясь к примерам 11, 12, заметим, что в банаховых и гильбертовых
пространствах отделимость выпуклых множеств может быть гарантирована при более жестких
ограничениях, чем в конечномерном пространстве Еп. Это обстоятельство приводит к тому,
что ряд важных результатов теории экстремальных задач, опирающихся на конечномерные
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 535
теоремы отделимости, не имеют аналога в банаховых и гильбертовых пространствах. В
частности, как свидетельствует следующий пример, в задачах оптимального управления, в которых
фазовое пространство является гильбертовым пространством, принцип максимума,
сформулированный в главе 6 для задач с фазовым пространством Еп, в общем случае не имеет аналога.
Пример 13. Пусть управляемый процесс описывается системой уравнений [290]
x'(t) = u,'(t), t>0; х'(0) = 0, i = 1,2,..., (59)
где u'(t) — ограниченные измеримые на каждом конечном отрезке 0 < t < Г, г = 1, 2,.,.,
функции, принимающие свои значения из множества
V = {u = (u\. ..,«*,...)6fe:|«*l«i + p, * = 1.2, ...>.
Под решением системы (59), соответствующим допустимому управлению u = u(t) = (ul(t),...
..., un(t),...), t > 0, будем понимать функцию x(t, и) = (ж (t),..., xn(t), ...), t > 0, где
г
x'(i) = x'(t, и1) = J и'(т)<1т, t > 0, i = 1, 2,..., такую, что x(t, ^)6¾ при всех t > 0. Та-
о
ким образом, фазовым пространством системы (59) является бесконечномерное гильбертово
пространство ^.
Рассмотрим задачу быстродействия: найти управление и = u(t) е V, £ > 0, такое, чтобы
соответствующее ему решение x(t, и) системы (59) удовлетворяло условию
х(Т;и) = х^(\, 1/2, 1/3,..., 1/п,...)
при минимальном Г.
Пользуясь принципом максимума из главы 6, нетрудно показать, что при каждом
фиксированном п^ 1 минимальное время перехода из точки хп(0)=0 в точку х"(Г)= ^ при движении
по траектории дифференциального уравнения xn(t) = un(t), t >0, хп(0) = 0, с ограничениями
1"п(*)1< п + —2' О 0, Равн0 *п* = ~XT и реализуется на управлении "„*(*)= П + -?' * >0.
п га -t- i п^
Отсюда следует, что оптимальное время tt в исходной задаче не может быть меньше tnt, т. е.
** ^ *п*> 1 = 1,2,... Отсюда при п —> оо получим t„ ^ 1. С другой стороны для управления
и* = "*(*) = (I. 1/2, ■• •', 1/п, •• •) имеем а:(1,1^,) = я,. Это значит, что ¢^=1—оптимальное
время, аи = «, — оптимальное управление, xt(t)= 4¾ —оптимальная траектория в исходной
задаче быстродействия.
Убедимся в том, что принцип максимума в этой задаче не выполняется. Для этого по
аналогии с задачами оптимального управления из главы 6 напишем функцию Гамильтона —
Понтрягина
Н(х, и, ф, (¾) = (¾ + (ф, u)h, ф = (ф{ фп,...)
и сопряженную систему
«*) = -Я«<К('),»,('),М) = 0, *>0, 1 = 1,2,... '
Отсюда имеем ^(*)зс,. = const, V>(*) = (ci, с% cn,.. .)6¾. Если сп^0 для некоторого п^
> 1, то из условия max H(xt(t), и, V>(*), (¾) однозначно определится un(t)= Г-frЧ—V ) s'gncn-
t ^ 0, что не совпадает с u"(t) = ^. Это значит, что принцип максимума в рассматриваемой
задаче может иметь место только в вырожденном случае с" = 0, га = 1, 2,..., т. е. V"(*) = 0
и Я(х^(*), ut(t), V'C*), °о) = % = const. Согласно условию трансверсальности (6.2.43) тогда
Щж*(**)> "*(**)> Ф(К)> %)~^> так что (¾ = 0. В результате получаем ((¾. V>(*)) = 0, что
противоречит принципу максимума (см. теорему 6.2.2).
Рассмотренный пример показывает, что для задач оптимального управления в банаховых
пространствах принцип максимума в общем случае не имеет места. Тем не менее
существуют классы задач оптимального управления, для которых принцип максимума остается верным
и в том случае, когда фазовое пространство не является конечномерным [287-290; 641]. С
другой стороны, можно указать и такие классы задач оптимального управления с
конечномерным фазовым пространством, в которых принцип максимума не имеет места: такие задачи с
дискретным временем см. ниже в § 6, с непрерывным временем — в [137].
8. В заключение отметим, что функцию, дифференцируемую в смысле определения 3, в
литературе часто называют сильно дифференцируемой или дифференцируемой по Фреше
[393]. Существуют и другие определения дифференцируемости функции, отличные от сильной
дифференцируем ости. Приведем одно из них.
536
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Определение 6. Пусть функция J (и) (определена в некоторой окрестности О (и,-у)
точки и из банахова пространства В. Говорят, что функция J(u) слабо дифференцируема
или дифференцируема по Гато в точке и, если существует предел
11m J("+«y-J(") = j'(u, ft) (60)
при всех h G В. Если существует J'(и) G В*, что J'(u, ft) = (J'(и), ft) Vh G В, то J'(u)
называют слабой производной или производной Гато функции J(u) в точке и.
Заметим, что из дифференцируемости по Гато не следует существование производной Гато,
о чем свидетельствует „
Пример 14. Пусть J(u)= ^ 2 при х2 + у2 > 0, J(0) = 0, и = (х, у) G Е2. Очевидно,
J(tu) = tJ(u) Vu e Я2, Vt G R, так что lim J(°+^)- J(°) = J(ft)= j'(0, ft) Vft G Я2. Это
означает, что рассматриваемая функция дифференцируема по Гато, но J'(0, h) зависит от h
нелинейно.
Нетрудно видеть, что из дифференцируемости по Фреше следует дифференцируемость по
Гато, а также совпадение производных Фреше и Гато. Обратное утверждение неверно.
Пример 15. Пусть и — (х, j/)g Е2, J(u)= 1, если у = х2, J(u) = 0, если уфх2. В точке
и = 0 эта функция имеет производную Гато J'(0) = 0, но по Фреше она недифференцируема
и, более того, разрывна в этой точке.
Такое различие между производными Фреше и Гато связано с тем, что в случае
дифференцируемости по Фреше сходимость в (60) является равномерной по всем h, \\h\\ <7, а в случае
дифференцируемости по Гато такая равномерность и представление J'(u, h) = (J'(u), h)
необязательны.
Из (60) следует, что если функция J(u) в точке и имеет производную Фреше или Гато,
то она дифференцируема в этой точке по любому направлению е, ||е|| = 1, причем ,'"' =
= (J'(u), е) (ср. с формулой (4.2.14)). Из существования производной по направлениям не
следует дифференцируемость по Гато.
Пример 16. Функция J (и) = ||«||в в точке и = 0 имеет производную по любому
направлению, причем ,' ' = ||е|| = 1. Однако отношение J—*—t—I—" = М||ft|| при t —>0
не имеет предела, так что J (и) недифференцируема по Гато в точке и = 0.
Понятие производной Гато широко используется при исследовании экстремальных задач в
банаховых пространствах ([14; 393; 605; 638] и др.).
Упражнения
1. Результаты примера 5 вывести из примера 4. Указание: представить функцию (19)
в виде J (и) = (А*Аи, и) - 2(А*Ъ, и) + \\Ь\\2, и G Я.
2. Пусть В — банахово пространство, F — гильбертово пространство, оператор A G £(# —>
—> F), b g F. Доказать, что функция J(u)= ||Ли —Ь|||, выпукла и дважды непрерывно
дифференцируема на В, производные J'(u), f (и) представимы в виде (21), где A* g C(F —> В*) —
сопряженный к А оператор.
3. Доказать, что решение задачи Коши
x(t) = D(t)x(t) + f(t), <о^*<Г; x(t0) = ab
представимо в виде
х(*)=Ф(*, to)^+S Ф(*, r)/(r)dr, t0^t^T;
решение задачи Коши
Vi(t) = -DT(t)V(t) + s(t), to^t^T, V(r) = Vp
представимо в виде
Ф(г) = фт(т,г)ф1 + JФт(г,t)g(r)dr, ъ < * < ^
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 537
где матрица Ф(4, т) — решение задачи (34), Фт(4, т) — транспонированная матрица.
Указание: предварительно установить следующие свойства матрицы Ф(4, т):
Ф(*,т) = Ф(и)Ф(£,т) Vi,r,£e[i0,r]; [Ф(г,т)Г[=Ф(т,г) Vi,re[t0,r];
^^ = -Ф(*,т)£(т) Vt,r[to,r].
4. Доказать, что функция J(xq) = \х(Т; Xq) — Ь|2, где x(t; Xq) —решение задачи
x(t) = D(t)x(t), *о<*<Г; x(t0) = x0, (61)
D(t) — матрица размера п х п с элементами d,-(t) G £оо[*о, Г], дважды непрерывно
дифференцируема на Еп; вывести формулы для J'(«), J («). Указание: ввести оператор
Axq^ х(Т\х0) € С(Еп ~^> Еп) и воспользоваться результатами примера 5; показать, что
сопряженный к А оператор А* действует на элемент с е Еп по правилу: А*с — ф(10; с), где
V>(t; с) — решение задачи: ф(t) = —DT(t)V>(£), t0 < t < Г; ^(Г) = с; воспользоваться
упражнением 3 и доказать формулы: J'(u) = 2ФТ(Т, *о)[Ф(^ t0)^ - Ь], j"(u) = 2ФТ(Т; *0)ф(^ *о)-
г
5. Доказать, что функция J(a^) = J \x(t; Xq) - 6(t)|2dt, где x(t;a^) — решение
задало
чи (61), дважды непрерывно дифференцируема на Н — Еп; вывести формулы для J (и),
f(u). Указание: ввести оператор Axq = x(t; xq) е С(Н —> F), F = ££[*о, Г] и
воспользоваться результатами примера 5; показать, что сопряженный к А оператор А*
действует на элемент c = c(t)€F по правилу: А*с — V>(*o> с)> где ^(*1с) — решение задачи:
i/j(t) = — Z)T(t)V>(£) — c(t), t0 < t < Г; ^>(Г) = 0; воспользоваться упражнением 3 и доказать
формулы: У (и) = 2 J Фт(г, *0)[Ф(т, ^)¾ - b(r)]dr, f (и) = 2 J Фт(г, *0)Ф(т, <«,)*.
6. Доказать, что функция J(u,x0) = \x(T; и, Xq) — Ь|2, где x(t;u, 2¾)— решение задачи
x(t) = D(t)x(t) + B(t)u(t), t0^t^T; x(t0) = XQ (62)
дважды непрерывно дифференцируема по совокупности переменных z = (u, 2¾) е Я =
= ££ [*о> Г]х £п. Указание: ввести оператор Az = x(T;u, Xq) е ЦН -^> Е"),
воспользоваться результатами примера 6, упражнения 4.
т
7. Доказать, что функция J(u, а^)= \ \x(t\ w, а^) —6(t)|2dt, где x(t; u, 2¾) — решение
Задало
чи (62), дважды непрерывно дифференцируема по совокупности переменных г = (и,ь)ЕЯ=
= L^[tQ, Т]хЕп. Указание: ввести оператор Az~x(t; и, x0)eC(H-^F), F~L%[t0, Т],
воспользоваться результатами примера 8, упражнения 5.
8. Пользуясь теоремой 3, написать условия минимума выпуклой функции J(u) из
упражнений 4-7 на выпуклом множестве U С Н.
9. Написать необходимое условие минимума функции из примера 3 для случая U = С[а, Ь].
10. Пусть Н — гильбертово пространство, функция J(u) е С2(Я). Показать, что если в
некоторой точке ut€ Н выполняются условия J'(%) = 0, (J (%)h, h) > 0 Vft 6 Н, h ф 0, то
этого, вообще говоря, еще недостаточно для того, чтобы в точке ut достигался локальныйили
ОО / /71 "
глобальный минимум J(u) на Н. Указание: рассмотреть функцию J (и) = £ 1*—
71= 1\ «
)» ^. (hn)'z
, и €1^, в точке ut = 0; убедиться, что J'(ut) = 0, (J (и»)/», h) = 2 J] *—31 > °
n~ 1 п
Vh^O, но в точке и = (0,..., О, ип = i, 0,...) значение J(u)< J(ut) = 0 [393].
11. Пусть Н — гильбертово пространство, функция J(u) G С2(Н). Доказать, что если в
некоторой точке ut€H выполняются условия
J'(uj = 0, (J'K)ft, ft)>H|ft||2, Vftetf, /i = const>0, (63)
то u,, — точка строгого локального минимума функции J (и) на Н. Убедитесь, что при Н ~Еп
условия J'(uj = 0, (f(ut)h, h}>0 Vfc e £n, ft ^0, равносильны (63).
,"\2
538
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
12. Доказать, что функция J(u) = ||u||B дифференцируема в В =£р[0, 1], 1 <р<оо, всюду,
кроме и = 0, и найти J'(u). Будет ли J(u) дифференцируема (по Фреше или по Гато) в
B=L1[0Il]?BLoo[0Il]?BC[0,l]?
13. Доказать дифференцируемость отображения F: L2[a, b]—> L2[c, d], которое
определяется равенством
ь
F(u)=lK(t,T)u{r)dr, c^t^d,
а
где K(t, t)£L2(Q), Q ={(t, т)€Е2: c^.t^d, а^т^Ъ}.
14. Найти производную отображения (43), действующего из L2[t0, Г] в H^[tQ, Г].
15. Пусть функции J[(u),..., Jm(u) переменных и = (и1,..., ип) непрерывно дифференци-
{№)\
руемы на Еп. Доказать, что тогда отображение F(u) = ... , действующее из X = Е в
V/m(«)/ ,
Y = Em, непрерывно дифференцируемо на Еп и его производная F (и) представляет собой
линейный оператор с матрицей
/ ЗЛИ dfx(u) \
(матрица Якоби). Доказать, что если fi(u) G С2(Еп), то F(u) G С2(Еп).
16. Показать, что множество U из примера 12 не имеет опорной гиперплоскости во всех
точках u=u(t)G U, для которых |u(t)|< 1 почти всюду на [0, 1]. Доказать, что если u = u(t)G U
и |u(t)| = 1 на множестве А положительной меры, то через такую точку v можно провести
опорную к U гиперплоскость с нормальным вектором c = c(i)eL2[0, 1], где c(t) = — slgnu(t)
при t G А и c(t) = 0 при t G[0, \]\А.
17. Пусть в пространстве В — С[0, 1] даны два множества М — {и = u(t) € L2[0,1]: |u(t)|<
< 1,0< t < 1} и JV= {u = u(t)Gi2[0, 1]: jsignf^ - t)u(t)dt = l]. Доказать, что M и
ЛГ выпуклы, замкнуты, не имеют общих точек, но не могут быть сильно отделимы (ср. с
теоремой 4.5.3).
18. Пусть U = {u~(u\ .. .,ип,.. .)G L: |un|< „:+ -,, п= 1, 2,...}. Доказать, что в точке
п
v = (1, 1/2,..., 1/n,...) G U нельзя провести опорную к U гиперплоскость (см. пример 13).
Имеет ли U внутренние точки в ^? Выяснить, к каким точкам из U можно провести опорную
к U гиперплоскость.
19. Доказать, что «гильбертов кирпич» (см. пример 11) компактен в метрике ^
(определение 2.1).
20. Пусть U — открытое выпуклое множество из банахова пространства В, функция J(u)
конечна, полунепрерывна снизу (в метрике В) и выпукла на U. Доказать, что J(u) имеет
субградиент во все точках и G U и слабо полунепрерывна снизу на U [233].
21. Доказать, что теорема 3 остается справедливой, если функция J(u) имеет производную
по Гато на множестве U.
22. Доказать, что если производная Гато функции J (и) существует в некоторой окрестности
точки «q и непрерывна в этой окрестности, то в точке «q существует производная Фреше, и
она совпадает с производной Гато [393].
ъ
23. Пусть J(x) = J /(t, x(t), x(t))dt, где /(t, x, у) — дважды непрерывно дифференцируе-
а
мая функция по совокупности своих аргументов, x(t) G С [а, Ь]. Доказать, что функция J(x)
дифференцируема в пространстве С1[а,Ь], и написать условие минимума этой функции [393,
стр. 502].
24. Доказать, что в пространстве I, функция у=\х\{= *Г,\хг\ недифференцируема ни в
одной точке (ни по Фреше, ни по Гато). » = 1
§ 3. ДИФФЕРЕНЦИРОВАНИЕ. УСЛОВИЯ ОПТИМАЛЬНОСТИ 539
25. Пусть отображение F: X—>Y, где X, Y — нормированные пространства,
дифференцируемо на X. Показать, что ||F(a:+ ft) - F{x)\\ < sup \\F'(x + eh)\\\\h\\ ([393], стр. 483).
0<S < 1
Убедиться, что это неравенство, вообще говоря, не может быть заменено равенством F(x +
+ ft) — F(x) = F'(x + 9h)h при каком-либо в, 0 < в < 1 (ср. с формулой (9) при Y = Е1),
рассмотрев пример: F(t)= ( ^^t ) : -Е1 ~».Е2 на отрезке 0< t < 1.
§ 4. Методы минимизации
Здесь мы будем предполагать, что читатель знаком с большинством из
рассмотренных в части I методов минимизации. Заметим, что из этих
методов лишь некоторые являются сугубо конечномерными, т. е.
приспособленными для решения задач минимизации лишь в конечномерных
пространствах — это симплекс-метод, метод покоординатного спуска и некоторые
другие методы. Большинство же описанных в главе 5 методов минимизации
вполне могут быть применены для минимизации функций на множествах из
бесконечномерных банаховых и гильбертовых пространств — это
градиентный метод, методы проекции градиента, условного градиента, возможных
направлений, сопряженных градиентов, штрафных функций, Ньютона и др.
Идеи и описание упомянутых методов минимизации в бесконечномерных
пространствах по форме ничем не отличаются от их описания в
конечномерном случае. Поэтому здесь мы ограничимся лишь кратким описанием
некоторых из этих методов, отсылая читателя за подробностями к главе 5.
Далее, формулировки и доказательства теорем сходимости для
большинства упомянутых методов в бесконечномерном случае могут быть получены
путем небольшой корректировки соответствующих конечномерных теорем
и их доказательства из главы 5. Для того чтобы показать, как это делается,
мы ниже приведем несколько таких теорем. Некоторые из излагаемых
методов будем иллюстрировать на примере следующей задачи минимизации
квадратичной функции
J(u) = \\Au-b\\2F^ml, иеЦ (1)
где А € С(Н —> F), Н, F — гильбертовы пространства, Ь € F, U — выпуклое
замкнутое множество из Я (задача (2.3)). Напоминаем формулы
производных этой функции (пример 3.5):
J'(u) = 2A*(Au-b), J"(u) = 2A*A. (2)
Для иллюстрации методов также будем использовать задачу оптимального
управления:
J (и) = \х(Т, и) -b|2^inf; (3)
x(t) = D(t)x(t) + B(t)u(t) + f(t), t0<t<T; x(t0) = x0; (4)
u = u(t)e UCL*[t0, T) (5)
(обозначения см. в примерах 2.14, 2.15). Градиент функции (3) имеет вид
J'(u) = 2BT(t№(t;u), to<t^T, (6)
где ф(Ь;и) — решение задачи Коши
<Ht) = -DT(t)V(*)> t0^t^T; il>(T) = x{T',u)-b (7)
540
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
(см. примеры 3.6, 3.7). Примеры других задач оптимального управления
см. ниже в §§ 5—12.
1. Градиентный метод может применяться для поиска приближенного
решения задачи
J {и) —> inf; и е Н,
где Н — гильбертово пространство, J (и) € С1(Н). Этот метод заключается
в построении последовательности {ик} по правилу
uk + i=uk-akJ\uk), к =0,1,..., (8)
где щ — некоторая заданная начальная точка, ак — положительная
величина. Если J'(uk)^0, то ак можно выбрать так, чтобы J(uk + l) < J(uk). В
самом деле, из равенства (3.5) имеем
J(uk + l)-J(uk) = ak(-\\J>(uk)\\2 + o(ak)/ak)<0
при всех достаточно малых ак > 0. Если J'(uk) = 0, то процесс (8)
прекращается и при необходимости проводится дополнительное исследование
поведения функции в окрестности точки ик для выяснения того, будет ли
ик принадлежать Ut или нет. В частности, если J(u)— выпуклая функция
на Н, то согласно теореме 3.3 ukeUt. Различные способы выбора
величины ак в методе (8) описаны в § 5.1. Упомянем два из них: первый — ак
выбирается из условия
fk(ak)=inUk(a), fk(a) = J(uk-aJ>(uk)) (9)
(этот вариант градиентного метода называют методом скорейшего спуска),
второй — когда J(u) е С1,1(Н) (см. определение 2.6.1) и известна
постоянная L > 0 из неравенства
\\J'(u)- J\v)\\^L\\u-v\\, u,veH, (10)
величину ак в (8) можно взять из условий
0<e0<afc<2/(L+2e), (11)
где е, е0 — положительные числа, являющиеся параметрами метода.
На практике итерации (8) продолжают до тех пор, пока не выполнится
какой-либо критерий окончания счета, описанный, например, в § 5.1.
Посмотрим, как выглядит метод (8), (9) на примере задачи (1) при U — Н.
С учетом формулы (2) для градиента процесс (8) можем записать в виде
ик + 1=ик-ак(2А*(Аик-Ъ)), к = 1,2,... (12)
Нетрудно убедиться, что функция fk{&) здесь является квадратным
трехчленом. В самом деле, для любых и, h € Н имеем:
д(а) = J(u + ah) = \\А(и + ah) - bf = \\aAh + (Au - b)f =
= a2\\Ah\\2 + 2a(Ah, Au - b) + \\Au - bf =
= a2\\Ah\\2+2a(h,J'(u)) + J(u) Va € E. (13)
Из формулы (13) при u = uk, h = -J'(uk) = -2A*(Auk - b) следует, что
fk(a) = a2\\2A(A*(Auk-b))\\2-a\\2A*(Auk-b)\\2 + J(uk), a €R. (14)
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
541
Отсюда видно, что при АА*(Аик -6)^0 условие (9) однозначно определяет
величину
_ \\A\Auk-b)f
a»-\\AA4Auk-b)f>()- <15>
Если АА*(Аик — b) = 0, то процесс (12) останавливается, так как тогда
\\A*(Auk-b)f = (AA*(Auk-b),Auk-b)=0, fk(a) = J(uk), J>4) = 0
и ик eUt (теорема 3.3). Таким образом, для задачи (1) метод скорейшего
спуска (8), (9) порождает процесс (12W15).
Явные формулы для метода (8), (9) можно выписать'и в случае
задачи (3)-(5) с U = LZ[t0, Т]. Их нетрудно получить, если эту задачу сначала
свести к задаче (1) (см. пример 2.15) и далее воспользоваться
формулами (12), (15). Получим процесс
«* + i(*) = «*(*)-<** -2BT(t)^(t,uk), to^t^.T, к =1,2,..., (16)
где i[)(t, ик) — решение задачи (7) при и = ик,
а (x(T,uk)-b,x(T,uk-J'(uk))-x(T,uk)} =
* \x(T,uk-J'(uk))-x(T,uk)\2 т
[\BT(tW(t,uk)\4t
2\x(T,uk-j'(uk))-x(T,uk)\2 К >
(подробнее вывод формул (16), (17) см. в [151]).
Приведем теорему сходимости метода скорейшего спуска,
представляющую собой обобщение теорем 5.1.1-5.1.3 на случай гильбертовых
пространств.
Теорема 1. Пусть функция J (и) определена на гильбертовом
пространстве Н, J(u) е С'''(Я), Jt = inf J(u) > — оо. Пусть {uk}—по-
следовательность, полученная методом (8), (9) при некотором
начальном приближении щеН. Тогда последовательность {J(uk)} монотонно
убывает и
lim ||J'K)ll=0.
k —»оо
Если, кроме того, функция J (и) выпукла на Н, и множество М{щ) =
= {и € U: J(u) ^ •/('"о)} ограничено, то последовательность {ик}
минимизирует эту функцию на Н, причем справедлива оценка скорости
сходимости
0< J(uk)~ Jt^.cjk, k = 1,2,..., С[' = const ^0.
Если функция J(u) еще и сильно выпукла на Н, то {ик} сходится к
единственной точке минимума ut по норме Н, причем
0^J(uk)-Jt^(J(Kv)-Jf)qk,
К - uj2 < (2/м)( JK) - W, fc =0,1,...,
где q = 1 - fi/L , 0 < g < 1, д > 0 — постоянная из теоремы 2.2.
Эта теорема доказывается также, как аналогичные теоремы 5.1.1 —5.1.3.
542
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Покажем, что градиенты функций (1), (3) удовлетворяют условию (10)
и, следовательно, для их минимизации можно использовать метод (8) с
выбором шага ак по правилу (11). Для функции (1) условие (10) является
простым следствием формулы (2):
||J'(u)-J'(«)|| = ||2A*A(u-«)||<2||A*A||||u-«|| Vu, v е Н, (18)
так что здесь L =2\\А*А\\. Из (18) с учетом связи задач (1) и (3)-(5)
(см. примеры 2.15, 3.7) можем сказать, что градиент функции (9) также
удовлетворяет условию (10). Приведем оценку сверху постоянной L в этом
случае. Приращение Ax(t) = x(t; и) - x(t; v), t0 < t < T, согласно (4)
является решением задачи Коши
Ax(t) = D(t)Ax(t) + B(t)(u(t)-v(t)), i0<i<T; Дж(*0) = 0.
Отсюда, пользуясь оценкой (2.9), имеем
\x(t; и) - x(t; v)\ ^ CqWu - v\\L; Vt e[t0, Г];
, (19)
В силу (7) функция Дч/)(*) = ^(t; и) - ^(t; v), t0 < t < T, является
решением задачи Коши
A^(t) = ~DT(t)A^(t), t0<t<T; Аф(Т) = х(Т;и)-х(Т;у),
откуда, рассуждая также, как при выводе оценки (2.9), получаем:
\ф^;и)-ф^;у)\^ел^т-^\х(Т;и)-х(Т;у)\ Vt€[t0, Г]. (20)
Подставим оценку (19) при t = Т в (20). Будем иметь
|V(t;n)-V(t;^)|<e^"(r-io>c0lh-^llij Vt€[<o, Г]. (21)
Из формулы (6) и оценки (21) следует, что
\\J'(u)- J\v)\\Li=^\2BT(t)^(t)\4t)^ 4L\\u-v\\H, ■■
Г = 2(Г-*0)В1Х£;2^>-Ч '
Таким образом, установлено, что функции (1), (3) принадлежат классу
С1,1(Н) и в (12), (16) величину ак можно взять из (11) (например, ак = jj)-
Конечно, приведенная в (22) оценка для L может оказаться довольно
грубой и шаг ак из (11) тогда будет слишком маленьким, метод (16) будет
сходиться медленно.
Теорема, аналогичная теореме 5.2.4, при U = Н, 6к = 0, к=0, 1,...
остается справедливой и для метода (8), (11).
Отметим, что градиентный метод выше мы изложили применительно к
гильбертовым пространствам. В банаховом пространстве В градиентный
метод в форме (9) писать нельзя, так как слагаемые в правой части (9)
принадлежат разным пространствам (ик еВ, -akJ'(uk)£B*) и их сумма не
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
543
имеет смысла. Не вдаваясь в детали, укажем, что в банаховом пространстве
аналогом (9) является процесс ик + 1 = ик — акрк, где направление рк € В
определяется из условия min (J'(uk), h) = (J'(uk), pk).
2. Метод проекции градиента может применяться для поиска
приближенного решения задачи
J {и) -+ inf; и е Ц (23)
где U — выпуклое замкнутое множество из гильбертова пространства Я,
J(u)E Cl(U). Для описания этого метода нам понадобится понятие
проекции точки на множество.
Определение 4.4.1 проекции 7-^(^) точки иеЯна множество U, а также
свойства проекции и условия оптимальности для задачи (23), выраженные в
теоремах 4.4.1, 4.4.2, 4.4.4, сохраняют силу и в гильбертовом пространстве.
Метод проекции градиента для решения задачи (23) заключается в
построении последовательности {ик} по правилу
«* + 1=^К-«*^'Ю). fc =0,1,.-., (24)
где ак — положительная величина. Если при некотором к оказалось, что
ик + [ = ик, то процесс (24) прекращают. В этом случае точка ик
удовлетворяет необходимому условию оптимальности, а если J (и) — выпуклая
функция, то ик е Ut (теорема 4.4.4).
Различные способы выбора величины ак в методе (24) описаны в § 5.2.
Заметим, что метод (24) при U = Я переходит в градиентный метод.
Методом (24) удобно пользоваться лишь в тех случаях, когда имеется
явная формула для проекции точки на множество. Укажем несколько
примеров множеств, когда нетрудно получить такую формулу. Проекция точки
и € Я на шар
U = S(u,R) = {u<=H: ||и-«||<Д}
представима в виде
Г u + R(u-u)/\\u-u\\ при ||и-¥||>Л, _
и {и при || u - u|| < R;
проекция на гиперплоскость
Т = {иеН: (с, и) = 7}
выражается формулой
Ги(и) = и + (ч-(с,и))с/\\с\\2;
если
U = {ueH: Аи = Ь},
где А е С(Н —> Я), Ь е Я, оператор АА* имеет обратный, то проекция точки
ие Н может быть записана в виде
Vu(u) = u-A*(AA*)-l(Au-b).
Приведенные формулы для проекций доказываются так же, как это
делалось в примерах 4.4.1-4.4.3.
Метод (24) для задачи (1) запишется в виде
«* + i =П/К - afc(2A*(Aufc - Ь))), к =0, 1,...
544
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Посмотрим, как выглядит метод проекции градиента для задачи (3)-(5),
когда множество U имеет вид
U = {и = u(t) = (ul(t),..., «'(*)) е Lr2[t0, Т]: at(t) <
<и*(*)<Д.(*) почти всюду на [*0, Г], г = 1,..., г}; (26)
здесь a{(t), P{(t) — заданные функции из L2[t0, Г]. Проекция любой
точки и = u(t) = (u*(t),..., ur(t))eL2[t0, Г] на это множество представляет
собой вектор-функцию Vv(u) — (wl(t),..., wr(t)), t0 < t < T, где
( a((t) при u'(t) <«,(*),
«»'(*)={«'(*) при a,(t)<«'(t)<A(0.
1 Д(*) при Д.(*) ■<«'(*), * = 1,..-, г
(ср. с примером 4.4.5). Поэтому (к + 1)-е приближение uk+l(t) =
= (ulk + l(t),..., u£+l(t)), t0 < t < Г, метода проекции градиента для
задачи (3)-(5), (26) будет получаться по правилу
«!+■(*) = <
( <*,(*) при'^(t)- ak(2BT(t)i)(t;uk)).<a.(t),
ui(t)-ak(2BT(t)^(t;uh)). при
«<(*) < K(t) - ak(2BT(t)i>(t; ик)){ < Д(*),
[ Д.(*) при «■(*)- ак{2Вт{Ь)ф(1;ик)){>(1{{1),
(27)
г = 1,..., г; здесь ?/>(£; и) — решение задачи (7), (Вт(Ь)ф(Ь; uk))t — г-я
координата вектора BT(t) ф{Ь; ик). Согласно (22) градиент функции (3)
удовлетворяет условию Липшица с постоянной L —2(Т- *0)Ц£ахе2'4я»(г~(°>.
Поэтому при выборе ак в (27) можно воспользоваться условием (11).
Если в задаче (3)-(5) множество U является шаром из L2[t0, Т], т. е.
U = lu = u(t)eLr2[t0, Г]: $ \u(t)-u(t)\2dt <Я2],
(28)
где и = ¥(*) — заданная функция из L2[t0, Т], R — заданное
положительное число, то в силу формулы (25) метод проекции градиента приведет к
последовательности, которая строится по правилу
ик+А*)=<
гГ(*) + Д-
uk(t)-ak2BTW(t;uk)-u(t)
1/2
(l\uk(t)-akBT(tW(t;uk)-u(t)fdt)
при l\uk(t)-ak2BT(t)Tl>{t;uk)-li{t)\4t>R\
ч
ик{1)-ак2Вт{Ь)ф{Ь;ик)
при ] \uk(t) - ak2BT(t№(t;uk) - u(t)\4t < Д2
(29)
Приведем теорему сходимости метода (24), (11), обобщающую теоремы
5.2.1, 5.2.2 на случай гильбертовых пространств.
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
545
Теорема 2. Пусть функция J(u) определена на выпуклом
замкнутом множестве U гильбертова пространства Н, J(u) е Cl*l(U),
Jt = inf J (и) > —oo. Пусть {uk} — последовательность, полученная
методом (24), (11) при произвольном начальном приближении щеи. Тогда
последовательность {J(ик)} монотонно убывает и lim 11^-^ + 111 = 0.
к —»оо
Если, кроме того, функция J {и) выпукла на Н и множество М(и0) =
= {ueU: J(u) < J('Uq)} ограничено, то последовательность {ик}
минимизирует эту функцию на U, причем справедлива оценка
0< J(uk) — Jt < cjk, fc = l,2,...; cy — const ^0.
Если функция J (и) еще и сильно выпукла на U, то {ик} сходится к
единственной точке минимума ut по норме Н, причем
\\ик ~ и*\\2 ^ fy/k, к = 1,2,...; q = const ^0.
Для сильно выпуклых функций можно предложить другой вариант метода
проекции градиента, имеющий более высокую скорость сходимости.
Теорема 3. Пусть U — выпуклое замкнутое множество из Н,
функция J(u) принадлежит С1,'(£/") и сильно выпукла на U, и пусть
0 < а < 2/ii , где постоянные д, L, \± < L, взяты из (10) и теоремы
4.3.3. Тогда последовательность {ик}, получаемая из (24) при ак = а,
к =0, 1,..., сходится к точке минимума ut по норме Н, причем
справедлива оценка
11и*-ч11< К-Ч|1(9(а))*» fc=0> ^---.
где q(a) = (l-2ixa + a2L2)ll2,0<q(a)<l.
Теоремы 2, 3 доказываются также, как аналогичные теоремы 5.2.1-5.2.3.
3. Метод условного градиента может применяться для поиска
приближенного решения задачи
J (и) —» inf; и е Ц
где U — выпуклое замкнутое ограниченное множество из гильбертова
пространства Н, J (и) € С1 (U). Этот метод заключается в построении
последовательности по следующему правилу: по известному fc-му приближению
находят вспомогательное приближение йк € U из условия
(J'(uk), йк - ик) = lnf< J'(uk), и - ик),
или, что равносильно, из условия
ък£Ц (J'(uk),uk) = ml(J'(uk),u), (30)
и затем полагают
ик + 1=ик + ак(йк-ик), 0<аА<1. (31)
Заметим, что линейная функция (J'(uk), и) слабо непрерывна на U, а
множество Ь согласно теореме 2.6 слабо компактно. Отсюда и из теоремы 2.4
следует, что нижняя грань в условии (30) достигается хотя бы на одном
элементе йк € U.
546
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Если при некотором к оказалось, что ик = ик, то процесс (30), (31)
прекращают. В этом случае в силу условия (30) имеем ini(J'(uk),u — ик) =
= (J'(uk), ик — ик) = 0, т. е. (J'(uk), и — ик) ^ 0 при всех и € U. Согласно
теореме 3.3 это означает, что точка и, удовлетворяет необходимому
условию оптимальности, а если при этом J (и) — выпуклая функция, то ик € Ut.
Различные способы выбора величины ак в (31) описаны в § 5.4.
Например, ак может выбираться из условия
fk(ak)= ini fk(a) = fkt, fk(a) = J(uk + a(uk-uk)). (32)
0^ a ^ 1
Посмотрим, как выглядит метод условного градиента для задачи (3)-(5),
когда множество U имеет вид (26) или (28). Согласно (30) для определения
йк = uk{t) нужно на множестве U минимизировать линейную функцию
](BT(t)^(t;uk), u(t))E,dt = ] ±{Вт{1Ж1;ик))^{1)<11.
Отсюда видно, что в случае множества (26) будем иметь
«*(*) = («*(*).•■•.***(*)). <о<*<^ где
и
,m f <*<(*) ПРИ {Вт{1)ф{1;ик))^0,
hK > \ 13,(1) при {Вт{1)ф{1;ик)){<0,
а если U — шар (28), то с помощью неравенства Коши — Буняковского
получим
^) = ЭД-К *'<*>«*-»>
([\BT(tW(t;uk)\l,dt}
Параметр ак, определяемый условиями (32) в рассматриваемой задаче,
может быть выписан явно. Пользуясь тождеством (27) при и=йк, v = uk,
(3 = 1 — а и формулой (6), нетрудно показать, что [151]:
fk(a)=J(uk)+2a(x(T,uh)~b,x(T,uk)~x(T,uk))+a2\x(T,uk)-x(T,uk)\2=
= J(uk) + 2a \(BT(t№(t;uk),uk(t)-uk(t))E,dt +
+ а2\х(Т,йк)-х(Т,ик)\2, -оо<а<+оо. (33)
Если х(Т,йк) — х(Т,ик) = 0, то fk(a) = J(uk) = const при всех а.
Следовательно, fk(a) = (J'(uk + а(йк - ик)),йк - ик) =0 при всех а. Отсюда с
учетом условия (30) получаем fk(0) = 0= (J'(uk), йк -иЛ < (J'(uk),u-uk)
для любого uEU. Согласно теореме 3.3 тогда ut — uk = uk(t) — оптимальное
управление в задаче (3)-(5).
Рассмотрим случай х(Т, йк)^х(Т, ик). Тогда функция (33) представляет
собой квадратный трехчлен и достигает своей нижней грани на числовой
оси при
\(Вт(1)ф(Р, uk),uk(t) - uk(t))E,dt
а — ат — — -
\х(Т,йк)-х(Т,ик)\%п
(х(Т,ик)-Ь,х(Т,Чк)-х(Т,ик))в
\х(Т,йк)-х(Т,ик}\%п
2 ■ (34)
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
547
Так как в силу условия (30)
2\{Вт(1)ф(1,ик),йк(1)-ик(1))ЕЛ1 = {1\ик),йк-ик)ф\ик),ик-ик)=(),
Ч
то ясно, что а*к ^ 0. Возможен случай а£ = 0. Согласно условию (30) и
формуле (34) это значит, что
0= (J'(uk), uk(t) - uk(t)) < (J'(uk), и - щ)
при всех и е U. В силу теоремы 3.3 тогда ut = uk = uk(t) — оптимальное
управление в задаче (3) — (5).
Если а*к < 0, то квадратный трехчлен достигает своей нижней грани на
отрезке 0 < а < 1 при
afc = min{l;ai*}. (35)
Это и есть искомое явное выражение для ак, удовлетворяющее
условию (32). Для получения (к + 1)-го приближения остается положить
«* + !(*) = «*(*)+«*(«*(*)-«*(*)), *0<*<^
Сходимость метода условного градиента для задачи (3)-(5) вытекает из
следующей теоремы.
Теорема 4. Пусть U — выпуклое замкнутое ограниченное
множество из гильбертова пространства Н, функция J(u)
принадлежит Cl,l(U), Тогда для последовательности {ик}, определяемой
методом (30)-(32) при любом выборе начального приближения щеи,
справедливо равенство
\im(J'(uk),uk-uk)=0. (36)
к —*оо
Если, кроме того, функция J {и) выпукла на U, то последовательность
{ик} минимизирует эту функцию на U, причем справедлива оценка
0^J(uk)-Jt^cJk, к = 1,2,...; q = const ^ 0. (37)
Если J (и) еще и сильно выпукла на U, то {ик} сходится к
единственной точке минимума ut по норме Н, причем
\\uk — ut\\2 < Cj/fc, к = 1,2,.,.; Cj = const ^0.
Доказательство. Прежде всего заметим, что из ограниченности
множества U, условия J(u)e С1,'(£/") и леммы 2.6.1 следует, что
| J(u)\ < 17(11,,)1 + ||J'K)IIII« - «„И + L \\u - щ\\>/2 <
< | J«)| + || J'K)IM + Ld2/2 < oo
при всех ueU; здесь d= sup \\u — v\\ —диаметр множества U. Это значит,
u, ve.U
что функция J (и) ограничена на U. Следовательно, Jt > — оо. Обозначим
Jk(u) = (J'(uk), и - ик). Из (30) следует, что
ЛЮ<ЛК) = 0, fc = 0,1,.--
Далее, справедливо неравенство
J(uk)- J(uk + l)^a\Jk(uk)\- a2Ld2/2 (38)
548
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
при всех a,0<a<l,fc=0, 1,..., которое доказывается так же, как
аналогичное неравенство (5.4.18). Отсюда
0< 1Л(«*)1< aLd2/2 + (J(uk)~ J(uk + l))/a, (39)
к =0, 1,...; 0< а < 1. Так как J(uk) не возрастает и J(uk) > Jt > —оо, то
{J(uk)} сходится и J(uk) — J(uk + l) —>0 при к —» оо. Поэтому, переходя в
неравенстве (39) к пределу при к —» оо, будем иметь
0< Шп_1ЛК)1 < ШтГ\Jk(uk)\ < aid2/2
fc-too fc->oo
при всех а, 0 < а < 1. Отсюда при а —» +оо получим равенство (26).
Пусть теперь J(u) выпукла на U. Согласно теореме 2.8 тогда Ut^0.
Возьмем произвольную точку ut € Ut. Из теоремы 4.2.2 и условия (30) имеем
0 < ак = J(uk) - J(ut) < (J'(uk), ик - ut) =
= -ЛКХ-ЛЮ = 1ЛЮ1, А: =0,1,... (40)
Отсюда и из равенства (36) следует, что {ик} — минимизирующая
последовательность.
Докажем оценку (37). Так как Jk(uk) —>0 при к —» оо, то найдется номер
к$ такой, что 0^^к = \1к(йк)\/(Ld2) ¢, 1 при всех к ^ к^. Тогда максимальное
значение функции а\ Jk{uk)\ — a2d2L/2 переменной а при —оо < а < +оо,
которое достигается при a =7¾. будет совпадать с максимальным значением
этой функции на отрезке 0 < а < 1 при всех к ^ 1%. Поэтому, полагая в
оценке (38) а =гук, получим
а* - ак +1 = J(uk) ~ J{uk+i) ^ \Jk(uk)\2/(2L d2), к^ко.
Отсюда и из неравенств (40) следует
Остается применить лемму 2.6.4 и убедиться в справедливости оценки (37).
Последнее утверждение теоремы для сильно выпуклых функций следует из
оценки (37) и неравенства (4.3.3). D
Заметим, что описание метода условного градиента и теорема 4
сохраняют силу и в том случае, когда U — выпуклое замкнутое ограниченное
множество из рефлексивного банахова пространства.
4. Метод возможных направлений может применяться для поиска
приближенного решения задачи
J(u)-Mni; ueU = {и£В: д((и)^0, г = \,...,m}, (41)
где В — банахово пространство, J (и), д{(и),..., дт(и)е С1(В). Для
описания этого метода нам понадобятся понятия возможного направления и
возможного направления убывания функции, введенные определениями 4.2.3
и 5.5.1.
Метод возможных направлений заключается в следующем. Пусть щеи,
е0 > 0 — некоторое начальное приближение. Допустим, что fc-e
приближение (ик, ек), ике U, £к>0 при каком-то к ^ 0 уже известно. Определим
множество номеров
1к = {г: 1 < г < т, -ек < gt{uk) < 0}
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
549
и в пространстве переменных z = (e, а)£В х Е1 рассмотрим
вспомогательную задачу
ст-Mnf; z = (e,a)eWk={(e,a): (J'(uk),e)^a,
(&Ю> е> <°i *^4;|lell< !}•
Множество Wfc выпукло, замкнуто и ограничено, поэтому если В
является рефлексивным банаховым пространством, то согласно теореме 2.8
задача (42) имеет решение. Пусть (е.., аЛ — решение задачи (42), т. е.
(ек, ак) Е Wk и ок = inf о. Так как z = (0, 0) € Wk, то ясно, что ик < 0. Име-
ются две возможности:
1) ак < — ек. Тогда направление ек^0 является возможным направлением
убывания функции J(u) в точке ик на множестве U. Полагаем
uk + i = uk + akek> °<Q;fc<^; efc + i = efc. (43)
где
(Зк = sup{a: ик + tek е Ц О < t < а} > 0.
2) — efc < ак < 0. Тогда полагаем
«*+i=«*» ^ + 1 = 0¾. О<0<1,
где 0 — параметр метода, и снова переходим к рассмотрению задачи (42) с
заменой множества 1к на множество 1к + 1 ={г: 1 < г < т, — efc + [ ^д((ик) <0}.
Различные способы выбора величины аА в (43) описаны в § 5.5.
Заметим, что задача (42) далеко не всегда просто решается. Поэтому
методом возможных направлений пользуются для решения лишь таких
задач (41), в которых решение вспомогательных задач (42) может быть легко
найдено.
Предлагаем читателю самостоятельно исследовать сходимость этого
метода и рассмотреть, в частности, возможность обобщения теоремы 5.5.2 на
случай банаховых пространств.
5. Проксимальный метод применяют для решения задач минимизации
J (и) -»inf, и е Ц (44)
где U — выпуклое замкнутое множество из гильбертова пространства Н,
функция J {и) выпукла и полунепрерывна снизу на U, Этот метод
заключается в построении последовательности {ик\ по следующему правилу.
Начальная точка щЕН предполагается заданной. Если уже известна точка ик,
к ^ 0, то следующее приближение ик + 1 определяется как решение задачи:
tp(z, ик) = 2 ll-z — «J|2 + aJ(z)-^ini, z еЦ
где а > 0— параметр метода. Так как функция <p(z, ик) переменной 'z
полунепрерывна снизу и сильно выпукла на U, множество U •— выпукло и
замкнуто, то условия
ик+ у е Ц torf (p(z, ик) = tp(uk+l, ик) (45)
однозначно определяют точку ик + [ (теорема 2.10).
Для дифференцируемых функций J (и) описанный метод превращается в
метод проекции градиента в неявной форме:
«* + i=?Mu*-Q!jr'K + i))» fc=o, 1,...
(см. метод (5.6.14)).
5'Ш Гл. <8. МЕТОДЫ МИНИМИЗАЦИИ
•В задаче {(Г) на каждом шаге проксимального метода шужно решить задачу
минимизации:
\р(z, ик) — 211z — ик 112 4- faj| Az - Щ|2 —»inf, z € Ш
Если U — Ж, т :эт.а задача {равносильна задаче определения решения
линейного 'оверашорноко уравнения
■!Pz(z, ик) = z — mk+'2aA*(Az — Ь) = 0
или
Q&aA*A-+ I)z = 2аА*Ъ + ик.
Предлагаем чияителна ^самостоятельно расписать яршкоишаиьный метод для
задачи (3)-(5). -Аналогично теореме .5,6.5 доказывается
Т е о р ема !5. 'Пусть :W —(выпуклое .замкнутое множество из
гильбертова пространства :М„ функция Jfu) полунепрерывна снизу и
сильно выпукла на U <с постоянной сильной выпуклости.х. Пусть
последовательность f%j} определена методом (45) с произвольным ilqEH, Тогда
{ик} сильно в И сходится >к точке ut —решению задачи (44), причем
HK-^ir^'K-^llVi *-'0,'1, , q = l+'2ax-
6. Метвд сопряженных направлений применяют для поиска решения
задачи
J (и) -> inf; и е И,
где Н—гильбертово пространство, J (и) € С1(Н). Этот метод заключается
в постровнии [последовательности {ик} по правилу
«*+i =■«*-«*?*» ^=0,1,..., (46)
где
1Ро =./'(%), Рк = J'M ~ PkPk-u fc = 1, 2, , (47)
величина ]Зк определяется по одной из формул
А =КК), ^'K-i)- ^'K)>ll^'K-i)l|-2,
или
^ = -||J'K)ll2F'K-i)l|-2.
а ак в (46)>находят из условия
.№ак)=Шк(а), Д(а) = %-%), а > 0. (48)
Как показывает практика, погрешности, неизбежно появляющиеся при
определении ак из условия (48), могут привести к тому, Что векторы {рк}
из (47) перестают указывать направление убывания функции и сходимость
метода может.нарушиться. Чтобы бороться с этим явлением, метод сопря-
женньшградиентов время от времени обновляют, полагая в (47) /¾ =0.
В отличие ;от конечномерных пространств (см. § 5.6), в гильбертовых
пространствах нельзя ожидать, что точку минимума сильно выпуклой
квадратичной функции
J{u) = \{Au,u)-{b,u), иен, Ае£(Н->Н), Ъен,
удастся найти за конечное число шагов метода сопряженных градиентов.
§ 4. методы минимизации;
Ш
Предлагаем читателю самостоятельно сформулировать и; доказать аналог
теоремы 5.6.1 для гильбертовых пространств и рассмотреть возможность
применения метода сопряженных градиентов к задачам (1), (3)-(5)1.
7. Метод Ньютона может быть использован ддапоиска!решения!задачи
J (и) -> inf; и е Ц
где U — выпуклое замкнутое множество из банахова, пространства В,
J(u)£ C2(U). Этот метод заключается в построении последовательности
{ик} по следующему правилу: по известному fc-му приближению^ щ. € U
находят вспомогательное приближение йк еЛ7гиз>.условия!
Jk(uk) = inUk(u), (49)
где
Jk(u) = (J'(uk), и-ик) + ^(J"(uk)(u - ик)),ш- ик)у и s-:GJT
и затем полагают
ик +1 = ик + ак (йк - ик), 0 <,<ц, СII.• (50)
В частности, если U = В, то в точке минимума функции Jk(u) ее
производная Jk(u) обращается в нуль, т. е.
JjkO**) = J'K) + J"(uk)(uk - ик) = 0..
Если оператор J"(uk) имеет обратный оператор (J"(uk))~l, то отсюда имеем
uk=uk-(J"(uk))-lJ'(uk):
Подставляя это выражение для йк в (50), получим
ик + \=ик-ак{Г{ик))-Ч'(ик), к=0, 1,...
Таким образом, при U = В метод (49), (50) представляет собой широко
известный метод Ньютона для решения операторных уравнений! (в данном
случае уравнения J'(u) = 0).
Различные способы выбора величины ак в (50) описаны в § 5.10.
Предлагаем читателю самостоятельно сформулировать и доказать аналоги
теорем 5.10.1-5.10.3 о сходимости метода Ньютона для задач минимизации
в банаховых пространствах.
8. Метод штрафных функций может быть использован для поиска
решения задачи
J(u)-Hnf; иеЦ (51)
U = {ue U0: д{(и) < 0, г = 1,..., т; д{(и) = 0, i=m+l',..., е-}., (52)
где uQ _ заданное множество из банахова пространства' В, функции
J(u), gi(u),..., gs(u) определены на U0.
Определение 5.15.1 штрафной функции без изменении сохраняется и в
банаховых пространствах. Примером штрафной функции множества (52) на
множестве U0 является функция
Рк(и) = АкР(и), ueU0, (53)
где
P(u)=E(max{ft(u);0})p+ £ |ft(u)|p, ueU0, (54)
,■ = 1 «' = m + 1
552
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
числа Ак, называемые штрафными коэффициентами, таковы, что
Ак>0, к = 1,2,...; \imAk = +oo, р^1;
к —» оо
другие примеры штрафных функций см. в § 5.15.
Метод штрафных функций для задачи (51), (52) заключается в том, что
вводят функции
Фк(и) = 1(и) + Рк(и), иеи0, к = 1,2,..., (55)
и определяют последовательность {ик} условиями
ukeU0, Фк(ик)^Фк, + ек, (56)
где РкЫ) — штрафная функция множества U (например, функция (53),
(54)), Ф^ = т{Фк(и), ек >0, к = 1, 2,..., lim ек = 0. Если существует точка
U0 к —» оо
ukeU0, для которой Фк(ик) = Фк„, то в (56) допускается возможность ек = 0.
Заметим, что точка ик, удовлетворяющая условию (56), вообще говоря, не
принадлежит множеству U. При описании метода штрафной функции (55),
(56) подразумевается, что Фы > —оо при всех к = 1, 2,. ..
Приведем две теоремы о сходимости метода штрафных функций.
Теорема 6. Пусть функции J (и), дЛи), г = 1,..., s, определены на
множестве U0, а последовательность {ик} определена из условий (53)-
(56). Тогда
lim J К) < lim Фк(ик) = lim Фк> < Jt. (57)
к —* оо к —» оо к —> оо
Если, кроме того, J++ = inf J(u) > —оо, то
"о
Рк{и) = 0(А-к1), к = 1,2,..., (58)
Пт^Ю^О, i = l,...,m; \img.(uk) = 0, i = m+l,...,s. (59)
к —> оо к —>оо
Доказательство этой теоремы проводится дословно так же, как и теоремы
5.15.1. В § 5.15 приведен пример, показывающий, что в (57) неравенства
могут быть строгими.
Теорема 7. Пусть U0 — выпуклое замкнутое множество из
рефлексивного банахова пространства В, функции J(u), g{(u),..., дт(и),
\gm+i(u)\, ■ ■., |<7,(и)| слабо полунепрерывны снизу на U0 (например, эти
функции выпуклы и полунепрерывны снизу в метрике В ), Jtt = inf J (u) >
> —оо; множество и°
U(8) = {ue U0: д^и)^ 8, i = 1,..., m; |^(и)| ^ 8, i = m + l,.,.,s}
выпукло и ограничено при некотором 8 > 0. Тогда последовательность
{ик}, определенная условиями (53)-(56), такова, что любая точка и+,
являющаяся слабым пределом какой-либо ее подпоследовательности,
принадлежит Ut и lim J(uk)=Jt.
k —* оо
Доказательство. При сделанных предположениях для {ик}
соотношения (57)-(59) сохраняют силу. Из (59) следует, что ике U(8) при всех
к > 1%. Однако согласно теореме 2.6 множество U{8) слабо компактно.
Тогда существует хотя бы одна точка vt € U(8), к которой слабо сходится
§ 4. МЕТОДЫ МИНИМИЗАЦИИ
553
некоторая подпоследовательность {ик }. В силу слабой полунепрерывности
снизу указанных в теореме функций и соотношений (59) имеем
9t(%) < JinL&K ) < Jim ftK) < 0, г = 1,..., m;
Г —> 00 г К —»оо
lft(4)|^iim_lftK)|< Jim |ftK)| = 0, *=m+1,..., я.
)—юо r A: —» oo
Это значит, что v^E U. Тогда с учетом (57) получаем
Jt < J(vt) < jim_ J(uk ) ^ lim J(uk) < Jt,
l—юо r A: —» oo
так что
J(vt) — lim J(uk ) = Jt или г>4 € Ut.
r —»oo r
Таким образом, показано, что любая точка vt, являющаяся слабым
пределом какой-либо подпоследовательности {ик}, принадлежит Ut и
lim J(uk) = J„. Отсюда следуют утверждения теоремы 7. □
г —юо г
Доказанная теорема является аналогом теоремы 5.15.2. Читателю
предлагаем самостоятельно исследовать возможность обобщения других теорем
из § 5.15 на случай банаховых пространств.
Для иллюстрации метода штрафных функций рассмотрим задачу (3)-(5)
при дополнительных фазовых ограничениях вида
а. ^ x{(t, u)< Ь{, t0 < t < T, г = 1,..., m; m < n, (60)
или
х1(Т,и) = х\, г = 1,..., s; s < n, (61)
где аиЬих} — заданные числа. Для учета ограничений (60) можно взять
штрафную функцию
m Г
ДМ = Л £ H(max{a;4t,«)-bi;0})2 + (max{ai-a;i(t,n);0})2]dt,
i = i ^
гдеАк>0, lim Ак = +оо; ограничения (61) можно учесть с помощью штраф-
к —юо
ной функции
РЛ^) = Лк±(х^Т,и)-х})2, к = 1,2,...
г = 1
Тогда задача (3)-(5), (60) или (61) сведется к решению последовательности
задач минимизации функции
Фк(и)=\х(Т,и)-Ъ\*+Рк(и), к = 1,2,..., (62)
при условиях (2V (3). Вопрос о том, как определить градиент функции (62)
при условиях (4), (5) и как минимизировать функцию (62), будет обсужден
в следующем параграфе.
Предлагаем читателю самостоятельно исследовать возможность
обобщения других методов главы 5 на случай задач минимизации на множествах
из гильбертовых или банаховых пространств, исследовать сходимость этих
методов [65; 103; 112; 151; 638; 801].
S!54 iDi. 8. МЕТОДЫ ОТИЙММИЗАЩИИ
Упражнения
1. Пусть U = {.^(4:) = .^(4), иг(Щ<£1,$[^, Т]: u*<t,)>'B -почти всюду на .отрезке i0 <
i^ * < Я1,, «' = 1„ г-}-. Найти проекцию любой точки из ££{^, "-П на множество С/. Описать
метод проекции 1градиента дая задачи .(.3)-(5) с этим множеством.
:2. Описать метод сопряженных градиентов для задачи ((3)-(5) при U = Щ[10, Г].
3. ©писать градиентный метод, методы проекции градиента, условного градиента,
сопряженных направлений для задач минимизации функций
У
J<o) = H^ u)-b\2 + af;|u<t)f dt, a = const>0,
J(«)= JH*.«)-*(*)M М*)е-Чп[*о. г1.
J(u)= $|ж(*, u)-i(t)|2dt + a J \u(t)fdt, «= const >0
<o %
при условиях (4), (5). Исследовать сходимость методов.
4. Описать метод возможных направлений для задачи (41) в предположении, что U =
— Н — гильбертово пространство, взяв во вспомогательной задаче (42) поиска возможного
направления убывания условие нормировки ||е|| = 1.
5. Описать градиентный метод, методы проекции градиента, условного градиента,
сопряженных направлений для задач минимизации функций из примера 3.4. Рассмотреть случаи,
когда U — Н, или U — шар или гиперплоскость в Н.
6. Сформулировать и доказать теоремы сходимости методов барьерных, нагруженных
функций из § § 5.17-5.18 для множества (52) из гильбертова пространства.
§ 5. Градиент в задаче оптимального
управления со свободным правым концом
Рассмотрим следующую задачу оптимального управления:
минимизировать функцию
J(u)=] f(x(t),u(t),t)+<l>(x(T)) (1)
при условиях *°
x(t) = f(x(t),u(t),t), t0^t^T; x(t0) = x0, (2)
u = u(t)eucL;[t0,T), (3)
где x = (ж1, х2,. . ., хп), и = (и\...,иг), функции f°(x,u,t), f(x,u,t) =
= (fl(x, и, t),. .., fn(x, и, t)), Ф(х) переменных (х, и, t)eEn х Er х [t0, Т]
считаются известными, U — заданное множество из LT2[t0, Т], моменты
времени t0, Т и начальная точка 2¾ заданы.
Определение решения (или траектории) х = x(t) = x(t, и), t0^t ^ Т,
задачи Коши (2), соответствующего управлению u = u(t)e L£[£q> Т], а также
условия его существования обсуждались в гл. 6 (см. теорему 6.1.1); там же
был доказан принцип максимума для задачи (1)-(3) (см. теорему 6.2.1, а
также равенства (6.2.25), (6.2.26), § 6.3).
1. Ниже будут сформулированы достаточные условия дифференцируемо-
сти функции (1) на L£[£0, Т], и получена формула для ее градиента. Примем
обозначения
f _ §f_ _ I Jxh • • ■> Jx" | _ I f[ fn\T
Jx — fix — I in in I \Jx г")'!/ )
/■n in
xl) ■ • ■) Jx*
§ 5. Градиент в задаче оптимального управления
555
f __ §f_ _ I /и1 > • • •) Л»г \ _ I JM fn\q
J и {fa \ fn fn I Vu'1 ")JuJ
(fxl \ ( fu'
:■ J, /j = l :• 1, i=o,...,n-, фх =
Jx" I \ Jur ■
Здесь /Jj = -fj — частная производная функции /* по переменной х*,
Т — знак транспонирования матрицы. Напомним, что нормой
матрицы А = {ау, г = 1,,,,, п; j = 1,..., т} порядка n х т называется число
|| А|| =sup l^l^ls», где верхняя грань берется по единичному шару |.z|s„, ^ 1.
Справедливо неравенство |.A.zL,> ^ ||-A[||«|B™ при всех z£Em. Введем
знакомую нам по гл. 6 функцию Гамильтона — Понтрягина
H(x,u,t,i)) = -f°{x, u,t) + (f(x, щЬ),ф), {ф)Т = {фх,ф2,...,фп). (4)
Обозначим
(¾ \ / Ни'
; . я«= ;
HXJ \ни.
Теорема 1. Пусть функции /°, /, Ф непрерывны по совокупности
своих аргументов вместе со своими частными производными по
переменным х, и при (х, и, t)e Еп х ЕТ х [i0, Т] и, кроме того, выполнены
следующие условия:
|/(я; + Ax,u + h,t)- f(x, и, t)\ ^L(\Ax\ + \h\), (5)
\\fx(x + Ax,u + h, t)-fx{x, u,t)\\^L(\Ax\ + \h\), (6)
|/°(s + Ax,u + h,t)- /°(s, u, t)\ <L(\Ax\ + \h\), (7)
\\fu(x + Ax,u + h,t)-fn(x,u,t)\\^L(\Ax\ + \h\), . (8)
\f2(x + Ax,u + h,t)-f2(x,u,t)\<L(\Ax\ + \h\), (9)
|Фв(я! + Дя!>-Фв(я!)|<Х|Дя!| (10)
при всех (x + Ax, u + h,t), (x, u, t) e En x Er x [t0, T], где L = const > 0.
Тогда функция (1) при условиях (2) непрерывна и дифференцируема
по и = u(t) в норме Ll[t0, Т] всюду на LT2[i0, Г], причем ее градиент
J'(u) = J'(u, t) € Ll[tQ, T] в точке и = u(t) представим в виде
J (и) = —HU(X, U, t, ^)|а! = а!(«,«),« = «(*),^=^(*,«) =
= fi(x(t,u),u(t),t)-(fu(x(t,u),u(t),t))T^(t,u), to^t^T, (11)
где x(t) = x(t, и), t0 ^. t ^ Г, —решение задачи (2), соответствующее
управлению и = u(t), a i/)(t) = т/Ч*, и), t0 < t ^ Т, является решением
сопряженной системы
ф(Ь) = -Нх(х, и, t, V(*»l«—-<*,«>.«—«<*> =
= f°(x(t,u),u(t),t)-(fx(x(t,u),u(t),t))^(t), t0^t<:T, (12)
при начальных условиях
г1>(Т) = -Фх(х)\х = х{Т1и). (13)
556
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Доказательство. Пусть и = u(t), и + h = u(t) + h(t) € L£[£0, T],
a x(t, и), x(t, u + h), t0 ^. t < T, — соответствующие этим управлениям
решения задачи (2). Из условия теоремы имеем
\f(x, и, t)\ < 1/(0=, u,t)- /(О, 0, t)\ + |/(0, 0, t)\ <
<i(|a;| + |u|)+ sup |/(0,0,t)|, (х,и, t) е Еп х Er x[t0, Т). (14)
Из (14) и из теоремы 6.1.1 и замечания 2 к ней следует существование и
единственность решения задачи (2^ при всех и = u(t) € L2[t0, Г].
Приращение Aa;(t) = x(t, и + h) — x(t, и), t0^t^T удовлетворяет условиям:
Ax(t) = f(x(t) + Ax(t),u(t) + h(t),t)-f(x(t),u(t),t),
t0^t^T, Ax(t0) = 0.
Из (15) и из теоремы 6.3.1 следует оценка
|Ax(i)|<C,S \h(t)\dt < С{(Т - t0y/2\\h\\Li, t0^t^T; (16)
здесь и ниже через СУ,С2,... будем обозначать константы, не зависящие
от выбора и = u(t) е LT2[tQ) Т].
Покажем, что приращение функции (1) пред ставимо в виде:
AJ(u) = J(u + h)- J(u) = - \ Hu(x(t), u(t), t,^(t))dt + R, (17)
где R = R{ + R2 + R3,
R, = (Фх(х(Т) + 0, Дя(Т)) - ФДя(Т)), Ая!(Г)>, 0 < ву < 1,
г
R2 = - ЦНх(х + в2Ах, и + в2Н,Ь,ф)- Нх(х, и, t, ф), Ax)dt,
Г ч
R3 = - l{Hu(x + 62Ax,u + 62h, t, ф) - Ни(х, и, t, ф), h(t))dt, 0< в2< 1.
Так как Ф(х + Ах) - Ф(х) = {Фх(х + вуАх), 0 ^ 0, < 1, то
Д-Д") = П/°И*) + &Ф), «(*) + М*)> *) - /°0Ф), «(*)» *)]Л+ (18)
*° +(Фв(Я!(Г)),Да!(Г)> + Л1,
Преобразуем второе слагаемое правой части (18). С учетом
соотношений (12), (13), (15) имеем
(Ф.ИТ)), Ах(Т)) = -(ф(Т), Ах(Т)) = - ] ±(4{t), Ax(t))dt -
т
- (ф(Ь0), Ax(t0)) = - \[(ф(1), Ax(t)) + (j,(t), Ax(t)))dt =
т
= -l№t),f(x(t) + Ax(t),u(t) + h(t),t)-
- f(x(t), u(t), t))dt + l(Hx(x(t), u(t), t, </>(*)), Ax(t))dt
§ 5. Градиент в задаче оптимального управления
557
Подставим полученное выражение в (18), откуда с помощью функции (4)
будем иметь
г
AJ(u) = - l[H(x(t) + Ax(t), u(t) + h(t), t, V>(*))-
f°
- H(x(t), u(t), t, ф(Ш<И + l(Hx(x(t), u(t), t, V>(t)), Ax(t))dt + Ry.
Отсюда, пользуясь формулой конечных приращений
Н(х+Ах, u+h,t,^)-H(x, и,Ь,ф)=(Нх(х+62Ах, и+в2Н,^ф),Ах)+
+ (Ни(х + в2Ах, и + 92h, t, ф), h), 0 < в2 < 1,
приходим к требуемому представлению (17) приращения функции (1).
Так как Я, (ж, и,г,ф) = -f°(x, и, t) + (fx(x, и, i))TV>, Ни(х, и, t, ф) =
= -f°(x, и, t) + (fu(x, и, Ь))тф, то с учетом условий (6)-(10) и оценки (16)
для величин R{, R2, R3 из (17) имеем
|Л,| ^L|Az(T)|2^C2|№;,
|Я2|<(1 + sup \ф{Ь,и)\)Ь ](\Ax(t)\4\Ax(t)\\h(t)\)dt <C3\\h\\lV
\R3\^(l + sup \^(t,u)\)Ll(\Ax(t)\\h(t)\Mh(t)\')dt^Ct\\h\\lt.
4 ЧтиT ' 4
Суммируя оценки для R{, R2, R3, получим
\R\^C5]\h(t)\4t = Cb\\h\\l. (19)
Из формулы (17) и оценки (19) следует дифференцируемость функции (1)
и формула (11) для градиента. Теорема 1 доказана. П
Таким образом, для вычисления градиента функции (1) при условиях (2)
нужно последовательно решить две задачи Коши: сначала из задачи (2)
нужно определить x(t, и), затем из (12), (13) — ф(Ь, и) и, наконец, по
формуле (11) найти искомый градиент. При решении упомянутых задач Коши (2)
и (12), (13) можно использовать различные приближенные методы [74; 89;
482; 630; 634].
Заметим, что дифференцируемость функции (1) в теореме 1 доказана при
довольно жестких ограничениях на исходные данные задачи (1)-(3). На
самом деле, формулу (17) с остаточным членом R, R/\\h\\L —>0, при}\h\\L —>0,
можно получить при несколько меньших требованиях. Например, вместо
условия (10) можно требовать Ф(х) € С1(Еп), а вместо условий (6)-(9)
для производных fx, /u\ г =0,..., п, можно ограничиться условиями типа
\Рх{х + Ax,u + h,t)- f*(x, и, t)| <: L |fr|7 + о(|Аав|),
где 0< 7 ^ 1. о(а)/а —> 0 при а —>0.
Заметим, что формулу градиента функции (1) иногда записывают в
несколько ином виде: вместо функции (4) берут
Н(х, и, t, ф) = Р(х, и, t) + (f{x, и, t), ф), (20)
558
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
сопряженную задачу (12), (13) заменяют на задачу
Ф(*) = -НМи,1,ф{1))\х^и)^и{1), to^t^T, (21)
ф(Т) = Фх(х)\х=х{%и), (22)
и тогда вместо формулы (11) будем иметь
J'(n) = ^(a;,u,t,V)L = ,((,u),u„u((),^Wu), t0^t^T. (23)
Нетрудно видеть, что функции Н и ф(Ь,и) и, следовательно, производная
Ни из (4), (11)-(13) и (20)-(23) отличаются друг от друга лишь знаком.
Пользуясь формулами (20)-(23), найдем градиент в задаче (4.3)-(4.5),
являющейся частным случаем задачи (1)-(3) при/°=0, f(x,u, t) = A(t)x+
+ B(t)u + f(t), ip(x) = \x-b\2, Тогда H(x, и, i, V>) = {ф, A(t)x + B(t)u +
+ /(*)/ = (-^ (*)Фу x) + \ВТ{Ъ)Ф, u) + (Ф> /(*)).' сопряженная задача имеет
вид
ф = -Нх = -Ат(1)ф{1), i0<i^T; ф(Т) = 2(х(Т,и)-Ъ),
градиент равен J'(и)=Вт{Ь)ф(1,и), £0<£^Т (ср. с формулами (4.6), (4.7)).
Для иллюстрации теоремы 1 приведем пример задачи оптимального
управления для нелинейной системы.
Пример 1. Рассмотрим задачу об оптимальном успокоении
математического маятника (см. примеры 6.1.1 и 6.2.6):
J (и) = (xl(T))2 + {x\T)f = \х(Т)\2 -»inf; (24)
xl(t) = x2(t), x2(t) = -smxl(t)-px2(t) + u(t), 0^ t ^ Г; (25)
x(0) = (хЩ, x2(0))^ x0 = (xl, x2); (26)
u = u(t)eUCLr2[t0, T); (27)
здесь момент Г > 0, постоянная (3, начальная точка 2¾ считаются
известными. Задача (24)-(27) является частным случаем задачи (1)-(3), когда /°=0,
ф(х) = Ф(х\ x^) = (xl)2+(x2)2, fl(x, и, t) = x2, f2(x, и, £) = - sin xl — /3x2+u,
tj = 0, n = 2, г = 1. Все условия теоремы 1 для задачи (24)-(27) выполнены.
Для вычисления градиента функции (24) составим функцию Гамильтона —
Понтрягина
Н(х, и, ф) = фух2 + ф2(— sin х[ — (Зх2 + и).
Поскольку Нх, = -ф2 cos ж1, НХ2 = фх- /Зф2, Ф^ = 2а;1, Фх2 = 2х2, то
сопряженная задача (21), (22) запишется в виде
ф\ = ф2соъхх(Ь,и), ф2 = —ф{+/3ф2, 0<i^i;
ф1(Т) = 2х\Т,и), ф2(Т) = 2х2(Т,и).
Так как Ни = ф2, то согласно формуле (23) градиент равен
1'(и) = ф2(^и), O^t^T.
2. Имея формулу градиента, нетрудно расписать градиентный метод,
методы проекции градиента, условного градиента — это делается так же, как
было сделано в § 4 для задачи (4.3)-(4.5). Заметим, что в задаче (1)-(3) в
общем случае, конечно, нельзя ожидать, что функция f(a) = J(u + ah) пе-
§ 5. Градиент в задаче оптимального управления
559
ременной а будет квадратным трехчленом, значит параметр ак из условий
типа (4.9), (4.32) будет определяться не так просто, как в задаче (4.3)-(4.5).
Во многих теоремах о сходимости методов минимизации требуется, чтобы
минимизируемая функция принадлежала классу Cl'l(U). Приведем
достаточные условия принадлежности С1, l(U) для функции (1) при условиях (2).
Теорема 2. Пусть выполнены все условия теоремы I и U = {и =
■= u(t) е L£[£0> Т\. u(t) е V(t) почти всюду на [£0, Г]}, где V(t)
—заданные множества из Ег, причем
sup sup \и\ < R < оо.
Тогда ^ur.6v(„
\\J'(u)- J'iv^^^L^u-vW^, .^ = const > О, (28)
при любых u,veU,
До казательство. Возьмем произвольные и = u(t), v = v(t)e U. Из
оценки (16) для Ax(t) — x(t, и) — x(t, v), t0 < t ^ Г, следует
\\Ax(t)\\c = maxT \Ax(t)\ <: C6\\u - v||v (29)
Далее, с учетом неравенства (14) имеем
t t т
\x(t,u)\= Xq+ J f(x(r, и), и(т), r)dr < L J \x(t, u)\dr + L $ \и(т)\с1т +
+ K|+ sup 1/(0,0, t)\(T-t0)^L \ \x(T,u)\dr + L(T-t0)R + Cr
Отсюда с помощью леммы 6.3.1 получим
sup \\x(t, и)\\с < е£(г-«(С7 + ЦТ- t0)R) = С8. (30)
U€f/
Оценим |-0(*) "")!• С эт°й целью заметим, что (x(t,u),u(t),t)eG =
= {(х, u,t)EEnxErx [t0, Г]: |х| < С8, |u| < R, t0 < t < Г} при всех и е U.
Так как функции Фх, fx, /^, /и непрерывны по совокупности аргументов на
замкнутом ограниченном множестве G, то
max тах{|Фв|, |/°|, ||/J|, ||/J|} = С9 < оо. (31)
Отсюда и из (12), (13) имеем
№(*,«)!■
Фх(х(Т,и))+\[Гх(х(т,и),и(т),т)-
й
- 1Лх(ъ и), и(т), (т))тф(т, и))<1т
^ С9 + С9(Г - t0) + С9] \ф(т, u)\dr, to^t^T.
t
Тогда из леммы 6.3.1 следует
sup U(t, и)\\с < С9(1 + Г - t0)ec^-« = С10. (32)
»€£/
Далее, оценим Аф(Ь) = if>(t, и] - i/)(t, v), t0 ^ t < Г. Из (12), (13),
оценок (29)-(32) и условий (6), (7), (10) имеем
|Д</>(*)1 < \Фх(х(Т, и)) - Фх(х(Т, v))\+
560
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
+ X №Ф, и), и(т), т) - /°(в(т, v), v(t), T)\dT +
t т
+ W(T> U) ~ ^, v)\\\f.(x(T, U), u{T), -7-)|| +
t
+ |-0(т-, v)\\\fx(x(r, и), и(т), г) - fx(x(r, «), v(t), т)\\)<1т ^
т
^L\Ax(T)\ + L K\Ax(t)\ + \u(t)-v(t)\)dt +
+ С9 J \ф(т, и) - ф(т, v)\dr + Cl0L \(\Ax(t)\ + \u(t) - v(t)\)dt <
^ C9 J \ф(т, и) - ф(т, v)\dr + Cju - „||v t0^t<:T.
t
Отсюда и из леммы 6.3.1 следует
\\ф(г,и)-ф(г,у)\\с^СпЕ^т-^\\и-у\\Ьг = С12\\и-ь\\Ь1. (33)
Наконец, из формулы (11), оценок (29)-(33) и условий (8), (9) получим
требуемое неравенство (28):
\\J'(u)-J'{v)\\L=(j \Hu(x(t, и), u(t), t, ф(Ь, и)) -
1/2
-Hu(x(t,v),v(t),t,^(t,v))\4tj <:
< L(l + \\1>{t, u)\\c)(J(\Ax(t)\ + \u(t) - v{t)\)4t)
1/2
+
+ cj\ \Ail)(t)\2dt) ^L^u-vW^, u,veU.
Теорема 2 доказана. □
3. Отдельно остановимся на одном частном случае задачи (1)-(3), когда
система (2) линейна по х, и, т. е.
x(t) = A(t)x(t) + B(t)u(t) + f(t), tu^t^T, x(t0) = x0, (34)
где A(t), B(t), f(t) — заданные матрицы порядка n х n, nxr, nxl
соответственно. Для задачи (1)-(3), (34) принадлежность классу С1, l(U) может
быть установлена при меньших требованиях, чем в теореме 2, и, кроме
того, удается сформулировать условия, гарантирующие выпуклость и сильную
выпуклость функции (1).
Теорема 3. Пусть функции f°(x, и, t), Ф(х) удовлетворяют
условиям теоремы 1 и матрицы A(t),B(t),f(t) кусочно непрерывны на
отрезке [t0, Т]. Тогда функция (1) при условиях (34) принадлежит
классу С1'1 на всем пространстве L£[t0, Т], причем ее градиент J'(u) в
точке и = u(t) е Lr2[tQ, Т] вычисляется по формуле
J'(u) = f2(x(t,u),u(t),t)-BT(t№(t,u), t0<:t^T, (35)
где x(t, и) — решение задачи (34), ф(Ь, и) — решение задачи
Ti>(t) = f°x(x(t,u),u{t),t)-AT{t)i>(t), t0^t^T;
ф(Т) = -Фх(х(Т,и)).
§ 5. Градиент в задаче оптимального управления
561
Доказательство. Заметим, что здесь все условия (5)-(10)
заведомо выполнены. Кроме того, для задачи (34) справедливы теорема 6.1.2,
оценка (6.3.9) (см. также оценку (4.19)). Поэтому, рассуждая также, как
при доказательстве теоремы 1, приходим к соотношениям (35), (36). Для
Ai/)(t) = ф(Ь, и) — il>(t, v) с учетом условий (7), (10), (36) будем иметь
\^(t)\4Amax]\A^(r)\dr+L\Ax(T)\+L](\Ax(t)\+\u(t)-v(t)\)dt
t ^
Отсюда и из леммы 6.3.1 следует оценка (33). Наконец, из формулы (35) и
условия (9) с учетом оценок (16), (33) получим
\\J\u)-J'(v)\\L^[]\f!(x(t,u),u(t),t)-f°(x(t,v),v(t),t)\4t)l/2 +
Укажем достаточные условия выпуклости и сильной выпуклости
функции (1) при условиях (34), кратко обсудим условия оптимальности в зада-
че (1)-(3), (34).
Теорема 4. Пусть матрицы A(t), B(t), f(t) кусочно непрерывны
на отрезке [t0, Т], функция Ф(х) выпукла на Еп, a f°(x, и, t) выпукла
по совокупности переменных (х, и), т. е.
f°(ax + (1 - а)у, аи + (1 - a)v, t) < af°(x, и, t) + (1 - a)f°(y, v, t) (37)
при всех (x, и, t), (у, v, t) e En x Er x [t0, Г], 0 ^ a ^ 1, и, кроме того,
пусть f°(x(t), u(t), t)eLAt0, T] при каждой непрерывной функции x(t),
t0 ^ t < Г, u(t) e Lr2[tQ, T]. Тогда функция (1) при условиях (34) будет
определена и выпукла на ££[Л, Т].
Если при этом функции f"(x,u,t), Ф(х) удовлетворяют условиям
теоремы 1, то функция (1) при условиях (34) достигает своей
нижней грани на всяком выпуклом замкнутом ограниченном множестве
UcLl[t0, Т], причем для оптимальности управления и^ = и^(Ь)е11
необходимо и достаточно выполнение неравенства
Х(Л°И*. Ч), М*), *) - ВТ{1)ф{1, ut), u(t) - ut(t))dt > 0 (38)
при всех u(t)e U, Если ut —внутренняя точка множества U, то
условие (38) равносильно условию
tf(x(t,ut),ut(t),t)-BT(t№(t,ut) = 0, t0^t^T. (39)
Если же вместо (37) справедливо неравенство
f°(ax + (1- а)у, аи + (1 - a)v, t) <: af°(x, и, t) + (1 - a)f°(y, v, t) -
-a(l-a)%\u-v\2, x= const >0 (40)
при всех a, 0^ a ^ 1, (x, u, t),(y,v, t)eEn x Er x[t0, T], то функция (1)
при условиях (34) является сильно выпуклой на ££|Л> Т] и будет
достигать своей нижней грани на любом выпуклом замкнутом множестве
U CL£[i0, Т], причем оптимальное управление единственно.
562
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Доказательство. Нетрудно видеть, что решения задачи (34)
обладают свойством
x(t,au + (l-a)v) = ax(t,u) + (l-a)x(t,v), Vte[t0, Г],
при всех и, v е L2[t0, Г] и а е Е (ср. с (2.7)). Тогда выпуклость [сильная
выпуклость] функции (1) при условиях (34) является простым следствием
выпуклости Щх) и условия (37) [условия (40)]. Остальные утверждения
теоремы вытекают из теорем 2.8, 2.10, 3.3. П
Пример 2. Пусть требуется минимизировать функцию
J(u) = \\{x\t) + u\t))dt
о
при условиях x(t) = —ax(t)+u(t), 0< t < Г; ж(0) = ^; u = u(t)eL2[0, Т] =
= U, где a, Xq, Т > 0 — заданные числа.
Эта задача является частным случаем задачи (1)-(3), (34) при f° = (x2 +
4- и2)/2, Ф(х) = 0, / = — ах + и, п = г = \ ик ней применимы теоремы 1-4.
Поскольку здесь функция f°(x, и) удовлетворяет условию (40) при х= 1/2,
то функция J(u) сильно выпукла на L2[0, Т] и достигает на L2[0, Т] своей
нижней грани в единственной точке ut = ut(t) б L2[0, Т]. Поскольку
Н(х, и,ф) = -(х2 + и2)/2 + ф(-ах + и),
то сопряженная задача (36) (или (12), (13)) здесь имеет вид
•0(t) = aV>(t) + a;(t, и), O^t^T; ф(Т) = 0,
а градиент согласно формуле (35) (или (11)) равен
J'(u) = u(t)-il)(t,u), 0^ t^ Т.
Условие (39) для оптимального управления тогда приведет к равенству
«,(*) = v(t,iO> o^'t^T.
Этот же результат был получен в примере 6.2.3 с помощью принципа
максимума. В силу теоремы 4 последнее равенство является не только
необходимым, но и достаточным для оптимальности управления ut = ut(t).
Заметим, что, пользуясь условием (37) выпуклости функции f°(x,u, t),
формулой (11) и теоремой 4.2.2, неравенство (38) можно переписать в
эквивалентном виде
Х[Я(я!(*,ч),ч(*),*,^(*,ч))-
-H(x(t,ut),u(t), t, V>(t,iO)]dt ^0, u(t)eU, (41)
где
H(x, и, t, ф) = -f°(x, и, t) + {ф, A(t) + B(t)u + /(*)).
Предлагаем читателю установить связь между принципом максимума и
условием оптимальности (41) — это может быть сделано так же, как в
примере 3.6 (формулы (3.30)-(3.32)).
4. Рассмотренная выше задача (1)-(3) является частным случаем задачи
оптимального управления, когда правый конец траектории свободен. Более
общие задачи оптимального управления, когда, например, правый конец
§ 5. Градиент в задаче оптимального управления
563
траектории закреплен или подвижен, или имеются какие-либо другие
ограничения на фазовые координаты и управление, могут быть сведены к задаче
вида (1)-(3) с помощью штрафных функций (см. § 4, п. 8),
Например, если задача (1)-(3) рассматривается при дополнительном
условии х(Т) = хх (правый конец закреплен), то в качестве штрафной
функции для этого условия можно взять
Рк{и) = Ак\х{Т,и)-х1\\ к = 1,2,...,
и рассмотреть задачу минимизации функции
**(«) - $ /°(я(*. «), «(*), Wt +Ф(х(Т, и)) + Ак\х(Т, и) - хх\2
при условиях (1)-(3); здесь и ниже {Ак} — некоторая заданная
положительная последовательность, стремящаяся к бесконечности. Нетрудно
видеть, что если функции /°, /, Ф удовлетворяют условиям теоремы 1, функция
Фк(и) дифференцируема и ее градиент определяется той же формулой (11),
нужно лишь условие (13) для ф(Т,и) заменить на
ф(Т, и) = -Фх(х(Т,и)) - 2Ак(х(Т, и) - xt).
Если задача (1)-(3) рассматривается при дополнительных фазовых
ограничениях вида
at < x{(t, и) ^ Ь., £0 ^ t < Т, г = 1,..., m, т < п, (42)
где at., bi —заданные постоянные, то штрафом может служить функция
т Т
Рк(и) = А £ П(тах{Я!'(*, «) - Ъ{; О})2 + (тах{а; - x*{t, и); 0}f)dt.
Тогда задача (1)-(3), (42) сведется к решению последовательности задач
минимизации функции
Фк(и)=1(и)+Рк(и)=]рк°(х^,и),иШ)сН+Ф(х(Т,и)), к = 1,2,... (43)
при условиях (2), (3), где
m
Fk°(x, и, t) ^ f°(x, u,t) + Ak £[(max{s* _ Ь.;0})2 + (max{as. - я;'; О})2].
t = i
При каждом к = 1, 2,,., задача (43) (2), (3) имеет тот же вид, что и
задача (1)-(3). Заметим, что
i^=/u°> F&{x, и, t)=fi(x,u,t)+2Ak тах{х'-Ь,;0}-2Ак max{as.-s\-0},
* = 1,..., m; JF£, =/«,, * = m + 1, ..., n.
Отсюда ясно, что если функции f°, f, Ф удовлетворяют условиям теоремы
1, то и для задачи (43), (2), (3) также будут выполнены условия
теоремы 1, и формула градиента для функции (43) будет определяться теми же
формулами (4), (11)-(13), нужно лишь в них /б заменить на Fk°.
564
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Если задача (1)—(3) рассматривается при дополнительном условии
д(и) = \ G(a;(t,u),u(t),*)<ft+*i(:c(2;u))<0,
'о
то штрафной функцией для этого неравенства можно взять
Pk(u) = Ak(max{g(u);0}f.
Возможно использование и других штрафных функций, аналогичных
приведенным в § 5.15. Комментарии к методу штрафных функций, сделанные
в § 5.15, сохраняют силу и для задач оптимального управления.
Отметим, что метод штрафных функций в главе 6 был использован для
доказательства принципа максимума.
Упражнения
1. Рассмотреть задачу минимизации функции
г
J(u)=lu2(t)dt
О
при условиях (25)-(27) и с закрепленным правым концом траектории: х(Т)= xt\ моменты Г
и точка xj заданы. Применить метод штрафных функций для учета условия на правом конце;
найти градиент штрафной функции.
2. Доказать, что при выполнении условий теоремы 1 функция (1) при условиях (2)
дифференцируема по переменной Xq е Еп, и по совокупности переменных (а^, и) е Еп х ££[tg, Т];
найти градиент.
3. Рассмотреть функцию
J(w)= \ f(x(t, w), w, t)dt +Ф(х(Т, w))
'о
при условиях x(t) = f(x(t), w, t), tg < t < T; a;(t0) = o^, w = (w1,..., wr) — управляющие
параметры, не зависящие от времени. Показать, что если функции /°, /, Ф непрерывны и имеют
непрерывные частные производные по х, w и \f(x + Ах, w, t) — f(x, w, t)\ < L \Ax\ при всех
(x + Ax, w, t), (x, w, t) e En x Er x [t0, Г], то функция J(w) дифференцируема и ее градиент
будет равен
J'(w)=\ Hw(x(t, w), w, t,i>(t, w))dt,
где H(x, w, t,ip)=:f0(x,w,t)+ (f(x, w, t), ф), V>(*, w) — решение задачи
ф(г) = -Нх(х(г,ги),ги,г,ф(Щ t0<t<T; ф(Т) = Фх(х(Т, w)).
Указание: воспользоваться техникой доказательства теоремы 1.
4. Пусть выполнены все условия теорем 3, 4 (кроме, быть может, условия (40)) и пусть
U — {и — u(t) е ££[t0, Г]: u(t) е V почти всюду на [tg, Г]}, где V — выпуклое множество
из Ет. Доказать, что тогда принцип максимума является необходимым и достаточным
условием оптимальности в задаче (1)-(3), (34). Указание: доказать выпуклость функции
Н(х, и, t, ф) по и и воспользоваться неравенством (38).
1
5. Пусть J(u)= l(u2(t) - ax2(t))dt, где i(t) = u(t) 6 L2[0, 1], ж(0) = 0, a— постоянная.
о
При каких значениях параметра а функция J(u) будет выпуклой или сильно выпуклой на
L2[0, Г]? Показать, что J(u)e Cl,l(L2), и найти градиент.
6. Пусть функции /°(ж, и, t), f(x, и, t), Ф(х) непрерывны по (х, u,t) е Еп х Ет х [^, Т],
выполняется условие (5) и |/°(ж, и + h, t) — f°(x,u, t)| ^ L(|h|2 + |u||h|), L = const >0, при
§ 5. Градиент в задаче оптимального управления
565
всех (х, u + h, t), (х, и, t)eEn хЕг х[1^, Г]. Доказать, что тогда функция (1) при условиях (2)
непрерывна на i^I^O' -^1 в метрике этого пространства.
7. Пусть функции f°(x, и, t), Ф(х) непрерывны по (х, и, t) е Еп х Ет х [tg, Г], f°(x, и, t)
выпукла по переменной и е Ет при каждом фиксированном (х, t)eEn х [t0, Г]. Доказать,
что тогда функция (1) при условиях (34) достигает своей нижней грани на любом выпуклом
замкнутом ограниченном множестве U е L% [t0, Г]. Указание: установить, что J (и) слабо
полунепрерывна снизу на iJI^O' -^1-
8. Пусть выполнены все условия теоремы 4 (кроме, быть может, условия (40)), U —
выпуклое замкнутое ограниченное множество из Ь^с -П' функция д(х, t) непрерывна по
(х, t)eEnx[t0, Г] и выпукла по хеЕп при каждом фиксированном t £(¾. Г]. Пусть
существует хотя бы одна траектория x(t, Uq) задачи (34), u^eU, такая, что g(x{t, «„), t)<0 при всех
t е [t0, Т]. Доказать, что тогда функция (1) при условиях (34) и ограничении g(x(t, и), t) <0,
t0 < t < Г, достигает на U своей нижней грани.
9. Пусть f°(x, и, t) = a(x, t)+ (b(x, t\,u), f(x,u,t) = A(x,t) + B(x,t)u и пусть матрицы
А(х, t), B(x,t), b(x, t) — порядков rax 1, га x г, га x 1 соответственно и функции а(х, t), Ф(х)
непрерывны по (х, t)e Еп х [fy, Г], \\А(х, t)\\ =g С0\х\ + С,, ||В(я, t)|| < С2, где С0, С,,С2-
неотрицательные постоянные. Пусть С/ — выпуклое замкнутое ограниченное множество из
LJIV ^1] и существует управление ид е U такое, что соответствующее решение x(t, Uq)
задачи (2) удовлетворяет условию x(T,Vq) = xi. Показать, что тогда функция (1) при условиях (2)
и дополнительном условии х(Т, и) = х1 достигает своей нижней грани на U. Указание:
установить, что если {ик} — минимизирующая последовательность, слабо сходящаяся к точке
и„, то J(ufc)-» J(ut).
§ 6. Градиент в задаче оптимального
управления с дискретным временем
1. Рассмотрим следующую задачу: минимизировать функцию
%1)=Е^,Ч')+Ф(%) 0)
»=0
при условиях
^ + 1 = 3(¾. *0» * =0,..., JV—1; Хо = а, (2)
[щ] = (щ,...,им_1); u{eVt, * =0,.. .,JV— 1, (3)
где ¢, = (¾1...., х?), щ = (и\,..., <), функции ^- = (^,..., Ff), 3°, Ф
предполагаются известными, Vt—заданное множество из Ет, натуральное
число N ^ 1 и начальная точка а заданы.
Задача (1)-(3) уже изучалась нами выше: в § 7.1 с помощью
динамического программирования исследовалась проблема синтеза для этой задачи.
В настоящем параграфе сформулируем достаточные условия
дифференцируемое™, выпуклости функции (1) при условиях (2), (3), а также выведем
необходимые условия оптимальности. Будем пользоваться следующими
обозначениями:
!,-(*•::*)-(?), 4-(*.:::..^)-(7).
W ••• f:J \р») \f£ ... fi:J \Fn
(F°)T = (JF2„ ..., F&), (F?)T = (FPh ..., F°r), (Фх)т = (Ф,„ ..., Ф.„).
Через L\[0, N] обозначим гильбертово пространство вектор-функций
дискретной переменной [и{] = (щ,и1,...,им_1) со скалярным произведением
566
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
JV-l ,N-\ ч 1/2
Ы> К1>£, = Е (ч-, «,->Я' и с нормой цк-111 = (Е к-110 • Пусть г/ —
множество всех дискретных управлений [щ] = (щ,..., uN_{),
удовлетворяющих условию (3); очевидно, U С ЬДО, N]<
Заметим, что (1) представляет собой функцию Nr переменных «„, им ...
..., uN_ [. Если функции -FJ(a;, и) непрерывны, a JFJ0', Ф полунепрерывны
снизу по совокупности переменных (х,и) Е Еп х Vt, множества V{ замкнуты
и ограничены в Ет, г = 0,..., N— 1, то функция Д[г^]) полунепрерывна
снизу и существование оптимального управления [u,J, на котором
функция (1) достигает своей нижней грани при условиях (2), (3), следует из
теоремы 2.1,1. Для приближенного решения задачи (1)-(3) могут быть
использованы методы гл. 5. Из-за большого числа переменных задачу (1)-(3),
по-видимому, удобнее рассматривать в пространстве Ь^[0, N], считая
функцию (1) зависящей от N векторных переменных г^, ии ..., uN_y.
Выведем формулу градиента функции (1) при условиях (2), (3) в
пространстве LT2[6,N].
Теорема 1. Пусть функции JFJ0, ^,Ф непрерывны по
совокупности своих аргументов вместе со своими частными производными по
переменным х, и при х Е Еп, uEVu г = 0,..., N — 1. Кроме того, пусть
\F{(x + Ax,u + h)- F{(x, и)\в. < L{\Ах\Е„ + \h\Er) (4)
при всех х, х + Ах и всех u,u + hEVt, г =0,.. .,N— 1. Тогда функция (1)
при условиях (2),(3) непрерывна и дифференцируема в норме Ll\0,N],
причем ее градиент 1'{\и.\) в точке [ut] Е U представим в виде
Г(Ы) = {Ны(х„фоЩ), i=0,...,N-l}EL'2[0,N), (5)
где
Hi(x,^u) = F°(x,u) + (^F.(x,u)), Hiu = {H^,...,Hiu,), (6)
[xi] = (¾) • • •> xn) ~ дискретная траектория задачи (2V
соответствующая выбранному управлению [uj Е U, а вектор-функция [ф{] =
= (VLu "Фо, • • ч VV-1) определяется из условий
4i-i = Hb(xt,1)i,ui), i=0,...,N-l, ^_1=Ф,(%)- (7)
Доказательство. Пусть W,[«,'] + [^]£^ и пусть [х-] и [х{] +
+ [Ах(] — соответствующие этим управлениям дискретные траектории
задачи (2), а 1([и{]) и 1([и{]+[к{]) = 1([щ])+А1 — соответствующие значения
функции (1). Из (2) следует, что приращение [Ах{] удовлетворяет условиям
Axi +, = ^(^ + Ах., и, + ht)- JRJte.u,), *=0,...,iV-l, Д^О. (8)
Так как Ф(х + Ах) — Ф(х) = (Фх(х + 6Ах), Ах), 0< в ^ 1, то из (1) получим
N- 1
AI = £ №(4 + Ахи щ + Ы - FP(x„ щ)) + (Фх(хм), &xN) + К (9)
где
Я, = (Фх(х„ + вАх„)-Фх(хм), AxN). (10)
С учетом соотношений (7), (8) имеем
JV-1
(Ф*(%), А%) = (Фм-U Axn) = Е [(Фг, А^ + 1> - (Фг-1, %.)] =
= Е^, Ц{х, + Ах,, и, + fc.) - Ц(х,, щ)) - Ё (Щх(х,, ф{, и,), AXi),
t=0 t=0
§ 6. ГРАДИЕНТ В ЗАЙАЧЁ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 567
Прдставляя дошученное выражение в (9) и используя функцию Н{(х, ф, и),
получим следующее представление для приращения функции:
»=.0
Из формулы конечных приращений следует
= Щх{, ф„щ) + (Нь{х1 + в,Ах.^ф.,п. + т{), Д^} +
+ Шх. + вАх{,ф{,щ + 8ЛД ht), О^ в, <С 1, г = О,.. , N - 1.
Подставим это равенство в предыдущее представление для AJ; будем иметь
А1=^,\н,и(х^ф,,и,),к{)+Е, Д^+^ + Яз, (И)
JV -1; =°
Щ = Е iPJb + ОАЪ, ^i Ч- + 4h)- Hb(x.t, ф0 «<), AXi), (12)
е=0
R3 = Т;Шъ + вАщ, Ф„ «,- + <?Л) - Д*<^ й. «,), М- (13)
»=0
Для оценки остаточного члена R формулы (11) нам понадобится одна
лемма, представляющая собой дискретный аналог леммы 6.3.1.
Лемма 1. Если некоторые величины <pit г = 0,..., N,
удовлетворяют неравенствам
0<^^а, 0<¥>| + 1<а+Ь £ ¥>„, * =0,..., N - 1, 6^0, (14)
т = 0
то справедлива оценка
0<^<а(1 + Ь)% *=0,...,JV, (15)
если же
0< ¥>,_,< а+Ь £ ¥>т, * =0,...,^-1,- 0<^_,^а, (16)
771 = г
то верна оценка
0<^<а(1 + Ь)"-«-\ * =0,..., JV-1. (17)
Доказательство можно провести по индукции. При k = 0 по
условию 0 ^ </>0 ^ а. Если неравенство 0 ^ (рт < а(1 + Ь)т верно при всех
т = 0, ..., г, то из (14) следует 0< </>,- + 1<а+Ь £} а(1 + Ь)т = а(1 + b)i + K
m = 0
Аналогично можно убедиться, что из (16) вытекает оценка (17). D
Продолжим доказательство теоремы 1. Из соотношений (8) для [Да;,] с
учетом условия (4) имеем
|A^- + il =
Е (А^т+1 - Л*т) ^ Е (Д^т(ат, «J - Ахт)\ ^
771 = 0 771 = 0 . ДГ_ 1
<(!+£) Е |Aa=m| + L t\hj.
Полагая в (14), (15) a=L Е 1^-|> Ь = (1 + L), ^ = |А^|, получим оценку
»=о
IA^-I^c/EViI, С,=£(2 + £)", i=0,...,N. (18)
t=0
568
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Из условий теоремы следует непрерывность функций Ф^., Hix, Hiu по
совокупности своих аргументов. Тогда с учетом оценки (18) из выражений (10),
(12), (13) заключаем, что остаточный член R в формуле (11) имеет
порядок о(||[/г,]||). Таким образом, в формуле (11) приращения функции первое
слагаемое является линейной ограниченной функцией на ЬЦО, N]
относительно [hf], а второе слагаемое имеет порядок o(||[/it-]||). Это значит, что
функция (1) при условиях (2), (3) дифференцируема и ее градиент имеет
вид (5). □
2. Зная формулу градиента, нетрудно расписать методы минимизации
применительно к задаче (1)-(3). Например, метод проекции градиента здесь
приводит к построению последовательности [щ]к = (¾½,..., uN_ { к) по
формулам
*Ч* + 1 = pVi(ui,k ~ ак Ди(%, Фы ««))i * =0,..., JV— 1, к = 0, 1,...,
где ак > 0 выбирается, как в § 5.2; [х{]к = (х0к,..., xNk), [ф{]к = (V-i.*. • • •
..., фм_ lk) — решения задач (2) и (7) соответственно при [и.] = [и{]к.
Приведем достаточные условия для того, чтобы градиент функции (1) при
ограничениях (2), (3) удовлетворял условию Липшица.
Теорема 2. Пусть выполнены все условия теоремы 1 и пусть
функции Ф, Ff, Ft°, Fiu, F? удовлетворяют условию Липшица по
совокупности (х, и) е Еп х V{ с константой L > 0, г = 0,..., N — 1. Пусть,
кроме того,
\Fi(x,u)\^.Al+A2\x\; Ау, А2 = const > 0, (19)
при всех х е Еп, ueVf, и множества V{ из (3) замкнуты и ограничены в
ЕТ, i=0,..., N—1. Тогда градиент функции (1) при ограничениях (2), (3)
удовлетворяет условию Липшица.
Доказательство этой теоремы полностью аналогично доказательству
теоремы 5.2; предлагаем читателю провести его самостоятельно.
3. Используя полученную формулу градиента, выведем необходимые
условия оптимальности для задачи (1)-(3).
Теорема 3. Пусть выполнены все условия теоремы 1. Пусть [ии] —
оптимальное управление, [х{] —соответствующая ему траектория
системы (2), т. е. I([u,t]) = iml([u.]), где нижняя грань берется по всем
[и{] из условий (2), (3). Пусть [ф{а] — решение задачи (7),
соответствующее управлению [u.t]. Тогда необходимо выполняются неравенства
Шхи, фш «„), щ -uit)>0, i=0,...,N-l, (20)
при всех u.eVit для которых направление e = ui — uu является
возможным для множества V. в точке ии, причем если ии —внутренняя точка
множества V., то
Ны{*и,Ф^^)=0; (21)
функции Н.(х, ф, и) определяются равенствами (6).
Доказательство. Положим в формуле (11) х{ = х^, ф{ = фи, и{ = и.,;
получим
Д' = £Vmu(zm„ Vu, О, К) + о№Ж (22)
т = 0
§ 6. ГРАДИЕНТ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 569
Пусть и{ — произвольная точка из VJ, для которой uit + a(ut — uit) € V{ при
всех а, 0 < а < а0. Возьмем в (22) [h ] = (0,..., О, h( = а(щ — uit), 0, ..,
...,0). Очевидно, при таком выборе [пт] управление [uit] + [h(] € U, и в
силу оптимальности [ии] из (22) тогда получим
О <: Д7 = (Hiu(xit, фш «,,), «К - «,,)> + о(а||[М1), 0 < а < а0.
Поделив обе части этого неравенства на а > 0 и перейдя к пределу при
а —>+0, сразу придем к неравенству (20), Если uit — внутренняя точка Vt,
то в (20) можно положить щ = ин — eHiu(xit, фн, uit) € Тл при некотором
е >0, что сразу приведет к равенству (21). Если V. — выпуклое множество,
то условие (20), очевидно, выполнено для любого и{ е Vt. Если ~У{ выпуклы
при всех г =0, 1,..., N — 1, то неравенства (20) в силу формулы (5)
равносильны одному неравенству (1'([ии]), [и{] — [uit])Lr ^ 0 при всех [uf] е U,
что совпадает с условием оптимальности из теоремы 3.3.
Таким образом, согласно теореме 3 оптимальным может быть лишь
управление [uit]e U, удовлетворяющее условиям (20). Однако, как связано
управление [uit] с экстремальными точками функции 77,.(ж,ч, фн, и) на множестве
Vu условия (20) на это не дают ответа. В частности, возникает
естественный вопрос: нельзя ли по аналогии с системами с непрерывным временем
утверждать, что оптимальное управление [ии] удовлетворяет принципу
минимума
Щ*ш Фш «*.) = min Н{(хн, фи, и), г = 0,..., 7V - 1 (23)
(чтобы здесь, как и в гл. 6, можно было говорить о принципе
максимума, нужно изменить знаки функций Н{, ф{). Ведь^необходимое условие
оптимальности тем ценнее, чем меньше управлений, подозрительных на
оптимальность, оно выделяет. В этом смысле условие (23) явно имело бы
преимущество перед условиями (20), так как неравенства (20) могут
выполняться не только в тех точках, где имеет место (23), но и в других
точках, в которых, например, Ны(хш фш uit) = 0. К сожалению, оказывается, в
управляемых системах с дискретным временем принцип минимума, вообще
говоря, не имеет места: на оптимальном управлении функция Н{(хн, фш и)
может и не достигать своего абсолютного минимума по и € Vi.
Пример 1. Пусть фазовое состояние системы описывается двумя
координатами (ж,., у{), г =0, 1, 2, причем
xi + l=Xi+2Ui, yi + l = -xf + y{+uf, г =0,1; ^ = 3; у0 = 0.
Пусть требуется минимизировать функцию 1(и0)иЛ = -у2 = Ф(х2,у2) при
условии [щ] = (щ,их)е U = {(u0,ul): К[<5, г=0, 1}. Нетрудно вычислить
явное выражение 7(^, ^) = 3(^+2^-1^+6. Отсюда следует, что
оптимальное управление (и^, ин) имеет вид: и^ = —2, иы = 5 (возможность ии = -5
предоставляем читателю рассмотреть самостоятельно). Оптимальная
траектория тогда такая: :% = 3, жи = —1, x2t = 9; t/0* = 0> 2/i* = ~5, %t = —19;
минимальное значение функционала равно 7, = -19.
Составим функцию ЯДж,., уи фи, ф2{) = фи(х. + 2щ) + ^(-xf + % + и?).
Система (7) здесь имеет вид
^l,i-l= Фи ~2Ал, ^2,.--1=^-. г' = 1>°>
1/>п=Ф =о, ф21=фУ2 = -\.
570
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Подставив сюда оптимальные (xit, уи), получим Ф1Ы=0, фт=—2, ф2н=—\,
■Ф2о*=-1- Тогда #<,(%,, Sb,, Vio*. Ф%)*> и)=-(и + 2у + 7. Как видим, на
оптимальном управлении u=uut=-2 функция Я0(^4, t/0t, фт, ф20*, и) достигает
своего абсолютного максимума, в то время как ее минимальное значение
при |и|^5 достигается в точке и=5. Поэтому для управляемых систем с
дискретным временем принцип минимума, вообще говоря, не имеет места.
4. Рассмотрим задачу оптимального управления линейными дискретными
системами: минимизировать функцию (1) при условиях (2), (3), если
Fi(xi,ui) = Alxl+Biui+fi, г =0,..., N-l, (24)
где А{, В{, /,. — заданные матрицы порядков raxn, nxrnnxl
соответственно.
Теорема 4. Пусть функции F°,Ф удовлетворяют условиям
теоремы 1. Тогда функция (1) при условиях (2), (3), (24) дифференцируема
в Ll[0, N] и ее градиент Г{[и{\) в точке [и{] вычисляется по формуле
1'(Ы) = ШЪ,Ч) + В?ф<, i=0,...,N-l}, (25)
где [xf] = (xq, ..., xN) —решение задачи (2), соответствующее
выбранному управлению [и{], а [ф{] = (ф_{,..., фм_ х) определяется из условий
Ф(-1=А?ф{-Р°(ъ,и<), i=0,...,N-l, ^_1=Ф*(%), (26)
матрицы Af, ВТ получены транспонированием матриц А{,В^ Если,
кроме того, Фх, F£, F? удовлетворяют условию Липшица по
совокупности (х, и) еЕп х ЕТ, то градиент /'([%]) удовлетворяет условию
Липшица на всем пространстве L£[0, N].
Формулы (25), (26) вытекают из теоремы 1; условие Липшица для
градиента доказывается аналогично тому, как это делалось в теореме 5.3.
Укажем достаточные условия выпуклости и сильной выпуклости
функции (1) при условиях (2), (3), (24).
Теорема 5. Пусть выполнены условия (24), функция Ф(х) выпукла
по х на Еп, a F°(x, и) выпукла по совокупности переменных (х, и), т. е.
F?(ax + (1- а)у, au + (l- a)v) < uF?{x, и)+ (1- a)FP(y, v) (27)
при любых х,уе Еп; u,veEr, а € [0,1] и i =0,..., N - I, Тогда
функция (1) выпукла на Ь%[0, N]. Если при этом функции Ф, Ц°
удовлетворяют условиям теоремы 1, множества Vit г =0,..., N — 1, выпуклы, то
для оптимальности управления [uit] необходимо и достаточно, чтобы
(Р°(хи,ин) + ВТфи,щ-и^)^0, UieV{, г =0,.., TV-1. (28)
Доказательство. Решение задачи (2), (24), очевидно, обладает
свойством х,(а[и{] + (1 - a)[vt]) = ах{([иЛ) + (1 - а)МЫ)> * = 0,..., N,
при любых а и любых [и{], [vf] е L2r[0, N]. Тогда выпуклость функции (1)
на Ь^[0, N] является простым следствием выпуклости Ф(х) и условия (27).
Условие оптимальности (28) вытекает из теоремы 3.3 и формулы (25). □
С помощью теоремы 2.10 аналогично доказывается
Теорема 6. Пусть выполнены условия (24), функция Ф(х) выпукла
по х еЕп и, кроме того,
F?{ax + (1 - а)у, аи + (1 - a)v) ^ aF?(x, и) + (1 - a)F?(y, v) -
-a(l-a)j\u-v\2, ^ = const>0,
§ 6. ГРАДИЕНТ В ЗАДАЧЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 571
при любых х, у е Еп; u,veEr, а € [0,1] и г = 0,..., N - 1. Тогда
функция (1) сильно выпукла на Zrj'[0, TV] и задача (1)-(3), (24) имеет, и
притом единственное, решение на любом замкнутом выпуклом множестве
UQLl[Q),N\.
Упражнения
JV — 1 JV- 1
.1. Доказать, что 1([и{\) = а £) .KJ\ +iP .Е ,1¾I + 7жлг' а>Й7 = const, при условиях (2),
i ='0 4 =!0
(24) дважды дифференцируема в ££[0, N]. Доказать, что если при этом а, /3, 7 > 0, то /([«;])
выпукла, а если а > 0, /3, 7 #= 0, то сильно выпукла на ££[0, iV].
2. Пусть выполнены все условия теоремы 5. Доказать, что тогда условие (23) является
необходимым и достаточным условием оптимальности в задаче (1)-(3), (24).
§ 7. Оптимальное управление процессом нагрева стержня
Рассмотренные выше (см. гл. 6, 7, § 8.2-8.5) задачи оптимального управления относились
к управляемым системам, описываемым обыкновенными дифференциальными уравнениями. В
приложениях также возникает большое количество задач оптимального управления
процессами, описываемыми дифференциальными (или интегро-дифференциальными) уравнениями с
частными производными. Таким задачам посвящена обширная литература, для многих классов
таких задач исследованы вопросы существования и единственности оптимального управления,
получены условия оптимальности, разработаны методы их решения (см., например, [11; 35; 51;
67-69; 86; 104; 107; 118; 119; 122-124; 134-136; 138-140; 144; 187; 195-197; 227; 228; 285;
287; 289; 290; 360; 366; 391; 395; 402; 407; 408; 419; 420; 424; 425; 456; 459; 460; 463; 467-469;
475; 478; 479; 483-487; 489; 504; 512; 514; 515; 524; 540; 544; 547; 551-560; 573-577; 609;
630; 640-642; 654; 664-669; 682; 701; 706; 707; 730; 761; 778-780; 784; 790; 801; 802; 805;
818] и др.). Ниже будут рассмотрены некоторые из таких задач.
В этом параграфе мы займемся задачами оптимального управления
процессами, описываемыми параболическими уравнениями. Такие задачи
возникают при изучении управляемых процессов теплопроводности, диффузии,
фильтрации и т. п. [107; 122-124; 228; 287; 289; 467; 504; 779].
1. Рассмотрим задачу, которая в теплофизических терминах может быть
сформулирована следующим образом. Имеется однородный стержень 0 < s <
< I, левый конец s =0 которого теплоизолирован, на правом конце s =1
происходит теплообмен с внешней средой и, кроме того, в стержне
имеются источники (или стоки) тепла. Через х = x(s, t) обозначим температуру
стержня в точке s в момент t. Пусть x(s, 0) = ip(s), 0<s < I, —
распределение температуры в стержне в начальный момент времени t = 0. Требуется,
управляя температурой внешней среды и плотностью источников тепла в
стержне, к заданному моменту Т > 0 распределение температуры в стержне
сделать как можно ближе к заданному распределению b(s), 0 < s < I.
Математическая формулировка этой задачи: требуется минимизировать
функцию
J(u)=$ |яв(в, T;u)-b(s)\2ds (1)
о
572
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
при условии, что x = x(s, t) = x(s, t; и) является решением краевой задачи:
xt = a?xss + q(s, t), (s, t)eQ={0<s<l, 0.< t < T} (2)
^.1.-0 = 0, 0<t^T; (3)
x.\.-, = v[p(t)-x(i,t)], 0<t^T, (4)
4=o = v(s). 0^s<Z, (5)
где a2, I, v, T — заданные положительные величины, p(t) — температура
внешней среды, g(s, £) — плотность источников тепла; ip(s), b(s) —
заданные функции из L2[0,1]. Предполагается, что u = (p(t), f(s, *))
—управление — принадлежит множеству
U = {u = (p(t), q(s, t)) е L2[0, Т] х L2(Q):
Pmin ^P(t)< Pmax почти всюду на [0, Г], Ц q2(s, t)dsdt < Я2}, (6)
Q
где pmia < pmax, R > 0 — заданные числа.
Гильбертово пространство пар u = (p(t), q(s, £)), p(t)eL2[0, T], q(s, t)e
eL2(Q), со скалярным произведением
г
<«1»«2> = J Pl(*)ft(*)d* + S^l(S> *)&(«> Odsd*
0 Q
и с нормой |М|Я = (|H|| + \Ы\1 )1/2> будем обозначать Я = ^2[0, T]xL2(Q).
Так как управление u = (p(t), q(s, t)) е U С Н может иметь разрывы, то
краевая задача (2)-(5), вообще говоря, не имеет классического решения
[698]. Поэтому понятие решения этой краевой задачи требует уточнения.
Определение 1. Обобщенным решением краевой задачи (2)-
(5), соответствующим управлению u = (p(t),q(s,t)) е Н, будем называть
функцию х = x(s, t) = x(s, t; u)eHl'°(Q) (см. обозначение в § 1), имеющую
следы x(s, •) € L2[0, Т] при всех s € [0, I] непрерывные в метрике LJ0, I],
следы х(-, t)eL2[0, I] при всех t е[0, Т] непрерывные в метрике L2[0, Т],
и удовлетворяющую интегральному тождеству
$ х(а, Т)ф(а, T)ds - J ip(s№(s,0)ds - §(хф( - a2x^s)dsdt -
0 0 Q т
- Ц qil)dsdt-a2v \{p{t) - х{1, Ь))ф{1, t)dt = 0
Q 0
при всех ф =ф{э, t)eHl(Q) и, кроме того, след х(-, t) при t = 0 совпадает
с функцией </?(s) почти всюду на [0, I].
Можно доказать, что при каждом и е Н краевая задача (2)-(5) имеет,
и притом единственное, решение — по этим вопросам отсылаем читателя к
книгам [441; 492]. Таким образом, функция (1) при условии (2)-(5)
определена всюду на Я.
Покажем, что задачу (1)-(6) можно свести к задаче (2.3) минимизации
квадратичной функции. С этой целью решение краевой задачи (2)-(5)
представим в виде суммы
x(s,t;u) = y(s,t;u) + x0(s,t), (s,t)eQ, (7)
§ 7. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ НАГРЕВА СТЕРЖНЯ 573
где y = y(s, t) = y(s, t;u) — решение задачи
Уг = <*У„ + Я{а, *)> (в, t)eQ, (8)
».L=o=o, ys\s=i = v(p(t)-y(i,t)), 0<t^T,
y\tm0 = 0, 0<s<Z, (9)
получающейся из задачи (2)-(5^ при ip = 0; Xq(s, t) — решение задачи,
получающейся из (2)-(5) при p(t) = 0, q(s, £) = 0. Введем оператор
Au = y(s,T;u), в €[0,1], (10)
который действует из пространства Н = L2[0, Т] х LJQ) в пространство
F = L2[0,1]. Из единственности решения задачи (8), (9) следует, что
y(s,t;au + /3v) = ay(s,t;u) + /3y(s,t;v), (s,t)eQ (11)
при всех u,veH, а, /3 € Е. Это означает, что оператор А, определенный
согласно (10), линейный. Убедимся, что этот оператор ограниченный. Для
этого умножим уравнение (8) на у = y(s, t; и) и проинтегрируем по
прямоугольнику Q. Преобразуем полученный интеграл с учетом условий (9):
0= ffi(»t - а2У„ ~ q)ydsdt = \ $ (\{y2)t ~ a?yyss - qy)dsdt =
Q 0 0 ч '
I Ь = Т Т 8 = 1
= Х 52/2(s, *) ds-\a2yya dt + ft a2y2dsdt - ft qydsdt =
0 t = 0 0 s = 0 Q Q
= i \ y2(s, T)ds + a2u ] y2{l, t)dt - a2u ] p(t)y(l, t)dt +
+ a2 ft y2dsdt -ft qydsdt. (12)
Q Q
Далее воспользуемся элементарными неравенствами
(а+Ь)2<2а2 + 2Ь2, \ab\ < \еа2 + ^Ь2,
справедливыми для любых a, b, е > 0. Отсюда и из (12) имеем
i \ y2(s, T)ds + a2v \ у2{1, t)dt + a2 ft y2dsdt =
О О Q
Г / . т , Г >
+
= а2и \ p(t)y(l, t)dt + ft qydsdt < a2v(e^ \ p2(t)dt + ±- \ y2(l, t)dt)
0 Q Ч 0 ' 0 '
+ e2 ft y2(s, t)dsdt + 2^ ft q2(s, t)dsdt (13)
Q S2 Я
для любых £[ > 0, е2 > 0. Кроме того, поскольку
y2(s, t) = (J y.tf, t)rff - y(l, £))2 < 2(} %(£, *)#)' + 2t/2(Z, t) <
<2z}t/2(£, t)de+2y2(I,t), (e,*)€Q,
о
TO
ft y2(s, t)dsdt^2l2 ft y2(s, t)dsdt +21 $ y2(l, t)dt. (14)
Q Q 0
574
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
В правую часть неравенства (13) подставим оценку (14). После приведения
подобных членов получим
1 , г
\ \y\s, T)ds+(a2v-\a2ve-e2l2) \y2(l, t)dt+(a2-e2l2) $ y2(s, t)dsdt <
0 0 Q
^ ir $ P2(t)dt + jr § q2(s, t)dsdt, Ve,>0, Ve2>0. (15)
1 0 ' Q
Возьмем числа eu e2 столь малыми, чтобы а2и — на2^-l2e2>0, d2 — l2e2>0,
например, e2 = d?ev e{ =min< —^1 —^-¾ \. Тогда из (15) получим оценку
||Au||*. = \ y2(s, T; u)ds < С02(||р|||!|0|Г] + \\q\\\\{Q)) = C2\\u\\2, (16)
о
где C02 = max< —; -5—>. Это означает, что оператор (10) ограниченный.
Следовательно, А е£(Н —»F), причем \\А\\ < С0. С учетом (7), (10) имеем
x(s, Г; и) = Аи + Xq(s, Т), s е [0,1]. Поэтому функцию (1) можем
представить в виде
J (и) = \\y(s, Г; и) + xois, Т) - b(s)\2ds = \\Аи - Ъ{\\%,
о
где bl = bl(s) = b(s) — x0(s, T)eL2[0, I]. Таким образом, задача (1)-(6)
сведена к задаче (2.3). Отсюда и из теоремы 2.12 с учетом слабой
компактности множества (6) (теорема 2.6) заключаем, что задача (1)-(6) имеет хотя
бы одно решение. Из примера 3.5 также следует, что функция (1) дважды
непрерывно дифференцируема на Н и ее производные равны
J'(u) = 2A*(Au-bl), J"(u) = 2A*A. (17)
Тогда
||J'(u)-7'(«)11<2||А||2||и-«||<2С?||и-«|| \/u,veH, (18)
где постоянная С0 взята из (16) и учтено, что \\А\\ = \\А*\\ < Cv Это значит,
что J(u) е С1''(Я) (определение 2.6.1).
Посмотрим, как в рассматриваемой задаче действует оператор А*,
сопряженный к оператору (10). Покажем, что оператор А* каждому элементу
c = c(s)e F = L2[0,1] ставит в соответствие элемент А*се Н = L2[0, Т] х
х L2(Q) по следующему правилу
A*c = (a2wP(l,t;c)^(s,t;c)), (19)
где 'ф =^(s,t) = ^(s,t; с) —обобщенное решение краевой задачи
V>( = -a2V>ss, (s,t)eQ,
^.1.-0=0, ^.1.=.=-^(1. *), 0<t<^ ф\г=т=ф), 0<s<Z.
В самом деле, из (2)-(5), (10), (20), (21) имеем
i i
(Ли, c)F = $ y(s, Г; u)c(s)ds = J y(s, Г; и)ф(з, Г; c)ds =
о о
§ 7. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ НАГРЕВА СТЕРЖНЯ 575
о \0 /
= й(»«^ + уФ№<к = Wv«4>+f4> + v{-<*4„)]dsdt =
Q .=, g
= а2 1(У.Ф - УФ.) dt - а2 Ц(у,^. - vMdsdt + ffi /V^scZi =
о s=0 r Q Q
= a^ X p(t)^l. = «de + ff /0^rf* = <«, А*с)я. (21)
Формула (19) установлена. Из (10) (17), (19) следует, что градиент
функции (1) равен
J'{u) = 2{a2iAJ}{l, t);V(s, *)), (22)
где ^>(s, t)~решение задачи (20), (21) при c = Au—bl = y(s, T;u)—bl(s) =
= y(s, T;u)+a\)(s, T)—Ь(з) = ж(з, Т; u)—b(s). Теперь, учитывая выпуклость
функции (1), можем сказать: для того чтобы управление % = (pt(t), qt(s, t))
принадлежало множеству Ut = {и е U: J (и) = Jt = inf J (и) ^ 0} решений
задачи (1)-(6), необходимо и достаточно, чтобы
(J'K), и - ut)H = J а2иф{1, t)(p(t)-Pt(t))dt +
о
+ ft V(«, *)(«(«, *) - «.(«, 0)^00 (23)
Q
при всех u = (p(t), <?(s, £))е U. Вариационное неравенство (23) вытекает
из формулы (22) и теоремы 3.3.
Замечание 1. Приведенные выше доказательства оценки (16),
равенства (21) нельзя признать вполне строгими, так как существование
некоторых встретившихся в выкладках интегралов, законность операций
интегрирования по частям не всегда вытекают из определения решения
рассматриваемых краевых задач и остались необоснованными. Для строгого
доказательства нужно было бы сначала сгладить функции u(t), ip(s), q(s, t), b(s),
провести указанные преобразования для классических решений
соответствующих сглаженных краевых задач, а затем перейти к пределу по параметру
сглаживания и прийти к требуемым соотношениям для обобщенных
решений краевых задач. Полная реализация намеченной здесь схемы строгого
доказательства соотношений (16), (21) довольно громоздка для изложения,
поэтому мы здесь вынуждены ограничиться приведенными выше
рассуждениями, а читателя отсылаем за подробностями к руководствам и
монографиям по уравнениям с частными производными [441; 492].
2. Для численного решения задачи (1)-(6) могут быть использованы
методы проекции градиента и условного градиента (см. § 4).
Метод проекции градиента в задаче (1)-(6) сведется к построению
последовательности {ик = (pk(t), qk(s, £))} по правилу
ft + i(*)=<
pk(t)-2aka?wl>(l, t;uk) при
Pmin<Pk(t)-2aka2v4>(1, *;«*)< Ртах,
Pmin ПРИ ft(*) - 2aka2wp(l, t;uk)<pmln,
pmax при Pk(t)-2aka2mp(l,t;uk)>pmax,
(24)
576
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
' 9*(в, *)-2а^(в, *;«*) при
Ц \qk(s, t) - 2акф(з, t; uk)\4sdt < Я2
9* + i(e» *)=<
fl(gfc(M)-2afcv>(s> *;"<,))
1/2
при
(й1й(в.*)-2«^(*.*;«*)|2«*«и)
Ц|д,(в,*)-2а^(в',*;«»)|2ЛЛ>Л2,
(25)
где через ^(s, t; ик) мы переобозначили решение задачи (20) при c = ck(s) =
= x(s, Т; ик)— b(s) (ср. с формулами (4.27) и (4.29)); выбор параметра ак
можно проводить с помощью одного из описанных в § 4.2 приемов. В
частности, оценка (18) указывает на возможность выбора ак из условий (5.2.4):
О < е0 < ак < 2/(L + 2е), е > О, L = 2С02.
(26)
Метод условного градиента в задаче (1)-(6) сведется к построению
последовательности (¾ = (pk(t), qk(s, *))} по правилу
где
ft + i(*) = ft(*) + a*(?*(*)^ft(*)), O^t^T,
Qk + i(s, *) = 9*(e» *) + ak(Qk(s, *)- 9*(в| *))» (s> *)€ Q,
Pmin при ^(I, *;«4)^0,
P*(*) =
Ртах При i>(l,t;uk)<0,
«*(«»*) =
Ril>(s,t;uk)
(SSI^(*.*;«*)I2A«**)
1/2'
(27)
(28)
(29)
а параметр ak, 0 < afc < 1, может быть выбран одним из указанных в § 5.4
приемов. Вспомогательное приближение йк = (pk(t), qk(s, t)) е U здесь
определено из условия минимума линейной функции
(J'(uk), и)н = \ 2aV0, t;uk)p(t)dt + ft 2ф(а, t; uk)q(s, t)dsdt
0 Q
при ограничениях (6).
Заметим, что из равенства (11) при и = йк, v = uk, /3 = 1 — а и
формулы (22) следует, что функция
/*(«) = J(uk + а(йк~ «*)) = ^К) + 2a \(x(s, Г; uj - у(я)) X
о
х (x(s, Г; йк) - x(s, Г; ufc))ds + а2 \ \x(s, Т; йк) - x(s, Г; ufc)|2ds =
о
= ^К) + a(J'(uk), йк - Щ)н + <*2 $ |я(я, Г; й*) - я;(в, Г; ufc)|2ds
о
при x(s, Т, uk)y^x(s, Т; ик) является квадратным трехчленом относительно
переменной а. Поэтому, рассуждая так же, как при выводе формулы (4.35),
из условий
ЛК)= min fk(a), 0<а,<1,. (30)
0< а < 1
§ 7. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ НАГРЕВА СТЕРЖНЯ 577
мы получим, что
ak = min{l;a*k}, (31)
где
\(x(s, Т; ик) - b(s))(x(s, Г; ик) - x(s, Т; uk))ds
ак = _о . =
l\x(s,T;uk)-x(s,T;uk)\2ds
о
т
S а2иф{1, t;uk)(pk(t)-pk(t))dt й Ф(8, t;uk)(qk(s, t)-qk(s, t))dsdt
= -*, + ^ >o.
[\x(s,T;uk)-x(s, T;uk)fds l\x(s,T;nk)-x(s,T;uk)\2ds
о 0
В случае, когда x(s, Т;йк) = x(s, T; иЛ, 0 < s < I, или а^ = 0, то uk = ut —
оптимальное управление задачи (1)-(6).
Согласно теоремам 4.2 и 4.4 последовательность {ик}, построенная
методом (24)-(26) или методом (27)-(31), является минимизирующей для
задачи (1)-(6).
На практике приходится пользоваться разностными аналогами этих
методов: встречающиеся в (24)-(26) и (27)-(31) интегралы вычисляются с
помощью формул численного интегрирования (например, формулы
прямоугольников или трапеций), а при решении краевых задач (2)-(5) и (20)
можно пользоваться, например, неявной разностной схемой в сочетании с
прогонкой [74; 89; 362; 480; 481; 615; 630-635, 698; 362] (см. также ниже
§ Ю.7).
3. Перейдем к рассмотрению более сложной задачи минимизации
функции (1), когда наряду с условиями (2)-(6) требуется, чтобы температура
стержня не превышала некоторой заданной величины х, т. е.
x(s,t;u)^x, (s,t)eQ. (32)
Такие задачи возникают при исследовании таких тепловых процессов,
когда перегрев материала выше определенной критической температуры х не
допустим.
Для решения задачи (1)-(6), (32) воспользуемся методом штрафных
функций. Для учета ограничения (32) возьмем штрафную функцию
Рк(и) = Ак Ц | max{a;(s, t; и) - x;0}\2dsdt,
Я
где {Ак} — заданная положительная последовательность, {Ак}—>оо и при
каждом к = 1, 2,... будем рассматривать задачу минимизации функции
Фк(и)=\\х(з,Т;ик)-Ъ(з)\Чз + Рк(и) (33)
о
при условиях (2)-(6). Функция (33) дифференцируема на Я и ее градиент
имеет вид
^k(u) = 2(a2iApk(l,t;u);^k(s,t;u))eH, (34)
где if)k(s, t;u) — решение уравнения
V>j = -а2фт -2Akmax{x(s, t;u) - х;0}, (s,t)eQ, (35)
при краевых и начальных условиях из (20), c(s) = x(s, Т; и) — b(s).
578
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
В самом деле, приращение АФк(и) = Фк(и + к)—Фк(и) здесь представимо
в виде
АФк(и) = $ 2(x(s, Г; и) - b(s))Ax{s, T)ds +
о
+ §2Akmax{x(s, t; и) - x;0}Ax(s, t)dsdt + Rk, (36)
Q
где Дx(s, t) = x(s, t;u + h) — x(s, t;u) — решение краевой задачи (8), (9),
в которой и = (р, q) заменено на h = (Ар, Aq). Рассуждая так же как при
выводе оценки (16), из (13), (14) нетрудно получить оценку
й |Дя;(в, t)\4sdt + $ |Дя;(в, T)\2ds ^ С0\\Ц%.
Q О
Поэтому остаточный член Rk в (36) оценивается так:
|Я,|< \\Ax(s,T)\4s+2A^\Ax(s,t)\4sdt^Ck\\h\\%, Ск=С0(1+2Ак). (37)
О Q • ,
Справедливо равенство
\2(x(s,T;u)-b(s))Ax(s,T)ds =
о т
= J a2iApk(l, t; u)Ap(t)dt + $J i>k(s, t; u)Aq(s, t)dsdt —
0 Q
— Ц 2Ak max{a;(s, t; u) — x;0}Ax(s, t)dsdt,
Q
которое вытекает из цепочки равенств, аналогичных (21). С учетом этого
равенства из (36), (37) получим
г
АФк(и) = \ а?1лрк(1, t; u)Ap(t)dt + Ц фк{з, t;u)Aq(s, t)dsdt + Rk, (38)
0 Q
при этом |.RJ < Сь||^||я, Ск = const ^ 0. Из (38) вытекает дифференцируе-
мость функции (33), и получается формула (34).
Как видим, формула (34) вполне аналогична формуле (21), и поэтому нет
ничего удивительного в том, что методы проекции градиента и условного
градиента для задачи (33), (2)-(6) реализуются по тем же формулам (24),
(25) и (27)-(29) с заменой <ф на фк.
4. В рассмотренных задачах при выводе формулы градиента важную роль играли
вспомогательные краевые задачи вида (20), которые принято называть сопряженными краевыми
задачами, соответствующими исходной задаче оптимального управления. Возникает вопрос,
откуда берется сопряженная краевая задача, по каким правилам она составляется?
Здесь мы приведем некоторые эвристические соображения, помогающие в составлении
сопряженной краевой задачи, установим связь между решением сопряженной краевой задачи и
множителем Лагранжа задачи оптимального управления [112]. Все построения проведем на
примере задачи (1)-(6), считая, что
и = (р, q) е U = Я = L2[0, Г] х L2(Q).
Следуя уже известной нам процедуре исследования задач на условный экстремум (см. §§ 2.3,
4.8, 4.9, 6.2 и § 2), составим функцию Лагранжа задачи (1)-(6):
1
L(x, р, q, ф)= J \x(s, T)-y(s)\2ds+ SS фк(з, t)(-xt(s, t)+a2x„(s, t)+q(s, t))dsdt, (39)
§ 7. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ НАГРЕВА СТЕРЖНЯ 579
где V>(si *) — множитель Лагранжа, соответствующий ограничению (2). Будем предполагать,
что функции x(s, t), V>(S| t) являются достаточно гладкими на Q = {(s, t): 0 < s < I, 0 ^ t <
< Г}. Поскольку уравнение (2) уже учтено в (39), то от функции x(s, t) будем требовать
лишь удовлетворения граничным и начальным условиям (3)-(5); дополнительные условия на
функцию ip(s, t) будут наложены ниже.
Дадим приращения (вариации) переменным х, р, д,т. е. рассмотрим функцииx(s,t)+Sx(s,t),
p(t)+Sp(t), q(s,t)+Sq(s,t), (s,t) e Q, такие, что
Kl, = 0 = °. Sxs\s = l = v(Sp(t)-Sx(l,t)\ «x|.-o = °- (4°)
Вариация функции Лагранжа (39), представляющая собой главную линейную часть
приращения этой функции, имеет вид
SL = J 2(x(s, Т) - y(s))Sx(s, T)ds + Ц ф(-6хг + а26х33 + 6q)dsdt.
О Q
Учитывая условия (40), преобразуем двойной интеграл с помощью интегрирования по
частям. Получим
1
6L= l[2(x(s, Т)-у(а))-ф(з, T)]6x(s, T)ds+ §(фt+a2фaa)6xdsdt+ § фSqdsdt +
0 Q Q
Г r Г
+a2 \(vi>(l, ^+фа(1, t))Sx(l, t)dt+a2u \ф(1, t)Sp(t)dt+ J фчф, t)Sx(0, t)dt.
0 0 0
Считая, что в оптимальной точке выполняется условие стационарности 6L = 0, и пользуясь
достаточно большим произволом в выборе Sx(s, t), приравняем нулю коэффициенты при
вариациях Sx(s, Г), Sx(s, t), Sx(l, t), Sx(6, t) и придем к условиям для множителя Лагранжа
ip(s, t), полностью совпадающим с сопряженной краевой задачей (20); приравнивая нулю
коэффициенты при 6p(t) и Sq(s, t), получим условия ф(1, t) = 0, V(s, £) = 0, которые согласно
формуле (22) означают равенство J'(u) — 0 — условие оптимальности в задаче (1)-(6) при
ие U = Н.
Изложенный на примере задачи (1)-(6) подход к получению сопряженной краевой задачи
применим для широкого класса задач оптимального управления процессами, описываемыми
как обыкновенными дифференциальными уравнениями, так и уравнениями с частными
производными. Этот подход кратко можно сформулировать в виде следующих правил:
1) сначала нужно записать задачу минимизации в виде
J(u) ~»inf, Ь{(х, и, О=0> ££<%, i = l,...,m; lt(x, u)=0, i = l,...,p,
где Gi — заданная область из евклидова пространства Еп>, х=х(£)~(х1((1),..., хп(£)) —
фазовые переменные, и = (и'(£),..., иг(£)) — управления, L{ —дифференциальный оператор,
I. — операторы граничных и начальных условий, и составить функцию Лагранжа
m
L(x,u^) = J(u)+ •£ 1Ф{(()Ь,(х(е),и(е),№;
i = 1 G,
2) затем нужно найти вариацию функции Лагранжа по фазовым переменным и
управлениям с соблюдением граничных и начальных условий Ц(х, и) — 0, г =,(,,.., р, и с помощью
интегрирования по частям (или с помощью формулы Гаусса — Остроградского для сложных
многомерных областей) с учетом граничных и начальных условий преобразовать полученную
вариацию так, чтобы выражения под знаками интегралов по областям G; не содержали
частных производных вариаций фазовых переменных;
3) наконец, пользуясь условием стационарности функции Лагранжа и произволом в выборе
вариаций фазовых переменных, приравнять нулю коэффициенты при соответствующих
вариациях; совокупность полученных при этом равенств представляет собой условия на множители
Лагранжа и образует искомую сопряженную краевую задачу.
Предлагаем читателю, пользуясь этими правилами, самостоятельно вывести, сопряженную
краевую задачу для задачи (33), (2)-(6), а также для рассматриваемых ниже задач
оптимального управления.
Подчеркнем, что приведенные в этом пункте рассуждения не могут считаться строгими
и являются лишь полезными наводящими соображениями при получении сопряжённой
краевой задачи, выводе формулы градиента, необходимых условий оптимальности. Для полной
580
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
строгости нужно еще выполнить большую и трудную работу и определить, что понимается
под решением исходной и сопряженной краевых задач, исследовать вопросы существования
и единственности решения этих задач, дать строгий вывод формулы приращения с оценкой
остаточного члена и т. п. ,,i,
5. Выше были подробно рассмотрены задачи оптимального управления для простейшего
уравнения теплопроводности с одной пространственной переменной. Из этих рассмотрений
видно, что, хотя окончательные расчетные формулы, реализующие методы проекции
градиента и условного градиента для ограничений вида (6) достаточно просты и удобны для
использования на ЭВМ, вывод этих формул связан с довольно громоздкими оценками, и строгое
исследование таких задач является весьма тонким и хлопотным делом. Еще более трудным
и громоздким становится исследование задач оптимального управления системами,
описываемыми более общими параболическими уравнениями при более сложных функционалах,
граничных условиях, ограничениях на управления и на решения. Здесь мы ограничимся лишь
приведением формул градиента для следующей задачи.
Пусть П — заданная область в евклидовом пространстве Еп переменных s = (sv ..., sn) с
кусочно гладкой границей Г; пусть Г[ и Г2 — кусочно гладкие части границы Г, не имеющие
общих точек, причем Г[ иГ2 = Г (в частности, одно из этих множеств Г[ или Г2 может быть
пустым). Пусть tg, Т — заданные моменты времени. Обозначим Q = {(s, t): s е П, t0^t^ Г}.
Пусть в Q имеется конечное число кусочно гладких поверхностей, разбивающих Q на
конечное число подобластей Q,, г — 1, 2,..., р (случай р = 1, Qi .== Q не исключается). Поверхность,
которая служит границей для подобластей Ql и Qk, обозначим через Tkl. Будем считать, что
физические характеристики рассматриваемой области Q (плотность, теплопроводность,
удельная теплоемкость и т. п.) непрерывны внутри каждой подобласти Q{ и могут терпеть разрывы
типа скачка лишь на поверхностях Гк1.
Рассмотрим задачу минимизации функции (функционала):
J»= И Ф0(«Л *(«,*:«W«,0)d«tt + S №i(«,t, dx^u\nl(s,t))drldt+
+ S S Ф2(яЛа:(М;u),«2(s,t))dT2dt+ \ <&3(s, x(s,T; и), ^(s^ds (41)
% г, а
при условиях 2
п п ' ' '
xt - Е °у(я1 *К,,. + Е Ms> г)\ + c(s> i)x-<Po(s, *. «о(Я| *))> («. *) е Q; (42)
И«.*)1ги=0. [^1^=0. (*,*)еГы; (43)
ж(в1 *)Uer, = Vi(si *i "i(s. *))Ler,i *0<*<г; (44)
(Ч^+Т(*,*И«.*))|,6 =^(«.*,«2(»,*))1.6Г,. *0<*<Г; (45)
ж(*. *)U = ^ = У3(в> Чз(в»> sen> (46)
dx(s t) .A - dx(s t)
где —ядт = E aij(si *) cos(n, s;)—^H—l — производная функции x по конормали к гра-
h 3 - 1 3
нице подобласти Qk в точке (s, t); n = n(s, t) — внешняя для <3fc нормаль в той же точке (s, t)
с направляющими косинусами cos(n^sj), i = 1, 2,..., n; [z(s, t)]r — разность предельных
значений функции z(£, т) при стремлении точки (£, т) к (s, t) е Гм изнутри подобласти Qk и Q,
соответственно; ay(s, t), Ьг(з, t), <^(s, t, u), c(s, t), 7(5, *),фДв, t, z, u) — заданные функции
n n
своих аргументов, £ %•(*, *)£;£j > a E £г?- aij-aji> ПРИ BCex (s> *)G Q> £ = (£i> ■ ■ •>£„):
t,J = l 1 = 1
a = const > 0; a;As, t), bt(s, t) непрерывны внутри подобластей Qt и могут терпеть разрывы
типа скачка лишь на поверхностях Гк1; функции и = («q(s, t), u{(s, t), ^(s, t), ihls)) являются
управлениями, подлежащими определению из условия минимума функции (41). Будем считать,
что «g(s, t) е L2(Q), иг-(в, t) e L2(Ti), i = 1, 2, «3(e) e L2(fi) и удовлетворяют ограничениям
типа (6).
Нетрудно видеть, что рассмотренные выше задачи оптимального управления для уравнения
теплопроводности (2) являются простым частным случаем задачи (41)-(46). Заметим, что
некоторые из управлений и-, j — 0,1,2,3, могут отсутствовать в задаче (41)-(46),— в этом
случае функции Ф^, ipi не. зависят от и-.
§ 7. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ НАГРЕВА СТЕРЖНЯ 581
Управление и = («g(s, t), u{(s, t), u,(s, t), «3(e)) в задаче (41)-(46) удобно считать
элементом гильбертова пространства H = L2(Q) х Ь2(Т{) х £2(Г2) х L2(Cl), в котором скалярное
произведение двух любых элементов щ = («оДв, £), uu(s, t), «^-(s, *)> ЧзД5))' г = Ь 2i
определяются посредством формулы
(«Пи2>я= й «01 (я,tjt^s.tjdsdt-f J J u11(s,t)u12(s,t)drldt +
+ S S «2l(s> *Нг(я, t)dsdt + S ^l(s)432(s)ds'
а норма — формулой \\и\\н = ((u^u^jj)1/2. При некоторых требованиях к функциям
a«i Ьг-, с, 7) <PsiФ* и к области Q можно доказать, что при каждом иеН обобщенное решение
x(s, t, и) краевой задачи (42)-(46) существует и единственно [492; 698], а функция (41) при
условиях (42)-(46) дифференцируема в Я и ее градиент имеет вид
Piu+I'iuhser,
Г(и)=\-ф(8,г,и)<р0и+Ф0и;- Е E(ayV)s;,-cos(rp;.)+E h со5(п,^)Ф
где частные производные (piu вычислены для аргументов (s, t,u{ (s,t)), i = 0,1,2,3, а Ф,-,
и Ф12 — для тех же аргументов, с которыми функция Ф,. входит в (41), г — 0,1, 2, 3; ф =
= V>(s, t, ") — решение сопряженной краевой задачи
*,-- £ (^)3,,+ Е(^)3|-^-8Фо^^^")^(^)), (M)6Q. [^ *
Vj=l s = l
£ K,"0)s cos(n,e,.)- E b;COs(n, s^+V-cos^, i)
Li, j =.1 ' 1 = 1
= 0, (e,t)eru;
r„
^i(M,^,M','))
*(«.*)Lr= * Wz Lr' *o<*<r;
Is €1^ t^* Is €1^
n . n .
£ (%-V0s< 008(71,8,.) + 7(8,^)^- E b,.COS(7l,S.)V c _ =
"95 ^^Url' *0<t<ri
ЭФ2(я, t, s(s, t, ц), «2(s, t))|
Имея формулу градиента и опираясь на общую схему методов проекции градиента и условного
градиента из § 4, пп. 2, 3, нетрудно расписать формулы, реализующие эти методы
применительно к задаче (41)-(46).
Упражнения
1. Рассмотреть задачу (1)-(6), заменив условие pmjn <р(*)^Ртах на условие p(t)eL2[0, Г],
г
S 1р(*) — Р(*)1 «* < ^oi где p(t) е£2[0, ^"1 и число R0 >0 заданы. Описать методы проекции
о
градиента и условного градиента.
2. Найти градиенты функции (1) при условиях (2)-(5) по каждой из переменных
(р = <р(х) е £2[0,I], p(t) е L2[0,l], g(s,t) е £,(<?) и по совокупности переменных и =
= (ip(x), p(t), q(s, t))eH = i2[0, Z]x i2[0, T]xL2(Q). Описать методы проекции градиента
и условного градиента, считая, что p(t), q(s, t) удовлетворяют условиям (6), и, кроме того,
Vmin <V(SK Ршах почти ВСК)ДУ на [°> *)•
1 г
3. Рассмотреть функцию J(u)=/30 l\x(s,T,u)-b(s)\2ds+(3l l\p(t)\2 dt+/32JJ \q(s, t)\2dsdt
0 0 9
при условиях (2)-(5), считая /¾ = const > 0, i = 0, 1, 2; b(s)eL2[0, l]. Доказать, что эта функ-
582
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
ция сильно выпукла на Н; найти ее градиент; описать градиентный метод при U = Н и методы
проекции градиента и условного градиента при ограничениях (6),
1 г
4. Рассмотреть функцию J(p) = $ \x(s, Т,и)- b(s)\2ds + (3 J |p(t)|2 dt, /3 = const > 0, при
0 0
условиях (2)-(6), считая функцию f(s,t)eL2(Q) заданной, Доказать, что тогда
управление р, = pjt) минимизирует J(p) тогда и только тогда, когда H(pst(t), ф(1, t, р,)) =
= min Н(р, ф(1, t, р„)), 0< t < Г, где минимум берется по отрезку pmin ^p(t) <pmax, Н(р, ф) =
= а ирф+/3р , V>(S| t, р) — решение задачи (20). Указание: заметить, что Н(р, ф) выпукла
по р, J'(p) = Hp(p(t), ф(1, t, р)), и воспользоваться теоремой 3,3.
5. Рассмотреть задачу (1)-(6) при ограничениях х < x(s, t, и) < х, где х,х — заданные
величины; учесть эти ограничения с помощью штрафной функции.
г '■',/'
6. Требуется минимизировать функцию J(p)= \ p2(t)dt при условиях (2)-(6), считая
о
функцию f(s, t) е L2(Q) заданной, и дополнительном условии x(s, Т,р) = y(s), 0 ^ s ^ I,
y(s) е L2[0,1]. Указать штрафную функцию Рк(р) для дополнительного условия; найти
градиент функции Фк(р)= J(p) + Pk(p); описать методы проекции градиента и условного градиента.
§ 8. Оптимальное управление колебательными процессами
Задачи оптимального управления колебательными процессами имеют
многочисленные приложения: к ним, например, приводят задачи об
успокоении качки судна или стрелы подъемного крана, о работе
вибротранспортеров, об организации виброзащиты, амортизации и т. п. [122-124; 354; 355;
395; 557; 596; 599; 641; 698; 706; 802; 812]. Здесь мы рассмотрим
несколько задач оптимального управления процессами, описываемыми уравнением
колебания струны и уравнением поперечных колебаний стержня.
1. Пусть имеется однородная упругая гибкая струна, один конец
которой свободен, на другой ее конец действует внешняя сила, и, кроме того,
к каждой точке струны также приложена внешняя сила. Требуется,
управляя указанными внешними силами, к заданному моменту времени привести
струну в состояние, характеризуемое смещением и скоростью точек
струны, как можно меньше отличающееся от некоторого заданного состояния
(например, состояния покоя, когда смещение и скорость равны нулю).
Математическая формулировка этой задачи: минимизировать функцию
J {и) = \(\x(s, Г; и) - y0(s)\2 + \xt(s, Г; и) - yi(s)\*)ds ' (1)
о
при условиях
xa = c?x„ + q{8,t), (s,t)eQ = {0<s<l,0<t<T}, (2)
я.1.-о = Р(*), я.1. = «=0, 0<*<Г;
ж1« = о=(А)(3)> Ж*|*=0 = У1.(3)> 0<s<l,
« = (Р(*), «(«, t))eUCH = L2[0, Т] х L2(Q), (4)
где а2 > 0, I > 0, Г > 0, ^(s), t/£(s), г =0,1, 0^ s ¢.1 — заданные функции,
причем f0(s) е Я'[0, 1], <£>[(s), ?/0(s), t/^s) е LJ0, Z], U — заданное
множество из Н. В частности, если y0(s) = ^(3) = 0, то здесь можно говорить о
задаче наилучшего успокоения струны.
Определение 1. Под обобщенным решением краевой задачи (2),
(3), соответствующим управлению u = (p(t), q(s, t)) е Н, будем понимать
§ 8. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КОЛЕБАТЕЛЬНЫМИ ПРОЦЕССАМИ 583
функцию х- x(s, t) = x(s, t;u)e Hl(Q), след которой при t = 0 совпадает
с f0(s) и которая удовлетворяет интегральному тождеству
§(с?х.ф, - xt4t ~ H)dsdt + а2 ]ф(0, t)p(t)dt - } ф(а, 0)^(s)ds = 0
Q 0 0
для всех функций ф =ф(а, t) eHl(Q), след которых при t = Т равен нулю
(см. обозначения в § 8.1).
Можно показать, что краевая задача (2), (3) при каждом и е Н имеет, и
притом единственное, обобщенное решение [492; 472]. Это решение может
быть представлено с помощью формулы Даламбера в виде [698]:
s — at
+ i ГТТ)m,r)d^dr+at Л(*-^)+аЕ Ф-Цг1-), (5)
0я-а((-т) m=l ч 'm = 0v '
где Ф0(з),Ф1(з), F0(s, t) — четные относительно s=0,
21-периодические no s продолжения функций ip0(s), ^(s), q(s, t) соответственно, а
Pi(t)=— lp(£)d£ при i>0, jF|(t)=0 при i^O. Формулы для обобщенных
о
производных xs, xt могут быть получены из (5) формальным
дифференцированием по s и t соответственно. Из формулы (5) следует, что
max [\x2(s, t;u) +xj(s, t;u)]ds <
^ C0(\p\t)dt + ft q\s, t)dsdt + l(rf(s) + tf(s))ds), (6)
40 Q 0 '
где C0 — постоянная, не зависящая от (р, q, tp0, <ру) [441; 492].
Считая, что в (2), (3) ip0(s) = 0, (/3[(s) = 0, введем оператор
Au = (x(s,T;u),xt(s,T;u)), O^s^l, (7)
действующий из гильбертова пространства H = L2[0, T]xL2(Q) в
гильбертово пространство F = L2[0, I] х L2[0, I]. Легко убедиться, что А
—линейный оператор. Из оценки (6) следует ограниченность этого оператора, так
что А 6 С(Н —> F). Это значит, что задачу (1)-(4) при ip0 = ср{=0 можно
записать в виде задачи (2.3):
J(u) = \\Au-b\\2F->ml, иеЦ (8)
где Ь = (y0(s), y^s)) eF. В общем случае, когда (p0(s), </>i(s)) ^0, решение
задачи (2), (3) можно представить в виде
x(s,t;u) = xl(s,t;u) + x0(s,t), (s,t)eQ, (9)
где x^s, t; и) — решение задачи (2), (3) при (/¾ = ^,=0, a x0(s, t) — решение
той же задачи при p(t) = 0, q(s, i)=0. Следовательно, и в общем случае
584
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
задачу (1)-(4) можно записать в виде задачи (8), где с учетом (9) надо
принять
Аи = (Xl(s, Г; и), xu(s, Г; и)), Ь = (y0(s) - а$,(я, Г), у,(я) - a^(s, Г)).
Если U — выпуклое замкнутое ограниченное множество из Н, то, как
следует из теоремы 2.12, задача (1)-(4) имеет хотя бы одно решение.
Пользуясь представлением этой задачи в форме (8) и результатами примера 3.5,
убедимся, что функция (1) дважды непрерывно дифференцируема и
получим формулы для ее производных. С этой целью покажем, что оператор
А*, сопряженный к оператору (7), на каждый элемент c = (cq(s), c{(s)) е F
действует по правилу ,; "
А*с = (с?ф(0^;с); il>(s,t;u))eH, (10)
где ф = ф(s, t; с) — решение краевой задачи
фн = а*ф33, (a,t)eQ, (И)
^.1.-0 = 0, ^.1.-.=0, 0<*<Г;
•0li = r = c1(s), ViUr = -<*>(*)» 0<s<Z.
Краевая задача (11), (12) заменой т— T—t формально может быть
сведена к задаче вида (2), (3), однако функции Cq(s), c{(s) в (12) менее гладкие,
чем f0(s), fi(s) в (2), (3), поэтому здесь можно ожидать существование
лишь более слабого решения, чем в задаче (2), (3). (
Определение 2. Под обобщенным решением краевой задачи (11),
(12) будем понимать функцию ф = ф(з, t) = ф(в, t; с) е L2(Q), имеющую
следы ф(а, •) е £2[0, Г], ф(-, t) е L2[0, I] при всех s е [0, (], t е [0, Г] и
удовлетворяющую интегральному тождеству
Ц.(ФИ - ttjjxisdt = - \(ф)Ф(з, Т) -ф)Ф((з, T))ds,
Q 0
справедливому при всех Ф = Ф(в, t) е H2(Q) со следом Ф|(=0 = Ф(|(=о =
= ф.1.-о = *.!.-«= о. . • ,. ' ■
Решение задачи (11), (12) также может быть представлено с помощью
формулы Даламбера вида (5), откуда, кстати, и следует его существование.
Из (2), (3) при> = 0 и (11), (12) имеем
(Au,c)F = \(x(s,T;u)c6(s)-¥xl(s,T;u)cl(s))ds =
о .. ■• •
= l(-™l>t + x^)\t = T= l[l ■m(^tx+^xt)dt)ds =
о о чо '
= §(~Фих + ^xtt)dsdt = §[а2(-ф33х + фх33) + фq]dsdt =
= Wt%(-4>.x + <К) + 4>Q]dsdt = I а\-ф3х + <K)ILo^ +
г
+ Ц фqdsdt = $ а2ф{0) t)p(t)dt + Ц фqdsdt = (и, А*с)н.
Q о Q
С учетом замечания 7.1 можем считать, что формула (10) доказана.
§ 8. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КОЛЕБАТЕЛЬНЫМИ ПРОЦЕССАМИ 585
Из формул J'(u) = 2A*(Au-f), J" = 2А*А и из (7)-(12) следует, что
функция (1) дважды непрерывно дифференцируема и ее градиент равен
J'(u) = (a^(0,t;c), ф(8,Ь;и)),
(13)
где г[> = г[)(з, t;c) решение задачи (11), (12) при 0 = ((^(3),0^)), (^(s) =
= 2(x(s, Т; и) - y0(s)), c,(e) = 2(xt(s, Г; и) - У1(з)), О < s < I.
Так как функция (1) выпукла на Н, то согласно теореме 3.3 эта функция
на выпуклом множестве U С Н будет достигать своей нижней грани в точке
Ч = (Р*(*)> <Z*(S> t))EU тогда и только тогда, когда
(J'K), и - Ч)я = X a2V>(0, t, uj(p(t) - p,{t))dt +
о
+ Й V(«, <> Ч)(9(в, *) - 9*(e, *))<*"** ^ О
Q
при всех u = (p(t), q(s, t)) е U,
Для решения задачи (1)-(4) могут быть использованы описанные выше
методы минимизации. Кратко остановимся на методах проекции градиента и
условноготрадиента, предполагая, что множество U состоит из управлений
и = (p(t), q(s, t)) еН, удовлетворяющих условиям
J p\t)dt < Щ, Ц q2(s, t)dsdt < Rf,
(14)
где R0, R{ — заданные положительные числа.
Метод проекции градиента для задачи (1)-(4), (14) с учетом
формулы (13) сведется к построению последовательности {ик = (pk(t), qk(s, t))}
по правилам
' ftW-ajk^MO, *,«*) при
]\pk(t)-aka^(0,t,uk)\4t<R*,
ft + i(*)=<
RgiPkW ~ aka Фф,*,ик))
,т ч 1/2
[I \Рк(*)~ <*ka4(0,t,uk)\2dt j
при
l\pk(t)-ccka^(0,t,uk)\4t>Rl,
' qk(s,t)-akil)(s,t,uk) при
ffi k(s> *) - a*V»(e» *» «*)|2<*«** < Л
l >
%+i(s. *)=<
fii(gfc(s>*)-a^V'(s.*>"fc))
ч 1/2
при
(15)
(SMS> *)-«А^(я, t,ufc)|2dsdt)
Й1?к(м)-"^(М,^,)Р">^
Q
где параметр ak > О выбирается одним из способов, описанных в § 5.2.
586
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Одна итерация метода условного градиента для задачи (1)-(4), (14) будет
выглядеть так:
ft+l(*) = ft(*)+a*(P*(*)-ft(*))i ,щ
9* + i("» *) = «*(«• *) + «*(9*(e» *)-«*(*» *))•
где
Рк\и)— ~~Т^ ГТ/2 1 yfcl*'1'/- , И/2 1 l1'^
(S IV-(o, t, Ufc)|2dt J (й И». *. «*)12«**« J
а величина аА) 0 < аА < 1, может быть выбрана одним из указанных в § 5.4
способов. Функция fk(a) = J(uk + а(йк — ик)) переменной а представляет
собой квадратный трехчлен, поэтому, рассуждая так же, как при выводе
формулы (4.35), из условия fk(ak) = min fk(a) можно определить ак =
= mln{!,<*;}, где °<e<1
ai=2
Ia2^(0,t,uk)(pk(t)-pk(t))dt+ll^(s,t,uk)(qk(s,t)-qk(s,t))<hdt
т -1
Х(2|я;(в, Т, щ)-х{8, Т, йк)\* + 2\xt(s, Т, uk)-xt(s, Т, uk)\*)ds
, (18)
(20)
причем если выражение в первой или во второй квадратной скобке
обращается в нуль, то ик = (pk(t), qk(s, t)) — оптимальное управление в
рассматриваемой задаче (1)-(4), (14).
2. Рассмотрим задачу
J (и) = \(\х(8, Г; и) - y0(s)\2 + \xt(s, Г; и) - yi(a)\*)da - inf, (19)
о
где х = x(s, t;u) — решение краевой задачи
хи = xss + r(s)u(t), (s, t)eQ = (0, I) x (0, Г),
3=1,=0=°. a;|.-i=0, 0<i<T; a;|t-0=0, zf|i=0=0, 0< s < I,
управление
u = u(t)EUCH = L2[0,T]; (21)
функции y0(s) e Щ[0, I], yl(s)eL2[0, I], r(s)gl2[0,!] — заданы.
Определение 3. Обобщенным решением краевой задачи (20),
соответствующим управлению и = u(t) е L2[0, Т], будем называть функцию
х = x(s, t;u) е Hl(Q), имеющую следы х(-, t) е Щ[0, I], xt0, t) е L2[0, I]
при всех t е [0, Т], x(s, •), xs(s, ■) е L2[0, Т] при всех s е [0, I] и
удовлетворяющую интегральному тождеству
§(хяфя - xtj,t - r(s)u(t)^)dsdt + $ ф(з, T)xt(s, T)ds=0
Q 0
при всех ф = i/)(s, t) е Hl(Q), причем след x\t=0 =0, 0 < s < I.
§ 8. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КОЛЕБАТЕЛЬНЫМИ ПРОЦЕССАМИ 587
Можно показать [441; 492], что задача (20) при каждом и = u(t) е
е L2[0, Т] имеет, притом единственное, решение х = x(s, t;u), и
справедлива оценка:
1 г
max \l(x2(s,t;u)+xf(s,t;u)+xf(s,t;u))ds < (¾ *\u2(t)dt, Cq= const >0. (22)
Решение задачи (20) можно записать в виде формулы Даламбера,
аналогичной формуле (5) [698]. Приведем представление решения в виде ряда
Фурье:
x(s, t; и) = £ !Щ& \ u(0 sin y/Tk{t - 0^, (23)
fc = i VAfc о
где ek(s) = л/j sin y/\^s — собственная функция оператора — —-f, </>(0) =
= 0, ip(l) = 0, соответствующая собственному числу Afc = (x) ' Гк~
i
= § r(s)ek(s)ds, к = 1,2,.., Более тонкий анализ показывает [458; 557],
о
что решение задачи (20) имеет производную уи, представляющую собой
производную функции yt в смысле обобщенной функции (распределения) и
имеющую следы из Я~'[0, I] почти для всех t е [О, I].
Задачу (19)-(21) можно записать в форме (8), где оператор А внешне
определяется той же формулой (7), но теперь А действует из H = L2[0, Т]
в F — L2[0, l]xL2[0, I], f = (y0(s), y{(s))eF. Как и в случае операторов (7),
(10), можно показать, что здесь сопряженный оператор А* имеет вид
А*с=\ r(a)il>(a,t;c)ds, (24)
о
где ф = ф(з, t;c)-—решение краевой задачи
^« = •0»», (s,t)eQ;
^1.-0=0, ^1...=0, 0<*<Т; (25)
•0l( = r = ci(s). A\t = T = -co(a), 0<s<Z, c^(c0(s),cl(s))eF.
Обобщенное решение задачи (25) понимается в том же смысле, как в
определении 2, и его также можно записать в виде формулы Даламбера [698].
Функция (19) принадлежит классу С2(Я), и ее градиент равен
J'(u) = A*c=\r(s)^(s,t;c)ds,
о
где ф(з, t; с) — решение задачи (25) при c0(s) = 2(x(s, T;u)—y0(s)), c{(s) =
= 2(xt(s, T; и) — y{(s)). Если U —выпуклое замкнутое ограниченное
множество, то задача (19)-(21) имеет хотя бы одно решение (теоремы 2.6 и
2.12). Критерий оптимальности на выпуклом множестве U в этой задаче
(теорема 3.3) запишется в форме
(7'К). и - ч)я = $ г(з)ф(з, t; ОНО - ut(t))ds > 0 Vu е Ц
Q
где ct = (2(x(s, T;ut)-y0(s)),2(xt(s, Г; ut)-yl(s))), Предлагаем читателю,
588
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
действуя по аналогии с задачей (1)-(4), дать описание методов проекции
градиента и условного градиента для задачи (19)-(21), когда
U = {ueL2[0,T]: lu2(t)dt^R2}.
о
3. Пусть дан однородный упругий стержень, один конец которого жестко
закреплен, другой конец свободен. Требуется, управляя внешней
поперечной нагрузкой; привести стержень к заданному моменту времени как можно
ближе к заданному состоянию. Эту задачу математически можно
сформулировать в виде следующей задачи минимизации:
J (и) = \(\x(s, Т,и)- y0(s)\2 + \xt(s, Т,и)- yi(s)\2)ds - inf, (26)
о
x„ + a2x3333 = u(s,t), (s,t)eQ-{0<s<I,0<i<T}, (27)
^1.-0 = ^1.-0 = 0, 0<t^T, (28)
^1, = ,-^1 = ,=0, 0<t^T, (29)
x\t=o = <A)(S), xt\t=o = iPi(s)> 0<s^l, (30)
u = u(s, t)eU = {u(s, t)eL2(Q); § u2(s, t)dsdt < R2}, (31)
Q
где a2, I, TJ R — заданные положительные числа; <ft(s), ^(s), г = 1, 2, —
заданные функции; ip0(s) 6 Я2[0, I], <д,(0) = </>0(0) = 0; </>,(s), t/0(s), 2/i(s) е
е£2[0,1].
Определение 4. Обобщенным решением краевой задачи (20)-(23),
соответствующим управлению u = u(s, t)eL2(Q), будем называть функцию
x(s, t) = a;(s, t, и) 6 If2,'(Q), имеющую следы x(-, £), же(-;, t) 6 L2(0, l] при
всех £ 6 [0, T], a;(s, ■), x3(s, •) 6 i2[0, Z] при всех s 6 [0, l] и
удовлетворяющую условиям (28), (30) в смысле равенства соответствующих следов и
интегральному тождеству
й(-а^« + a4sVss - W0<*"ft - $ ^(S)V(s,0)dS - X xt(s, Т)ф{а, T)ds =0
Q 0 0
при всех V> = ,0(s, t)eH2il(Q), •0L=o = '!/,Js=o = o> °<s < Г' Можно
показать [458], что при каждом u = u(s, t) решение задачи (27)-(30) существует
и единственно.
Убедимся, что функция (26) дифференцируема на L2(Q).
Проиллюстрируем, как можно получить формулу градиента, пользуясь лишь
определением 8.3.3 градиента, явно не прибегая к задаче (8). Возьмем произвольные
и, и + h Е L2(Q) и соответствующие им решения -x{s\'tyu), x(s, t,u + h)
краевой задачи (27)-(30). »
Обозначим Ax(s, t) = x(s, t, u + ty-x(s, t, u). Из (27)-(30) следует, что
Ax(s, t) является решением краевой задачи
Axtt + d2Ax3333 = h{s,t), (s,t)eQ, (32)
Ax\3=0 = Ax3\s=0 = 0, AxJ3 = l = Ax333\3^=0, 0<t^T, (33)
Ax\t=0 = Axt\t=0 = 0, 0<s<Z. (34)
§ 8. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КОЛЕБАТЕЛЬНЫМИ ПРОЦЕССАМИ 589
Тогда приращение функции (26) запишется в виде
Д J (и) = J {и + h)- J {и) = [[2{x(s, Т,и)- y0(s))Ax(s, Т) +
о
+ 2(xt(s, Т,и)- y^s^Ax^s, T)]ds + R, (35)
где
R = \(\Ax(s,T)\2 + \Axt(s,T)\2)ds.
о
Справедлива оценка
|fl|<Ci||/i||! =С1 S$|/i(ajt)|2dadt, C1=const>0. (36)
Q
Наметим схему доказательства этой оценки. Умножим уравнение (32) на
Axt(s, t), проинтегрируем по прямоугольнику Qt = {(s, г): 0 < s < I, 0 < т<
< *} и получившееся равенство преобразуем с учетом условий (33), (34);
будем иметь
ft hAxtdsdr = \\{Ахн + c?Axm)AxtdadT = 5 ИДяв«)21'-о^в +
+ \ a2AxSS3Axt\\^dr - ft c?AxmAxt.d8dt = \ \ \Axt(s, t)\2ds -
О Qt О
- I a2Ax33AxJs=0dt + ft a2AxssAxsstdsdt - \ \ \Axt(s, t)\4s +
+ у \(^Y\Uds = I \ \Axt(s, t)\2ds + £ \ \Ax33(s, t)\2ds
о о о
при всех £, О < t < Т. Отсюда с помощью неравенства \аЪ\ < (а? + Ь2)/2
получим
\\Axt{s, t)\2ds^ \(l\Axt{s, T)\*ds)dT+[ \ h2(s, r)dsdT, 0<i < Т.
Тогда из леммы 6.3.1 при </>(£) = $|ДжДз, t)\2ds, Ь = ftfr2(s, t)dsdt, а=\
следует, что о Q
Х|Дя;*(в. *)|2*<er §h2(s, t)dsdt, 0<t^T. (37)
О Q
В частности, при t = Г имеем
\ |Дж((з, T)\2ds < ет ft fr2(s, t)rferft. (38)
О Q
Далее, из равенства
г
Ax(s, Т) = Ax(s, 0) + $ Дже(з, t)dt
о
590
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
с учетом первого условия (34) и оценки (37) получим
} \Ax(s, T)\4s = \ (] Axt(s, t)dt)2ds <
0 0 ч0 '
< Г $ (J |Дя;((в, t)\2ds)2dt < Г2ег ft fr2(s, t)dsrft.
Сложив эту оценку с (38), придем к оценке (36).
Для преобразования правой части формулы приращения (35) введем
сопряженную краевую задачу
^ + ^....=0, (s,t)eQ,
^1.-0 = ^.1.=0 = 0. ^..1. = , = ^...1. = ,=0, O^t^T, (39)
•0Ur=Ci(s)=2(^(s, T)-y,(e)), ^t\t = T=-c0(s)=-2(x(s, T)-y0(s)),
0 < s < I.
Под решением задачи (39) здесь понимается функция ф(з, t,u) = ^(s, t)e
6 L2(Q), удовлетворяющая интегральному тождеству
Й(Ф« + a^Wdsdt = 2 \(x(s, Т) - У0(з))Ф(з, T)ds +
Я ( о
+2l(xt(s,T)-yl(s)y^t{8,T)ds
о
для всех функций Ф = Ф(в, t) е Я4,2(<3), обладающих обобщенными произ-
водными Фх1>Фхх1 eL2(Q) и таких, что Ф|.=0 = *.1.-о = *..!.-« =*«.l.-« =0
при 0< t < Г и Ф|(=0=ф(|(=0 = 0 при 0< s < /.
С помощью решения i/)(s,t,u) краевой задачи (39) приращение
функции (26) можно представить в виде
Д7(и) = ft V(s. *. «)Л(в» *)dsrf* + R- (40)
В самом деле, из (35) с учетом условий (32)-(34), (39) имеем
,
ДJ(u) = l(-i/ft(s, T)Ax(s, Т) + ф(а, T)Axt(s, T))ds + R =
о
1 T f)
= И ж(~Ф(&х + i>Axt)dtds + R = ft(—0нДж + V>Axtt)dtds + R =
оо Q
= ft a2(</-....Az - фAxзsзз)dsdt + ft #<Ы* + Л =
Q Q
г
= а2 Х(^.„Дя; - Ф„Ьх, + ф3Ах33 - ^Ax333)\lzl0dt +
о
+ ft ifihdsdt + R = ft V(s, *, w)Ms> t)dsdt + Д.
Q Q
Формула (40) получена. Из (40) и оценки (36) следует, что функция (26)
дифференцируема на L2(Q), и ее градиент равен
J>(u) = ^(s,t,u), (s,t)eQ. (41)
Конечно, как и в задаче (1)-(4), приведенный выше вывод формулы (40) и
оценки (36) нельзя признать строгим; относительно строгого доказательст-
§ 8. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ КОЛЕБАТЕЛЬНЫМИ ПРОЦЕССАМИ 591
ва формулы (41) см. замечание 7.1. Можно показать, что функция (26)
выпукла на L2(Q) и принадлежит С1' l(L2). Отсюда и из теоремы 2.8 следует,
что задача (26)-(31) имеет хотя бы одно решение. Согласно теореме 3.3
для оптимальности управления ut = ut(s, t)EU необходимо и достаточно,
чтобы $V(si *i 4)(u(si *) —u*(s) t))dsdt ^0 при всех u = u(s, t)e U.
Предлагаем читателю самостоятельно написать итерации методов
проекции градиента и условного градиента для задачи (26)-(31) и для (к + 1)-го
приближения получить формулы, аналогичные формулам (15)-(18).
Упражнения
т
1. Показать, что функция J{(u)=J(u)+p $p2(t)dt+/3 Цд (s, t)dsdt, /3 = const>0, где J(u)
0 Q
взята из (1), при условиях (2), (3) сильно выпукла на Я = L2[0,1] х L2(Q). Описать метод
скорейшего спуска для задачи минимизации J{(u) на всем пространстве Я.
2. Показать, что функция J{(u) = J (и) + /3 Ц "2(s, t)dsdt, /3 > 0, где J (и) определяется
Я
формулой (26), при условиях (27)-(30) сильно выпукла на L2(Q). Описать метод скорейшего
спуска для минимизации J^u) на L2(Q).
3. Найти градиент функций (1) и (26) по начальным условиям (ip0, <ру), >
4. Пусть в задачах (1)-(4), (19)-(21), (26)-(31), имеются дополнительные ограничения
\x(s, t, и)\ ^ 7о> lx((si *i u)l ^ Ъ> (s> Ч G Q' Учесть эти ограничения с помощью штрафных
функций, вывести формулу градиента для штрафной функции; описать метод штрафных
функций в сочетании с методом проекции градиента или условного градиента.
5. Пусть требуется минимизировать функцию J(u)= Jpr(t)dt + Цд (s, t)dsdt при услови-
0 Я
ях (2)-(4), (14) или функцию J(u) — JJ u2(s, t)dsdt при условиях (27)-(31) и дополнительных
Я
ограничениях x(s, Т, и) = 0, xt(s, Т, u) = 0, 0<s <Z, где Т>0 — заданное время; учесть
дополнительные ограничения с помощью штрафных функций; найти градиент штрафной функции.
6. Получите формулу (41), пользуясь результатами примера 3.5. Указание: запишите
задачу (26)-(31) в форме (8), где А —оператор (7), действующий из пространства H = L2(Q)
в пространство F = L2[0,1] х L2[0,1] при (<р0, (р{) = 0, покажите, что сопряженный к А
оператор А* действует из F в Я по правилу. A*c=^(s, t\ с), где с = (eg, q), ф = ф(з, t;c) —
решение краевой задачи (39); в случае ((р0,9^)^0 воспользуйтесь аналогичным (9)
представлением решения задачи (27)-(30).
§ 9. Оптимальное управление процессами,
описываемыми уравнением Гурса ■— Дарбу
При исследовании процессов сорбции, сушки и др. возникает следующая
задача оптимального управления [51; 104; 135; 136; 268; 540; 575; 664; 698]:
минимизировать функцию
J(u) = й /°Ив, *), я.(«. *), Me, *), Ф, *), s> t)dadt +Ф(х(1, Г)) (1)
Я
при условиях
xat(s,t) = f(x(s,t),xs(s,t),xt(s,t),u(s,t),s,t), {s,t)<=Q, (2)
x(0,t) = a(t), 0<i<T; a:(a, 0) =/3(a), 0<s<Z, (3)
u = u(s,t)eUCLT2(Q), (4)
592
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
где х = (х\ .. „ ж"), / = (/',..., Г), 11 = (111..... и% а=(а\..„ а"), /3 =
= ((3\..., $п), Q ={(s, t): 0<s < г, 0< t < Г}; /, Г —заданные
положительные числа, f{(x,p, q, и, s, t), г = 0,..., п, Ф(х), a*(t), ^(s), г = 1,...
..., n, — заданные функции, [I — заданное множество.
Эту задачу будем рассматривать при выполнении следующих условий:
1) функции /г(ж, р, q, и, s, *), г = 0,..., п, и их частные производные
/J) /р) /,) /« непрерывны по совокупности аргументов (х, р, q, и, s, t) е Е" х
х Еп х Еп х Ет х [О, Z] х [О, Т] и удовлетворяют условию Липшица по
(x,p,q,u);
2) функция Ф(х) обладает непрерывными частными производными Фх(х)
при всех хеЕп;
3) а(*)еЯД0,Т],/3(в)еЯД0,*]; а(0) = /3(0).
Под решением задачи (2), (3), соответствующим управлению u = u(s, t)e
6 L£(Q), будем понимать вектор-функцию x(s, t) = x(s, t, и) e L£(Q),
имеющую обобщенные производные x^s, t), xt(s, t), x3t(s, t) 6 £|(Q) и
удовлетворяющую уравнению (2) почти всюду в Q, а условиям (3) — в смысле
равенства соответствующих следов ж(0, •), ж(-,0).
При сделанных выше предположениях задача (2), (3) при любом и =
= u(s, i)e££(Q) имеет, и притом единственное, решение. Важно заметить,
что любая вектор-функция x(s, t) eL%(Q), обладающая обобщенными
производными xs(s, t), xt(s, t), xst(s, i)e L%(Q), непрерывна в замкнутом
прямоугольнике Q (точнее, x(s, t) эквивалентна непрерывной на Q функции).
Это значит, что решение x(s, t, и) задачи (2), (3) можем считать
непрерывной функцией Q, и тогда имеет смысл говорить о значении х(1, Т,и),
о величине Ф(х(1, Т, и)). Таким образом, при сделанных выше
предположениях функция (1) определена при всех и — u(s, t) е L£(Q).
Можно показать, что непрерывная на Q вектор-функция x(s, t) является
решением краевой задачи (2), (3) тогда и только тогда, когда она
удовлетворяет интегральному уравнению
x(s,t)=a(t)+/3(s)-a(0)+l\f(x(^T)M^r)M^'r)M^rU,T)^dT. (5)
0 0
Опираясь на это интегральное уравнение, существование и единственность
решения задачи (2), (3) могут быть доказаны с помощью рассуждений,
аналогичных рассуждениям из доказательства теоремы 6.1.1.
Покажем, что при некоторых сделанных дополнительных
предположениях функция (I) дифференцируема на L£(Q). Возьмем произвольные
и, и + h б LUQ) и соответствующие им решения x(s, t, и), x(s, t,u + h)
задачи (2), (3). Тогда обозначим
Дж(в, t) — x(s, t, и + h) — x(s, t, u),
/S.fi=fl(x(s,t, u+h), xs(s,t, и + h), xt(s,t, u+h), u(s, t)+h(s,t), s,t)—
-/'(ж(8, t), ж5(з, t), a;t(s, t), u(s, t), s, t), г'=0,...,п.
Из условий (2), (3) следует, что
&x3t = Af, (s,t)eQ, (6)
Дж(0, t)=0, O^t^T, Дж(в, 0) = 0, 0<s<Z. (7)
§ 9. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССАМИ 593
Можно доказать, что верна следующая оценка:
max |Aa;(s, t)| + ess sup *\ \/S.x3(s, t)\2ds +
г
+ ess sup \ |Дже(з, t)\2dt < C0 Ц h2(s, t)dsdt, C0 = const > 0. (8)
OsSssS! 0 Q
Приращение функции (1) равно
Д J(u) = J (и + h)- J(u) = ОД Д/°сЫ* + ДФ, (9)
где Q
ДФ = ¢(¢(1, t; u + Д)) - ф(ж(г, 3] «)).
Умножим уравнение (6) на некоторую функцию ф =i[)(s, t) EL^iQ) и
проинтегрируем полученное равенство по прямоугольнику Q. Будем иметь
0=^((^,-Ax3t) + (^,Af))dsdt.
Q
Сложим это равенство почленно с (9) и получим
&J(u)= й(Д/° + (Д/, ф) - (ф, &x3t))dsdt + ДФ.
Q
Если ввести функцию Гамильтона — Понтрягина
H(x,p,q,u,s,t^)=f°(x,p,q,u,s, t) + (f(x, р, q,u, s, Ь),ф), (10)
то приращение /S.J(u) можно переписать в виде
&J(u)=§(&H-^,&x3t))dsdt+№, (11)
Я
где ДЯ = /S.H(s, t\ = Н(х + Дж, xs + Джа, х, + Дж(, и + h,s,t, ф) -
— Н(х, xs, xt, и, s, t, ф)\ аргументы (s, t) функции х, Ах и их производных,
и, h, ф для краткости здесь опущены.
Учитывая ограничения, наложенные выше на функции /', г —0,..., п,
Ф(х), a(t), f3(t), с помощью формулы конечных приращений Лагранжа и
оценки (8) из (11) имеем
Д7(и)= §{{H.Ax)+{HpAx.)+{HqAxt)+{Hu, h)-^Ax3t))dsdt +
+ (<px(x(l,T)),Ax(l,T)) + R,
где остаточный член R удовлетворяет условию
I^IIHIl'-»0 при II^IIl,-»0; (13)
частные производные Нх, Нр, Н, Ни в (12) вычислены в точке (x(s,t),
Xs(S> *). xt(s> *). u(s> *). s> *. V4S, *))■
Преобразуем первые три слагаемых в (12) интегрированием по частям с
учетом условий (7). С помощью теоремы Фубини [393; 492] получим
§(Hx,bx)d8dt=-l(\(£;\Hs(t,t)dt,Ax{8,t))d8)dt
Т I
SM НЛ£, t)dt,Ax3(s, t))dsdt = S$(S l Яв(£, t)d£dT, Ax3t(s, t))dsdt;
594
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Ц(Яр, &x3)dsdt = §{] Нр{а, r)dr, &x3t(s, t))dsdt,
Q Q t
Ц(Я„ &xt)dsdt = ft(} Я,(£, t)d£, &x3t(s, t))dsdt.
Q Q >
Кроме того, в силу условий (7) имеем
Ах(1, Т) = \ Ах.(£, T)d£ = \ ] Ахл{£, r)d^dr = ft &x3tdsdt,
О 0 0 Q
поэтому
(Фх(х(1, Г)), Ах(1, Г)) = Й(ФЖ№ Г)), Azsi(s, t))dadt
Q
Подставим полученные равенства в формулу (12). Будем иметь
Д7(и)= ЙНМ*. *) + Ф«(^, Г))+ХЯр(в,т)йт+ J Я,(£, i)d£ +
Q J s
+ J } Яв(£, r)^dr, Assi(s, t))derft+ ХХ(Я„(в, i)rM«, t))dsdt+R, (14)
is Q
До сих пор ф = V>(si t) была произвольной функцией из L%(Q). Теперь
выберем эту функцию так, чтобы
^(в,*)^в(х(/1г))+|яр(в1т)сгт+}я^,*к+Ия(е(^тКсгт> (15)
(в, *) б Q.
Так как в (15) Hp(s, t), Hq(s, £), Hx(s, t) представляют собой
частные производные Нр, Я, Нх функции (10), вычисленные в точке
(x(s, t), x3(s, t), xt(s, t), u\s, £), s, £, ф(з, £)), причем H(x, p, q, u, s, £, ф)
линейно зависит от переменной ф, то (15) является линейным
интегральным уравнением относительно ф(з, £). Уравнение (15) аналогично
уравнению (5), и существование и единственность его решения ф(в, Ь) = ф(з, £, и)
при сделанных выше предположениях доказывается аналогично тому, как
доказывалась теорема 6.1.1.
С учетом условия (15) из (14) имеем
Д7(и)= ХХ(Я„(в, £), h(s, t))dsdt + R. (16)
Я
Отсюда и из условия (13) следует, что функция (1) дифференцируема и ее
градиент равен
J'(u)=Hu(s,t)=Hu(x(s,t,u),xs(s,t,u),xt(s,t,u), u(s,t),s,t, ф(з,Ьи)). (17)
Подчеркнем, что при выводе формулы (16) исходные функции /°, /
предполагались такими, что Hu(s, £) eL£(Q).
Предлагаем читателю самостоятельно выписать, пользуясь
формулой (17), необходимые условия оптимальности в задаче (1)-(4) для
выпуклого множества U, сформулировать условия существования
оптимального решения, условия выпуклости и сильной выпуклости функции (1), дать
описание градиентного метода, методов проекции градиента и условного
градиента.
§ 9. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОЦЕССАМИ
595
Упражнения
1. Получить формулу градиента в задаче (1)-(3), считая, что u(s, t) = u(s) GLffl, П или
u(a, t) = u(t)€L%[0, Т], или u(s,t)=w&ET.
2. Применить метод штрафных функций к задаче (1)-(4) при ограничениях \x(s, t)\ ^. 1 или
\xl(s, t)\ < 1, i'=l п, или JS \x(s, t)\2dsdt < 1. Найти градиент штрафной функции.
Я
3. Сформулировать и доказать принцип максимума для задачи (1)-(4), считая, что U =
= {u(s, t) е^2(<?)•' u(s,t)e V почти всюду на Q}, где V—заданное множество из Ет [51].
: 4. Рассмотреть задачу [104; 119; 134; 135; 478]:
J (u) = §F0(z(s,t;u),u(s,t),stt)dsdt-+lni, иеЦ (18)
Я
где z = z(s, t;u) = (z ,..., zn) — решение задачи
z; = F""(z,u,s,t)> 1=1,.,.,m; г\=Р1 (z,u,s,t), i = m+l га; (s,t)<=Q=(0,l)x(0,T) (19)
«<(0,t) = /i<(t)) i = 1,..,,m; г<(а,0) = 1/'(я), i = m 4-1 ra, (20)
управление u = u(s,t) = (ul uT) e L^iQ), U — заданное множество из L^iQ);
F'(z, и, s, t), i =0,..., n, /il(t), i = 1,,.,, m, vl(s), i = m + 1,..., n — достаточно гладкие
функции своих аргументов. Доказать, что функция (18) дифференцируема в ££(<3),
найти формулу ее градиента; дать описание методов проекции градиента, условного градиента.
Указание: показать, что задача (18)-(20) в пространстве переменных х = (ж1,..., хп),
t 3
xl(s,t)= J zl(s,r)dr, г = 1,..., m; xl(s, t) = J zl(£, t)d£, i = m + 1,.,., n, запишется в
0 0 (
виде задачи (1)-(4) с f = F{(x\t..., x(m, x3m+',..., xsn), i = 0,...,n; e'(t) = ^'(т)Ж-,
; . о
i = 1,..., m, al(t)=0, i=m+l,..., ra, (3l(s)=0, i=l,..., m, (3l(s)= \ H(£)d£, i=m+l,..., ra;
0
воспользоваться формулами (15), (17) и в них вернуться к исходным переменным z.
5. Сформулировать и доказать принцип максимума для задачи (18)-(20) в случае множества
U из упражнения 3 [134].
§ 10. Взаимодвойственные задачи управления и наблюдения
1. Под задачей управления в этом параграфе будем понимать задачу
определения такого допустимого управления, которое переводит
динамическую систему из некоторого начального состояния в заданное состояние к
заданному моменту времени. Многие задачи управления можно записать в
виде операторного уравнения
Au = f, (1)
где А — линейный непрерывный оператор, действующий из гильбертова
пространства Н в гильбертово пространство F, т. е. А £С(Н —> F), элемент
f EF. Описание оператора А содержит информацию о начально-краевой
задаче, характеризующей динамическую систему, элемент / связан с
начальным или конечным состоянием системы. Поясним сказанное на
примерах.
Пример 1. Пусть динамическая система описывается обыкновенным
дифференциальным уравнением
x = D(t)x + B(t)u(t), 0<i<T; ¢(0) = 0, (2)
596
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
где D(t), B(t) — кусочно-непрерывные матрицы размера п х n, п х г
соответственно, и = u(t) = (ul(t),..., ur(t)) € L2[0, T] — управление, х =
= x(t) = x(t;u) = (xl(t),..., xn(t)) траектория системы (2),
соответствующая управлению и =u(t). Момент Г > 0 задан. Задача управления:
требуется найти управление и = u(t) £ L2[0, Т] такое, что
x(T;u) = f, (3)
где / — заданная точка из Еп. Введем оператор А следующим образом
Аи = х(Т;и). (4)
Выше было показано (см. пример 2.14), что такой оператор А € С(Н —> F),
где Н = L2[0, Т], F =Еп. Из (3), (4) следует, что задача управления (2),
(3) может быть записана в виде уравнения (1).
Для более общей, чем (2), системы
y = D(t)y + B(t)u(t) + f(t), to^t^T, f(t)eL2[t0,T], (5)
задача определения управления u = u(t), переводящего эту систему из
начального состояния y(t0) = y0 в заданное конечное состояние у(Т) = у{,
легко может быть сведена к задаче (2), (3). Прежде всего, начальный момент
t0 можем считать равным нулю, так как в противном случае сделаем замену
T=t — t0. Далее, любое решение у = y(t; и) уравнения (5) представимо в
виде (пример 2.15)
y(t;u) = x(t;u) + y0(t), 0 < t < Т,
где x(t;u) — решение системы (2), y0 = y0(t) — решение системы (5) при
u(t) = 0. Отсюда следует, что задача перевода системы (5) из точки t/g в
точку уу равносильна задаче (2), (3) при / = у1 — у0{Т) к уравнению (1) с
оператором (4).
Пример 2. Рассмотрим краевую задачу
я«=я«» («,*)€Q=(0,l)x(0,T),
(6)
^.1.=0 = 0, (xs + x)\s = l=u(t), 0<t<T; x\t=0=0, 0 < a < I,
описывающую температуру стержня (см. задачу (7.2), (7.3) при q=0, </>=0).
Найдем управление и = u(t) е L2[0, Г] такое, чтобы в'заданной момент Т
температура стержня имела заданное распределение f(s)£ L2[0, I], т. е.
x(s,T;u) = f(s), 0^ s ^1. (7)
Введем оператор
Au = x(s,T;u), 0<s<Z. (8)
Как было отмечено в § 7, такой оператор А е С(Н —* F), где Н = L2[0,l],
F = L2[0, I]. Отсюда следует, что искомое управление является решением
уравнения (1), где оператор А определен согласно (8), а элемент f = f(s)
взят из (7).
Пример 3. Рассмотрим краевую задачу
я« = я„, (s,t)eQ=(0,l)x(0,T),
(У)
я.1.=о=«(*)» ¢.1.=.=0, 0<t<T; s|i=0=0, в,|«=о=0, O^s^l,
§ 10. ВЗАИМОДВОЙСТВЕННЫЕ ЗАДАЧИ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ 597
описывающую колебания струны (см. задачу (8.2), (8.3) при д = 0, </э0=0,
¥>i =°)- Будем искать управление u=u(t)e L2[0, Т] такое, чтобы в момент
Г > 0 состояние (смещение и скорость) струны совдало с заданным
x(s,T;u) = y0(s), xt{a,T;u) = yl(a), о < а < I, (10)
где y0(s), y{(s) е L2[0, I] — фиксированные функции. Введем оператор
Au = (x(s,T;u),xt(s,T;u)), (11)
который действует из Я = L2[0, Г] в F = L2[0, I] х L2[0, I]. В § 8 было
отмечено, что такой оператор А е С(Н —> F). Отсюда видно, что искомое
управление является решением операторного уравнения (1), где А взят
из (11), a / = (y0(s), Vl(a)) е F - из (10).
Пример 4. Основываясь на краевой задаче (8.20):
xtt = xss + r(s)u(t), (s,t)eQ=(0,l)x(0,T),
x\s=0 = x\s = l=0, 0<t<T, x\t=0 = xt\t=0 = 0, O^s^l, '
сформулируем еще одну задачу управления колебанием струны. Будем
искать управление и = u(t) £ L2[0, Т] такое, чтобы состояние струны в
заданный момент Т удовлетворяло условиям (10). Нетрудно видеть, что
если ввести оператор А по той же формуле (11), задачу управления (12),
(10) также можно записать в виде уравнения (1).
2. Предположим, что некоторая задача управления линейной
динамической системой уже записана в виде операторного уравнения (1).
Отождествляя задачу управления с уравнением (1), далее будем говорить о
задаче управления системой А. Сформулируем такие важные понятия теории
управления, как поточечная управляемость, полная управляемость в
терминах уравнения (1).
Определение 1. Систему А будем называть поточечно
управляемой или, иначе, f-управляемой, если уравнение (1) с фиксированной
правой частью / € F имеет хотя бы одно решение. Скажем, что система А
вполне управляема, если уравнение (1) имеет решение при всех / € F.
Таким образом, если мы пожелаем узнать, будет ли та или иная линейная
динамическая система поточечно или вполне управляемой, а также найти
соответствующее управление, то можем обратиться к хорошо развитой
теории линейных операторных уравнений, методам их решения [130; 334; 393;
416 и др.] о '
Приведем без доказательства несколько теорем из этой теории,
которые могут быть полезны при исследовании конкретных задач
управления. При формулировке этих теорем будем пользоваться обозначениями:
R(A), R(A*) — область значений оператора А е С(Н -> F) и
сопряженного оператора А* € C(F -> Я), где Н, F — гильбертовы пространства, R(A),
Л (А*) —замыкание R(A), R(A*) в норме F и Я соответственно, N(A),
N(A*) — нули (ядра) операторов А, А* соответственно, [/,(/)
—множество решений уравнения (1) при фиксированном / € F, ut — нормальное
решение уравнения (1), определяемое условием: ||и„||я = inf ||и||я.
Теорема 1. Если 17,(/) ф 0, то 17,(/) = «, + ЩА), где «, —
произвольный фиксированный элемент из Ut(f)- Если Ut(f) ф 0, то
существует, притом единственное, нормальное решение уравнения (1). Для
598
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
того чтобы элемент ut е Ut(f) был нормальным решением уравнения (I),
необходимо и достаточно, чтобы ut е R(A*).
Теорема 2. Если уравнение
Лс = /, А = АА* (13)
разрешимо, то система A f -управляема, причем ut = А*с —нормальное
решение уравнения (1), где с — произвольное решение уравнения (13).
Если R(A*) = R(A*), то верно и обратное: из f -управляемости системы
А вытекает разрешимость уравнения (13).
Теорема 3. Эквивалентны следующие утверждения:
1) система А вполне управляема, т. е. £/*(/)=£ 0 V/ е F;
2)R(A) = F;
3J N(A*) = {0}, R(A*) = R(A*);
4) имеет место оценка: \ А*с\\н ^ ц\\с\\р VcGF, /i = const>0, так что
оператор А* обратим и (А*)"1 е C(R(A*) —» F);
5) справедлива оценка (Ac, c)F ^ м||с||| Vc е F;
6) уравнение (13) имеет, притом единственное, решение при ecexfeF.
Доказательства теорем 1-4 читатель может найти в [334; 416]. Мы здесь
лишь отметим, что их доказательство существенно опирается на
разложение гильбертова пространства на прямую сумму взаимно ортогональных
подпространств: нулей линейного непрерывного оператора и замыкание
области изменения сопряженного оператора [334; 393; 705], т. е.
H = N(A)®R(A*), F = N(A*)®R(A).
3. Проиллюстрируем применение теорем 1-3 на примере задачи
управления (2), (3), в частности, докажем известные теоремы Н. Н. Красовского,
Р. Е. Калмана [411]. Прежде всего заметим, что в задаче (2), (3) множество
значений оператора (4) является подпространством конечномерного
пространства Еп и, следовательно, замкнуто, т. е. R(A) = R(A). ТбгДа, как
известно, замкнута и область значений оператора А*, т. е. R(A*) = R(A*).
Отсюда и из теоремы 2 следует, что система (2) поточечно управляема
тогда и только тогда, когда уравнение (13) имеет решение. В рассматриваемой
задаче управления (2), (3) оператор Л = АА* е£(Еп->Еп), и система (13)
представляет собой систему п линейных алгебраических уравнений с п
неизвестными с = (с1,..., с"). Выпишем матрицу Л этой системы в явном
виде, пользуясь представлениями (пример 3.6):
Аи=1Ф(Т,т)В(т)и(т)(1т, A*c = BT(t)<&T(T,t)c, (14)
о
где Ф(4, г) — решение системы (3.34)
^!1 = Я(*)ф(*,т), 0<*<Г; Ф(т,т) = 7.
г
Отсюда следует, что АА*с = $ Ф(Т; т)В(т)Вт(т)Фт(Т, т)сйт, так что
о
к = АА* = 1Ф{Т,т)В{т){Ф{Т,т)В(т))тйт. (15)
§ 10. ВЗАИМОДВОЙСТВЕННЫЕ ЗАДАЧИ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ 599
Таким образом, для того чтобы узнать, является ли система (2)
/-управляемой, достаточно выяснить разрешимость системы линейных алгебраических
уравнений (13) с квадратной матрицей (15). Если c = ct— какое-либо
решение системы (13), то
u = ut{t) = A*ct = BT{t)<5>T{T, t)ct, 0<i<T (16)
— нормальное решение задачи управления (2), (3). Если система (13), (15)
не имеет решения, то система (2) не является /-управляемой.
Далее, пользуясь теоремой 3, получим следующий критерий полной
управляемости системы (2).
Теорема 4. Для того, чтобы система (2) была вполне
управляемой, необходимо и достаточно выполнения одного из следующих трех
условий:
1) ранг матрицы (15) равен п;
2) равенство
A*c = BT(t)<S>T(T,t)c=0 (17)
справедливо почти всюду на [0, Г] тогда и только тогда, когда с = 0;
3) матрица (15) положительно определена, т. е. (Ас, с) > 0 Усе Еп,
сфО.
Доказательство. Система (1), (4) и, следовательно, система (13),
(15) имеет решение при всех / е Еп тогда и только тогда, когда detA ^0
[192; 353], т. е. rangA = п. Далее, в силу представления (14) для оператора
А* условие N(A*) = {с е F: А*с — 0} = {с = 0} равносильно условию (17).
Кроме того, здесь R(A*) = R(A*). Отсюда и из утверждения 3) теоремы
3 следует, что для полной управляемости системы (2) необходимо и
достаточно, чтобы тождество (17) выполнялось только при с=0. Наконец,
утверждение 3) теоремы 4 равносильно утверждению 5) теоремы 3. □
Опираясь на теорему 4, сформулируем условие полной управляемости
системы (2) непосредственно в терминах матриц D(t), B(t).
Теорема 5 (Красовский Н. Н.). Пусть матрицы D(t), B(t)
дифференцируемы на отрезке [0, Т] п — 1 раз. Последовательно определим
матрицы
K0(t) = B(t), Km+l(t) = Km(t)-D(t)KJt), m = 0,l,...,n-l, (18)
и составим блочную матрицу
K(t) = (K0(t),...,Kn^(t)), O^t^T, (19)
размера п х пг. Для полной управляемости системы (2) достаточно,
чтобы существовал хотя бы один момент т е [0, Т] такой, что
rangK(r) = n. (20)
Доказательство. Возьмем произвольный вектор с € Е п и составим
функцию
z{t,c) = cT<$>{T,t)B(t) = cT®{T,t)K0{t), O^t^T. (21)
Поскольку Лф<£*) =-<£>(T,t)D(t), 0< t < Т (см. упражнение 3.3), то,
пользуясь индукцией и равенствами (18), нетрудно доказать, что
^§^1 = cT^(T,t)Km(t), O^t^T, m = 0,l,...,n-l. (22)
600
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Покажем, что z(t, с) = 0, 0 ^ t < Т, только при с = 0. В самом деле, если
z(t, с)=0, то и все производные этой функции равны нулю на [0, Г]. С
учетом (19), (22) отсюда имеем
(стФ(Т, t)K0(t),..., стФ(Т, t)Km(t),..., стФ(Т, *)#„_,(*)) =
= стФ(т,^к(г)=о Vf€[o, г].
В частности это верно и для момента t = т, взятого из (20), так что
стФ(Т,т)К(т) = 0 или Кт(т)Фт(Т,т)с=0. Однако ранг матрицы Кт(т)
^авен п в силу (20), поэтому последнее равенство возможно только при
<т(Т,т)с=0. Отсюда, учитывая, что квадратная матрица Ф(Т,т)
невырожденная, получаем, что с = 0. Тем самым установлено, что z(t, с) =
= стФ(Т, t)B(t) = 0, 0< t ^ Т, только при с = 0. Это значит, что
равенство (17) возможно только при с = 0. Согласно теореме 4 система (2) вполне
управляема. □
Для стационарных систем, когда D(t), B(t) постоянные матрицы,
оказывается, условие (20) необходимо для полной управляемости системы (2).
Теорема 6 (Калман Р. Е.). Система (20)
х = Dx + Вщ O^t^T, (23)
где D, В — постоянные матрицы, вполне управляема тогда и только
тогда, когда
rmg(B,DB,...,Dn-lB) = n. (24)
Доказательство. Достаточность. Для постоянных матриц
D,B из (18), (19) следует, что Km = (-l)mDmB, К = (B,-DB, D2B, ...
..., (—l)n~lDn~lB). Нетрудно видеть, что ранги матрицы К и
матрицы (24) равны, так как столбцы этих матриц отличаются лишь знаками.
Отсюда и из (24) следует, что vangK = п, и в силу теоремы 5 система (23)
вполне управляема.
Заметим, что поскольку матрица (19) здесь не зависит от £, то
условие (20) выполняется при всех т € [0, Г]. Это значит, что при выполнении
условия (24) стационарная система (23) вполне управляема на любом
отрезке [0, Г], Г > 0.
Необходимость. Пусть система (23) вполне управляема. Покажем,
что тогда выполняется условие (24). Снова воспользуемся функцией (21)
z(t, с) = стФ(Т, t)B, O^t^T.
Так как матрицы В, D не зависят от t, то функция z(t, с) бесконечно
дифференцируема. Как и в (22) с помощью индукции нетрудно доказать, что
z™ = dm*$с) =(-1)тсгФ(Т; t)DmB Vt, m=0,l,... (25)
Далее, воспользуемся теоремой Кэли — Гамильтона [192; 353]: любая
квадратная матрица D является корнем своего характеристического многочлена
det(D - XI) = 0. Это значит, что если det(D - А7) = (Ап + ДА""1 + ...
■■ . + Д.-Л +A,)(-l)n, то Dn + (1XD»-' + .. . + (3n_xD + (3J=0. Умножим
это матричное равенство слева на стФ(Т, t), справа на В. С учетом
равенств (25) получим
«<">-А«(""° + А«("~2> + -.. + (-1)"-'Д.-1«' + (-1)"Д»« = 0 VtGR. (26)
§ 10. ВЗАИМОДВОЙСТВЕННЫЕ ЗАДАЧИ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ 601
Таким образом, функция z = z(t, с) при любом фиксированном сеЕп
является решением линейного дифференциального уравнения n-го порядка с
постоянными коэффициентами. Так какФ(Т; Т) = 1, то z = z(t, с) при t = Т
удовлетворяет условиям
z(m\T,c) = (-l)mcTDmB, m=0, 1,..., n-1. (27)
Так как по условию система (23) вполне управляема, то равенство (17)
возможно только при с = 0. Отсюда и из (26) следует, что набор
(z(t,c),z'(t,c),...,z(n-l\t,c))^0 VtGE, Vc^O. (28)
В самом деле, если (z(t0, %),..., z(n~l)(t0, %)) = 0 при каких-то t0 и (¾ ф
Ф 0, то по теореме единственности решения задачи Коши для
уравнения (26) [588; 694] z(t, (¾) = 0 Vt е Е, что невозможно в
силу (17). Положим в (28) t = Т. С учетом равенств (27)
получим (с*1 В, -cTDB, cTD2B,..., (-1)"- lcTDn- 'В) = cT(B, -DB, D2B,...
..., (-l)n~lDn-lB)^0 при всех с eEn, с ^0, что равносильно (24).
Теорема 6 доказана.
Таким образом, проблему полной управляемости стационарной
системы (23) удалось свести к алгебраической задаче (24) определения ранга
некоторой матрицы. Условия полной управляемости для задач управления,
аналогичных задачам из примеров 2-4, исследованы, например, в [11; 122;
123; 175; 287; 354; 355; 404; 730; 784; 797; 802; 804; 812]. Заметим, что
задачу управления (1), конечно, можно записать в виде задачи минимизации
квадратичной функции (2,3): J (и) = \\Аи - f \\% —>inf, иЕ U = H, из которой
при Jt =0, Ut ф0 получим решение задачи (I).
4. Покажем, что с каждой задачей управления (1) тесно связана
некоторая, так называемая двойственная задача наблюдения, которую
сформулируем следующим образом. Пусть за системой А ведется наблюдение, и с
помощью какой-то измерительной аппаратуры определяется элемент
д = А*сеН, (29)
называемый сигналом; здесь А* — оператор, сопряженный к оператору А
из (1), Предполагается, что элемент с € F мы не можем наблюдать
напрямую, и мы желаем по сигналу (29) определить проекцию неизвестного нам
элемента с на заданный элемент / € F, точнее, скалярное произведение
(/, с)F. Будем искать такой элемент иеН, называемый
восстанавливающим величину (/, с)у, чтобы скалярное произведение элемента и на
наблюдаемый сигнал д в точности равнялось искомой величине (/, c)F, каким бы
ни был неизвестный элемент с, порождающий сигнал (29), т. е.
выполнялось равенство
(u,g)H = (f,c)F УсеК (30)
Сформулированная задача наблюдения (29), (30) называется двойственной
к задаче управления (1). На первый взгляд может показаться, что эти задачи
слабо связаны друг с другом. Однако верна
Теорема 7. Задачи (1) и (29), (30) одновременно разрешимы или
неразрешимы. Если они разрешимы, то решение и каждой из них
удовлетворяет операторному уравнению (1).
602
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Доказательство. Пусть задача наблюдения (29), (30) разрешима,
пусть и — восстанавливающий элемент этой задачи. Тогда из равенств (29),
(30) имеем:
(f,c)F = (u,g)H = (u,A*c) = (Au,c) Ус е К (31)
Отсюда следует, что (Au — f,c)F = 0 Vc € F. Полагая в этом равенстве
с = Аи — f, получим Аи — f = 0, т. е. восстанавливающий элемент и
является решением уравнения (1). Таким образом, если задача наблюдения (29),
(30) разрешима, то задача управления (1) также разрешима. Обратно: если
задача управления (1) имеет решение, то для решения этой задачи
справедлива та же цепочка равенств (31), из которой следует, что любое решение
и уравнения (1) является восстанавливающим элементом задачи
наблюдения (29), (30). □
Заметим, что задачи (1) и (29), (30) являются взаимодвойственными и
для их формулировки достаточно знать оператор А или А* и элемент /.
Здесь, конечно, мы учитываем, что А € С(Н —> F), где Н, F — гильбертовы
пространства, и справедливо равенство А** = А.
Определение 2. Система А называется f-наблюдаемой или
поточечно наблюдаемой по сигналу (29), если уравнение (1) при заданном / € F
имеет хотя бы одно решение. Система А называется вполне наблюдаемой
по сигналу (29), если уравнение (1) имеет решение при всех / е F.
Сравнивая определения 1, 2, заключаем, что понятию поточечной
управляемости [полной управляемости] в задаче управления соответствует
понятие поточечной наблюдаемости [полной наблюдаемости] в двойственной
задаче наблюдения.
В силу теоремы 7, связывающей взаимодвойственные задачи
управления и. наблюдения, при исследовании задачи наблюдения (29), (30)
могут быть использованы теже теоремы 1-3. В частности, для выяснения
того, будет ли система А /-наблюдаемой, можно воспользоваться
уравнением (13). Если система А вполне наблюдаема, то в силу
утверждения 4) теоремы 3, оператор А* обратим, (А*)-1 е C(R(A*) —> F).
Отсюда следует, что равенство (29), рассматриваемое как уравнение
относительно неизвестного (наблюдаемого) элемента с, однозначно разрешимо
и c = (A*)~lg. Оператор U = (A*)~l естественно назвать
восстанавливающим оператором. Если F — сепарабельное пространство и система А
вполне наблюдаема, то в качестве элемента / в (30) можно
последовательно брать / = Д, к = 1,2,..., где {fk}— ортонормированный базис в F.
Каждое уравнение Аи = fk имеет хотя бы одно решение и = ик, к — 1, 2,...
Тогда по формулам (30), (31) мы можем определить коэффициент Фурье
ск = (Л) с) = (¾) 9)1 к = 1,2,..., неизвестного элемента с и восстановить
оо оо
его по формуле с = £ ckfk = £ (ик, g)fk.
fc = i *: = 1
5. Сформулируем задачи наблюдения, двойственные к задачам
управления из примеров 1-4.
Пример Г. Оператор А*, сопряженный к оператору (4), имеет вид
A*c = BT(t)il)(t;c), O^t^T,
где <ф = il>(t; с) — решение задачи Коши:
ф=-ВТ^)ф, 0^t<T; ^(T) = ceEn = F (32)
§ 10. ВЗАИМОДВОЙСТВЕННЫЕ ЗАДАЧИ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ 603
(см. пример 3.6). Задача наблюдения (29), (30) для системы (32),
двойственная к задаче управления (2), (3), формулируется так: найти элемент
и = u(t) € Н = L£[0, Т], восстанавливающий величину (/, с)Е„ по
формуле (30), где g(t) = BT(t)i[)(t; с), 0< t < Т — наблюдаемый сигнал.
Согласно теореме 7 восстанавливающий элемент u = u(t) является решением
уравнения (1), где А —оператор (4). Для решения задачи /-наблюдаемости
для системы (32) можно воспользоваться уравнением (13) с матрицей (15).
Теоремы 5, 6 содержат условия полной наблюдаемости системы (32),
совпадающие с условиями полной управляемости системы (2).
Пример 2*. Оператор А*, сопряженный к оператору (8), действует
по формуле
A*c = i/j(l,t;c), O^t^T,
где ф =,0(s, t; с) — решение краевой задачи (7.13), (7.14) с с = c(s)e F =
= L2[0, I]. Задача наблюдения для системы (7.13), (7.14), двойственная к
задаче управления (6), (7), формулируется так: найти элемент u = u(t)e
€L2[0, Т) = Н, восстанавливающий величину (f,c)F — \f(s)c(s)ds по фор-
о
муле (30), где g(t) = ф(1, t; с) — наблюдаемый сигнал. Согласно теореме 7
восстанавливающий элемент u = u(t) является решением уравнения (1),
где А — оператор (8).
Пример 3*. Оператор А*, сопряженный к оператору (11), имеет вид
А*с = ф(0^;с),
где ф = ф(з,Ь;с) — решение краевой задачи (8.11), (8.12) при c = c(s) =
= (co(s), c^s)) е F = L2[0, I] x L2[0, l]. Задача наблюдения для
системы (8.11), (8.12), двойственная к задаче управления (9), (10),
формулируется так. Наблюдаемый сигнал имеет вид
д = д(Ь) = А*с = ф(0,г;с), O^t^T.
Требуется найти функцию u = u(t) eL2[0, Т] = Н, для которой
(и, д)н = ] u{t){A*c){t)dt = (/ c)F = \{!0{з)ф) + Ms)Cl(s))ds, (33)
о о
где f = {fo(s), f{(s)) — заданный элемент из F. Восстанавливающий
элемент u = u(t) является решением уравнения (1), где А —оператор (11).
Пример 4*. Оператор А*, сопряженный к оператору (11),
порожденному системой (12), согласно формуле (8.24), имеет вид
A*c=Xr(e)^(e,t;c)de, O^t^T, (34)
о
где ф = ф(в, t;c) — решение краевой задачи (8.25). Задача наблюдения для
системы (8,25), двойственная к задаче управления (12), (10),
формулируется так. Наблюдаемый сигнал имеет вид (34). Требуется найти функцию
и = u(t) € LJ0, Т] = Н, для которой выполняется равенство (33).
Восстанавливающий элемент u = u(t) является решением уравнения (1), где А —
оператор (11), соответствующий системе (12).
604
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
6. Описанная схема составления взаимодвойственных задач управления
и наблюдения может быть применена и к другим классам линейных
динамических систем, описываемых различными дифференциальными, интегро-
дифференциальными, разностными уравнениями.
Параллельное изучение пар взаимодвойственных задач управления и
наблюдения позволяет глубже понять многие аспекты теории таких задач,
открывает возможности использования методов, разработанных для
решения, скажем, задач управления, и применения их к задачам наблюдения и
наоборот. В частности, отметим, что сформулированный выше класс задач
наблюдения (29), (30) является подклассом обратных задач. Поэтому
математический аппарат, разработанный в рамках теории и методов решения
обратных задач (см., например, [127; 230; 269; 557; 618; 812]) может быть
использован как для исследования задач наблюдения, так и двойственных к
ним задач управления. Использование идей двойственности полезно также
и при исследовании вопросов аппроксимации задач управления и
наблюдения [170; 363; 433; 598; 599; 607; 797; 804].
Упражнения
1. Проверить, что система х = u(t), 0 < t < Г, вполне управляема в классе постоянных
управлений при всех Г > 0.
2. Доказать, что система х = u(t), у = —u(t), и = u(t) е L2[0, Г], поточечно управляема
тогда и только тогда, когда х(Т) + у(Т) = х(0) + у(0).
3. Исследовать, будут ли следующие системы поточечно или вполне управляемы
[наблюдаемы]:
(x = y + u(t) |i = s ■"'з)1-± = У лр = 1 + иС)
\ у = -х \ y = u(t) X y = x + u(t) \ у = х + у
5)/ *=*+«<*> 6)р=2*-2^> 7)Н::;
0,Xy = x + y + v(t) ,\y^y-x-U(t) "\х3 х
v ^ V X = uyt)
4. Доказать, что система (2) не является вполне управляемой тогда и только тогда, если
существует вектор с е Еп, ct ^0, что правые концы всех траекторий системы принадлежат
гиперплоскости Г={хе Еп; (ct,x} = 0}, т. е. (ct,x(T,u)} = 0 Vu е L^O, Г]. Указание:
воспользоваться утверждением 2) теоремы 4 (см.1 также [411;' 712]).
5. Можно ли утверждать, что если N(A*) = {0}, то N(A) также состоит из единственной
нулевой точки? Указание: рассмотреть оператор с матрицей А = I „ « . ),
действующий из Е2 в Е3.. ... ^ '
6. Доказать, что если А еС(Н —> F), Я, F — гильбертовы пространства, то R(A) = R(A)
тогда и только тогда, когда или 1) ЩА*) = ЩА*) [416], или 2) inf \\Аи\\ >0, где нижняя грань
берется по всем и еН, \\и\\ = 1, (и, v)~0 \/veN(A) [131].
7. Докажите теоремы 1 -3.
8. Доказать, что оператор А+, который каждому f £R(A) ставит в соответствие
нормальное решение уравнения (1), является линейным. Если R(A) = R(A), то А+ е£(Д(.А)~> F),
N(A+) = N(A*), R(A+) = R(A*), A+A = I -VN,A) (7¾ — оператор проектирования на U),
АА+ = РщА\ (в частности, если R(A) = F, то АА* = 1, поэтому оператор А+ называют
псевдообратным к оператору А), АА+А=А, А+АА+ = А+, (АА+)* = АА+, (А+А)* = А+'А,
А++ = А, (А*)+ = (А+)*.
9. Для системы (7.2), (7.3) задачу управления x(s, Г; и) = f(s), 0 ^ s < I, записать в
виде уравнения (1); сформулировать двойственную к ней задачу наблюдения. Указание:
воспользоваться операторами (7.9), (7.13).
§ 10. ВЗАИМОДВОЙСТВЕННЫЕ ЗАДАЧИ УПРАВЛЕНИЯ И НАБЛЮДЕНИЯ 605
10. Для системы (8.2), (8.3) задачу управления (10) записать в виде уравнения (1);
сформулировать двойственную к ней задачу наблюдения. Указание: воспользоваться
операторами (8.7), (8.10).
11. Для системы (8.27)-(8.30) задачу управления (10) записать в виде уравнения (1);
сформулировать двойственную к ней задачу наблюдения. Указание: по формуле (11) ввести
оператор А, действующий из Н = L2(Q) в F = L2[0,1] х L2[0,1]; опираясь на оценку (8.34),
убедиться, что А еС(Н —>F); показать, что сопряженный оператор А* действует по правилу
А*с = ip(s, t; с), где ф = V>(si £; с) — решение краевой задачи (8.37).
12. Пусть колебания струны описываются краевой задачей
*« = *«. (M)eQ = (0.')x(0,T),
*1.=0 = "(*)> ==1.=1=°. 0<t<T; x|J=0 = 0, xt\t=0 = 0, 0<s<г.
Задача управления: найти u = u(t) eL2[0, Г], чтобы x\t = T = j/0(s), xt\.T = y,(s), 0< s < I.
Доказать [804], что эта задача при Т>21 имеет решение при всех y0(s)eL2[0, Г], j/[(s)e
еЯ"'[0,!]. Сформулировать двойственную задачу наблюдения. Указание: показать,
что оператор А из (11) в этой задаче действует из Н = L2[0, Г] в F - L2[0,1] х ff~'[0, I],
непрерывен, а сопряженный к нему оператор А* действует по правилу: А*с = ф3(0, t; с), где
ф = ф(8,1;с) — решение краевой задачи
^«=^„, (s, *) eQ; ^1,=0 = ^5 = ,=0, V>l( = r = ci(s). V'(li = r = -^s)1
где с = (со(8), C|(s))eF* = L2[0,1]хН^[0, l]; доказать оценку: ||A*e||H^ T~l'2l\\c\\F [804] и
воспользоваться утверждением 4) теоремы 3 (в других функциональных пространствах такая
задача управления исследовалась в [354; 355]).
13. За динамической системой
^=^-.,, (e,t)eQ = (0,l)x(0, Г), ^1..0 = ^1. = ,=0, V>Ur = c(s)
ведется наблюдение и измеряется сигнал д(^) = Ф3(^, *;с), 0 < t < Г. Требуется найти
элемент u = u(t)eL2[0, Т]=Н, восстанавливающий величину (/, c)L |0(] по правилу (30), где
/ = f(s) е F = L2[0,1] — заданный элемент. Для этой задачи наблюдения сформулировать
двойственную задачу управления.
§ 11. Метод моментов
1. Сначала изложим элементы теории моментов. Начнем с так называемой
конечномерной проблемы моментов.
Пусть В — банахово пространство, В* — сопряженное к В
пространство. Пусть заданы элементы ip{,ip2,.. .,ipn Е В и вещественные числа
/i = (ди ..., мп). Проблема моментов формулируется так: найти линейный
функционал и 6 В* такой, что
(и, <д) = М,-, г = 1,...,п. (1)
Напоминаем, что через (и, ip) мы обозначаем значение функционала и на
элементе tp е,В. Рассмотрим условия, обеспечивающие существование
решения проблемы (1). Если д=0, то, очевидно, проблема (1) всегда имеет
решение, например, и=0. Пусть д^0. Тогда, оказывается, важную роль
при исследовании вопросов существования решения проблемы (1) играет
следующая конечномерная задача минимизации:
д(с) = \\±с*ч>(\\в->Ы, сеГ/1={с = (с1,..,с")еГ:{м,с) = 1}. (2)
s = l
606
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Убедимся, что задача (2) имеет решение. Заметим, что Г — гиперплоскость
в Еп — это непустое выпуклое замкнутое множество. Функция д(с)
непрерывна и, более того, удовлетворяет условию Липшица на Еп:
п п
\д(с + 8с)-д(с)\^\\ Е «c'pj < max |&'| Е llv<ll = ill*cIL
Vc,c + 8ceEn.
Сначала рассмотрим случай, когда система {tp{,..., tpn} линейно
независима. При этом д(с) = 0 тогда и только тогда, когда с = 0. Непрерывная
функция д(с) > 0 на компактном множестве S = {с: \с\ = 1} достигает
своей нижней грани хотя бы в одной точке (¾ £ S, причем #(¾) = ming(c) > 0.
п i S
Поэтому д(с) = \с\ Е ГТV* ^ 1^(¾) —> +°° ПРИ 1с1 —* °°- Согласно теоре-
ме 2.1.3 найдется точка с, е Г , для которой inf д(с) = g{ct) = gt. Так как
0£Г„, то ct^0 я g(ct) = gt> 6. сеГ*
Пусть теперь система {tp{,..., </>п} линейно зависима. Не умаляя
общности, можем считать, что элементы </>[,..., </>fc, к < п, линейно независимы,
а остальные <рк + 1,. .., </>„ —линейно выражаются через них:
Ъ
Ё a«V<> (^,---,¾)^0. 3 = к+ 1,..-
п.
« = i
Тогда
9(c) = Ес>,+ ± С (!><,¥>,) = E(W ± с'аЛп
Допустим, что k
М* = ЁауМо 3 = k + 1,..., п.
s= 1
Условие (fi, с) = 1 в этом случае запишется в виде
к п / к \ 1с / тъ \
EcV,+ Е с* Е%м. =Е с+ Е CayU = i.
(3)
(4)
(5)
(6)
•iM*).
Введем новые переменные с1' = с* + Е с5'ау, г = 1,..., fc, M = (Mi,
g(c)— E Cj'/'j ■ Тогда с учетом соотношений (4), (6) имеем: inf g(c) =
s = 1 (ft c> = [
= _inf g(c). Так как элементы {^,..., ц?к} линейно независимы, то как
(7Г, с) = 1
было установлено выше, найдется точка с, = (с',..., ск), (/х, с„) = 1, такая,
что д(с„)= inf (7(с)>0. Тогда ct = {c\,..., с*,0,.. .,0)еЕп удовлетворяет
(/1, С) = 1
условию (д, сЛ = 1 и g(ct) = g(ct) = inf д(с) = gt>0. Таким образом, за-
дача (2) разрешима и в случае (3), (5), причем gt >0. Наконец, рассмотрим
случай, когда tplf..., ipk линейно независимы, выполнены условия (3), но (5)
к
нарушено при некотором j = j0, к + 1 ^ j0 < п, т. е. ^ — Е ^¾¼ = афО.
Определим с„ = (с,1, ..., с") так: с; =—^-, г = 1,..., к, с* = —, остальные
к
Е
с/=0. Тогда (М, с.) = Е М* --^ +М4£ = (М*-Е №%,)^ = 1- т. е. с,еГ,
С
< = 1
§11. МЕТОД МОМЕНТОВ
607
Кроме того, с учетом равенства (4) имеем: g(ct)= Y1 ( — ~^Г "*" ~ ) V\'
= 0= inf д(с) — gt. Таким образом, доказана i = i\ а )
(д, с) = 1
Теорема 1. Пусть fi^O, Тогда задача (2) имеет решение, т. е.
Эс, е Г , что inf g{c) = g(ct) = g„^0, причем:
(лс)=1
1) g, > 0, если ¥>i,...,¥>„ линейно независимы или ipu ..., ipk, к <п,
линейно независимы и выполнены равенства (3), (5);
2) 5* =0> если ¥>!,...,¥>*, к <п, линейно независимы, выполнены
равенства (3), но хотя бы одно из равенств (5) не выполнено.
Теперь мы можем сформулировать следующий критерий существования
решения проблемы моментов (1). Обозначим через Ut множество решений
этой проблемы. Заметим, что проблема (1) в общем случае может иметь
много решений. Решение ut проблемы (I) назовем нормальным решением,
если \\и II = min \\u\k Если д = 0, то и =0, очевидно, является нормальным
ие£/,
решением проблемы (1),
Теорема 2. Пусть fj, ф0. Тогда для того чтобы Ut^0, необходимо
п
и достаточно, чтобы в задаче (2) gt = inf ]Г} ct tp{ > 0. £сли Ut Ф 0,
то существует нормальное решение ut проблемы (1), причем \\ut\\ = —..
Множество решений проблемы (1) представимо в виде: Ut = ut + U0t, где
U0t —множество решений проблемы (1) при /х = 0.
Доказательство. Необходимость. Пусть Ut ф 0. Возьмем
произвольные и 6 Ut и с 6 Г . Умножим г-е равенство (1) на с1 и просумми-
п п
руем получившиеся равенства: J^c'(u, (р{) = (и, Ylci{Pi) = (м'>'с) = 1- Тогда
n . i=l t = 1 !,.i
1 ^ IMI ]С С*</'» ^с S Г . Переходя к нижней грани по с 6Т^,, отсюда по-
лучаем 1 ^ IMI&- Следовательно, gt > 0 и, кроме того,
0<£<|Н \/ueUt. (7)
Достаточность. Пусть gt > 0. Покажем, что тогда проблема
моментов (1) имеет хотя бы одно решение, причем 3¾ е Ц,, для которого ||ч|| = —.
Введем два множества М и N следующим образом: 9*
М = {<реВ: |МКяг,},
п
N = {tp еВ: ip=Yl ci(Piдая какого-либо с е Г^}.
г = 1
Нетрудно проверить, что оба множества выпуклы, int М^0. Кроме того,
|М1 ^ 9* Vi/з eiV и || ^) || <gt V</>eint М, так что int М nN — 0. По теореме
3.6 множества М и N отделимы, т. е. существует ut 6 В*, что
(ч,¥>><1 V^eAf, (ч,^1 V^eJV. (8)
Возьмем какую-либо точку с„ б Г , для которой <7(с„) = infg(c) = & (теоре-
ма 1), и положим (pt=Yl c*4>i- Нетрудно видеть, что tpteM П 7V. Тогда
из (8) следует, что (ut,(pt) = l. Покажем, что
(ч, „) = 1 V^eJV, : (9)
608
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Возьмем произвольный элемент ip е N. По определению множества N най-
п '
дется точка сбГ^, что <р = Е с'щ. Для точки са = ас + (1 — а)с„ име-
ем (д, са) = a(fj,, с) + (1 - а)(д, с*) = 1 Va el. Тогда ipa = aip + (1 -
- <*)V. = « E cV< +(!-«)£ Q.'v>* = X>>* e TV Vc* e R. В силу (8)
£=1 г = 1 £ = 1
1 <<Ч, Va) = (u*, ау + (1-а)у.) = <Ч, <А,) + а(ч> </>- </>.) = 1 +a(ti„ </>-</>.)
или 0 < a (ut, ip — tpt) VaeK. Это возможно только при (ut, tp — (pt) = 0, т. е.
(ut, (р) = (ut, (pt) = 1 \f(p e N. Равенство (9) установлено.
Покажем, что ut — решение проблемы (1). Так как м т^О, то /х{ ^0 при
каком-либо г, 1 < г < п. Для таких д£ положим с = (¾ = (0, ..., 0, cj = —, 0,...
..., 0). Ясно, что (ju,, Cq) = 1, поэтому ip0 — — tp. е N. Согласно (9) тогда 1 =
= (ut, (/¾) = тг(4> <Л-)> т- е- (4, У*) = М» дая всех г, для которых дг ^0- Если
же ^ =0, то возьмем ср = (cj,..., с;-1, с* = Д с/ + 1.,..., с"), /3 е К. Так как
<М.с„>= £ М,с/+0.Д = (м,с,> = 1 V/3eR, то ^=^ c^eN V/3eR.
В силу (9) тогда l = (ut,tp^}= £ c*5Vy + /?(ч*> Vi) v^ e ^- Разделим это
3 = 1,3 ^i
равенство на [3 > 0 и устремим /3 —> +оо. Получим: (nt, </^) =0 = щ. Таким
образом, показано, что (ut, (pt) = fi{ при всех г = 1,..., п, т. е. ut е С£.
Убедимся, что ut — нормальное решение проблемы (1). Так как (ut, ip) < 1
V</> е М в силу (8), то |К||= sup (ч,¥>> = sup (4, f-) = ±-'supK. </>) < f-
iiHki пик». * * <p^M *
С другой стороны, для точки ut е Ц, из (7) имеем: ||uj| ^ —. Следовательно,
||uj| =inf ||u|| = —, т. е. % — нормальное решение проблемы (1). Попутно
Ut У*
получили, что
&'Н4|| = 1-«><&)■ (1°)
Равенство
ut = 4 + г/0.
предлагаем читателю доказать самостоятельно. □
2. Рассмотрим так называемую конечномерную I-проблему моментов:
найти функционал ие В* такой, что
(ч<Л-)=Мо г = 1,...,п, \\и\\ < I, (11)
где I > 0 — заданное число. Как видим, I—проблема моментов отличается
от проблемы (1) наличием дополнительного ограничения ||и||'< I. Опираясь
на теорему 2 нетрудно получить критерий разрешимости /-проблемы (11).
Заметим тогда, что при \i = 0 проблема (11) всегда имеет решение,
например, ut = 0.
Теорема 3. [441]. Пусть мт^О. Для того чтобы проблема (11)
имела хотя бы одно решение, необходимо и достаточно, чтобы
ft=4nf Е4 >\- (12)
Доказательство. Необходимость. Пусть и — решение I —
проблемы (11). Тогда и является решением и проблемы (1), и по теореме
2 необходимо gt > 0, I ^ ||и|| ^ —.
У*
§11. МЕТОД МОМЕНТОВ
609
Достаточность. Пусть gt ^ j. Согласно теореме 2 проблема (1)
имеет нормальное решение ut с нормой ||и„|| = — < I, так что щ —решение
проблемы (11). Теорема 3 доказана. □ *
Замечание 1. Основываясь на теоремах 1-3, можно наметить
следующий порядок действий для определения решения проблем (1), (11).
Можем считать, что fj-^О. Тогда задача (2) имеет смысл, и, решая эту задачу,
можем определить
с,еГ, g(ct) = gt = \\tpt\\, <A,= £C*</V
;= 1
Так как проекция точки на гиперплоскость Г^ легко вычисляется (пример
4.4.2), то при решении задачи (2) можно использовать метод проекции
градиента или субградиента (см. § § 5.2, 5.3). Если при этом выяснится, что
gt =0, то согласно теореме 2 проблема (1) не имеет решения. Если gt > 0,
то проблема (1) разрешима. Нормальное решение ut проблемы (1)
удовлетворяет равенствам (10), которые можно присоединить к системе
уравнений (1). В частности, если равенства (10) однозначно определяют элемент
ut, то ut — нормальное решение проблемы (1). Например, если В = Н —
гильбертово пространство, то из (10) имеем ut = ^f. Если найденное нор-
мальное решение ut проблемы (1) удовлетворяет неравенству \\ut\\ ^ I, то
ut — решение I—проблемы (11). Если же ||uj > I, то проблема (11) не
имеет решения.
Замечание 2. Если В = Н — гильбертово пространство, то можно
предложить следующий более простой метод решения проблемы (1), явно
не использующий задачу (2). А именно, решение можем искать в виде
u=±aiyi. (13)
s = l
Подставив (13) в (1) для определения неизвестных коэффициентов а1, . ..
..., а", получим систему линейных алгебраических уравнений
п
Z)(Vi»V,V = Mi» J = 1,..., п. (14)
Нетрудно видеть, что элемент и из (13) будет решением проблемы (1) тогда
и только тогда, когда а = (а1,..., а") — решение системы (14). Матрица
системы (14) симметрична и представляет собой матрицу Грама [89; 192;
353] системы векторов tpu ..., </эп. Если эти векторы линейно независимы, то
матрица Грама невырождена, и система (14) имеет единственное решение.
3. Остановимся на бесконечномерной проблеме моментов, также
имеющей приложение в задачах управления. Пусть заданы некоторая
последовательность элементов tpu (/¾,..., tpn1... из банахова пространства В и
числовая последовательность д0 ^,..., цп,... Требуется найти функционал
и & В*, удовлетворяющий условиям
<«.Vi> = Mi» г = 1,2,... (15)
Покажем, что разрешимость сформулированной проблемы моментов (15)
тесно связана с разрешимостью следующих конечномерных проблем
моментов, полученных «усечением» проблемы (15): ищется функционал ип £ В*
такой, что
<«»» </>*> = Mi, г = \,...,п\ п=1,2,... (16)
610
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Согласно теореме 2 проблема (16) при каждом фиксированном п разрешима
п
тогда и только тогда, когда рьп = 0 или gnt > 0, где gnt = inf Yl cLfi
Mn = (Mi,...,Mn). cn = (c',...,c:). <"-с«> = ' < = i
Теорема 4. Пусть В — сепарабельное банахово
пространство. Для того чтобы проблема (15) имела решение, необходимо и
достаточно, чтобы проблемы (16) были разрешимы при каждом п^1 к
sup \\unt\\ < оо, где unt —нормальное решение проблемы (16).
п^ 1
Доказательство. Необходимость. Пусть и — решение
проблемы (15). Тогда, очевидно, и является решением проблемы (16) при
каждом п^ 1. Из разрешимости проблемы (16) при каждом п)1 и
теоремы 2 следует существование нормального решения unt, п = 1, 2,.... Тогда
llun*ll ^ llull« п= 1, 2,..., так что sup \\uw\\ < ||u|| < оо.
Достаточность. Пусть при каждом п^ 1 проблема (16) разрешима
и sup \\uw\\ <оо, где unt — нормальное решение проблемы (16). Так как про-
странство В сепарабельно, то из ограниченной последовательности {unt}
можно выбрать подпоследовательность {«„*}, которая сходится к
некоторому элементу v 6 В* в следующем смысле: lim {ип t, tp) = (v, <р) \/tp б В
к —» оо к
(см. [393], гл. IV, § 3). Отсюда и из равенств (и , </>,) = /^, ¢ = 1-,..., пк,
при к —» оо получим (у, <а) = \ii для всех г = 1, 2,... Следовательно, г; —
решение проблемы (15). Теорема 4 доказана. П
Добавив к (15), (16) условие
\ЫН1, (17)
получим бесконечномерную I -проблему моментов и ее конечномерные
аппроксимации соответственно. Аналогично теореме 4 доказывается
Теорема 5. Пусть В — сепарабельное банахово пространство.
Тогда I -проблема моментов (15), (17) разрешима тогда и только тогда,
когда при каждом п^ 1 разрешима I-проблема (1.6), (17), причем ||wnJ| < I
Vn = 1, 2,..., где unt —нормальное решение проблемы (16), (17).
При поиске решения каждой из конечномерных проблем (16) или (16),
(17) можно действовать по схеме, изложенной в замечании 1. Может
случиться, что при каком-то п^ 1 проблема (16) или (16), (17) не имеет
решения. Тогда согласно теоремам 4, 5 соответствующая бесконечномерная
проблема (15) или (15), (17) также не имеет решения.
Теоремы существования решений бесконечномерной проблемы моментов
для конкретных систем {<л, г = 1,2,...} см., например, в [11; 122; 123; 166;
287; 400; 415; 784; 802].
4. Проиллюстрируем метод моментов на задаче управления динамической
системой
x = D(t)x + B(t)u(t), 0^t<T; ж(0) = 0, (18)
где момент Т > 0 задан, A(t), B(t) — кусочно-непрерывные на [0, Т]
матрицы пхп, пхг соответственно. Управление u = (ul(t),..., ur(t)) будем
называть допустимым, если u{(t) — ограниченная измеримая функция,
почти всюду на отрезке [0, Т] удовлетворяющая неравенству
\и*(г)\^1, г = 1,...,г, г>о. (19)
§11. МЕТОД МОМЕНТОВ
611
Пусть задана точка х{ е Еп, щ ^0. Будем искать такое допустимое
управление, что
х(Т;и) = х1, (20)
где x=x(t;u)—траектория системы (18), соответствующая управлению и.
Сведем задачу (18)-(20) к /-проблеме моментов (И) в подходящим
образом выбранных банаховых пространствах В, В*. С этой целью
воспользуемся уже известным нам представлением (см. пример 3.6) решения
системы (18): t
x(t;u)=\<£>(t,T)B(T)u(T)dT, O^t^T,
о
где матрица Ф(£, т) размера n х п определена условиями —at =
= £>(£)Ф(£, т), 0< £, т< Т; Ф(т, т) = 1. Тогда условие (20) можем записать
в виде уравнения
I Ф(%т)В{т)и{т)йт = хх. (21)
о
Обозначим г'-ю строку матрицы Ф(Т, т)В(т) через
Ъ = Ъ(Т,т) = (<рг[(Т,т),...,ч>г(Т,т)), О^т^Т; г = 1,...,п.
Тогда уравнение (21) перепишется в следующей покоординатной форме
{^Vi) = ](i:vHT,T)u'\T))dT = xtt г =1,..., п. (22)
о S' = i '
Функции </>; = (р{(Т, т), г = 1,..., п, кусочно-непрерывны на [О, Т], и
поэтому можем считать, что ^еВ = L[[0, Т] — банахово пространство с нор-
Т г
мой \\(Pi\\B = $ Yl W!{T, т)\йт. Сопряженным к В является пространство
О 3 = 1
В* = Lrx[0, Т] с нормой ||и||в, = ess sup max |и'(*)1 [2581- Условие (19)
теперь можем записать в виде: o^t^rl^i^r
\\и\\в. ^ г, (23)
результат (и, </>;) применения функционала иЕВ* к элементу tp. еВ
определяется формулой (22^. Тем самым задача (18)-(20) сведена к задаче (22),
(23), представляющей собой /-проблему моментов (11) при ii = xly^0 на
паре пространств В = L[[0, Т], В* = L^[0, Т], и для ее исследования
могут быть использованы теоремы 1, 2 по схеме, изложенной в замечании
1. Поскольку в задаче (2) целевая функция д(с) удовлетворяет условию
Липшица, то при решении этой задачи можно использовать подходящие
модификации метода покрытий из § 5.13.
При вычислении значений функции д(с) = J2с*ц>{(Т, т) в фиксиро-
i = i в
ванной точке с необязательно иметь явное выражение для матрицы Ф( Т, т).
Дело в том, что здесь
£ с*ъ(Т, т) = (Ф<(Т, т)В(т))тс = Вт(т)Фт(Т, т)с=Вт(т)ф(т; с),
где ф — ф(т; с) = ФТ(Т, т)с является решением задачи Коши: ф =—Отф,
Т г
О ^ т ^ Т, ф(Т) = с. Следовательно, д(с) = $ 52
О 3 = 1
i = i
dr.
612
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Для более общих систем вида (10.5) задачу управления при
условиях (19), (20) можно свести к I -проблеме моментов (22), (23) с помощью
уже известного нам приема, изложенного в примере 10.1 (см. также
примеры 2.15, 3.7). Если условия на управления заданы в виде
<*,(*)<«<(*)<&(*). 0<*<^ * = 1,...,г,
то можно перейти к новому управлению v = (v',..., vT) по формулам
v* = [и' - 5(a4(t) + fl(*))]ft(t)-g<(t)' * = 1, • •., П
с ограничениями вида (19): |v'(t)| < 1, г = 1,..., г.
Замечание 3. Предполагая, что матрицы D(t), B(t) из (18)
определены при всех t > 0 и на каждом конечном отрезке [О, Т] кусочно
непрерывны, рассмотрим следующую задачу быстродействия: найти минимальное
время Т = Tt и управление и = u(t), 0^t^.Tt, удовлетворяющее
условиям (19), при которых уравнение (20) имеет решение. Для поиска решения
этой задачи можно воспользоваться методом моментов. По определению
оптимального времени Tt задача (18)-(20) разрешима при Т = Тф, а при
всех Т, 0 < Т < Tt эта задача не имеет решения. Согласно теореме 3 тогда
9. = 9ЛТ) = ,т1 \\± <••><( 21 т)\\в < } при всех Т, 0< Т< Т., и ft(T.)£ {.
(i,,e> =
; = i
В случае непрерывности функции gt(T) это означает, что время Т„ является
минимальным корнем уравнения &(Т) = у, и для поиска Т^ могут быть
использованы известные методы. К задачам быстродействия мы еще вернемся
в § 10.6.
Замечание 4. Мы рассмотрели метод моментов для задачи (18)-(20)
при специальном выборе «базисных» функций ф[(Т, t),..., </>n(T, i), 0^ t <
< Т, порожденных самой системой (18) и уравнением (21). Разумеется,
здесь можно использовать и другие базисные функции (/^(4),..., </>„(*)) • •.
(например, тригонометрическую систему). Однако в этом случае мы уже
не можем гарантировать, что получающаяся при этом I -проблема моментов
будет конечномерной.
Замечание 5. При переходе от задачи (18)-(20) к I-проблеме
моментов (22), (23) выбор пространств B=L[[0, Т], В* = LrJ0, Т] был
продиктован видом ограничений (19). Приведем примеры других ограничений
на управления, когда задачу управления (18), (20) также удается свести к
I -проблеме моментов (22) с ограничением вида
Н|в.<1 (24)
на других парах пространств В, В*.
Если в задаче (18), (20) ограничение на управление имеет вид
М*)1р = ( ЕК(*)М ^г почти всюду на [О, Т], 1 < р < оо,
то такая задача сводится к I-проблеме моментов (22), (24) в банаховом
пространстве В* с нормой ||u||B. =ess sup |гл(*)| , сопряженном к банахову
Т j j
пространству В с нормой ||</>||в = \ \<p{t)\qdt, где - + - = 1 [258].
§11. МЕТОД МОМЕНТОВ
613
Если в задаче (18), (20) ограничение на управление имеет вид
/г \Чр
fSM*)l«rf*J <1, 1<р<оо, 1<<*<оо,
то в (22), (24) в качестве В* надо принять банахово пространство с нормой
/т \1/р
\\и\\в = ( X lu(*)la^* ) i сопряженное к банахову пространству В с нормой
1М1в = П М*)1И* ) ' где р + д =1' в + Д = 1 (случай р = а =2, ? =оо
рассмотрен в п. 3 § 10).
5. Применим метод моментов к следующей задаче управления
колебаниями струны:
xtt = xss + r(t)u(t), (e,t)eQ=(0,l)x(0,T),
я!|.=о = Я!1.-1=0» O^t^T; я;|(,0 = 0, я,|( = 0=0, O^s^l,
где г = r(t) е L2[0,1] — заданная функция. Требуется найти управление
и = u(t) е L2[0, Т] такое, что
x\t = T = yo(a)i xt\t = T = yi(s), 0<s^Z, (26)
гДе Uo(s) S H0'[0, I], Vi(s)E L2[0, I] —заданные функции (см. пример 11.4).
Как было замечено в § 8, решение x = x(s, t; и) краевой задачи (25) пред-
ставимо в виде ряда (8.23):
a(e,*;u)=£-^efc(e)W(OsUi\A*(*-£K. (s,t)eQ, (27)
fc = l VAfc о
где efc(s) = л/j sin ^- — собственная функция оператора — —f, </>(0) =
= <£>(£) = 0, соответствующая собственному числу ЛА = I -^j- 1 . Как известно
(см., например, [557]), система функций {ek(s), 0< s < I, к = 1, 2,...}
образует ортонормированный базис в пространствах L2[0,1], i?0'[0,1], Я_1[0,1],
поэтому справедливы разложения
оо оо оо
M)(s)=E2/ofcefc(s)) 2/i(s)=E2/ifcefc(s)) r(s)=^2rkek(s), O^s^l, (28)
где
i i i
Шк = J M)efc(s)ds> »i* = Xffi e*(s)ds> rfc = Me)e*(e)rfe» fc = l,2,...
ooo
Производная функции (27) по переменной t имеет вид
оо t
^(e>*;«)=£ WeHu(0«>s\/A7(t-0#. (M)eQ. (29)
fc = l о
Отметим, что ряд (27) сходится в норме max ( $ t/s2(s, t)ds I , ряд (29) —
в норме max ( j t/2(s, t)ds J (подробнее см., например, в [557]).
614
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Подставим выражения (27)-(29) в равенства (26), умножим
получившиеся равенства на e3.(s), у = 1,2,..., скалярно в L2[0, I]. С учетом орто-
нормированности системы {efc} в L2[0,1] лолучим систему уравнений для
искомого управления u = u[t):
^= X «(о sin у/Гк{т -о^ = %*.
А О
гЛ«(Осо8Л/Х;(Т-0^=2/и) А: = 1,2,...
о
Отсюда, считая, что
rfc^0 Vfc = l,2,... (30)
имеем
Xn(Ocos^A;(T-0^ = ^ = afc,
о г*
(31)
$u(0 sin ^^-0^ = ^^ = ^, fc = l,2,...
0 fc
Система (31) представляет собой бесконечномерную проблему
моментов (15) относительно и = u(t) Е В* = L2[0, Т], в которой роль элементов
{у>к} играют функции {cos у/\~к(Т - £), sin V^(T - £), fc = 1, 2,...},
принадлежащие пространству В = £2[0, Т].
Предполагая, что наряду с (30) выполняются условия
Е К + Ч) = £ [(¾^)2 + (^)2А J < оо, (32)
покажем, что проблема моментов (31) и, следовательно, задача
управления (25), (26) разрешима при всех Т ^ 21.
Сначала рассмотрим случай Т = 21. В интегралах (31) сделаем замену
переменной Т — £ = т. Учитывая, что Т = 21, получим
21
\ и{21 - т) cos фГктйт = afc,
(33)
Ju(2I-T)sIn>/A77rfT = *jk, fc = l,2,...
о
Поскольку •! -^= cos \/\~кт, —7= sin \/\~кт\, где Afc = ( ^у- J , является ортонор-
мированной системой в £2[0, 21], то по теореме Рисса — Фишера [393] при
условии (32) функция
ч(21-т) = -^ЕКсо8>/АГт+Ь*81п>АГт), 0<t^2Z (34)
является решением проблемы моментов (33). Ряд (34) сходится в норме
L2[0, 21], и его сумма ut(2l — т) Е L2[0, 21]. Перейдем в (34) к переменной
t = 21 — т. Учитывая, что cos y/\^(2l — t) = cos(27rfc — ?j-t) = cos \f\~kt,
sin л/\~к(21 — t) = sin(27rfc — ^-i) = -sin \f\"kt, получим
4(*) = -7f E (¾ cos ^t-Ь* sin VAT*), 0<i^2Z, (35)
§11. МЕТОД МОМЕНТОВ
615
где коэффициенты ак, Ьк взяты из (31). Заметим, что
21
Su.(t)dt=0, (36)
так как функции {cos \/^fc*) s^n v^7*» fc = 1, 2,...} ортогональны в L2[0, 21)
к элементу e<,(s) = 1. Тем самым показано, что при Т =21 задача
управления (25), (26) имеет решение (35), обладающее свойством (36).
Рассмотрим случай Т > 21. Нетрудно проверить, что функция
V{t) = \ut(T-t), Т-21ЩТ, (37)
является решением проблемы (31) и задачи управления (25), (26) при
Т>21. Покажем, что при Т > 21 задача (25), (26) имеет другое, в
отличие от (37), 21-периодическое решение. А именно, пусть Т =21N + а,
0< а < 21, где N ^ 1 —целое число. Через vt(t) обозначим 22-периодиче-
скую функцию, которая на одном периоде [0, 21] определяется следующим
образом:
ЛГ + 1 - (38)
^4(t), a<t^2l,
где функция ut(t) взята из (35). Убедимся, что vt(t), 0< t < Т, — решение
проблемы моментов (31). Поскольку функции vt(t), cos л/\~к(Т — £)
являются 2Z-периодическими, то их произведение г>„(£) cos \f\~k(T — £) также
2Z-периодично. Поэтому, учитывая, что «*(£)— решение проблемы (33),
имеем
Г 2JV1
Х«ф(Осо8>/аГ(т-о^= X %(Осо8>/а:(г-о^ +
о о
2JVl+a
+ $ %(Осо8>/аГ(т-о^ =
2JV1
21
= N $ „,(£) cos ^(Т - 0# + X 4(0 cos VaT(T - Od£ =
о о
(JV +1) X ч(Осоз ЛА7(т - о^ + JV X «.(О cos у/Гк(т- о# =
О а
= Хч(Осо8л/а;(Г-0^=%, fc = l,2,...
г
Аналогично доказывается, что $v,(£)sin \f^l(T ~ О^ = Ък, к = 1, 2,.. .;
г , г о
$ vt(t)dt = I ut(t)dt =0. Таким образом, функция (38) является решением
о о
задачи управления (25), (26). Можно показать [802], что (38) — нормальное
решение этой задачи:
Применения метода моментов к различным задачам управления читатель
найдет, например, в [11; 122; 123; 166; 287; 400; 411; 415; 784; 802].
616
Гл. 8. МЕТОДЫ МИНИМИЗАЦИИ
Упражнения
1. Пользуясь методом моментов, решить задачи управления из упражнения 10.3, считая,
г
что управление удовлетворяет ограничениям 1) ]«(£)] < I; 2) 0<u(t) < I; 3) J u2(t)dt $: I и,
кроме того, 8:(0) = 3/(0) = 0,.8:(7)=:/,, j/(T) = /2.
2. Примените метод моментов к задачам управления из примеров 10.2-10.4, а также
упражнений 10.9-10.13.
ГЛАВА 9
Методы решения неустойчивых задач оптимизации
При численном решении прикладных задач важное значение имеет тот факт, будет ли
решение рассматриваемой задачи непрерывно зависеть от исходных данных или, иначе говоря,
будет ли искомое решение устойчивым по отношению к возмущениям входных данных.
Если решение устойчиво по входным данным, то можно быть уверенным в том, что достаточно
малые погрешности в задании входных данных приведут к малым погрешностям в
определении решения. Иное дело решать неустойчивую или, как еще говорят, некорректную задачу,
решение которой не является непрерывно зависящим от входных данных: в этом случае
приближенное решение задачи, соответствующее неточным входным данным, может как угодно
сильно отличаться от искомого точного решения при сколь угодно малых погрешностях
входных данных. Между тем неустойчивые задачи не такая уж большая редкость — они часто
встречаются в самых различных областях физики, техники, экономики и т. д. [695]. Возникает
важная проблема: как решать такие задачи?
Основы теории и методов решения неустойчивых задач заложены в работах А. Н. Тихонова,
В. К. Иванова, М. М. Лаврентьева и др. К настоящему времени создана достаточно полная
общая теория неустойчивых (некорректных) задач, разработаны приближенные методы решения
таких задач. Из обширной литературы, в которой отражены современная теория
неустойчивых задач, методы их решения, приложения, исторические аспекты, библиография, мы здесь
в состоянии упомянуть лишь ее малую часть [17; 22; 23; 28; 60; 62-64; 91; 113; 115; 127; 130;
131; 142; 145-147; 149-153; 155-165; 167-174; 176-182; 184; 185; 188-190; 192; 215; 223;
224; 229; 230; 235-238; 242; 268-271; 275; 334; 335; 360; 363; 365; 367; 389; 391; 394; 403;
405; 421; 432; 438; 439; 443; 445; 450-455; 461; 462; 467; 474; 490; 501; 506-510; 519; 522;
524; 526; 537; 556; 557; 579; 592; 593; 596; 597; 599; 600; 618; 619; 621; 622; 625-628; 651;
658; 659; 679; 680; 69Ь693; 695-697; 708; 714; 740; 741; 757; 758; 764; 771; 782; 783; 788;
799; 800; 805; 808; 812; 817],
В этой главе мы рассмотрим лишь некоторые из методов решения неустойчивых задач
минимизации.
§ 1. Постановка задачи. Устойчивые
и неустойчивые задачи минимизации
Будем рассматривать задачу
J(u)-Hnf, иеЦ (1)
U = {uE U0: #(и)<0, г = 1,...,т; д{(и) = 0, г = т + 1,..., s}, (2)
где U0 — заданное множество из некоторого метрического пространства М
с метрикой р(и, v), функции J(u), д{(и), 1,..., s, определены на U0 и
принимают на этом множестве конечные значения. В (2) не исключаются
возможности, когда отсутствуют либо ограничения типа неравенств (т =0),
либо типа равенств (s = т), либо оба вида таких ограничений (m = s = О,
U = U0). Пусть U ф<2>. Напоминаем (см. § § 1.1, 2.1), что задачу (1), (2)
можно истолковать либо как задачу первого типа, когда ищется величина
J„ = inf J {и) (или приближение к Jt) и при этом не предполагается, что
указанная нижняя грань непременно достигается в какой-либо точке, либо
как задачу второго типа, когда ищется не только Jt, но какая-либо точка
ut б U0, близкая ко множеству Ut = {и б U: J(u) = Jt}, подразумевая при
этом, что J„ > —оо, (7 ф 0.
618
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Будем считать, что множество U0 известно точно (например, U0 = M), а
вместо функций J(u), д{{и) известны их приближения J6(u), giS(u) такие,
что
\J6(u)-J(u)\^%(8,u), \ga(u)-gi(u)\4%(S,u)
VuEU0, г = 1,..., s,
где 5 = (5n 52,..., 8q) > 0 — параметры погрешности функции ФД5, и), г =
= 0,..., s, характеризующие уровень погрешности входных данных J {и),
д{(и), г = 1,..., s, определены и неотрицательны при всех 8 > 0, и е U0,
lim ФД5, и) = 0, г = 0,..., s, Vu е U0. Например, возможно, ФД5, u) = |5| =
=^(5,^) = ^ + ... + 5, илиФ;(5, и) = \8\(1+Щи)), ueU0, i=0,...,s, где
П(и) ^ О — известная функция. Зависимость функции Ф; от переменной и
отражает нередко возникающую на практике ситуацию, когда в разных
точках и EU0 измерения величин проводятся с разной точностью. При
необходимости можем считать, что 0< 5 < 50 = (501,..., 50д)<оо (т. е. 0< 8{ < 50j),
где 50г — верхняя оценка для разумно мыслимых значений погрешности 5;,
г = l,...,q.
Пользуясь приближениями Js(u), gi6(u) из (3), по аналогии с (1), (2) мы
можем составить задачу
J{(u)-Hnf, ueUt, (4)
Us = {ue U0: gis(u)^0, i = 1,..., m; g.6(u) = 0, г = m + 1,..., s}, (5)
называемую возмущенной задачей. Допустим, что множество Us непусто
и нам удалось определить величину Jj4, а в случае JSt > —оо еще и какую-
либо точку uSt е USt = {и е иб: Js(u) = JSt}. Возникает естественный
вопрос: можно ли при малых 5 использовать величину J6t и точку u6t 6 lLt
в качестве приближения для J„ и Ut соответственно, зная, что в силу (3)
погрешность задания входных Данных стремится к нулю при 5 —> 0, т. е.
можно ли ожидать, что lim JSt = J„ и lim p(uSt, Ut) = 0? Для ответа на этот
6 —* 0 6 —* о
вопрос рассмотрим простенький пример.
Пример 1. Задача:
J(u) = 0-Mnf, ueU = E1.
Очевидно, здесь .7, = 0, Ut = El. Пусть приближения Js(u) таковы, что
|.7,(и)- J(u)\^%(8,u) = 8, 5>0 УиеЕ1. (6)
Тогда возмущенная задача имеет вид:
J{(u)-Mnf, ueUs = U = El.
Нетрудно видеть, что \J6t(u)— Jt(u)\ = \JSt(u)\ ^5 V5>0. Это означает, что
при достаточно малом 5 > 0 величина JSt вполне может служить
приближением для Jt = 0 независимо от выбора Js(u) из (6). Посмотрим, можно ли
при условиях (6) использовать решение u6t возмущенной задачи в качестве
приближения ко множеству Ut. Для этого мы прежде всего должны быть
уверены, что множество USt непусто. Однако нетрудно видеть, что
выполнение такого требования можно гарантировать далеко не для всех реализаций
Js(u) из (6). Так, например, если JAu) = 5е~1"1, то USt = 0 V5>0. Заметим,
что эта функция непрерывна на Е\ А если реализации Js(u) из (6) будут
§ 1. ПОСТАНОВКА ЗАДАЧИ
619
разрывными, то ясно, что ситуация лишь ухудшится. Рассмотрим случай,
когда в рассматриваемой задаче погрешность зависит от и. А именно, пусть
\Js(u)-J(u)\^%(6,u) = 6(l + \u\), 5>0 VueE1. (7)
Условию (7) удовлетворяет функция Js(u) = — 5(1 + \и\). Очевидно, тогда
JSt = —оо V5 > 0, Полученное значение JSt трудно признать высбкоточным
приближением для Jt = 0, какими бы малыми ни были числа 5 >0. Нетрудно
указать реализации приближения Js(u) из условия (7), для которых J6t >
> —оо. Однако и в этом случае возможно, что JSt не будет близким к J„ =0.
Так, например, если Js(u) = — 8\и\е"5^, то условие (7) выполняется и J{t =
= Js(j) = -e~l V5 > 0, но lim JSt = e~l ^0= Jt. Конечно, из (7) можно
извлечь и такие реализации Js(u) (например, Js(u)=0 или любые J6(u)
из (6)), когда lim JSt = Jt. Однако выборка реализаций Js(u) носит, как
6 —* о
правило, случайный характер, и у нас нет оснований полагать, что попавшая
в наше распоряжение реализация Js(u) из (7) непременно будет хорошей.
Таким образом, при условиях (7) величина JH, полученная из возмущенной
задачи, вообще говоря, не может служить хорошим приближением для Jt.
Из анализа рассмотренного примера 1 уже можно сделать некоторые
выводы, касающиеся общей задачи (1), (2). Выяснилось, что конкретные
реализации приближений Js(u), giS(u) из (3), используемые для
формирования возмущенной задачи (4), (5), могут быть «хорошими» или «плохими»,
и в зависимости от этого задача (4), (5) будет «хорошей» или «плохой».
Решение «хорошей» возмущенной задачи может быть использовано для
получения приближенного решения задачи (1), (2), а «плохая» задача для
этих целей не годится. Однако у нас нет никаких критериев для оценки
качества приближения, кроме условий (3), и мы не в состоянии отличить
«хорошее» приближение от «плохого». Поэтому при попытке использовать
возмущенную задачу (4), (5) для построения приближенного решения
исходной задачи (1), (2) приходится иметь в виду всевозможные (включая
самые «худшие») реализации приближений входных данных.
Кроме того, заметим, что использование элементов множества U6t в
качестве приближений ко множеству Ut предполагает, что \]ь„ф(2>. Однако,
как видно из примера 1, множество USt может оказаться пустым даже в
простейших задачах минимизации с точно заданным множеством. Имея в
виду это обстоятельство, вместо множества U6t разумнее пользоваться
множеством
USs = {ие U6: Js(u) < JSt + s}, е> 0, (8)
так как, во-первых, это множество непусто по определению нижней грани
при всех реализациях Js(u), giS(u) из (3), лишь бы Us Ф 0, JSt > —оо, и,
во-вторых, если все же UH^0, то U6t С U5s Ve > 0. Для иллюстрации этих
соображений рассмотрим
Пример 2. Задача: J(u) = u2->lni, ие U = Е1. Здесь Jt = 0, Ut =
= {ut=0}. Пусть приближение Js(u) таково, что
\Js(u)-J(u)\^6(l+u2), 0<5<1, VuEE1.
Это означает, что и2 - 5(1 + и2) = J_(u) < Js(u) ^ J+(u) = и2 + 5(1 + и2)
Vu б Е1. Отсюда переходя к нижней грани по и б Е1, получим -5 ^ JSt =
= infJ{(u)< 5, так что \imJSt = Jt = 0. Кроме того, пользуясь графиками
620
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
функций J_(u), J+(u), нетрудно показать, что USe 6 — Д/Т^Т'' V 1 -6
при всех 0 < 5 < 1, е > 0, где множество C7fc определено согласно (8). От
сюда следует, что sup \и - ut\ ^ д/ . _ / —> 0 при (5, е) —> 0. Это означает,
что при достаточно малых 5, е любая точка ии 6 £7{е может быть
использована в качестве приближения к точке и. — 0. В то же время множество
U6= {и б El: Js(u) = Л*} вполне может оказаться пустым.
Заметим также, что если в рассматриваемом примере приближения Js(u)
удовлетворяет условию \Js(u)—J(u)\^. 5(1+Ы7), иеЕ1, 7>2, то в худшем
случае может реализоваться выборка /^(^) = ^-5(1 + 1^17). Тогда JSt = —oo
V5 > 0, и о близости J{. к J. = 0 говорить не приходится, а множество (8)
не имеет смысла.
Приведенные примеры показывают, что возмущенная задача (4), (5) в
каких-то случаях вполне может быть использована для получения
приближенного решения задачи (1), (2), в каких-то случаях — нет. Это зависит от
того, устойчива задача (1), (2) к возмущениям входных данных J {и), д{(и),
г = 1,..., s, или неустойчива. Перейдем к строгим определениям,
предполагая, что в (3) погрешности Ф;(5, и), г =0,..., s, фиксированы.
Определение 1. Задачу (1), (2) называют устойчивой по функции,
если при любом выборе J6(u), gi6(u), г = 1,..., s, из условий (3) в
возмущенной задаче (4), (5), множество Us^0, V5 > 0 и справедливо равенство
14-7,. = .7. (9)
«-.о
(возможно J. = —оо здесь не исключается). Если существуют Js(u), д(6(и),
г = 1,..., s, удовлетворяющие условиям (3), для которых либо Us=0 при
некоторых сколь угодно малых 5> 0, либо Us^0 при всех 5, 0 < 5 < 50, но
не выполняется равенство (9), то задача (1), (2) называется неустойчивой
по функции.
Определение 2. Пусть в задаче (1), (2) J.> -оо, £7.^0. Эту задачу
называют устойчивой по аргументу, если она устойчива по функции и
11m sup im" р(й,«) = 0, (10)
is-e)-,0»euu vsU.
где множество USe определено согласно (8). Задача (1), (2) называется
неустойчивой по аргументу, если она неустойчива по функции или не
соблюдается равенство (10).
Поясним геометрический смысл равенства (10). Величина inf p(u,v) =
«е £/,
= р(и, Ut) — расстояние от точки и до множества £7. — нам уже знакома.
Равенство означает, что для любого числа 7 > 0 найдутся такие числа 50 > О,
е0 > 0, что при всех 5, е, 0 < |5| < 50, 0 < е < е0 множество USs принадлежит
множеству {иеМ: р(и, £7.)<7}- называемому ^-раздутиеммножества Ut
(см. ниже упражнения 6, 7).
Если задача (1), (2) устойчива по функции, то, как следует из (9), при
любых реализациях J6(u), giS(u) из (3) величину JSt при достаточно
малых 5 > 0 можно взять в качестве приближенного решения этой задачи,
рассматриваемой как задача первого типа. Если задача (1), (2) устойчива
по аргументу, то, как следует из равенства (10), любая точка u& 6 USe при
достаточно малых 5, е будет близкой ко множеству Ut и может быть взята
в качестве приближенного решения задачи (1), (2) второго типа.
§ 1. ПОСТАНОВКА ЗАДАЧИ
621
На практике точно вычислить значение J6t удается лишь в редких
случаях. Обычно приходится довольствоваться тем, что с помощью того или
иного метода минимизации, примененного к задаче (4), (5), определяем
какую-либо точку и6 е Us, для которой
Л»^ЛККЛ» + М(<5), М(«5)>0,
где предполагается, что JSt > -оо, lim р,(8) = 0. Тогда, если задача (1), (2)
6 —* О
устойчива по функции [по аргументу], то при малых 8 > 0 величина J6(us)
близка к J, [точка %, е USs близка ко множеству Ut].
Проблеме устойчивости задач оптимизации посвящена обширная
литература, см., например, [45; 52; 70; 84; 87; 88; 179; 181; 233; 277; 363; 448;
501; 502; 720; 789; 791; 817]. Здесь мы приведем две теоремы, выделяющие
подклассы устойчивых задач (1), (2). А именно, рассмотрим задачу
J(u)-Mnf, иеЦ (11)
считая множество U известным точно (в (2) т = s — 0, U = U0), а
приближения Js(u) функции J(u) удовлетворяет условию
\Js(u)-J(u)\^8 УиеЦ 8>0. (12)
Теорема 1. Задача (11) при выполнении условий (12) устойчива
по функции.
Доказательство. По условию U6 = U V<5 > 0. Неравенство (12)
перепишем в виде
J(u)-8 ^J6(u)^J(u)+8 VuEU = Us, 8>0. (13)
Если Jt = -оо, то из (13) следует, что JSt = inf Js(u) = -оо, так что
равенство (9) соблюдается. Если Jt > -оо, то, переходя в неравенствах (13)
почленно к нижней грани при и е Us = U, получим; Jt — 8 ¢. J6t ¢. Jt + о
V<5 > 0. Отсюда при 5 —> 0 приходим к равенству (9) и в этом случае.
Теорема 2. Пусть U — компактное множество из М, функция
J(u) полунепрерывна снизу на U, приближения Js(u) удовлетворяют
условию (12), U6 = U V5 > 0. Тогда задача (1П устойчива по аргументу.
Доказательство. В силу теоремы 8.2.1 Jt > -co, Ut ф 0.
Устойчивость задачи (11) по функции установлена в теореме 1. Из Jt> — со и
равенства (9) следует, что JSt > —оо при всех достаточно малых 8 > 0. Тогда
множество USs^0 Ve > 0 по определению нижней грани. Возьмем
произвольную последовательность {(8к, ек)} —> 0, 8к > 0, ек > 0, к = Ц2, ... Для
краткости положим Us с =Uk.Uo определению верхней грани найдется
точка ик е Uk такая, что
supp(u,tf.)-i<pK,tf.), к = 1,2,... (14)
иеик
Включение ик е Uk согласно (8) означает, что ик е и&Л и для некоторой
реализации Js (и) из (12) выполняются неравенства J^4 = lnf J^(u)< JSk(uk)^
< Л . + £ц к = 1, 2,... Отсюда и из теоремы 1 следует, что lim Js (uk) = Jt.
°к* К k-too *
Тогда в силу (12) lim J(uk) = Jt. Это означает, что {ик} —
минимизирующая последовательность задачи (11). По теореме 8.2.1 тогда lim р(ик, Ut) =
к —* оо
= 0. Отсюда и из (14) имеем lim sup р(ик, Ut) = lim sup p(u, Ut) = 0. В
622
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
силу произвольности последовательности (6к,ек)—>0 отсюда
непосредственно вытекает равенство (10). Теорема 2 доказана.
Для иллюстрации вышеизложенного рассмотрим несколько примеров.
2
Пример 3. Задача: J(u) = —^—r —>inf, и е U = El. Здесь Jt = 0, Ut =
1 + и
= {ut=0\. Пусть приближения Js(u) удовлетворяют условию (12), Us=El
У 6 > 0. По теореме 1 эта задача устойчива по функции. Покажем, что она
неустойчива по аргументу. Возьмем реализацию Js(u) = J(u), и е.Е1. Тогда
Js* = Jt=0. Точка ие = —j= принадлежит множеству (8), так как Js(ue) =
е
= 2 ^ е = JSt + е. Однако sup р(и, Ut) ^ р(ие, Ut) = \ue\ —>оо при е—>0.
1 + £ U€U„
Равенство (10) не выполняется. Отметим, что в этой задаче множество U
некомпактно.
Пример 4. Рассмотрим задачу оптимального управления: J (и) =
1
= \ \x(t;u)\dt^inl, x(t) = u(t), 0^ t ^ 1, ж(0)=0, u = u(t) G U ={u(t) e
eL2[0, 1]: \u(t)\ ^ 1 почти всюду на [0, 1]}. Здесь Jt=0, Ut = {ut(t) = 0}.
Пусть приближение Js(u) удовлетворяет условию (12), US = U V<5 >0. В
силу теоремы 1 задача устойчива по функции. Рассмотрим возмущенную
задачу: Js(u) = J \S sin | - x(t; u)\dt —> inf, ueUs = U. Тогда JSt = 0, USt =
о 1
= {uSt = coSj, te[0, 1]}. Однако sup ||u-«J||2 > ||uet-uj|2 = j cos2 jdt =
= l(l + | sin I)-, > при 5^0. U€U"
Задача неустойчива по аргументу в метрике L2[0, 1].
1
Пример 5. Задача: J(u)= J «2(i)cZt->inf, u = u(t)eU = {ueC[0, 1]:
о
\u(t)\ ^1 Vie [0, 1]}. Очевидно, J, = 0, Ut = {ut = 0}. Пусть приближения
Js(u) удовлетворяют условию (12), Us = U. Задача устойчива по функции
в силу теоремы 1. В возмущенной задаче: Js(u) = J(u) —»inf, и е Us,
последовательность
„ч i - ■- -■■ °^*^¥
|<t<l, fc = l,2,...
является минимизирующей. Отсюда следует, что ик е USe при Ve > 0, если
номер А; достаточно велик. Однако lim sup \\и — «J|c^lim \\uk—ut\\c = l.
(<U)->0uei7& fc-»oo
Поэтому задача неустойчива по аргументу в метрике С[0, 1]. Нетрудно
проверить, что при тех же условиях эта задача будет устойчива по аргументу
в метрике L2[0, 1].
Заметим, что в теоремах 1, 2 и примерах 1-5 предполагалось, что
множество (2) известно точно. Если же множество также задается с
погрешностями, то задача (1), (2) может оказаться неустойчивой (по функции или по
аргументу) даже при дополнительном требовании компактности множества.
Более того, множество (5) может оказаться пустым при всех сколь угодно
малых 6, и возмущенная задача (4), (5) не будет иметь смысла. Покажем
это на примерах.
§ 1. ПОСТАНОВКА ЗАДАЧИ
623
Пример 6. Задача: J(u) = и —> inf, и е U = {и е U0 = Ех: д1(и) =
= т^т ^0}- Здесь U = {0}. J, = 0, Ut = {0}. Пусть функции Js(u), gls(u)
удовлетворяют условиям (3) с функциями Ф0(<5, и) ^Ф,(6, и) = 8. В
частности, если Js(u) = u, g\S(u) = дЛи) — 8, то ибф<2), JSt = —oo У 8 > 0. Если
же дц(и) = 9\(и) + 8, то £/> = {«££': д,^(«) ^О} = 0 У8 >0, и
возмущенная задача теряет смысл. Задача неустойчива по функции и тем более по
аргументу.
Пример 7. Задача: J(u) = и —> inf, « е С/ = {и е С/0 = .Е1: д^и) —
= \и- 1| + |« + 11-2 = 0}. Здесь £/ = [-1,+1], J, = -l, £/, = {«, = -1}.
Пусть условия (3) выполняются с функциями Ф0(5, «) = Ф[(5, «) = 25(1 +
+ \и\). В возмущенной задаче: Js(u) = и —» inf, и£ !7{={иеВ': 9ц(и)=
= |(1 + 5)« — 1| + |(1 — 8)и + 1| — 2=0} множество С/в при всех 8, 0 < 8 <
< 1, состоит из двух точек и = 0 и « = 1, так что J^ =0, USt = {%* =0}.
Равенство (9) нарушается, задача неустойчива даже по функции. Заметим,
что если gls(u) = \u — l\ + \u + l\ — 2 + 8, то множество Us = {u еЕи. gls(u) =
= 0} = 0 У8 > 0, возмущенная задача не имеет смысла.
Пример 8. Рассмотрим задачу линейного программирования: J (и) =
= -a;-y->inf, ueU = {u=(x,y)eU0; £[,(«) = ж-у ^0, д2(и) = -х + у ^0},
где U0 = {и = (х, у) G Е2: 0 ^ аз < 1, 0^у^2} — компактное множество.
Здесь Jt = -2, Ut = (¾ = (1; 1)}. Пусть условия (3) выполняются с
функциями ФД6, и) = 5(1 + \и\), г =0, 1,2. Возмущенная задача может иметь вид:
Ми) = -аз - у -> inf, и е Us = {и е U0: gls(u) = (l + 8)x-y^0, g2s(u) =
= (-1 + 8)х + у^0}, где 0<*<1. Тогда Us ={« = (0,0)}, JSt=0, USt = Us.
Равенство (9) не выполняется. Задача неустойчива по функции. Более
того, если gls(u) = д{(и) + 8, g2S(u) = д2(и) + 8 или д{в(и) = (1 + 8)х - у + 8,
g2S(u) = -(\-8)x-\-y+8, то множество Us={ueU0: gls(u) ^0, g2S(u) ^0}
пусто при всех 8, 0 < 8 < 1, и возмущенная задача не имеет смысла.
Пример 9. Рассмотрим задачу квадратичного программирования:
J(u) = аз2 + у2 + z2 -> inf, и е U = {и = (аз, у, z) е Е3:
gl(u) = l -x-y-z^O, g2(u) = y + z- 1 ^0, д3(х) = х < 0}.
Если u = (x,y,z)eU, то y+z> l—x = l+\x\^l^y+z, что возможно только
при х = 0, у + z = 1. Это значит, что U С С/, = {и = (аз, у, z) е Е3: у + z =
= 1, х = 0}. Очевидно, Ux С С/. Следовательно, V = UX. Нетрудно проверить,
что решением рассматриваемой задачи является точка ut = (аз„ = 0, yt = ^,
zt = ■=), причем J(ut) = Jt = £. Так как множество U выпукло, а функция
J(u) сильно выпукла на U, то задача других решений не имеет. Пусть
возмущенная задача имеет вид: Js(u) = J(u) = х2 + у2 + z2 —> inf, и е Us =
= {иеЕ3; gls(u) = g,(u) = l-x-y-z^O, #>«(«) = У +0 + 8)z - I ^0,
g3S(u) — д3(и) = х^0], 8 >0. Покажем, что C/s = Ця={« G-Б3: 1-х-у-
-z^O, y + (l + S)z-l^0, х^О, у ^1, z^O} V8 >0. Очевидно, USICUS.
Обратно, если и = (х, у, z)e.Us, то y+z^ l-x = l + \x\^ 1 > y+(l + 8\z, что
возможно только при 0^ 8z или O^z. А тогда у> 1 —a;-z = l + |a;| + |2:|^l.
Следовательно, С/4 С [Л,, так что J74 = Usl У8 > 0. Нетрудно проверить, что
решением возмущенной задачи является точка uSt = (xSt=0, ySt = l, zSt=0).
В самом деле, J'(««.) = (°> 2- °) H(J'(^J. «-««.) = 2(у~ 1) > О V« е Usl = Us
(теорема 4.2.3). Кроме того, JSt = J(uSt) = 1. Таким образом, | JH - Jt\ = g,
p(uSt, ut) = -y= У8 >0. Задача неустойчива ни по функции, ни по аргументу.
624
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Приведенные примеры показывают, что неустойчивые задачи нередки в
линейном, выпуклом и невыпуклом программировании, в области
оптимального управления, в теории приближения. Если задача неустойчива по
функции [или по аргументу], то при решении задачи первого [второго] типа
пользоваться возмущенной задачей (4), (5) нужно с большой осторожностью,
помня, что здесь многое зависит от того, какие реализации входных
данных Js(u), giS(u) из (3) имеются в нашем распоряжении, и что в общем
случае на этом пути получение хороших приближений решения исходной
задачи (1), (2) не гарантировано.
Возникает естественный вопрос: можно ли разумно распорядиться
имеющимися у нас входными данными Js(u), giS(u) из (3) и с их помощью
сконструировать новую вспомогательную экстремальную задачу, решив
которую мы могли бы при достаточно малых погрешностях получить решение
исходной задачи с высокой точностью? Ответ на этот важный для практики
вопрос дается в следующих параграфах, в которых излагаются различные
устойчивые методы решения неустойчивых задач минимизации,
разработанные в рамках общей теории и методов неустойчивых (некорректных) задач
[184; 439; 695; 697 и др.].
Упражнения
1. Доказать, что задача: J(u) = — и—»inf, ие U = {иеЕ\_ = U0 : д1(и) = —и^.О, </2(u) = u —
— 1 < 0} устойчива по функции и по аргументу, если погрешности задания входных данных
J (и), ду(и), д2(и) удовлетворяют условиям (3) с функциями Фг(5, и) = 5(1 + |u|), г =0, 1,2.
2. Исследовать на устойчивость задачу: J(u\ = (x- 1)2 + (0-1/-1 )2—>inf, и = (х, г/)е U = E2,
считая, что погрешность задания функции J (и) удовлетворяет условию: | Js(u) — J(u)\ < 5(1 +
+ |u|2). Указание: рассмотреть приближение Js(u) = (х — 1)2 + (ёу- I)2.
3. Доказать, что задача: J (и) = х — у —»inf, и е U = {и = (х, у) ^ 0: </[(и) = х + у — 1 <
< 0, д2(и) = — х — у + 1 ^ 0} неустойчива по функции, если погрешности задания входных
данных J(u), д{{и), д2(и) удовлетворяют условиям (3) при ФД5, и) = 5(1 + \х\ + \у\), и е В2.
Указание: рассмотреть возмущенную задачу (4), (5) при Js(u) = x — y, gls(u) = (l + S)x+
+ (1 + 5)2/-1 + 5, g2s(u) = (-1 + 5)а; + (-1 + S)y + 1 - 5, 0 < 5 < 1.
4. Исследовать на устойчивость задачу: J(u) = u—»inf, ue U = {u£El: ^(14) = |u— l| + |u+
+ 11 - 2 < 0}, считая, что входные данные удовлетворяют условиям (3) с ФД5, и) = 25(1 + \и\),
г =0,1. Указание: рассмотреть реализации Js(и), gls(и) из примера 7.
5. Исследовать на устойчивость по функции и по аргументу задачу: J(u)'■= ж2 + j/2 —> inf,
и = (ж1 у) £ Е2, когда погрешность | Js(u) — J(u)\ < Ф(5, и) = 5(1 + |и|7), 7^0- Рассмотреть
случаи 7 = 0,1,2, 3.
6. Пусть А, В —два множества из некоторого метрического пространства М. Уклонением
множества А от множества В называется величина (3{А,В)— sup inf p(a,b). Приведите
пример двух множеств А, В таких, что fl(A, В) ф /3{В, А). Указание: рассмотрите
случай, когда В С А, В ф А (см. равенство (10)).
7. Пусть А, В —два множества из метрического пространства М. Величина h(A,B) =
= max{/3(A, В); @(В, А)} (см. упражнение 6) называется хаусдорфовым расстоянием между
множествами А и В. Докажите, что на множестве всех ограниченных замкнутых множеств
из М величина h(A, В) удовлетворяет всем аксиомам метрического пространства [192; 350;
393; 428]. Выясните геометрический смысл величины h(A,B) (см. § 10.5).
§ 2. МЕТОДЫ РЕГУЛЯРИЗАЦИИ
625
§ 2. Методы регуляризации для решения
неустойчивых задач первого типа
Рассмотрим задачу
J(«)->lnf, иеЦ (1)
ueU={ueU0: &(u)<0, г=1,..., m; gt(u)=0, i=m+l, ..., s}, (2)
как задачу первого типа, когда ищется величина Jt = inf J(u). Будем
предполагать, что множество (2) непусто, причем множество U0 известно
точно, а вместо функций J(u), gt(u) известны их приближения,
удовлетворяющие условиям (1.3^. Выше было показано, что задача (1), (2) может
оказаться неустойчивой по функции (определение 1.1), и тогда величина
JSt = inf Js(u), полученная как решение возмущенной задачи (1.4), (1.5)
первого типа, вообще говоря, не может служить хорошим приближением
для величины Jt, какими бы малыми ни были погрешности задания
входных данных. Для надежного получения решения неустойчивой по функции
задачи (1), (2) первого типа нужно иметь специальные методы, называемые
методами регуляризации. Такие методы для решения задач первого типа
разрабатывались, например, в [445; 501; 507; 697; 817]. Изложим некоторые
из них.
1. Сначала рассмотрим задачу:
J (и) -> inf, и е Ц (3)
предполагая, что множество U известно точно, а приближения Js(u)
функции J(u) удовлетворяют условию
\Js(u)- J(u)\^$(6, и) VueU; 6>0, (4)
где функция Ф(<5, и) ^0 Уи е U, S >0, lim Ф(<5, и) = 0 \fueU. Следуя [445;
8 —* 0
697; 817], рассмотрим вспомогательную задачу:
Xs(u) = Js(u) + 4S,u)^ini, иеЦ (5)
где Js(u) — произвольная функция, удовлетворяющая условию (4).
Предположим, что каким-либо методом нам удалось найти величину Xs*(u) =
= inf *«(«)■
ueU
Теорема 1. Пусть множество U в задаче (3) известно точно,
пусть выполнено условие (4). Тогда при любом выборе Js(u) из (4)
справедливо равенство
\imXst = J*- (6)
Доказательство. Из (4), (5) имеем: хЛи) ^ J(u) ^и е U.
Следовательно, Xs* ^ J* ^ -°°- ТогАа J* < Х«* < хЛи) = Js(u) +ЩЬ и) < J(u) +
+ 2Ф(& и) Уи eU, У6 > 0. При 6 -»0 отсюда получаем: Jt ^ Jim Х«* <
«-.о
^ ~ШпХб* ^ J(u) + nm 2Ф(Й, и) = J (и) У и е U. Перейдем в этих неравенст-
8 —* 0 S—i0
вах к нижней грани по и е U. Будем иметь: -оо ^ Jt ^ Hm Х«* ^ 1}тХ«* ^ J,-
«-.о *-*0
Следовательно, limxs* = lim%«* = J*< чт0 равносильно (6). Теорема 1
доказана. □ *-° *"°
626
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Равенство (6) означает, что величина %«», полученная как решение
задачи (5) при достаточно малых 8 > О, будет близка к Js даже в том случае,
когда исходная задача (3) была неустойчива по функции. Однако точное
значение %«* можно найти лишь в редких случаях, и на практике мы можем
иметь лишь какое-то приближение к %«»• В свою очередь такое
приближение можно получить, решая задачу (3), лишь тогда, когда задача (5) сама
устойчива по функции. Будет ли она таковой? Оказывается, что при
малых погрешностях, допускаемых при вычислении значений функции Xs(u)>
задача (5) будет устойчивой по функции. А именно, пусть вместо точного
значения Xs(u) мы можем вычислить его приближение ХяД"") такое, что
1х*(«) - х»1 < м Vnea (7)
Тогда, как следует из теоремы 1.1, задача (5) устойчива по функции, т. е.
lim„ Х«„* = Х«», где X«„* = inf хвЛи)- Более того> поскольку в (7) величина \i
/1—* о и ^
не зависит от 8, нетрудно установить более сильное утверждение:
lim Xsu* = J*- (8)
Докажем его. Переходя к нижней грани по и е U, из (7) имеем: |х«,,* — Х«*| ^
^ fj,. Тогда
\Xsp* ~ J*\ < \Xsp* ~Xs*\ + \Xs* ~ J*\ < M + \Xs* ~ J*\-
Отсюда и из (6) следует равенство (8).
Допустим, что нам удалось найти величину xs , для которой
|x«M-X«j..|<e(/i), Hme(/i) = 0. (9)
^ /1 —.о
Из (8), (9) непосредственно следует, что при достаточно малых (8, /i)
величину xSfl можно взять в качестве приближения для искомой величины
Jt. Для поиска Xsy. может быть использована устойчивая по функции при
условиях (7) задача (5).
2. Рассмотрим задачу (1), (2), когда множество U известно неточно и
погрешность задания входных данных J (и), д{(и), г = 1,..., s, удовлетворяет
условиям (1.3):
\Js(u)-J(u)\^%(8,u) VueU0 (10)
l0«(«)-ft(«)l<*<(4«) v«etf0> * = l,...,e>;. (11)
где функции ФД<5, u)>0 V<5>0, VueU0, lim ФД5, u)=0 Vue U0, i=0,...,s.
S —> 0
Для учета ограничений типа равенств и неравенств из (2) воспользуемся
штрафными функциями (см. § 5.15). Ограничимся рассмотрением
простейшей штрафной функции:
P(u)=t(9t(u)Y, «etf0> Р>0, (12)
1 = 1
где gf(u) = тах{0; д{(и)} при г' = 1,...,т, д+(и) = \д^и)\ при г = т + 1,...
..., s. При выполнении условий (11) в качестве приближения для функции
Р(и) можно взять функцию
^(«) = Е(й(«))р. «etf0> р>0. (13)
§ 2. МЕТОДЫ РЕГУЛЯРИЗАЦИИ
627
Оценим разность \Ps(u) — Р(и)\. Заметим, что из неравенства (5.14.15):
\а+ — Ь+\ ^ \а— Ь\ следует
ЫМ - 9Н«)\ < \9Ли)- 9i(u)\ <Ф,($ и)
VueU0, 8>0, i = 1,..., s.
Поскольку
\av -bv\^\a-b\v Va^O, b^O, 0 < i/ ^ 1, (15)
то с учетом (12)-(14) имеем
|Р,(«)-.Р(и)|<ЕФ,($и) V«GC/0) 8>0, 0<р<1. (16)
1=1
В случае р > 1 воспользуемся формулой конечных приращений Лагранжа
для функции <р(х) = хр, x£El. Получим \ар — Ьр\=р\Ь + в(а—Ь)\р~1\а—Ь\ ^
^.p(\b\ + \a-b\)p-l)\a-b\. Va^O, b^O. Отсюда и из (11)-(13) вытекает:
\Ps(u) - Р(и)\ ^ ± р(д+(и) + Щ6, и))р- %(8, и)
<=i (1/)
Уие170, 8>0, р>\.
Из (16), (17) следует, что для штрафных функций (12), (13) при
условиях (11) справедлива оценка
\Рв(и)-Р(и)\^Щ8,и) Уиеи0, 8>0, (18)
где
' ЕФ,($«) ПРИ 0<р<1,
':' (19)
Ер№) + Ф|(^«))'"1*^«) при р>1-
1 = 1
Ф(<5, «)=<
Заметим, что в дальнейшем мы не будем пользоваться явным видом (13),
(19) функций Ps(u), Ф(<5, и), нам будет достаточно того, что некоторая
функция Ps(u) удовлетворяет неравенству (18), где Ф(<5, и)^0 Уи е U0, 8 > О,
lim Ф(<5, и) = 0 Уи е С/0. Введем функцию
Хв(«) = 7в(«) + А(*)Рв(«) + Ф0(^«) + А(*)Ф(^«)> «еС/0) 5>0,(20)
где Js(u), Ps(u) какие-либо функции, удовлетворяющие условиям (10), (18),
А(8)>6 — штрафной коэффициент. Рассмотрим задачу
Xj(«)-»Inf, ueU0. (21)
Приведем достаточные условия, гарантирующие равенство
Jim Xs* = J; Xs* = inl Xs(u). (22)
Мы здесь не будем стремиться к формулировкам возможно общих условий,
при которых справедливо равенство (22), а ограничимся рассмотрением уже
628
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
знакомого нам класса задач (1), (2) с сильно согласованной постановкой
(см. определение 5.15.3). А именно, пусть существуют постоянные с, ^0,...
..., с3 ^ 0, v > О, такие, что
4<Л«) + Ес,(0,+(«)Г, иеи0. (23)
Условия, обеспечивающие выполнение неравенства (23), приведены в
леммах 5.15.1, 5.15.5 (см. также пример 5.15.8), которые сохраняют силу и в
метрических пространствах.
Теорема 2. Пусть выполнены условия (10), (18), (23), параметры
р, v из (12), (23) таковы, что р ^ и. Пусть А(6) > 0, lim А(6) — +оо,
8 —* 0
lim А(8)^(8, и) = 0 Уи е U0. Тогда справедливо равенство (22).
S —* о
Доказательство. Из условия (23) вытекает неравенство
Jt^J(u) + A(8)P(u) + BA-^ V«€C/0, <5>0, р ^ ц (24)
где при р = v по определению полагается .A-irnr=0, 2? =0 и считается, что
А(5) ^ |с| = max |cj, а при р > i> здесь В = {р - v)v'^vp~'^r:;\c\jr'", |с| =
1 < г ^з
= (]Е 1с»г ") • Для доказательства (24) при р > v надо воспользоваться
рассуждениями, использованными при переходе от неравенства (5.15.25)
к (5.15.26), с заменой Ак на А(6), функции Фк(и) = J(u) + АкР(и) на
фе(и) — J(u) + A(8)P(u). При р = v из (12) и (23) непосредственно имеем
Jt ^ J (и) + max |с.|Р(«) ^ J(«) + A(£)P(u) Vu е J70. Из (24) с учетом
неравенств (10), (18) и определения (20) функции хЛи) следует
J, ^ J» + A(S)Ps(u) + %(8, и) + А(8)Щ8, и) + В(А(8)Г^ =
= Xs(u) + B(A(6))-^ Уиеи0.
Тогда Jt ^ Xs* + В(А(8))~^гг. Отсюда, снова обращаясь к (10), (18), (20),
получаем
J, - В(А(8)Г& ^ Xst ^ X» < Пи) + А(6)Р(и) + 2%(8, «)+,'
+2А(8)Щ6,и) Уиеи0, 8>0.
Эти неравенства справедливы и для точек uEU. Так как Р(и) = 0 пщиЕ U,
то из (25) имеем: J, - В(А(8))~& ^ xSt =¾ J(u) + 2%(8, и) + 2А(8Щ8, и)
V«G U, У 8 >0. Отсюда и из свойств функций Ф0(<5, и), Ф(<5, и) при 8 —»0
следует: J„ ^jiin х«* ^ lim х** ^ J(u) ^и £ ^- Перейдем в этих неравенствах
я_,о *->о
к нижней грани по и е U. Получим lim Хя* — limxs* = J*< чт0 равносиль-
но (22). Теорема 2 доказана. Случай Jt = —оо в (22) не исключается. □ .
Отметим, что если погрешности при вычислении значений функции (20)
таковы, что \Xsii(u) ~ Xs\u)\ ^ V- V« G С/0 (ср. с (7)), то из теоремы 1.1 и
равенств (22) вытекает, что задача (21) устойчива по функции и вполне
может быть использована для получения приближенного значения искомой
величины J.
§ 2. МЕТОДЫ РЕГУЛЯРИЗАЦИИ
629
3. Рассмотрим метод регуляризации для решения неустойчивых
задач (1),(2) первого типа, не использующий штрафные функции и
основанный на идее расширения множества. Предположим, что погрешности
задания входных данных удовлетворяют условиям (10),(11). Введем множество
W(8, 0) = {иеи0:ди(и)<,%(8,и) + 6, г = 1,...,т,
lft«(«)l < ЗД «) + 0, * = m + 1, .. ., я} =
= {ueU0:g£(u)^%(6,u) + 6,i = l,...,8},8>0,6Z0. (26)
Убедимся, что W(8,6)^0 V<5 > О, в > 0. Возьмем произвольную точку
ueU. Тогда ft+(«) = 0 и из (14) имеем gfs(u) ^ g+(u)+4t,(8, и) ^ Щ8, и) + в,
г'=1,..., s. Отсюда следует, что UcW(S, в) У 8 >0, в >0, т. е. W(8, в) —
расширение множества U. Далее, предполагая, что задача (1), (2) имеет
сильно согласованную постановку и нам известны величины с,., v из (23)
(или их оценки сверху), введем функцию
х» = ^(«) + Ф0(^«)+Е^(2Ф^«)Г, иеи0, (27)
1 = 1
и рассмотрим задачу
Xe(«)-»lnf, ueW(8,e). (28)
Теорема 3. Пусть выполнены условия (10), (11), (23), пусть 0 <
< г/ ^ 1. Тогда
lim v,.(0) = 4> llmvet(0)=J„ (29)
(й, S)-»U й —> U
гдеХ,Лв)= $ Ми) \/8>0, 6^0.
До казательство. Из (14), (26) следует
&+(«)<*Й(«)+ФЛ$«)<2Ф,($и) + 61 VueW(M), * = 1,..., я..'
Отсюда с учетом условий (10), (23), определения (27) функции %«("") и
неравенства (15) имеем
4 < ^(«) + Е сД2Ф.(5, «) + в)" ^ Js(u) + %(8, и) +
1 = 1
+ Е с{(Щ(6, и)У + Е сг|(2ФД5, и) + ву - (2Ф,($ «))"J ^
i = i
<х,(«) + Н0" Vuef(M),
где \с\{ = с{ + ... + с . Переходя в этих неравенствах к нижней грани по
ueW(8, в), получим J, ^ ха*(в) + Iе li0" V<5 >0, 0^0. Тогда
J. ^ Xs.(9) + 1СН" < Х«(«) + Mi*" <
^ 7(«) + 2Ф0(5,«)+ЕсДФг(5,«)Г + |сН1' VUeW(M). (30)
i = l
В частности, эти неравенства справедливы для всех и е U С W(<5, 0). При
(б, в) —»0 с учетом свойств функций Фг(<5, «), г — 0,..., s, из (30) имеем
J. ^ Jim_x^(0) ^, Ир *,.(*) ^ J {и) Уиеи.
630 Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
В силу произвола в выборе и g U это возможно лишь тогда, когда
Нгп ХяЛв)= lim Xs*(Q) = J*> что равносильно первому равенству (29).
(б, в)—»о (М)-*о
Опираясь на неравенства (30) при 0=0, аналогичными рассуждениями
приходим ко второму равенству (29). Теорема 3 доказана. □
Выясним, будет ли сама задача (26)-(28) устойчивой по функции. Сразу
заметим, что при в = 0 эта задача может оказаться неустойчивой. В
самом деле, например, может случиться, что giS(u) — gt{u) + ФД6, и), 6 >0,
г = 1, ..., m, m = s. Тогда W(6,0)= U и, как мы видели в примерах 1.7, 1.8,
множество W(S,0) может оказаться пустым при малейших возмущениях
входных данных giS(u), и задача (26)-(28) потеряет смысл. Рассмотрим
случай в >0. Предположим, что вместо точных значений JAu), д^(и), Фг(<5, и)
мы можем вычислить лишь их приближения JSfl(u), gfSil{u), ФгД<5, и), для
которых
1ЛМ(")-^("JKMi |0&.(«)-0«(«)I<Mi * = 1,..., в,
(ol)
|Ф<„($и)-Ф,($и)|</4, *=0, ...,в, V«eC/0, 5>0, 0>О, м>0.
Тогда вместо функции %«("") из (27) будем иметь
X*» = Л» + *o„(S «) + Е ^(2Фг„(5, «))", « G U0. (32)
Отсюда с учетом (31) и неравенства (15) получаем
|хвм(«)-Хв(«)|<2м+ЕсЖ2Ф<,(^«))-(2Ф,(*,«)Г1<2м+|с|1(2м)" Уг*еС/0
ИЛИ
X«(«)-2m-|c|i(2m)"<X«m(«)<X«(«) + 2m + |c|i(2m)" V« g U0. (33)
Далее, в определении (26) множества W(6, в) положим в = 2ц и заменим
д^(«), ФД6, «) функциями giS)l(u), Ф^(б, «), взятыми из (31). Тогда получим
множество
W^S, 2^) = {и е и0:д+,(и)^¥(8, и)+ 2^, i = 1,.., а]. (34)
Покажем, что
W(6,0)CWfl(6,2^)CW(S,e) Уб^Зц. (35)
В самом деле, если ие W(6,0), то ^(«)<ФД6,«) и с учетом (31) имеем
&У") < 0«(«) + М ^ ФДй, «) + м ^ Ф{Д 5, «) + 2/1 V« G W(6,0),
г = 1,.., s.
Это означает, что W(6,0) С W^S, 2ц). Аналогично, если и G W^(5, 2/Д то
ft«(«) < ftV(u) + м <*«.($ «) + 2м <ф,(«, «) + Зм <ф,($ «) + е,
г = 1,..,8,
так что Wfl(S, 2ц) С W(<5,6») V0 ^ 3/а. Включения (35) установлены. Из них
следует, что
хМ= Л{.,Xs(uH.JJL x'(tt>< u,Ko) х«<«>=х..<°> v6^ (36)
§ 2. МЕТОДЫ РЕГУЛЯРИЗАЦИИ
631
В неравенствах (33) почленно перейдем к нижней грани по и е W (6, 2/i).
С учетом (36) получим
ХвЛ0)-2м-|с|,(2М)Ч Inf У«м(«)=Х^<Х«,(0)+2м+|с|1(2мГ, V^3M.
uelv (42/») г г
Отсюда и из (29) следует, что
lim Хяп* = J*-
Это означает, что при условиях (31), в ^ З/i. > 0, задача (26)-(28)
устойчива по функции, и она может быть использована для вычисления величины
XSllt, которая согласно теореме 3 при достаточно малых (8,6) является
приближенным решением задачи (1), (2) первого типа.
Отметим, что для задач линейного программирования в [179] предложен и
исследован метод регуляризации, основанный на идее расширения
множества и приводящий к устойчивой вспомогательной задаче вида (26)-(28),
также являющейся задачей линейного программирования (см. ниже § 7, п. 4).
Другой вариант метода регуляризации задач минимизации первого типа,
основанный на сочетании идей расширения множества и метода покрытий,
можно извлечь из работы [592], в которой рассмотрены более сложные по
сравнению с (1), (2) многокритериальные задачи и устойчивые методы их
решения.
4. В заключение параграфа сделаем несколько замечаний.
Замечание 1. В теории и методах неустойчивых (некорректных)
задач фундаментальную роль играет понятие регуляризирующего
оператора (регуляризирующего алгоритма) [63; 695]. Сформулируем это понятие
применительно к задаче (1), (2) первого типа.
Определение 1. Оператор Rs, который каждому набору
приближенных данных (Js(u), Фр(<5,и), giS(u), ФД<5,и), i = l,..., s),
удовлетворяющих условиям (10), (11), ставит в соответствие число х«.
называется регуляризирующим оператором задачи (1),(2) первого типа, если
Umx, = J,.
Изложенные выше три метода регуляризации (метод (5), методы (20),
(21) и (26)-(28)) определяют оператор, который при выполнении условий
теорем 1-3 является регуляризирующим.
Замечание 2. Перечисленные методы регуляризации отличаются
друг от друга тем, что для своей реализации требуют различную
априорную информацию. В методе (5) мы должны заранее знать, что множество U
непусто и известно точно и, кроме того, должны иметь приближения Js(u)
для целевой функции, удовлетворяющие условию (4) с известной функцией
Ф(<5, и). Для реализации метода (20), (21) нужно иметь приближения Js(u),
Ps(u) и функции погрешности Ф0(<5, и) Ф(<5, и) из (10), (18), множество U0,
а также знать информацию о том, что задача (1), (2) имеет сильно
согласованную постановку и оценку сверху показателя v из (23) для правильного
выбора параметра р в штрафной функции (12); в методе (26)-(28) нужно
еще дополнительно иметь оценки сверху для величин ct из (23).
Подчеркнем, что все методы решения неустойчивых задач так или иначе
предполагают наличие какой-либо априорной информации о
рассматриваемой задаче, о ее входных данных и их погрешностях и т. д. Различные
аспекты проблемы использования априорной информации в методах
решения неустойчивых задач обсуждаются, например, в [184; 450; 509; 557; 693;
695; 697; 757; 817].
632
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Замечание 3. В описанных методах регуляризации мы не касались
конкретных методов определения величин %«» в задачах (5), (21) и (26)-
(28). Для вычисления Xs* могут быть использованы любые подходящие
методы минимизации (например, методы из гл. 5) в зависимости от свойств
функции Xs(u)' структуры множеств U, U0, W(S, в). К сожалению, здесь
нет общих рецептов, и тонкую работу по согласованию параметров
используемого метода минимизации с параметрами изложенных выше методов
регуляризации каждый раз приходится проводить отдельно с учетом
конкретных особенностей решаемой задачи. Требуют дальнейшего исследования
также проблемы, связанные с задачами (1), (2) первого типа, когда
входными данными являются не значения функций J (и), д{(и), а какие-то другие
элементы этих задач, например, производные упомянутых функций.
Упражнения
1. К задачам из примеров 1.1-1.9 применить изложенные выше методы регуляризации.
Проверить, имеют ли эти задачи сильно согласованную постановку в смысле неравенства (23).
2. Применимы ли изложенные методы регуляризации к задачам из упражнений 1.1-1.4?
§ 3. Стабилизатор. Леммы о регуляризации
1. Задачу
J(u)->inf, и<=Ц (1)
U = {ue U0: д{(и)^0, i = l,...,m;-g{(u) = 0, i = m + l,...,s} (2)
далее будем рассматривать, как задачу второго типа, считая, что U0 — за^-
данное множество из некоторого метрического пространства М с метрикой
р(и, v), функции J(u), д{(и), i — l,...,s, определены на U0 и принимают
на этом множестве конечные значения. Напоминаем, что в задачах второго
типа наряду с величиной, близкой к Jt= inf J (и), ищется точка и G U0,
близкая в метрике М ко множеству Ut = {и е U: J(u) = Jj. Здесь и далее
предполагается, что
J,>-oo, Ut^0. (3)
В § 1 было показано, что задача (1), (2) может оказаться неустойчивой
по аргументу при возмущениях входных данных J(u), д{(и), г = 1,..., s,
и попытка использовать решение (см. множество (1.8)) возмущенной
задачи (1.4), (1.5) в качестве приближенного решения задачи (1), (2) второго
типа не всегда оправдана. Для гарантированного получения хорошего
приближения, как и в случае задачи (1), (2) первого типа, здесь нужно
пользоваться методами регуляризации [695]. Для описания этих методов нам
понадобится понятие стабилизатора.
Определение 1. Функция Щи), определенная на непустом
множестве Un С U0, называется стабилизатором задачи (1), (2) в метрике М,
если:
1) Щи)^0 Уиеип;
2) множество С1С = {и е UQ\ Щи) ^ с} при всех с, для которых С1С ф 0,
относительно компактно, т. е. из любой последовательности {uk}eQ,c мож-
§ 3. СТАБИЛИЗАТОР
633
но выбрать подпоследовательность, которая в метрике М. сходится к
некоторой точке иеМ;
3) множество
Unt = UtHUn^0. (4)
Приведем примеры функций, которые могут служить стабилизатором для
задачи (1), (2) в некоторых часто встречающихся функциональных
пространствах.
Пример 1. Пусть М — Еп — n-мерное евклидово пространство. Тогда
в качестве стабилизатора задачи (1), (2) можно взять функции
Щи) = \и-й\1, Щи) = ((D(u -й),и-й})1, и£Еп, (5)
где и— заданная точка из Еп, D —заданная положительно
определенная матрица n-го порядка, I — любое положительное число.
Относительная компактность множества С1С здесь вытекает из классической теоремы
Больцано — Вейерштрасса [350; 352]. Требование (4) в задаче (1), (2) при
М — Еп равносильно условию Ц, ф 0, так как функции (5) определены на
Еп и поэтому можем считать, что Un = U0, U — UП Un, Uut — UtC)Un — Ut.
Пример 2. Пусть М = Сг[а, Ъ] — банахово пространство г-мерных
непрерывных вектор-функций u = u(t) = (ul(t),..., ur(t)), а^ t ^ Ъ, с
нормой II«II0 = max |«(t)|. Рассмотрим функцию
fi(«)=ll«lll> = ?(l«(*)la + l«(*)la)d*. (6)
а
определенную на множестве Hl[a, Ъ] (обозначения см в § 8.1). В силу
известных теорем вложения (см., например, [492; 557; 648]) Щ[а, Ь] с
С Сг[а, Ь]. Убедимся, что множество U = {и £ ЯДа, b]: Щи) ^ с}
относительно компактно в метрике Сг[а, Ъ]. В самом деле, из неравенства
Щи) ^ с следует существование хотя бы одной точки t, е [а, Ь] такой, что
\u(t{)\^(c(b-a)-xyi2. Тогда |«(t)|= } «(т)йт +«(*,) ^ (с(Ь - а)'1)1'2 +
■ Ъ v 1/2
+ (Ъ-ау!2(\\й(т)\чЛ ^(с(Ъ-а)-1У>2+(с(Ъ - a))1'2 = const УиеЩ. Да-
лее, имеем \u(t) — u(r)\ = J u(s)ds <|t — т|1/2( J \u(s)\2ds) ^(c|t —т|)1/2
т ^ a '
\fu G Qc. Таким образом, множество функций CI равномерно ограничено и
равностепенно непрерывно на отрезке [о, Ь]. Из теоремы [393, стр. 110]
тогда следует, что из любой последовательности {uk(t)}e.Clc можно
выбрать подпоследовательность, сходящуюся к некоторой непрерывной
функции u(t) равномерно на отрезке [а, Ь]. Относительная компактность
множества С1С в метрике Сг[а, Ь] установлена. Для задачи (1), (2) со множеством
U0 С Сг[а, Ъ] требование (4) означает, что эта задача имеет хотя бы одно
решение «„ = «„(*) еЯДа, Ь]. При выполнении этого условия функция (6)
с областью определения Un= [/0пЯг'[а, Ъ] является стабилизатором
задачи (1), (2). Стабилизатором может служить также функция ^(^) = (11^1^,)1
при любом I > 0.
Покажем, что функция
fi(«)=(max |«(t)|+ sup '"У-У1)', 0<7<1, *>0 (7)
1фт
634
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
также может быть использована в качестве стабилизатора в задаче (1), (2)
при U0 С Cr[a, Ь], если эта задача имеет хотя бы одно решение ut = ut(t),
удовлетворяющее условиюГельдера: \ut(t)—ut(T)\^L\t —т|7, t, те[а, b]. В
самом деле, если £}(«)$: с, то max |«(t)|^c, = ^'<" 1-/ + ^--/^1 ^^ 1 + --
а^ t < Ь
■■с I1, \u(t)—и(т)\ ^C,|t— т\
t, т е [а, Ь] Уи е 0,с. Это значит, что множество функций С1С равномерно
ограничено и равностепенно непрерывно на отрезке [а, Ь]. В силу теоремы
Арцела множество С1С относительно компактно в метрике Cr[a, Ь].
Функции (6), (7) могут служить стабилизатором и в задаче (1), (2) при
M = Lp[a, b], 1 ^р ^оо, так как из равномерной сходимости
последовательности непрерывных функций следует ее сходимость в норме Ьр[а, Ъ].
Пример 3. Пусть М. = С™[а, Ь] — банахово пространство m
раз непрерывно дифференцируемых r-мерных вектор-функции с нормой
d'ujt)
= ^2 тах
a<t <Ь
dt1
Если в задаче (1), (2) множество U0 С С™[а, b], и
эта задача имеет хотя бы одно решение u(t) elrm+l[a, Ь] (см. обозначение
в § 8.1), то стабилизатором в ней можно взять функцию
Ь , m + 1
dt1
dt.
Если же такая задача (1), (2) имеет решение u(t) е С™[а, b], m-я производ-
dmu(t) dmu(r)
ная которого удовлетворяет условию Гельдера —^tm dt
Vt, т G [а, Ь], О < 7 ^ 1, то стабилизатором может служить функция
dmu(t) dmu(r)
€L\t-T\
Щи)
\и\
+ sup
tfkr
dtr
dt'
\t-r\
Эти утверждения доказываются с помощью рассуждений, аналогичных
приведенным в примере 2.
Пример 4. Пусть в задаче (1), (2) [ICM = L\[a, b], и эта задача
имеет хотя бы одно решение ut = ut(t) е V[a, b]. Здесь под Vr[a, b]
понимается банахово пространство вектор-функций «(*) = («'(*),..., wr(i)) с
ограниченным изменением, в котором норма равна \\u\\v, = \и(а)\ + Vab(u),
V}(u) — полное изменение функции и = u(t) на отрезке [а, Ь] ([393],
см. также § 6.4). В такой задаче стабилизатором можно взять функцию
0(«) = ||«||ут. Покажем, что множество Q,c = {u£ V[a, b]: Щи)^с}
относительно компактно в метрике Ь\[а, Ь]. В самом деле, из неравенства Щи) ^ с
следует, что \u(t)\ ^ \и(а)\ + \u(t) — и(а)\ ^ \и(а)\ + Vab(u) ^ с Vi G [а, Ь]
Уи€.С1с. Далее, считая для определенности u(t) = u(b) Vt > b, будем иметь
\ \u(t + т) - u(t)\dt ^ \ Vtt + 4u)dt = J(K( + » - VJ(u))dt =
а а а
= {Vat(u)dt-"]TVat(u)dt^2cT Vt>0, Vuettc.
Следовательно, множество функций С1 равномерно ограничено и
равностепенно непрерывно в норме L\[a, b]. Это значит (см. теорему 8.2.2), что
множество 0,с относительно компактно в метрике L\[a, b].
При исследовании задач (1), (2), когда U0QM = B — банахово
пространство, ниже нам понадобится понятие слабого стабилизатора.
§ 3. СТАБИЛИЗАТОР
635
Определение 2. Функция Щи), определенная на непустом
множестве [/„CC/jCB, называется слабым стабилизатором задачи (1), (2),
если:
П Щи)^0 Уиеип;
2) множество С1С = {и е Un: Щи) ^ с} при всех с, для которых Q Ф 0,
относительно слабо компактно, т. е. из любой последовательности \ик} G
G С1С можно выбрать подпоследовательность, которая слабо в В сходится к
некоторой точке и еВ;
3) множество Unt =UtnUn непусто.
Пример 5. Пусть М.—В — рефлексивное банахово пространство.
Тогда в качестве слабого стабилизатора задачи (1), (2) возьмем функцию
Щи) = \\и — п||д, и£В; 7 > 0>
где п — заданный элемент из В. Относительно слабая компактность
множества С1С следует из теоремы 8.2.3; требование Unt ф 0 равносильно условию
и^ф0, так как здесь можем считать, что Un = U0, и, следовательно, Unt = Ut.
Если U0 — выпуклое множество из рефлексивного банахова
пространства, то в качестве слабого стабилизатора можно взять равномерно выпуклую
функцию Щи) на U0. Тогда множество С1С = {и G U0: Щи) ^ с} ограничено
(теорема 4./.1) и относительно слабо компактно (теорема 8.2.3).
Примеры 1-5 показывают, что при построении стабилизаторов для
задачи (1), (2) весьма полезны знания условий относительной компактности
[относительно слабой компактности] множеств в конкретных метрических
[банаховых] пространствах, теорем вложения одного функционального
пространства в другое [95; 492; 535; 557; 648; 649].
2. В трех основных методах регуляризации для решения задачи (1),
(2) второго типа (методы стабилизации, невязки, квазирешений),
которые будут изложены ниже, строится однопараметрическое семейство точек
{us, 6 > 0} G Un, удовлетворяющее условиям
J(us)^Jt + 0(6), J. = infJ(u); (8)
9i(us)<iP(S), г = 1,..., т, \gt(us)\ ^ р(6), г = т + 1, ..., s; (9)
Щщ)^Щ +-/(6), Щ = ЫЩи), (10)
где 0(6),-/(6), р(6)— некоторые функции параметра 6 > 0. При
исследовании сходимости упомянутых методов регуляризации важную роль играют
следующие две леммы, которые будем называть леммами о регуляризации.
Лемма 1. Пусть
1) множество U0 замкнуто в метрике М, функции J(u),g.(u), i =
= 1,...,т; \дг(и)\, г = т + 1,..., s, полунепрерывны снизу на U0,
множество (2) непусто и выполнены условия (3);
2^ Щи) — стабилизатор задачи (1), (2) в метрике М;
3) точки us e.Un, 6 > 0 таковы, что выполнены условия (8)-(10), где
llm 0(6) = 0, \imp(6) = 0, sup|7(5)|<oo. (11)
Тогда ^° *^_
llm J(us) = Jt, Hmig.(us) ^0, i = 1,..., m;
о->0 S ->0 /194
llm &(««) = 0» i = m+ l,...,s, llmp(u„ 17.) = 0.
Если наряду с условиями 1)-3) выполнено еще условие
636
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
4) Un = U0, функция Q(u) полунепрерывна снизу на U0, lim7(<5) = 0, то
наряду с (12) *-°
\1тЩив) = Щ, llmp(us,U„) = 0, (13)
о —* U о —* и
где U„ = {и е Ut: Щи) = Щ}.
Доказательство. Из (10), (11) следует, что fi(«4)<fi„+sup |т( 5")| =
«>о
= с < оо, т. е. us е С1С = {и G [/„: С1(и) ^ с}. Поскольку множество С1
относительно компактно, то из любой последовательности {uk = us }, где {6к}—>0,
можно выбрать подпоследовательность {ик }, сходящуюся к некоторой
точке vteM. Из замкнутости U0 и из (¾} с UnС U0 следует, что vt G С/0. Далее,
пользуясь полунепрерывностью снизу функций дЛи), г = 1,..., т, \д((и)\,
i = т + 1,..., s, и включением vt G £/0, из (9), (11) имеем
•ft(«.)<JiOL&(«*)< Um&(ufc)<0, г = 1,...,т,
Г —>оо Г г—> оо г / 1 /1 \
=0 ^ |ft(«*)| ^ Jim. Шщ )| <1im |ft(«fc )| =0, * = т + 1,..., е.
г —> оо г г —* оо г
Это означает, что vt G С/. Из полунепрерывности снизу функции J(u),
условий (8), (11) вытекает J„ ^ J(v„) <"lim .7(¾ ) =¾ lim 7(¾ ) ^ J„, т. е.
г —*оо г г —» оо г
lim 7(¾ ) = J(vt) = J„. Это означает, что vt е £/„. Тогда 0 ^ р(ик, Ut) ^
г —»оо г г
< Р(ик» Ч). г = 1, 2,..., поэтому lim /э(г% , Ц.) = 0 = p(vt, UJ. Тем самым
Г Г —ЮО г ;
показано, что для любой точки vt, являющейся пределом какой-либо
подпоследовательности {ик } произвольной последовательности {ик = us }, где
{5,.}—>0, справедливы равенства lim 7(¾ ) = J(vJ — Jt, lim /9(¾ , [7,)=0 =
г —* оо г г—ЮО г
= p(vt, UJ. Отсюда следует, что каждое из числовых множеств { J(us), 6 >
>0}, {p(us, Ut), 6 > 0} имеет единственную предельную точку, равную Jt
и 0 соответственно, что равносильно утверждению (12).
Пусть теперь выполнены все условия 1)-4) леммы. Снова возьмем
произвольную последовательность (¾ = us }, где {6к} —>0, и произвольную
точку vt, являющуюся пределом какой-либо подпоследовательности (¾ } этой
последовательности. По доказанному vt е Ut. Отсюда с учетом равенства
Unt = Ut, полунепрерывности снизу стабилизатора Щи) на U0, lim7(<5) = 0
и условия (10) имеем *-*°
Щ = inf Щи) ^ Q(vt) ^ Пт_Щик) ^ИтЩик) ^ Щ, (15)
1% г—*оогг—юог
т-е- }^LПЮ = fiM = fi*'v*е и**-Тогда °< р(ик>и») < /°К'v*^ r =
= 1,2,..., и, следовательно, lim p(uk, С/ ) = 0. Это означает, что каждое
Г —i оо г
из числовых множеств {Щие), 6 > 0}, {p(us, £/„), S > 0} имеет
единственную предельную точку, равную Щ и 0 соответственно, что равносильно
утверждению (13). Лемма 1 доказана. □
Заметим, что примерами стабилизатора Щи), удовлетворяющего всем
условиям леммы 1, являются функции (5) на множестве Un= U0C.M = En.
3. В выпуклых задачах (1), (2), когда М = В — банахово пространство,
сходимость ко множеству Ц, в метрике В семейства {us, 6>0},
удовлетворяющего условиям (8)-(10), иногда удается получить, когда функция Щи)
§ 3. СТАБИЛИЗАТОР
637
является слабым стабилизатором. Такая возможность обсуждается в
следующей лемме.
Лемма 2. Пусть
1) В —рефлексивное банахово пространство, U0 —выпуклое
замкнутое множество из В, функции J(u), д{(и), г = I, .. .,т, \д{(и)\, г =
— т + 1,..., s, выпуклы и полунепрерывны снизу на U0, множество (2)
непусто и выполнены условия (3);
2) функция Щи) определена, полунепрерывна снизу, строго
равномерно выпукла на U0;
3) точки us G U0 удовлетворяют условиям (8)-(10), где
lim/3(5) = 0, \lmp(6) = 0, \1т-у(6)=0.
«-.О ' «-.0 х ' «-»0 '
Тогда
ton[J(us) = J(vt) = Jt, Нта(и,)<0, i = 1,..., m;
lim&(ue) = 0, i = m + l,...,s, (16)
lim Щщ) — Cl(v.) = £1, lim 11¾ - v.\\ —0,
S-,0 v «->o "
где vt — точка минимума функции Cl(u) на множестве Ut.
Доказательство. Из (10) следует, что us e.Clc — {u е U0: Щи) ^ с}
V<5 > 0, с = fi„ + sup \j(S)\ < °°- Это множество ограничено в норме В,
«>о
что доказывается также, как в теореме 4.7.1. Отсюда и из теоремы 8.2.3
вытекает, что Qc относительно слабо компактно в В. Поэтому из любой
последовательности {uk = us }, где {8к}-*0, можно выбрать
подпоследовательность {ик }, слабо сходящуюся к некоторой точке vteB. Так как
множество U0 выпукло, замкнуто, {ик } G U0, г = 1, 2,..., то vt G U0 (теорема 8.2.5).
Функции J(u), gt(u), г — 1,..., m; |ft(«)|, i = m + 1,,.., s, Щи) выпуклы
и полунепрерывны снизу на U0, следовательно, они слабо
полунепрерывны снизу (теорема 8.2.7). Отсюда и из (9), (11) следуют неравенства (14),
т. е. vt е U. Далее, как и в лемме 1 доказываем, что lim J(uk) = J(vJ — Jt,
г —* oo г
так что vt е Ut. Тогда справедливы неравенства (15), откуда получаем, что
lim Щик) = Щу^ = Щ, vteUtt = {ueUt: Щи) = Щ}, т. е. vt — точка мини-
г —>оо г
мума строго равномерной выпуклой функции на выпуклом множестве Ut.
Следовательно, Utt = {vt} (теорема 4.2.1). Кроме этого из теоремы 4.7.1
имеем: 5(||^ -v.||)<fi(ufc )-fi(«J, г = 1, 2,... Поэтому lim 6(\\ик -vj) = 0. По
f * Т —i ОО г
свойству модуля строго равномерно выпуклой функции это возможно
только при lim 11¾ — vt\\ =0. Из проведенных рассуждений следует, что каждое
Г —юо Г
из числовых множеств {J(us), S>0}, {Щие), 6>0}, {\\us — vt\\, 6>0} при
6—>0 имеет единственную предельную точку, равную J„, fi„,0
соответственно, что доказывает равенства (16). □
Примеры строго равномерно выпуклых функций были приведены в § 8.2.
Если В = Н — гильбертово пространство, то в лемме 2 можно взять сильно
выпуклую функцию Щи); например, Щи) = \\и\\2н.
4. При исследовании методов регуляризации нам еще понадобятся
некоторые результаты из § 5.15 о штрафных функциях, которые мы здесь
переформулируем в удобной для дальнейших ссылок форме.
638
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Лемма 3. Пусть задача (1),(2) имеет сильно согласованную
постановку (определение 5.15.3), т. е.
-00<J^J(u)+tci(gr(u)Y, u<=U0 (17)
при некоторых с.^0, i — 1,..., s, v > 0; точки us е U0, 5 > 0,
удовлетворяют неравенству
J(us) + A(6)P(us)^J>+ (1(8), (18)
s
где Р(и)= J2(9t(u)Y' u^Uq, — штрафная функция множества (2), р^и,
»=i
/3(5) ^0, А(6)>0, 11m /3(5) = 0, НтА(5) = +оо.
Тогда s^° s^°
0<a+KK(^K))l/p<P(*)> i = l,...,s, 5>0, (19)
-\c\(p(6)y^J(us)-J^(3(6), 5>0, (20)
где
p(6)
(а(Д)-|с|) ' A(<5) > |c| = max |c.| при ^ = t/;
(21)
чг=1
Доказательство проводится также, как в теореме 5.15.5 при р > v и
теореме 5.15.6 при р = v с заменой в них величины Ак на А(5), eh — на /3(5),
% — на us. Поэтому мы здесь ограничимся приведением лишь краткой
схемы доказательства.
Из (17), (18) имеем J(us)+A(6)P(us)^J(us)+± ct(g+(Us)y+p(8) или
г = 1
0^A(S)P(us)^±Ci(g+(Us)Y + P(6) V5>0. (22)
» = i
Пусть р > v. Тогда с помощью неравенства Гельдера получаем
0 < Ё сД&+ЮГ ^ \с\(РЫУ/р V5 > 0. (23)
i — 1
Из (22), (23) следует, что 0 ^ A(S)P(us) ^ |с|(Р(«,))^ + /3(5) ^
< {A^L,P(A(S)(P(us)Y/p + P(S)- Отсюда и из леммы 2.6.11 при z =
= (A(8)P(us))vlp получаем
(A(S)P(us)) ^ (\с\А(6)-^ '" + ^(3(6), V5 > 0.
После простых преобразований полученного неравенства, учитывая, что
9?(щ) < (p(us)Y'p приходим к оценке (19) при р > v.
При р = v из (22) сразу имеем А(8)Р(щ) ^ \с\Р(щ) + /3(5).
Отсюда при А(8) > \с\ следует Р(«4) ^ A,S\S\C\, что равносильно
оценке (19) при р = р. Наконец, из (17), (18), (23) вытекают неравенства
-\с\(Р(ие)у'^~^с{(д+(и)У^Т(ие)-^0(6). Отсюда и из (19) получаем
оценку (20). □
§ 3. СТАБИЛИЗАТОР
639
Упражнения
1. Можно ли функцию П(и)= $(u (t) + u (t))dt взять в качестве стабилизатора в метрике
С[0, 1] в задаче минимизации функции J(u) = J u2(t)dt на множестве U = L2[0,1]?
о
2. Задача: J(u) = max |u(i)| + max |u(i)|—unf, и e U = C2[0, 1]. При каких го, p функ-
1 m
цияП(и)=$ Y;
0 t = 0
dt может служить стабилизатором этой задачи в метрике С [0, 1]?
d'ujt)
dt1
1 1
3. Задача: J{u) = $ |u(i)|di —> inf, и e U = £i[0, 1]. Какие из функций Щи) = $ |u(i)|pdi,
о 1 о
fi(u) = max |u(t)|, Щи) = $(|u(t)| + |u(i)|)di является стабилизатором этой задачи в ме-
трике 1ц[0, 1]?
4. Доказать, что если задача (1), (2) при M = Cr[a, Ь] имеет хотя бы одно решение, принад-
ь
лежащее пространству Н2[а, Ь], то функция Щи) = $[fc(i)(u(t))2 + q(t)u(t)]dt, где функции
а
k(t), q(t) непрерывны и положительны на [а, Ь], является стабилизатором в метрике Сг[а, Ь].
5. Для задачи минимизации функций на выпуклом замкнутом множестве из Lp[a, b], 1 <
< р < оо, привести примеры слабых стабилизаторов.
6. Доказать, что в задаче минимизации функций на множестве U из Cm(G), GG-Б", при
п < 2т в качестве стабилизатора в метрике Cm(G) можно взять Щи) = ||и||Ят+1, если Ut П
Г\Нт + l(G)^0. Указание: воспользоваться теоремой вложения пространства Нт + ' (G)
в Cm(G) при п < 2т [492; 648; 649] (обозначения см. в § 8.1).
7. Доказать, что если Л,(и), П,(и) — стабилизаторы [слабые стабилизаторы] с одной и той
же областью определения Щ, то Щи) = alQl(и) + a2Q2{u), аг[ >0, а2 >0, а1 + а2 >0, также
являются стабилизатором [слабым стабилизатором].
8. Доказать, что в равенствах (12), (13), (16) предел равномерен относительно выбора точек
us из множества Z(5)={ueJ7n: J{us)^Jt+fi{6), gf(us)^p(6),i = l s, Щив)^Щ + у(ё)}.
§ 4. Метод стабилизации
1. Изложение методов регуляризации для решения неустойчивых задач
второго типа начнем с метода стабилизации, разработанного А. Н.
Тихоновым [695]. Этот метод в литературе часто называют методом
стабилизирующих функционалов. Опишем этот метод применительно к следующей
задаче второго типа:
J(u)->inf, иеЦ (1)
U = {ueU0, fif.(«)^0, г = 1,..., т; &(и) = 0, г = т + 1, ..., s}, (2)
где U0 — заданное множество из некоторого метрического пространства М,
функции J(u), &(«), i = l,...,s, определены на U0 и принимают на нем
конечное значение. Будем предполагать, что
J, = inf J(u) > -оо, U, = {и е U: J(u) = JJ ф 0. (3)
Для учета ограничений типа равенств и неравенств, задающих
множество (2), воспользуемся штрафной функцией
P(u)=±(gf(u))*, ueU0, р>0, (4)
г=1
640
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
где gf = т&х\^дг(и);0} при г = 1,..., т, gf = 1¾| при i — m + l,...,s. Пусть
й(и) — какой-либо стабилизатор задачи (1), (2) с областью определения
Un С U0. Предполагается, что множество Ц известно точно, а вместо
функций J(u), Р(и), которые наряду с J(u\, д^и), i = 1,..., s, также будем
называть входными данными задачи (1), (2), известны их приближения Js(u),
Ps(u), причем погрешности согласованы со стабилизатором в следующем
смысле:
\Js(u)-J(u)\^6(l+n(u)), \Ps(u)-P(u)\ ^6(1 +Щи)), ueUn,(5)
6 > 0 — скалярный параметр погрешности. Заметим, что возможный способ
перехода от приближений giS(u), i = 1,..., s, к Ps(u) обсуждался в § 2
(см. формулы (2.10)-(2.19)).
Составим функцию
ts(u) = ^(и) + А(6)Рв(и) + а(6)Щи), ueUn, (6)
называемую функцией Тихонова. Здесь Js(u), Ps(u) — какие-либо
конкретные реализации приближений входных данных из (5), А (6) > 0 — штрафной
коэффициент, а(6) > 0 — параметр регуляризации.
Рассмотрим задачу первого типа
*,(«)-> inf, иеиа: (7)
Для решения задачи (7) могут быть использованы методы, описанные в § 2.
Дальнейшее изложение не зависит от метода решения этой задачи. Мы
будем предполагать, что нам известна какая-либо точка щ, удовлетворяющая
условиям
««etfn, ts(us)^tSt + e(6), (8)
где подразумевается, что tSt= inf ts(u) > -оо, е(6) > 0. На формальном
уровне метод стабилизации описан. Осталось обсудить условия сходимости
метода (8) при 6 —>0, указать условия согласования параметров а(6), А(6),
е(6) этого метода.
Сначала приведем достаточные условия, гарантирующие неравенство
t. > -оо, У6 > 0. Как и в § 2, ограничимся рассмотрением класса задач (1),
(2), имеющих сильно согласованную постановку (определение 5.15.3), когда
-oo<J^J(u)+±Ci(gf(u)y, ueU0, (9)
при некоторых с, ^0,..., cs ^0, v >0. Тогда справедливо неравенство (2.24):
-oo<Jt^J(u) + A(6)P(u) + BA-^ Vu<=U0, 6>0, p^v, (10)
где при р = v по определению полагается А~*^ =0, 2? =0 и при этом
считается, что А(6) ^ \с\ = max cit а при р> v здесь В = (р - и)иГП'р~'-'\с\'Гп;,
lcl = ( Y1 СГ*) ' • Предположим, что параметры а(6), А(6) метода (8)
таковы, что
$ + &4($)<а($) V<5>0. (11)
§ 4. МЕТОД СТАБИЛИЗАЦИИ
641
Тогда из (5), (6), (10), (11) имеем
ts(u) > J (и) - 5(1 + Щи)) + А(8)Р(и) - А(8)8(1 + Щи)) +
+ а(8)Щи) >Jt- ВА~^ + (а(8) - 8 - 8А(8))Щи) -
-(8 + 8A(8))^Jt-BA~^-(8 + 8A(8)) Vu£Un, 8^0.
Это означает, что tSt > -со V<5 > 0. Тогда точка щ из (8) существует при
любом выборе е(<5) >0 по определению нижней грани.
2. Покажем, что при соответствующем согласовании параметров а(8),
А(8), е(8) метода (8) и некоторых дополнительных требованиях к
задаче (1), (2) точка us из (8) при малых 8 > 0 будет близка в метрике М
ко множеству Ut, а величина Js(us) близка к J„, т. е. пара (Js(ug),us)
является приближенным решением задачи (1), (2) второго типа. А именно,
справедлива
Теорема 1. Пусть
1) множество U0 замкнуто в метрике М, функции J(u), д{(и),...
■ ■ ч 9т(и), \9m±\i.u)\i ■ • ■> 1^.(^)1 полунепрерывны снизу на U0, выполнены
условия (3), (9);
2) Щи) — стабилизатор задачи (1),(2), Р(и) — штрафная функция,
определенная формулой (4) с параметром р ^ у;
3) приближения Js(u), Ps(u) функций J(u), Р(и) удовлетворяют
условиям (5);
4) параметры а(8), А(8), е(8) таковы, что
а(8)>0, А(8)>0, е(8)^0, У8>0,
\im(a(8) + s(8)) = 0, \imA(8) = +oo, (12)
sup(*±^)<l, «up ^< оо, Ыа(8)(А(8))^>0 (13)
(при p = v последнее из условий (13) не нужно, а условие lim А(8) = +со
можно заменить на А(8) > max с{ ). s^°
Тогда семейство {uS} 8 > 0}, определяемое методом (8), таково, что
\itnJ(us) = J„ lim а+(ив) = 0, * = 1,..., в; llmo(«„l7J = 0, (14)
S —»0 о —»0 о —* и
причем пределы в (14) равномерны относительно выбора Js(u), Ps(u)
из (5) и выбора точки us из (8), точнее,
lim sup \J(u)-Jt\=0, lim sup \gf(u)\=0, lim sup p(u,UJ=0, (15)
s~>0 ueX(S) «-*0 ueX(S) *-*° ueX(S)
где X(8) —множество, представляющее собой объединение множеств
x(8) = {ueUn: ts(u) = Js(u) + A(8)PJu) + a(8)n(u)^tSt + £(8)} по
всевозможным реализациям Js(u), Ps(u) из (5).
Пусть наряду с условиями i)—4) еще выполнено условие
5) Un = U0, функция Щи) полунепрерывна снизу на U0,
lim 6 + 6^S)=0, Нт4Й = 0, \im а(8)(А(8))^ =+оо (16)
642
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
(при p=v последнее из условий (15) не нужно). Тогда справедливы
равенства (14) и, кроме того,
11т ПК) = fi., \imp(us,UJ = 0, (17)
о —>и о —* и
где fi„ = inf Щи), Utt = {и е Ц,: £}(«) = Ц,}, причем пределы в (17) pas-
номерны относительно выбора Js(u), Ps(u) из (5) и выбора точки us
из (8), т. е.
lim sup |£}(«)-£}J=0, lim sup p(u, [/„) = 0. (18)
f-*°iiEX(J) S->°ueX(S)
Доказательство. Первое из неравенств (13) влечет за собой
условие (11). Отсюда и из (10) следует, что множество х(6) = {и е Un: ts(u) ^.
^ tSt + e(6)} непусто при всех е(6) >0 (если е(6) = 0, то условие ж(<5)=£0
предполагается). Кроме того, по определению стабилизатора множество
Unt = U„ П Un ф 0. Возьмем произвольные точки us G ж(<5), w„ G Un .
Учитывая, что Щи) ^ 0, Р(«) ^ 0 на Un, P(ut) = 0 и неравенства (5), (8), (10),
можем написать следующую цепочку неравенств
J(us) + A(6)P(us) ^ J(us) + A(S)P(us) + a(6)Q(us) ^
^ Js(us) + A(6)Ps(us) + a(6)Q(us) + (6 + 6A(6))(l + Щив)) =
=ts(us)+(6+6A(6))(l+n(us))^tSt+e(S)+(S+6A(6))(l+n(us))^
^ J(ut) + A(6)P(ut) + а(6)Щ%) + e(6) +
+ (6 + 6A(6))(l + Щие)) + (6 + 6A(6))(l + fi(4)) ^
^ J(us) + A(6)P(us) + B(A(6))-^ + а(6)Щ%) + e(6) +
+ (6 + 6А(6))(1+Щие)) + (6 + 6А(6))(1+Щи>)) V5>0. (19)
Выделив второе и последнее звенья этой цепочки, имеем
а(6)Щие) ^ В(А(6)У^ + а(б)Щи^) + е(6) +
+ (6 + 6А(6))(1 + Щие)) + (6+ 6А(6))(1 + Щи)), 6> 0.
Пользуясь произволом в выборе точки ut е Unt в этом неравенстве величину
Щи,) можем заменить на fi„ = inffi(«) и переписать его в виде:
(а(8) -6- 6А(6))Щие) ^ (а(6) +6 + 6А(6))Щ + е(6)+
+2(6 + 6А(6)) + В(А(6)У^
ИЛИ !
Щщ)^Щ + 1(6), 6>0, (20)
+ SA(t
1(6)= ч " ' . ,+щ.; °<^»р-.. (21)
Из выражения (21) следует, что j(6)^0, sup7(<5)<°° при выполнении
«>о
условий (12), (13) и lim 7(^) = 0 при условиях (12), (16). Далее, взяв первое
«-.о
§ 4. МЕТОД СТАБИЛИЗАЦИИ
643
и предпоследнее звенья цепочки неравенств (19), с учетом уже доказанного
неравенства (20), имеем
J(us)+A(6)P(us)^+a(6)n(uJ+e(6)+(6+6A(S))(2+n,+7(6)+n(uJ).
Пользуясь произволом в выборе и^ е Unt,, отсюда получаем
Цщ) + А(6)Р(щ)Щ + Р(6), (22)
где
Р(6) = а(6)а. + е(6) + а(6)-(1±$&у2 + 2П. + 1(6))>0, 6>0, (23)
причем lim /3(8) = 0 при условиях (12), (13). Из (22), (23) и леммы 3.3
следуют оценки
О^дГЫ^р(б), % = 1,...,8-, (24)
-\c\(p(S)Y^J(us)-Jt^P(S), V5>0, (25)
где величина P(S) определена формулой (23), величина р(6) —
формулой (3.21), причем lim р(6) = 0. Оценки (20), (24), (25) означают, что се-
S —* о
мейство точек {us, 6>0} удовлетворяет условиям (3.8)-(3.10). Отсюда и из
леммы 3.1 следуют равенства П4), (17). Остается доказать равенства (15),
(18). Первые два равенства (15) вытекают из оценок (24), (25), так как
величины р(6), P(S), как видно из формул (3.21), (23), не зависят от
конкретной реализации Js(u), Ps(u) из (5) и выбора точки us из (8). Докажем
третье из равенств (15). Пусть lim sup р(и, UJ = lim sup p(u, UJ, где
«-""uEirn k-"x>u€X(8k)
{6k}—* 0. По определению верхней грани для каждого номера к найдется
точка йк е.Х(6к) такая, что
sup p(u,UJ^p(uk,UJ + \, к = 1,2,... (26)
ueX(Sk)
Включение ик е Х(6к) означает, что ик е Un, ts^(uk) ^ ts t + е(6к), где ts^(u)
составлена по формуле (6) для каких-то реализаций Js (и), Ps (и) из (5),
т. е. ик = us €. х(6к). Из третьего равенства (14) имеем lim p{uk,Ujf) =
= 0. Отсюда и из (26) следует: 0^ lim sup р(и, Ц,) ^ lim sup р(и, Ц,) =
S^OueX(S) s~'0ueX(S)
= lim sup р(щ, Ц,)< Hm p(uk, Ц,) = 0, что равносильно третьему равен-
k^°°ueX(St) к-,°°
ству (15). Аналогично, выделяя последовательности {8к}—>0, для которых
lim sup \Щи)- Clt\ = lim sup |ft(«) —fij,
(-*0ii«(S) k->°°ueX(6i)
]imp(«, U„) = lim sup p(u, U„),
¢-.0 k-,°°u€X(St)
и последовательности {vk}, {wk} со свойствами
vkeX(6k), sup |fi(«)-fi,|^|fi(«fc)-fi,| + ^, к = 1,2,....,
ueX(St)
wkeX(6k), sup- p(u,UJ^p(wk, UJ)+j, k = l,2,...,
tl€X(Sk)
644
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
с помощью уже доказанных равенств (17) приходим к (18). Теорема 1
доказана. П
3. Отдельно остановимся на выпуклых задачах (1), (2), когда М = В —
банахово пространство. Покажем, что в этом случае для семейства {us, 8 >
> 0}, определяемого методом стабилизации (8), сходимость к решению в
норме В удается получить и тогда, когда функция Щи) является слабым
стабилизатором (определение 3.2).
Теорема 2. Пусть
1) В —рефлексивное банахово пространство, U0 — выпуклое
замкнутое множество из В, функции J(u), д{(и), г = 1,..., т, \д{(и)\, г =
= т + 1,..., s, выпуклы и полунепрерывны снизу на U0, множество (2)
непусто, выполняются условия (3), (9);
2) функция Q(u) полунепрерывна снизу, строго равномерно выпукла
на U0; Р(и) — штрафная функция, определенная формулой (4) с
параметром p^v;
3) приближения Js(u), Ps(u) функций J (и), Р(и) удовлетворяют
условиям (5);
4) параметры а(8),А(8), е(8) удовлетворяют условиям (12), (16).
Тогда семейство {us, 8 > 0}, определенное методом (8), таково, что
limJ(us) = Jt, llma+(u,) = 0, i = l,...,s,
6->o 6->o (07\
lim ШиЛ = 0,,., lim ||«s —u|L =0,
S-.0 x °' «-.0м ""
где vt — точка минимума функции Щи) на множестве ?7„, причем
пределы в (27) равномерны относительно выбора Js(u), Ps(u) из (5) и точки
us из (8). ; ,
Доказательство. Повторяя доказательство теоремы 1 при Un = U0,
убеждаемся, что оценки (20)-(25) сохраняют силу при всех достаточно
малых 6 > 0. Это значит, что при сделанных предположениях семейство
{us, 6 > 0} из (8) удовлетворяет условиям леммы 3.2, из которой следуют
существование и единственность точки ^ и равенства (27). Равномерность
пределов (27) доказывается также, как равенства (15), (18). □
4. Сделаем несколько замечаний, комментирующих теоремы 1,2.
Замечание 1. В качестве параметров а(6), А(8), е(6) метода (8),
удовлетворяющих условиям (12), (13), (16), можно, например, принять
а(8) = а16а, А(6) = а26-А, е(8) = аъ8е, 8 > 0, (28)
где а, > 0, а2 > 0, а3 ^ 0, 0 < а ^ е, А > 0, А + а ^ 1, а ^ А ^ (при р = v
последнее неравенство не нужно). Поскольку условия (12), (13), (16)
интересуют нас лишь при малых 8 > 0, то от параметров а(8), А(8), е(<5)
достаточно требовать соблюдения этих условий на каком-либо
полуинтервале 0 < 8 ^ 80, содержащем допускаемые неравенствами (5) погрешности
измерений.
Замечание 2. Примером стабилизатора, который обладает всеми
свойствами, требуемыми в теореме 1, являются функции (3.5), когда М. =
= Е»иип=и0.
Замечание 3. Правые части условии (5) на погрешности можно
заменить на <5со(1 + Щи)), где Co = const>0. Теоремы 1, 2 и их доказательства
при этом сохраняются, нужно лишь первое из неравенств (13) заменить на
suP^(*«(g) <1' а Условие (11) — на ф + 8А(8)) ^ а(8), 8>0.
«>о
§ 4. МЕТОД СТАБИЛИЗАЦИИ
645
Замечание 4. Кратко остановимся на методе стабилизации для
задачи второго типа
J(u)-»lnf, и<=Ц (29)
когда множество U известно точно (например, U = М. илиU = В). Эта
задача является частным случаем задачи (1), (2) при т = s =0, U = U0. Пусть
для приближений Js(u) функции J(u) выполнено первое из равенств ¢5),
где Щи) — стабилизатор задачи (29) (см. определение 3.1 при U = U0).
Тогда метод (8) применим и к задаче (29), если в качестве функции Тихонова
взять ts(u) = Js(u) + а(8)Щи). Теоремы сходимости метода (8) вэтом
случае получатся из теорем 1, 2, если в них и в их доказательствах принять
U0= U, Р(и) = Ps(u) = 0, а в (12), (13), (16) исключить элементы,
содержащие параметр А(8) (например, равенство lim +a(s\ = 0 здесь должно
быть заменено на lim —пгг = 0).
Замечание 5. Равенство lim sup р(и, Ut) =0 из (15) выражает
s->°xeX(S)
стремление к нулю при 8 —>0 уклонение множества Х(8) от множества Ц.
(см. (1.10), упражнение 1.6). Равенство lim sup \J(6)- Jt\ =0 означает,
s~,0xeX(S)
что уклонение множества {J (и), иеХ(6), 6 >0} от множества, состоящего
из одной точки Jt, стремится к нулю при 8 —>0. Аналогичный смысл имеют
остальные равенства (15), (18).
Замечание 6. Выше мы считаем, что стабилизатор С1(и) известен
точно. Однако такое предположение не всегда оправдано. Например, если
ь
используется стабилизатор Щи) = §(u2(t) + (u(t))2)dt, то для вычисления
а
интегралов здесь придется применять какие-либо квадратурные формулы и
неизбежно появятся погрешности. Для охвата подобных ситуаций можно
считать, что вместо точных значений Щи) известно их приближение Qx(u),
причем
|ц»-ад|^х(1 + «(«)), «etfn> o<x^i. (зо)
Условие (30) при возможных больших значениях Щи) характеризует
относительную погрешность в задании стабилизатора, так как тогда -JL-
-1
Щи)
^X(1 + кт-т) —Х- При выполнении условий (30) в функции (6) вместо
Щи) надо взять С1х(и), а параметр х = х(<5) наД° согласовать с
погрешностью 8, взяв supx(5)<°° в дополнение к условиям (13) и lim x(^)f=0 —
«>о
к условиям (16). Наличие в правых частях неравенств (5), (30)
слагаемого 1 в сумме 1 + Щи) оправдано тем, что возможны малые значения С1(и)
или даже Щи) = 0 в некоторых точках и, ив этом случае замена 1 + Щи)
на Щи) в (5), (30) привела бы к неоправданно жестким требованиям на
точность задания функций J(u), Р(и), Щи).
Замечание 7. Обсудим содержательный смысл элементов
множества иы, введенного в (17).
Определение 1. Точку wtef/t назовем нормальным решением
задачи (1), (2) по функции Щи) или, короче, il-нормальным решением, если
646
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Щщ)= inf £2(^)=^. Если £}(«)=|Ы| — норма в банаховом пространстве, то
ueUt
^-нормальное решение называют просто нормальным решением задачи.
В задачах оптимального планирования функция Щи) может выражать
собой стоимость затрат на организационные и технологические
перестройки при переходе от существующего состояния производства к его новому
состоянию, соответствующему оптимальному плану и. Тогда среди всех
оптимальных планов и е Ц, естественно выбрать тот план щ, для которого
стоимость затрат Щи) минимальна. Это означает, что наилучший
оптимальный план щ представляет собой ^-нормальное решение задачи (1), (2)
[374; 695]. Как утверждается в теореме 1, при определенных условиях
метод стабилизации (8) может быть использован для получения приближений
к ^-нормальному решению задачи (1), (2).
Задача поиска ^-нормального решения относится к так называемым
лексикографическим задачам минимизации, когда имеется некоторое
упорядоченное множество функций «/[(«), J2(u),..., Jt(u), определенных на
некотором множестве U и требуется последовательно решить задачи минимизации
в следующем порядке. Сначала решается задача: J^u) —»inf, ue.U,
находится множество Uu = {u£U: J,(«) = ini J{(u)}. Затем рассматривается задача:
J2(u)—»inf, и е Uu, определяется множество U2t,— {и е Uu: J2(u) — inf J2(u)}
и т. д., пока не будет найдено множество Uu = {ue i/,_u: Jt(u) — inf J,(«)'}.
Отсюда ясно, что ^-нормальное решение задачи (1), (2) является
решением лексикографической задачи, когда J{(u) = J {и), J2(u) = Щи), Uu = Ut,
U2lt = U^. Нетрудно понять, что лексикографические задачи относятся к
неустойчивым задачам, так как множества точек минимума Uu,..., Ult при
небольших возмущениях входных данных могут сильно изменяться, более
того, могут оказаться пустыми. Теорема 1 показывает, что для решения
некоторых таких задач может быть использован метод стабилизации [169].
5. Для иллюстрации изложенного метода стабилизации рассмотрим
несколько примеров.
Пример 1. Задача:
J(u)= UlK(s, t,u(t))dt) da-» Inf, ueU = C[a,b], (31)
с a '
где K(s, t, u) — непрерывная функция по совокупности аргументов
(s, t, и) е [с, d] х [a, b] х Е1. Эта задача тесно связана с интегральным
уравнением $ K(s, t,u(t))dt = 0 и, вообще говоря, неустойчива в метри-
а
ке С[а, Ь] [695; 697]. Пусть задача (31) имеет хотя бы одно решение
ь
и = u^(t) б Я'[а, Ь]. Тогда функция Щи) = ||«|||i = $(|u(*)|2 + \u(t)\2)dt,
а
определенная на множестве Un = Hl[a, Ь], является стабилизатором
задачи (31) в метрике С[а, Ь] (пример 3.2). Пусть \K(s, t,u)\ ^ Cq(1 + \и\),
Cq = const > 0, и пусть вместо точной функции K(s, t, и) нам известно
приближение Ks(s, t, и) такое, что
\Ks(s,t,u)-K(s,t,u)\^S(l+\u\), 8>0, y(s,t,u)e[c,d]x[a,b]xEl.
§ 4. МЕТОД СТАБИЛИЗАЦИИ
647
Если в качестве приближенного значения функции J (и) возьмем Js(u) =
d ,Ь ч 2
=• $ ( $ Ks(s> *> u(t))dt J ds, получим
с a '
\Js(u)-J(u)\ = \](l(Ks(s,t,u(t))-K(s,t,u(t)))dt)x
' с a '
x (\(Ks(s, t,u(t)) + K(s, t, u(t)))dt)ds\ ^
a '
^ I (I 6(1 + \u(t)\)dt ■ \(8 + 2co)(l + \u(t)\)dtys <:
^ 6(6 + 2co)(d - c)(b - a+ 1)(1 + I \u(t)\4t) ^
*: 6(6 + 2%)^ - c)(b - a+ l)2(l + \\u\\2H>),
т. е. погрешность согласована со стабилизатором (см. замечание 6).
Функция Тихонова
ts(u) =U\ Ks(s, t, u(t))dt)2ds + а(6) \(\u(t)\* + \u(t)\*)dt
с ^ a ' a
определена на Un—Hl[a,b]. Если us=us(t)eHl[a,b], ts(us) ^ inf ts(u) +
Hl[atb]
+ e(6), параметры a(6), e(6) выбраны так, как требуется в теореме 2, то
семейство {us(t),6>0} сходится ко множеству Ц, в метрике С[а,Ь].
Если задача (31) имеет хотя бы одно решение u(t), удовлетворяющее
условию Гельдера, то в качестве стабилизатора этой задачи в метрике
С[а, Ъ] можно использовать стабилизатор 3.7.
Пример 2. Рассмотрим задачу минимизации квадратичной функции
J(u) = \\Au-bfF-*mi, ueU (32)
где А е L(H -f F), Н, F — гильбертовы пространства, Ъ еН, U —
выпуклое замкнутое множество из Н (например, U = H). Пусть эта задача имеет
хотя бы одно решение. Условие разрешимости задачи (32) рассматривались
в § 8.2 (теоремы 8.2.12, 8.2.13). Будем искать точку и^е Ц,, ближе всего
расположенную к заданному элементу ne Н. Такая точка является
^-нормальным решением задачи (32), если Q(u) = \\и — и\\%. Пусть оператор А и
элемент Ъ заданы своими приближениями As £jC(H —> F), bs e F, причем
\\AS-A\\^6, ||bff — (33)
пусть множество U известно точно. В качестве приближенной функции
тогда естественно взять Js(u) = \\Asu — bs\\2. Допускаемая при этом
погрешность оценивается так:
\Js(u) - J(u)\ = \((Asu - bs) - (Au - b), (Asu - bs) + (Au - b))| <
«: (£||u|| + 6)((2\\A\\ + 6)\\u\\ +2\\b\\ + 6)^
^6(l + \\u\\f2(\\A\\ + \\b\\ + 6).
Ho (1 + ||u||)2 ^ (1 + ||u|| + ||« - u||)2 ^ 2(1 + ||«||)2(1 + ||« - n||2), поэтому
| Js(u) - J(u)\ ^45(1 + ||n||)2(||A|| + ||b|| + 6)(1 + Щи)), ueH. (34)
648
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Отсюда видно, что погрешность с учетом замечания 3 удовлетворяет
условию (5). Задача (32) при условиях (33), вообще говоря, неустойчива [334;
695] (см. упражнение 1.2). Для определения ее ^-нормального решения
можно воспользоваться методом стабилизации (8). Составим функцию
Тихонова ts(u) = \\Asu — bs\\2 + а\\и — гГ||^, иЕН, и определим точку us из
условий:
щеЦ ts(us) ^ in\ts(u) + е(6) (35)
В частности, если U = Н, то сильно выпуклая дифференцируемая
функция ts(u) достигает минимума в единственной точке us, которая является
решением операторного уравнения
t's(u) = 2A*s(Asu - bs) + 2а(6)(и - й) = 0.
Если х^ ,*ч
lima(5)=lime(5)=lim^m=o, (36)
S-,0 V ' S-,0 V ' S-,0 <*(S) ' v '
то из теоремы 2 следует, что lim||ws — wJ|H =0, где u^ — ^-нормальное
решение задачи (32). s~>0
Пример 3. Задача:
J(u) = J (I K(s, t)u(t)dt - 6(e)) ds -> inf, ueU = L2[a, b], (37)
где b(s) e L2[c, d], K(s, t) G L2(Q), Q = [c, d] x [a, b]. Эта задача тесно
связана с интегральным уравнением Фредгольма первого рода
ь
J K(s,t)u(t)dt = b(s), c^s^d.
а
Задача (37) является частным случаем задачи (32) при Н = L2[a, b], F =
= L2[c,d] ь
Аи = \к(Ь, s)u(s)ds (38)
a
— оператор Фредгольма (пример 8.3.10). Пусть Ц. Ф 0 и пусть вместо
функций K(s, t), b(s) известны их приближения Ks(s, t) е L2(Q), bs(s)£
G L2[c, d] такие, что
§\As(s,t)-A(s,t)\4sdt<6>, 1\Ш-Ъ(з)\Чз^6>, (39)
Q '•■'.■ с
d ,Ь ч 2
Тогда для приближенной функции Js(u) — П $ Ks(s, t)u(t)dt — bs(s)j ds
с a
Ь
справедлива оценка (34), где fl(u)— $\u(t) - u(t)\2dt. Функция Тихонова
имеет вид <•
ts(u) =l{\ As(s, t)u(t)dt - bs(stfds + а(6) \ \u(t) - u(t)\4t,
и G Ь2[а, Ь].
Если выполнены условия (36), то точки us, определяемые из (35), (40) при
ъ
U=L2[a,b] таковы, что \im $ \us(t)-ut(t)\2dt=0, где «„=«„(*) — fi-нор-
. 8 —i 0
а
мальное решение задачи (37).
§ 4. МЕТОД СТАБИЛИЗАЦИИ
649
Пусть задача (37) имеет хотя бы одно решение vt = vt(t) е Н1[а, Ь].
Покажем, как тогда можно построить семейство {vs е Ц 6 > 0}, сходящееся
при 6 —»0 к одному из решений этой задачи равномерно на [а, Ь].
Заметим, что оператор (38) определен и на Я, = Н1[а, Ъ] с Ь2[а, Ь], более того,
А е £(Я, -> F), так как
<( л
11^111^^) = sup l((Au)(s))4s^ sup $((Au)(s))4s=:
«"«я'м|<1е ««1чм1<1е (41)
= №я^> = й*а(«, *)<***«•
Поэтому имеет смысл задача:
J(u)-»Inf, и е С/, = Н1[а, Ь], (42)
где функция J(«) взята из (37). Множество решений задачи (42) обозначим
через Uu. По предположению, существует точка vt е Ц,пЯ'[а, b]. Нетрудно
видеть, что J(%) > Inf J(«) = Ju > inf J(«) = J„ = J(vt). Отсюда следует,
что Ju = J и i/u = Ц, П Hl[a, b] Ф 0. Рассуждая так же, как при выводе
оценки (34) с учетом (39), (41), получаем
1^(^)-7(^)1^45(11^11^^+116^+5)(1+11^11^,,,,,,,) VueW[a,b].
Составим функцию Тихонова задачи (42): ts(u)= Js(u) + <х(8)\\и\\2нцаЬ] и
определим точку vs€ U{=Hl[a, b], ts(vs) ^.'mi ts(u)+е(6). При выполнении
условий (36) согласно теореме 2 получим lim \\vs — t«J|Hi,0 ь, =0, где ш,е
S —i 0 III
^ Uu, ||ч||н'[а,ы = ^11«11н'[а,ы- Так как ^1* = ^ПЯ1[а, Ь], то ui.e С/;, так
что построенное семейство {«4, 6 >0} сходится к решению tu„ задачи (37)
в норме Я'[а, Ь] и, тем более, в норме С[а, Ь].
Пример 4. Рассмотрим задачу оптимального управления:
7(«) = |яв(Г,«)-Ь||.-»lnf, «еС/ (43)
где ж(£; и) — x(t)— решение системы
x(t) = D(t)x(t) + B(t)u(t), t0^t^T; ас(А>)=0, (44)
U — выпуклое замкнутое множество из Ь£[£0> Т\ (обозначения см. в
примере 8.2.14). Введем оператор Аи — х(Т,и), действующий из H — Lr2[t0, Т] в
F = Еп. В примере 8.2.14 было доказано, что А е£(Я —> F), и задача (43),
(44) сводится к задаче (32). Пусть в задаче (43), (44) множество Ц,
решений непусто (см. теоремы 8.2.12, 8.2.13). Пусть вместо матриц D(t), B(t)
и вектора Ъ известны кусочно-непрерывные приближения Ds(t), Bs(t) и
вектор bs такие, что
\\Ds(t)-D(t)\\^6, \\Bs(t)-B(t)\\^6 Vte[t0,T], |Ь,-Ь|<&(45)
Определим приближение As к оператору А следующим образом: Asu =
= xs(T, и), где xs = xs(t; и) — решение системы:
is(t) = Ds(t)xs(t) + Bs(t)u(t), А,<*<Г, x(t0) = 0. (46)
650
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Как и в примере 8.2.14 нетрудно установить, что As G £(Н —> F) У6 > 0.
Оценим ||А4-А||. Из (44), (46) имеем: xs(t;u) - x(t;u) = 1[Ds(t)xs(t) +
+ Bs(t) u(t) - D(t)x(t) - B(T)U(r)]dT = \(Ds(t)[xs(t;Z) - х(т;и)] +
+ [Ds(t) — D(t)]x(t; u) + [Bs(t)-B(t)]u(t))cIt. Отсюда и из (45) следует:
( т
\xs(t;u)-x(t;u)\^ sup \\Ds(t)\\1\xs(t; и)-х(т; u)\dr+ 6 J |аз(т; u)\dr+6
J \u(t)\ dt Vt e [t0, T]. Далее воспользуемся леммой 6.3.1. Учитывая нера-
венство sup||D4(t)|| $С sup||D(£)|| + 8 = Dmax+ 6 и оценку (8.2.8), получим
||a;Ht;«)-a;(t;«)||^e(^ + ^-io).5[(T-t0)c0 + x/T^]||«||i,
VtG[t0,T].
Взяв в (47) t = Т, придем к нужной оценке:
||А,-А|| = sup \\Asu-Au\\= sup \xs(T; и) - x(T; u)\ < &,,
M4<i 11«Ц<1 • (48)
Таким образом, условия (33) на погрешности в этой задаче выполнены.
Далее, предлагаем читателю взять стабилизатор Щи) = \\и\\\г и, следуя
рассуждениям из примера 2, применить метод стабилизации для задачи (43),
(44) при условиях (45), сформулировать условия сходимости метода к
il-нормальному решению в норме Ll\tQ, Т].
Пример 5. Рассмотрим каноническую задачу линейного
программирования:
J(u) = (c,u)-*ini, ueU = {u^0,Au = b}, (49)
где А —матрица размера mxn, Ъе.Ет,и€.Еп. Пусть Jt>— оо. Тогда Е£#0
(теорема 3.5.1), функция Лагранжа задачи (49) имеет седловую точку
(теорема 3.5.5), и, следовательно, в этой задаче выполнено условие (9) сильно
согласованной постановки (лемма 5.15.1). Пусть вместо точных с, А, Ъ
известны их приближения cs, As,bs с погрешностями
|с,-с|<$ \\AS-A\\^6, \bs-b\^S. (50)
Опишем метод стабилизации для задачи (49) при условиях (50).
Ограничения Аи = Ь будем учитывать с помощью штрафной функции Р(и) = \Аи —
— Ь\2. Положим Js(u) = (cs, и), Ps(u) = \Asu — bs\2. Стабилизатор возьмем
Cl(u) = \и\2. Имеем:
\Js(u)-J(u)\^S\u\^l2S(l + \u\2),
\Ps(u) - Р(и)\ = \((Asu - bs) - (Аи - b), (Asu - bs) + (Au - b))| <
^ 5(1 + |«|)((2||A|| + 6)\u\ +2\b\ + 6)^ 25(1 + |u|)a(J|A|| + |b| + 6) ^
^46(l + \u\2)(\\A\\ + \b\ + 6), ueEn.
§ 4. МЕТОД СТАБИЛИЗАЦИИ
651
Как видим, погрешности согласованы со стабилизатором (замечание 3).
Задача (7) здесь представляет собой задачу квадратичного программирования
для сильно выпуклой функции (§ 5.8):
ts(u) = (cs, и) + A(6)\Asu -bs\2 + а(6)\и\2 -> inf,
u<=U0 = {ueEn: и ^0}.
Определим точку us из условий: us е U0, ts(us) ^ inf ts(u) + e(6). Если na-
u€U0
раметры a(6), A(6), e(S) удовлетворяют условиям (12), (16), то, согласно
теоремам 1, 2, семейство (us, 6 >0} при 6 —>0 сходится к О-нормальному
решению в задачи (49).
Другой вариант метода стабилизации для задачи (49) при условиях (50),
заключающийся в переходе к новой вспомогательной задаче, также
являющейся задачей линейного программирования, будет рассмотрен в § 7.
Приведем еще несколько простых примеров, показывающих, что
условия (12), (13), (16) на параметры а(6), А(6), е(6) на классе задач (1), (2)
не являются грубыми.
Пример 6. Задача: J(u) = 0-> inf, и eU = E '.Тогда Jt= 0, Ut = U =
= Е. Возьмем стабилизатор Щи) = и2. Тогда множество Utt, ^-нормальных
решений состоит из одной точки и„ =0. Пусть 1^(^) ~~ J(u)\ ^ ^0 + и2)-
Тогда может случиться, что Js(u) = -6(l + и2). Функция Тихонова равна
ts(u) = -S(l+u2)+au2 = (a-8)u2-6. Если а — а(6)< 6, то tSt = 'mi ts(u) =
= —оо. Поэтому для реализуемости метода (8) необходимо условие 6 ^а(б)
(ср. с (11)). Тогда tSt = —S = ts(us), где us = 0 = щ V<5 > 0 без каких-либо
дополнительных согласований параметров. Условию ts(us) ^ tSt + е(8) =
= -8 + e(S) удовлетворяет точка us = yj^¾ = у |щ,1 - -щщ) • 6 >
> 0. Отсюда видно, что семейство {us, 6 > 0} ограничено, если sup —^ <
,д. «>о а( >
< 1, sup -SLi < оо, а для выполнения равенства lim us = % = 0 нужно еще
требовать lim -Art = 0.
Если оказалось, что Js(u) = ^6(1 + и)2, то ts(u) = -^8(1 +и)2 + аи2,
ts. = inf ts(u) = 2^5 = ts(us), где щ = ^j = -^) (2 + -^6))- Отсю-
да видно, что сходимость us к ^-нормальному решению возможна лишь
при lim —yjt = 0.
Пример 7. Задача: минимизировать функцию
\2
Г ("-1Г u>i
to, «<i,
на множестве U = {ueE1: и^-l}. Здесь Jt=0, Ut = {ueEl: |«|<l'}. Пусть
Щи) = и2, | Js(u) — J(u)\ ^ 6(l + u2) Vu£El, множество U известно точно.
Тогда fi% = inf и2 = О, Ц,„ = {щ = 0}. Допустим, что Js(u) = J (и). Тогда
Н < 1
*„(«) = J(u) + cra2, t^(«) = 0=t4(0). Пусть а = а(5) = 52, е = е(<5) = 2<5 при
652
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
0^5^1, е(<5) = 2 при S > 1. Тогда условию ts(u) ^ tSt + e(6) удовлетворяет
точка us = -j=. Хотя и lim J(us) = 0 = J„, но lim p(us, Utt) = +oo. Здесь
нарушено условие sup -¾^ < oo.
Рассмотрим другой набор параметров: а(6) = б2, е(6) = 2<52(1 + 6) при
0<5^1, е(6) = 2 при <5 > 1. Пусть снова Js(u) = J(u). Тогда точка us = l + 6
удовлетворяет условию ts(u)^ tSt+e(S) приб< 5^ 1.Ясно, что lim J(us) =
8 —* 0
= 0= Jt, limi p(us, U„)=0, но lim /э(«4, Ц,„)= 1. Здесь sup ^ <oo, однако
условие lim -¾^ = 0 нарушено.
Пример 8. Задача: J(«) = 0-Hnf, ue U = {u£El = U0: g(u) = u^0}.
Здесь Jt = 0, ££ = U. Функция Лагранжа этой задачи L(u, А) = Хи, и СЕ1,
А ^ 0 имеет седловую точку (щ, А* = 0) при любом выборе ut£Ut = U, так
что условие (9) сильно согласованной постановки здесь выполнено при s =
= 1, с = А*=0, v = \ (лемма 5.15.1). Пусть приближения Js(u), gs(u) таковы,
что | Js(u) — J(u)\ ^. 5(1 +и2), UE.E1. Эта задача неустойчива (пример 1.8).
Возьмем стабилизатор Щи) = и2, штрафную функцию Р(«) = тах{0; и} и ее
приближение Ps(u) = max{u; 0} —6гА Нетрудно видеть, что \Ps(u)—P(u)\ ^
<С 5(1 + Q(u)) Vw еЕ1. Пусть Js(u) = —Su2. Тогда функция Тихонова
ts(u) = -6и2 + А(6)[тах{и; 0} - 6и2 + аи2] =
_( А(6)и + и2(а-6-6А(6)), и^0;
~\ и2(а- S-SA(S)), и<0.
Если а — 6 — 6А(6) ^ 0, то tSt = inf ts(u) = 0; если а — 6 — 6А(6) < О, то
tSt = —оо. Как видим, нарушение условий (11) может привести к тому, что
метод (8) потеряет смысл. Пусть а — 6 — 6А(6)^0. Тогда условию (8)
ts(us) < е(<5) удовлетворяет точка
Отсюда видно, что для справедливости равенства lim p(us, Ц,) = 0 необхо-
8 —* О
димо выполнение соотношений sup ^\-Л <оо, А(6)>0, а(6)>0, lim А(8) =
=+оо, lim а(6) = 0 из (12), (13), причем первое из условий (13) строгого
8 —* О
неравенства заменено нестрогим, вытекающим из (11). Заметим, что здесь
lim p(us, U„) = 0, U„ = {% = 0} и без требования условий (16).
8 —* О
6. Для удобства дальнейших ссылок в §§ 8-12 отдельно сформулируем и
докажем специальный случай теоремы 2, когда семейство {us, 6 > 0}
определяется из условий (8) при е(5) = 0, а в (6) используются точные входные
данные.
Теорема 3. Пусть
1) U0 — выпуклое замкнутое множество из рефлексивного банахова
пространства В, функции J(u), gt(u), i = 1,..., т, \д{(и)\, г = т + 1,...
..., s, выпуклы и полунепрерывны снизу на U0, множество (2) непусто,
выполняются условия (3), (9);
§ 4. МЕТОД СТАБИЛИЗАЦИИ
653
2) функция Щи) полунепрерывна снизу, строго равномерно выпукла
на U0, Р(и) — штрафная функция, определяемая формулой (4) с
параметром р ^ max{i/; 1};
■6),
3) параметры а(6), А(8) удовлетворяют условиям
а(6)>0, А(<5)>0, V<5>0,
lima(<5) = 0, lim А(<5) = +оо, lim a(6)(A(6))^ =oo
S-.0 «-.o x ' s->o x
(51)
(при p = v^.\ последнее условие не нужно);
4) точка us является решением задачи
Ts(u) = J(u) + A(S)P(u) + a(6)n(u)^M, и е U0, (52)
т. е.
us е U0, Ts(us) = inf Ts(u), S > 0. (53)
"Ей
Тогда
где
lim J(us) = I, lim g+(us) = 0, г = 1,.
0 —* U О —* U
lim Ш«,:) = £1, lim 11«« — «Jl =0,
(54)
Щ = inf fi(«) = Щщ), и, e Ut. (55)
ueu
Доказательство. При сделанных предположениях функция Ts(u)
строго равномерно выпукла на выпуклом замкнутом множестве U0,
полунепрерывна снизу на Ц и достигает своей нижней грани на U0 в единственной
точке (теорема 8.2.11), так что задача (52) разрешима и точка us,
удовлетворяющая условиям (53), определяется однозначно. Так как множество Ц,
выпукло, замкнуто, то по той же теореме 8.2.11 точка «„,,
удовлетворяющая условиям (55), существует и единственна. Далее, с учетом (10), (53),
соотношений Щи) ^ 0, Р(и) ^ 0 и Р(щ) = 0 получаем цепочку неравенств
J(us) + A(6)P(us) ^ J(us) + A(6)P(us) + а(6)Щие) = Ts(us) ^
^ Ts(v.) = J (v.) + A(6)P(v,) + a(6)Q(vt) = J, + а(6)Щ £
^J(us) + A(6)P(us) + a(6)Slt + B(A(6))-^, 8>0,
аналогичную цепочке (19). Отсюда имеем
Щив)^Щ + В/(а(6)(А(6))^, V5>0 (56)
J(us) + A(S)P(us)^l + a(6)nt, V5>0. (57)
Из неравенства (57) и леммы 3.3 получаем оценки
0^g?(us)^p(6), -\c\(p(6)y<:j(us)-KP(8), V5>0, (58)
где величина p(S), определяемая формулой (3.21), /3(5) = а(6)Щ. Из (56),
(57) и из леммы 3.2 следует утверждение теоремы 3. □
Переформулируем теорему 3 для случая, когда в (1), (2) т = s =0, U = U0.
654
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Теорема 4. Пусть U — выпуклое замкнутое множество из
рефлексивного банахова пространства В, функция J (и) выпукла и
полунепрерывна снизу на U; Jt> -оо, Ut=fi0, Щи) = \\и\\2, а(6)>0, \ima(6) = 0,
точка us определена из условий s~'°
и,еЦ r,K) = Infr,(«), Ts(u) = J(u) + a(S)\\u\\2 V5>0.
Тогда u
•/»<^(««)<^+«(*)||ч||а. Il«*ll<ll4||=lnf||«||, %eU„ llm||u,-4.||=0.
Упражнения
1. Нарисовать график функции Тихонова te(u) = u2(l +u4)-1 + a{S)u2 для минимизации
функции J (u) = и2(1 + и4)-1 на множестве U = El. Показать на этом графике, что для
сходимости точек и, из (8) ко множеству Ц, = {0} необходимо согласованное стремление к нулю
параметров а(5), е(5). Указать условие согласования этих параметров.
2. Применить метод стабилизации к задачам из примеров 1.1-1.9, указать условия
согласования параметров метода.
3. Применить метод стабилизации (8) к общей задаче линейного программирования.
4. Применить метод стабилизации к задаче оптимального управления:
J(u) = \x(T;u)-b\%„->lnt,
x(t) = D(t)x(t) + B(t)u(t) + f(t), t0^t^T; x(t0) = x0,
u = u(t)G U — выпуклое замкнутое множество из £2[*о> Т]> считая, что матрицы D(t), B(t),
вектора /(t), b, xq известны неточно (обозначения см. в примере 8.2.15) и выполнены
условия (45), \xqs - xq\ :¾ S, \fs(t) - f(t)\ ¢. 6 VtG[t0,T]. Указание: воспользоваться
стабилизатором П(и)= ||и|||г,, т,,
5. В упражнении (4) функцию J(u) заменить на J(u) = $|a;(i) — y(t)\2dt, считая, что
l%(*)-w(*)l<*-
6. В задачах из упражнений 4, 5 использовать стабилизатор Щи) = ||«|1я|[( ri, считая, что
и.пНг1[Ъ,Т]*0. ъ ,
7. Показать, что задача J(u) = S П u(s)ds — /(<)) dt —> inf, и G U = L2[a, b], неустойчива
к возмущениям функции f(t) g Cx[a, b] в метрике L2[a, b] или C[a, b] (задача
дифференцирования функции /(i)). Указание: взять fs(t) = /(i) + 6 sin ■*, t g [a, b]. Применить к
этой задаче метод стабилизации, взяв стабилизатор Щи) = ||u||2 r0i bi.
8. Сформулировать и доказать аналоги теорем 1, 2 для задачи: J(u)—>inf, и g U, когда
множество U известно точно, а приближения Js(u) функции J(u) удовлетворяют первому из
неравенств (5) (см. замечание 3).
9. В задаче (32) предположить, что вместо A, b известны их приближения Ah, bs такие,
что \\Ah — А|| ^ h, \\bs — Ь|| ^ 6, множество U известно точно. Описать метод стабилизации
со стабилизатором Щи) = ||и||2. Указать условия согласования параметров a = а (Л, 6), е =
= e{h, 6), обеспечивающие сходимость метода к П-нормальному решению задачи в метрике
Н. Указание: воспользоваться схемой доказательства теорем 1, 2.
10. Исследовать сходимость при а —> +0 метода стабилизации
(c,u)+ia|u|2^Inf, ugJ7 = {u^0: Au = b) (59)
для канонической задачи линейного программирования
(с, и) -> inf, и g Ц (60)
§ 4. МЕТОД СТАБИЛИЗАЦИИ
655
где А —матрица размера го х п, Ь еВш, с е Еп. Показать, что двойственная к (59) задача
(§ 4.9) имеет вид
-(Ь, А)- 2^-| max{-(c + ATA);0}|2^ sup, AeSm. (61)
Убедиться, что задача (61) при а —> +0 равносильна методу штрафных функций для
двойственной к (60) задачи линейного программирования: —(Ь, A)—>sup, АеЛ={Ае.Ет: АТА + с>0}.
Указание: показать, что inf ( дш2 + /За;) = — g— | max{-/3; 0}|2 Va > 0, V/3.
ж > о \-^ / ^°*
§ 5. Метод невязки
1. Этот метод опишем применительно к уже рассмотренной задаче
минимизации (4.1), (4.2) второго типа при тех же предположениях (4.3)-(4.5).
Введем множество
V(6) = {ие Un: Js(u) + A(6)Ps(U)^lpSt + а(6)}, (1)
где Js(u), Ps(u) — какие-либо конкретные реализации приближений
J(u), Р(и) из (4.5), Щи), и <е Un—стабилизатор задачи (4.1), (4.2),
А(6)>0, а(6)>0— параметры метода, lim А(6) = +оо, ]\т a(o) = 0,lpSt =
= inf Ши) + A(6)Ps(u) + (6 + 6А(6))Щи)). Предположим, что V(6)=£0
и, приближенно решая задачу первого типа
fi(u)-»Inf, ueV(S),
нам удалось найти точку us, удовлетворяющую условиям:
useV(S), Щив)^Пн+ ^(6), (2)
где CtSt = inf Q(u), p(S) >0. На формальном уровне метод невязки опи-
и ё V(S)
сан. Осталось указать условия, гарантирующие непустоту множества V(S),
условия согласования параметров метода, условия сходимости метода.
Но сначала кратко поясним название метода невязки. Этот метод
первоначально применялся для минимизации функции J (и) = pF(Au, /),
возникающей при исследовании уравнений Аи = /, где А — оператор,
действующий из некоторого метрического пространства М. в метрическое
пространство F, f eF, pF(fu /2) — расстояние между точками /,, /2 е F.
Величину J(u) = pF(Au, f) принято называть невязкой уравнения Аи = /.
Если это уравнение имеет решение, то inf J(u) = Jt =0, и в этом случае
и ем
метод невязки [334; 508; 697] сводится к задаче минимизации
стабилизатора Щи) на множестве V(6) = {и е Un: J (и) < о"(<5)}, состоящем из точек,
для которых невязки уравнения не превосходят некоторой малой величины
<т(8). В задаче минимизации: J (и)—> inf, и е U невязкой можно назвать
величину J (и) — J„ и в качестве множества, на котором невязка мала, взять
V = {ueU: J(u)~Jt^a}; в задаче (4.1), (4.2) при использовании штрафной
функции V = {«e£/0: <5(u) = J(» + AP(u)^ inf Ф(и) + а} и при неточном
u£Un
задании исходных данных аналогом множества V является множество (1).
Таким образом, метод невязки заключается в минимизации стабилизатора
Щи) на множестве точек из Un, для которых невязка мала. Это
обстоятельство нашло отражение в названии метода невязки.
656
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Метод невязки (1), (2) удобно применять, когда величина ~ipSt + cr( 6),
входящая в определение множества V(6), известна. Если эта величина заранее
неизвестна, то для ее определения предварительно нужно, решая задачу
первого типа
lps(u) = Js(u) + A(6)Ps(u) + (6 + 6A(6))n(u)-*m[, ueUn, (3)
найти величину lpSt или ее оценку ~ipSt: + a(6). При решении задач (3) и (1),
(2) возможно использование методов из § 2. Дальнейшее изложение не
зависит от метода решения перечисленных задач.
Теорема 1. Пусть выполнены условия 1)_3) теоремы 4.1 и
параметры А(6), сг(6), р,(6) таковы, что
А(6)>0, а(6)>0, ц(6)>0,
\im(a(S) + SA(S)) = 0, limA(5) = +oo, (4)
supM(5)<oo, (8+6А(8))(3+Щ)+В(А(8)У^^а(6), 6>0 (5)
«>о
(при p = v последнее слагаемое в (5) отсутствует, а условие lim А(8) =
= +оо можно заменить на А(8)> max с,- ), где В =(р — р)р~р~р-"\с\р-",
|с| = (52 |с{|р~") прир> v, fit = inf Щи), Unt = UtC\Un. Тогда множество
V(8), определенное равенством (1), непусто при всех 8 > 0, семейство
{us, 8 >0} из (2) таково, что
HmJ(u,)=J„ Jim &+(«,) = 0, г = 1,..., s; limip(us, Ut) = 0. (6)
Если кроме перечисленных условий еще известно, что Un = U0,
функция Q(u)— полунепрерывна снизу на U0, \imp,(8) = 0, то наряду с (6)
справедливы равенства в~'°
lim Щив) = Щ, lim «К, [0 = 0, (7)
где Utt={u£Ut: Щи)=С1ф= inf Щи)}— множество 0,-нормальных
решений задачи (4.1), (4.2). Пределы в (6)^(7) равномерны относительно
выбора Js(u), Ps(u) из (4.5) и выбора точки щ из (2), т. е.
справедливы равенства (4.15),(4.18), где X(8) — объединение множеств
x(8)={ueV(8): Cl(us)^Clh+p,(8)} по всевозможным реализациям Js(u),
Ps(u) из (4.5).
Доказательство. Сначала покажем, что множество (1) непусто при
всех 8 > 0. Воспользуемся неравенством (4.10):
J^J(u) + A(8)P(u) + B(A(8)y^ \/ueU0, 8>0, p>v (8)
(при р = v последнее слагаемое в (8) отсутствует и А(8) ^ \с\ = max \с{\).
Из (3), (8), (4.5) имеем '<'<'
7ps(u) > J(u) + A(8)P(u) -(8 + 8A(8))(l + Щи)) +
+(6+6А(6))Щи)^1-В(А(6)Г^-(8+8А(8)) VueUu,
§ 5. МЕТОД НЕВЯЗКИ
657
так что <pSt > — оо. Далее, по определению Clt для любого е, 0 < е < 1,
найдется точка ws такая, что
че[/п», n(ws)^n, + s. (9)
Тогда с учетом (4.5), (8) получим
Js(ws) + A(6)Ps(ws) <: J(ws) + A(6)P(ws) +
+ (6 + 6A(6))(l+tt(ws)) ^1 + (6 + 6А(6))(\+Щ + e) ^
^ J(u) + A(6)P(u) + B(A(6))~^ + (6 + 6A(6))(2 + fij <
^ Js(u) + A(6)Ps(u) + (6 + 6A(6))(l + Щи)) +
+ В(А(6)У" +(6 + 6A(6))(2 + Щ) =
= Tps(u) + (6+ 6A(6))(3 + Щ) + B(A(6))-^ Vu g Ua.
Переходя к нижней грани по и G Un, отсюда с учетом второго
неравенства (5) имеем: Js(ws)+A(6)Ps(we)^~ipSt:+a(6), т. е. ws €V(6) V<5 >0. Таким
образом, V(6)^0 V<5>0. Таккак ft(u)^0 Vu<=Un, тоП{,= inf Щи)^0
и точка us, удовлетворяющая условиям (2), существует по определению
нижней грани. Для любой такой точки us с учетом включения wz е V(6)
имеем: Cl(us) ^Cl(we)+р(6)^Щ + е+ц(6) Ve, 0<е < 1. Переходя к пределу
при е —» +0 отсюда получим
Щие)^Щ + 7(6), >y(6) = ti(8) У6>0. (10)
Кроме того, из (4.5), (1), (2), (9), (10) следует
J(us) + A(6)P(us)^Js(us) + A(6)Ps(us) +
+ (6 + 6А(6))(\ + **(«,))<¥>,. + а(6) + (6 + 6А(6))(\ + Щ + ц(6)) <:
^1рв(гие) + а(6) + (6 + 6А(6))(1 + Щ + ^(6))^
^J(we) + A(6)P(ws) + (6+6A(6))(l + n(ws)) +
+ (6 + 6A(6))Q(ws) + a(6) + (6 +6А(6))(\ + Щ + ^(6))<:
*: J,+ (6 + 6A(6))(2 +ЗЩ + 2е+ ^(6))+ a(6) Ve, 0<e<l.
Отсюда при e —» 0 имеем:
J(us) + A(6)P(us)^ ^ + (3(6),
(3(6) = (6+6А(6))(2 + ЗЩ + ц(6)) + а(6), У6>0. K '
Отсюда и из леммы 3.3 следуют оценки
0<fc+KKp(*)> i=l,...,s; -\c\(p(6)Y^J(us)-J^P(6), V5>0, (12)
где величина /3(5) взята из (11), а р(6) определяется формулой (3.21). Из
оценок (10)-(12) и леммы 3.1 получаем равенства (6), (7). Равенства (4.15),
(4.18) здесь доказываются также, как в теореме 4.1. □
Замечание 1. Вместо второго из неравенств (5) на практике удобнее
требовать:
11m S + S,i{S)=0, \im а(6)(А(6))^= оо (13)
658
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
(при р = v последнее равенство не нужно). В качестве параметров А(6),
ст(5), ц(6), удовлетворяющих условиям (4), (5), (13), можно, например,
взять
A(5) = a,<5-A, a(S) = a2S', /1(5) = а35", V5 > О (14)
где А, а, ц, щ, а^, а3 — положительные постоянные.
Замечание 4.2 сохраняет силу и для метода невязки.
2. В выпуклых задачах (4.1), (4.2) в банаховых пространствах в
методе (1), (2) возможно использование слабого стабилизатора.
Теорема 2. Пусть выполнены условия 1)-3) теоремы 4.2 и
параметры А(6), <j(S), р(6) удовлетворяют условиям (4), (13), lim fj,(S) — 0.
S —* О
Тогда семейство {us, 8 >0}, определенное методом (1), (2) таково, что
limJ(u,) = J„ 11m а+(и,) = 0, * = 1,..., a;
(15)
lim ЩиЛ — С1„, lim \\ик - vA\„ = 0,
где vt —точка минимума функции Щи) на множестве Ц,. Пределы в (15)
равномерны относительно выбора Js(u), Ps(u) из (4.5) и точки us из (2).
Доказател ь с т в о. Повторяя доказательство теоремы 1 при Un = U0,
убеждаемся, что оценки (10)-(12) сохраняют силу при всех достаточно
малых 6 > 0. Отсюда и из леммы 3.2 следуют существование и единственность
точки vt и равенства (15). Равномерность пределов (15) доказывается
также, как равенства (4.15), (4.18). □
Замечания 4.3-4.7 с очевидными изменениями сохраняют силу и для
метода (1), (2).
Упражнения
1. Описать метод невязки для задач из примеров 1.1-1.9, 4.1-4.5.
2. Привести примеры задач, показывающих, что условия (4), (5), (13) на параметры метода
невязки не являются грубыми на классе задач (4.1), (4.2).
3. Применить метод невязки к задачам из упражнений 4.4-4.7.
4. Сформулировать и доказать аналоги теорем 1, 2 для задачи: J (и) —> inf, и е U, когда
множество U известно точно, а приближения Js(u) функции J (и) удовлетворяют первому из
неравенств (4.5).
5. К задаче (4.32) применить метод невязки в предположении, что \\Ah—А\\ ^h, \\bs—b\\^S,
множество U известно точно, П(и) = ||и||2. Указать условия согласования параметров метода
с погрешностями (h, 6).
§ 6. Метод квазирешений
1. Этот метод также опишем применительно к задаче минимизации (4.1),
(4.2) второго типа при тех же предположениях (4.3)-(4.5). Будем также
предполагать, что нам известно число г такое, что
иш П Qr ф 0, Qr = {и е Un: Щи) ^ г}, (1)
§ 6. МЕТОД КВАЗИРЕШЕНИЙ
659
где Q,(u) стабилизатор задачи (1), (2) в метрике М; напоминаем, что
множество иш = UnnUt непусто по определению стабилизатора. Метод
квазирешений сводится к приближенному решению задачи первого типа
<Ps(u) = Js(u) + A(6)Ps(u)-4]nl, ueQr,
и определению точки us из условий
useQr, <Ps(us)^<pSt + £(6), (2)
где <ps, = inf <ps(u), £(6) > 0 V<5 > 0.
Название метода квазирешений также связано с уравнением Au — f, где
А — оператор, действующий из некоторого метрического пространства М.
в метрическое пространство F, f G F. Пусть pF(Au, f) — невязка этого
уравнения. Квазирешением уравнения Au—f называют точку ад, еМ, для
которого pF(Aut, /)= inf pF(Au, f). Если pF(A%, /) = 0, то квазирешение
и еМ
щ превращается в обычное решение уравнения Au = f. Однако
квазирешение может существовать и тогда, когда это уравнение не имеет решения.
Предположим, что известно компактное в М множество Q С М,
содержащее хотя бы одно квазирешение уравнения Аи = /. Тогда метод
квазирешения [334; 695] сводится к задаче минимизации: p(Au,f) —»inf, и е Q.
Обобщением этого метода применительно к задаче (4.1), (4.2) является
метод (2), в котором роль Q играет множество Qr, роль невязки — функция
ips(u).
Теорема 1. Пусть выполнены условия 1)—3) теоремы 4.1,
условие (1) при некотором г и параметры А(6), £(6) метода (2) таковы,
что
А(6)>0, £(5)>0, limA(5) = +oo, lim £(5)=0 (3)
s —> о s —* о
( npup = v условие lim A(S) =+oo можно заменить на A(6)> max ct).
Тогда точка us, определяемая условиями (2), существует при всех
S > 0 и
\imJ(us) = l; jlfoo+(ue) = 0, * = 1,..., я; Um o(u„ 17.) = 0. (4)
8 —> 0 о —»0 о —* и
Пределы в (4) равномерны относительно выбора Js(u), Ps(u) из (4.5) и
выбора точек us из (2), т. е. справедливы равенства (4.15), гдеХ(8) —
объединение множеств х(6) = {и е Qr: (ps(u)^ ¥>«* + £(£)} по
всевозможным Js(u), Ps(u) из (4.5).
Доказательство. Прежде всего из (4.5), неравенства (4.10) и
определения множества Qr в (1) имеем:
Vs{u)=Js(u)+A{8)Ps{u) > J(u)+A(6)P(u)-(6+6A(6))(l+n(u)) >
> J, - В(А(6))-& -(5 + SA(S))(l + г) Уие Qr.
Следовательно, <pSt = inf <ps(u) > —оо и точка щ из условий (2) существует
по определению нижней грани. Возьмем произвольные точки us из (2), щ £
660
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
G Unt П Qr. С учетом (4.5), (2), неравенств Cl(us) ^ г, Щи^) ^ г получаем
J(us) + A(6)P(us)Z<ps(us) + (8 + 8A(8))(l + Q(us))^
£<Ps* +W) + (6+ &4(5))(1 + г) < ^К) + £(5) + (5 + SA(S))(l + г) <:
< J(4) + А(5)Р(Ч) + £(5) + 2(5 + £4(5))(1 + г) = J, + /3(5),
/3(5) = £(5) + 2(5+5A(5))(l + r) V5>0. (5)
Из (5) и леммы 3.3 следуют оценки
о<а+ККр(«), *=1,...,в, -|c|(p(ff)r<.7K)-.W(*) V5>o, (6)
где величина р(6) определяется формулой (3.21), а /3(8) взята из (5).
Неравенство Q(us) ^ г можем записать в виде (3.10):
Q(us)^Qt + -r(S), -y(S) = r-Qt, 8>0. (7)
Из оценок (5)-(7) и леммы 3.1 получаем равенства (4). Равенства (4.15)
доказываются также, как в теореме 4.1. □
Для того, чтобы семейство точек {us, 5 > 0} из (2) при 5 —> 0 сходилось
ко множеству il-нормальных решений задачи {4.1), (4.5), нужно, чтобы в
неравенстве (3.10) величина j(8) обладала свойством lim 7(^) = 0. Однако,
8 —* 0
как видно из (7), описанный вариант метода квазирешений таким свойством
не обладает. Существует более тонкий и конструктивно более сложный
вариант метода квазирешений [113; 151; 165], в котором неравенство (3.10)
выполняется с lim 7(^) = 0 и для которого имеют место равенства (4.18),
s —* о
а также справедлив аналог теоремы 4.2.
2. Сделаем несколько общих замечаний по поводу изложенных выше трех
методов регуляризации.
Замечание 1. Каждый из этих методов (как и методы § 2, см,
замечание 2.2) для своей реализации требует наличия некоторой априорной
информации. Прежде всего во всех трех методах предполагается, что в
задаче (4.1 ), (4.2) нам уже известно, что 11^=0, Jt = ini J (и) > —оо, Ut = {и е U:
J(u) — Jt}^0 и, кроме того, подразумевается, что существует стабилизатор
в нужной метрике и выполнены условия (4.5). На практике перечисленная
информация обычно добывается на стадии формирования математической
модели задачи, предварительного исследования ее свойств, и, как правило,
эта работа требует немалых усилий. Часть из этих проблем, относящихся
к условиям X > — сю. Ц, Ф 0. мы немного обсуждали в § 8.2. При выборе
стабилизатора Щи) наиболее труднопроверяемым является условие
принадлежности хотя бы одного решения % задачи (4.1), (4.2) области его
определения Un. Включение w„ G Un обычно означает, что это решение ад,
обладает некоторыми дополнительными свойствами «гладкости»
(непрерывность, гельдеровость, наличие производных и т. п.), которые в исходном
определении решения задачи, возможно, и не предусматривались, и
выяснение таких свойств не всегда простое дело.
В задаче (4.1), (4.2), когда множество U известно неточно, в §§4-6
мы еще предполагали, что задача имеет сильно согласованную
постановку в смысле выполнения неравенства (4.9), что позволило нам правильно
§ 6. МЕТОД КВАЗИРЕШЕНИЙ
661
выбрать параметры методов и единообразно исследовать их сходимость. По-
видимому, условие (4.9), характеризующее условие роста целевой функции
и ограничений на множестве U0, может быть заменено другой более удобной
априорной информацией о задаче.
Наличие перечисленной априорной информации дало нам возможность
реализовать метод стабилизации. Для метода невязки к этой информации
понадобилось добавить еще знание оценки Jt (или, точнее, оценки величины
lpSt из (5.1), а в методе квазирешений — оценки значения стабилизатора на
каком-либо элементе щ G Unt (см. условие (6-1)). Предупреждаем читателя,
что вспомогательные задачи (4.8), (5.2), (6.2), лежащие в основе описанных
методов регуляризации, могут иметь смысл и в том случае, когда какая-то
часть упомянутой априорной информации отсутствует. Однако тогда
решения us этих вспомогательных задач могут и не иметь какого-либо отношения
к исходной задаче (4.1), (4.2), что видно из следующего примера.
Пример 1. Задача: J («) = «-> inf, ие U = {u£El :и^ 0, дх{и)—и— 1^
^0, д2(и) = -и+2^0}. Очевидно, U = 0, и задача не имеет решения. Тем не
менее, если здесь мы формально применим метод стабилизации (4.8) со
стабилизатором Q,(u) = u\ то придем к задаче: ts(u) = и+А(6)(тах{д1(и); 0}+
+ тах{д2(и); 0}) + <х(8)и2 —> inf, и > 0, которая при любых a(S) > 0 будет
иметь единственное решение и.. Однако в этой задаче Ц, = 0, и мы не
можем утверждать, что p(us, Ц,) —> 0 при 6 —> 0.
Этот простой пример показывает, что перед применением того или иного
метода регуляризации нужно предварительно убедиться, что необходимая
для реализации метода информация уже имеется. О роли априорной
информации, важности ее учета при построении более эффективных методов
регуляризации см., например, в [184; 450; 509; 557; 693; 695; 697; 757; 817].
Замечание 2. Изложенные в §§ 4-6 методы регуляризации
содержат параметры, которые в каждом методе удовлетворяют своим условиям
согласования и прямо или косвенно учитывают имеющуюся информацию о
задаче (4.1), (4.2) (см. условие (4.12), (4.13), (4.16) в методе стабилизации,
(5.4), (5.5) — в методе невязки, (6.3) — в методе квазирешений). Эти
параметры не зависят от того, какая реализация входных данных Js(u), Ps(u)
из (4.5) имеется в нашем распоряжении и могут быть выбраны заранее,
до начала вычислений. Поэтому такой выбор параметров принято называть
априорным. Условия согласования параметров оставляют достаточно
большой произвол в их выборе (см., например, формулы (4.28), (5.14)). Следует
сказать, что выбор параметров является тонким делом, от этого зависит
скорость сходимости методов, их трудоемкость, точность. Для некоторых
классов задач проблема оптимального априорного выбора параметров
исследована, например, в [334; 462; 659; 679; 695].
Существует и другой, так называемый апостериорный способ выбора
параметров методов регуляризации, в котором учитываются свойства
конкретных приближений входных данных, имеющихся в нашем распоряжении,
свойства точек us, определяемых из вспомогательных задач и т. д.
Апостериорный выбор несколько усложняет реализацию методов, но обладает
немалыми достоинствами в смысле точности, лучшего учета конкретных
особенностей задачи и ее входных данных. Не имея возможности
подробнее останавливаться на проблеме апостериорного выбора параметров
методов регуляризации, отсылаем читателя к специальной литературе [130; 334;
507; 679; 693; 696; 697] и др.
662
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Замечание 3. Каждый из методов, описанных в §§ 4-6,
определяет оператор Rs, который каждому набору приближенных входных данных
(Js(u), Ps(u)) из (4.5) и набору своих параметров ставит в соответствие
точку us, определяемых из вспомогательных задач (4.8), (5.2), (6.2)
минимизации первого типа и при выполнении условий теорем сходимости
(теоремы 4.1, 4.2, 5.1, 5.2, 6.1) обеспечивает выполнение равенств (4). Это
означает, что такой оператор Rs является регуляризирующим.
Определение 1. Оператор Rs, который каждому набору
приближенных входных данных задачи (4.1), (4.2) второго типа ставит в
соответствие точку us е U0, называется регуляризирующим, если lim J(us) = Jt,
S —i 0
lim p(u, Ut) = 0, lim g-~(us) = 0, i = 1,..., s (ср. с определением 2.1).
S —i 0 S —i 0
Проблема существования регуляризирующих операторов, построение
оптимальных в том или ином смысле операторов Rs для различных классов
неустойчивых задач исследована, например, в [62; 63; 188; 334; 501; 693;
695; 697] и др.
Замечание 4. Неравенства<(4.24), (4.25), (5.12), (6.6) представляют
собой оценки скорости сходимости изложенных методов регуляризации по
функции. При дополнительных ограничениях на задачу (4.1), (4.2) удается
получить оценки скорости сходимости этих методов по аргументу, т. е.
оценки для p(us, Ut), p(us, UJ) [162; 173]. Оценки скорости сходимости методов
регуляризации для различных классов неустойчивых задач исследовались в
[179; 192; 334; 507; 508; 679; 697; 740] и др.
Упражнения
1. Для задачи: J (и) —»Inf, uet/c точно заданным множеством U описать метод
квазирешений, сформулировать и доказать аналог теоремы 1.
2. Применить метод квазирёшений для задач из примеров 1.1-1.9, 4.1-4.5, из упражнений
4.4-4.7.
3. Пусть иа —точка минимума функции Та(и) = \Аи- Ь\2 + а\и\2 при «6Е°; здесь А —
матрица размера mxn.be Ет, а > 0. Доказать, что'тогда \иа — uj < a\v\, где v —решение
уравнения {А*А) и = А*Ь с минимальной нормой [192, стр. 301].
§ 7. Методы регуляризации с расширением множества
В методах регуляризации, описанных и исследованных в §§ 4-6,
ограничения типа равенств и неравенств в задании множества (4.2) учитывались
с помощью штрафных функций. Ниже излагаются методы регуляризации,
в которых вместо штрафных функций используется некоторое расширение
множества, согласованное со стабилизатором и с погрешностями в задании
исходных данных.
Как и выше, будем рассматривать задачу
J(«)->inf, иеЦ (1)
U = {ue U0: &(«)<0, г = 1,..., т; ft(u) = 0, i = т + 1, ..., s}, (2)
где U0 — заданное множество из метрического пространства М с
метрикой р = р(и, v), функции J(u), д((и), г = 1,..., s, определены и конечны
§ 7. МЕТОДЫ РЕГУЛЯРИЗАЦИИ С РАСШИРЕНИЕМ МНОЖЕСТВА 663
на U0. Пусть Jt > -оо, Ц, ф 0. Пусть Щи), и eUnC. IL — какой-либо
стабилизатор задачи (1), (2) в метрике М. Как и выше, будем предполагать,
что множество U0 известно точно, а вместо функций J(u), д{(и) известны
их приближения Js(u), giS(u) такие, что
\Js(u)-J(u)\^6(l+n(u)), \giS(u)-9i(u)\ ^6(1+Щи)),
г = 1,..., s, ueUn, 6 >0.
Рассмотрим следующее множество
W(S) = {ие Un: giS(u) ^ в(8)(1 + Щи)), г = 1,...,т;
\giS(u)\ < 6(8)(1 + Щи)), i = m + 1,.. ., я} =
= {и е Un: д+(и) ^6(6)(1+Щи)), г = 1,. . ., я}, в(8)> 6. (4)
Нетрудно убедиться, что множество W(6) заведомо непусто и, более того,
представляет собой расширение множества UnUn. В самом деле, для любой
точки и е U П Un с учетом (3) имеем:
*Й(«)^дГ(и)+Н1+Щи))<; 6(\+Щи))< в(8)(\+Щи)), г = \, ...,s.
Это означает, что U П Un С W(5), так что W(S) действительно является
расширением множества U П Un.
Далее будем предполагать, что задача (1), (2) имеет сильно
согласованную постановку, т. е. выполняется неравенство
'■^■W+E^OfcW. иеи0, о 0, р>0. (5)
Так как для любой точки и е W(S) справедливы неравенства
ft+(«) < ft«(«) + *0 + ^(«)) < 6(1 + Щи)) + 6(1 + Щи)) ^
< 2(9(1 +fi(«)) V«GW(ff), i = 1,..., я, (6)
то из (5) следует, что
Jt^J(u) + \c\l(2ey(l + n(u))v yueW(S), 6>0, |c|, = Ekl-(7)
» = 1
Перейдем к описанию методов регуляризации, представляющих собой
модификации методов стабилизации, невязки, квазирешений, реализованные
на расширенном множестве (4). Как и в § 2 будем считать, что О < v ^ 1.
1. Начнем с метода стабилизации. Возьмем функцию Тихонова
ts(u) = Js(u) + а(6)Щи), ueUn.
Решая задачу минимизации первого типа: *5(г*) —^ inf, и е W(6), определим
точку us из условий
useW(S); ts(us)^tSt + s(6), (8)
где е(6)>0, ts=m^ts(u).
664
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Теорема 1. Пусть
1) множество U0 замкнуто в метрике М, функции J(u), д^и), i =
= 1,..., т, \д{(и)\, г = т +1,..., s, полунепрерывны снизу на U0; Jt > -оо,
Ц, ф 0, выполнено условие (5) с 0 < v ^ 1;
2) Щи) — стабилизатор задачи (1), (2) в метрике М;
3) приближения Js(u), д^(и), г = 1,..., s, удовлетворяют условиям (3);
4) параметры а(8), 6(о), е(8) таковы, что
а(8)>0, е(8)>0, 6(8) > 8, \im(a(8) +е(8) + 6(8)) = 0, (9)
Тогда точка us, определяемая методом (8), существует при всех 8>0 и
limJ(us) = Jt, llmo+(«,) = 0, 1 = 1,...., я, \imp(us,Ut)=0. (11)
О —> U О —>U О —> U
Пусть наряду с условиями 1)-4) еце выполнено условие
5) С/п = С/0, функция Щи) полунепрерывна снизу на U0,
limi±M^=0, limSJUo. (12)
Тогда кроме (11)
Hmfl(u,) = fl„ HmpK, CQ = 0, (13)
о —> и о —> и
где CI = inf £}(w), С/м = {и е [£: £}(w) = fi } —множество 0,-нормальных
решений задачи (1),(2). Пределы (11),(13) равномерны относительно
выбора Js(u), giS(u) из (3) и выбора точки us из (8).
Доказательство. Из (3), (7), (10), с учетом неравенства (1 +
+ Щи)У ^ (1 + Щи)) имеем
ts(u) ^ J(u) + а(8)Щи) - 8(1 + Щи)) ^
£ J, - |с|,(20(5)И1 + Щи)) + а(8)Щи) -8(1 + Щи)) =
= Jt + Щи)(а(8) -8- |с|,(20У) - 8 - 14(20(5^ ^
^Jt-8-\c\i(2e(8)Y>-oo VueW(8),
так что tSt = inf ts(u) > -оо и точка us из (8) существует при всех 8 > О по
W(S)
определению нижней грани. Далее с помощью условий (3), (7), (8) можем
написать следующую цепочку неравенств:
J(us) ^ J(us) + а(8)Щие) ^ Js(us) + а(8)Щие) + 8(1+ Щие)) =
= ts(us) + 8(1 + Щи,)) < tSt + е(8) + 8(1 + Щи,)) <
^ J(ut) + а(8)ЩЧ) + 8(1 + Щи,)) + е(8) + 8(1 + Щи,)) ^
^ J(us) + |С|,(20(5)Г(1 + Щи,)) + а(8)Щи>) +
+ 8(1+Щи>)) + е(8) + 8(1+Щив)) VuteUnt. (14)
§ 7. МЕТОДЫ РЕГУЛЯРИЗАЦИИ С РАСШИРЕНИЕМ МНОЖЕСТВА 665
Выделим второе и последнее звенья этой цепочки:
а(8)Щие) ^ |с|,(20(5)Г(1 + Щив)) + <*(8)Щщ) +
+ 5(1 + П(ч)) + е(8) + 8(\ + Щи,)).
Пользуясь произволом в выборе точки щ £ Unt, в полученном неравенстве
величину Щи^) можем заменить на Clt = inf Щи) и переписать его в виде
2S + \c\(2B(S)y (П ,. е(6)
Щив)^Щ + 1(8), 7W =" Т |cU2W + / > 5>0- (15)
1 1-?р1
Выделим первое и предпоследнее звенья цепочки неравенств (14). С учетом
уже доказанной оценки (15) получим
J(us)^J. + P(6),
Р(8) = а(8)Щ+8(1+Щ) + е(8) +8(1+Щ +4(8)), 6>0. К '
Кроме того, из (6), (15) имеем
ft+KK26»(ff)(l+fi. + 7(*)) = p(«), * = 1,..., я, 8>0. (17)
Заметим также, что из (5), (16), (17) следует
-\c\M6)Y < J («,) -К №), 6 > 0- (18)
Дальнейшее доказательство опирается на лемму 3.1 и проводится также,
как в теореме 4.1. Замечания 4.1-4.7 к теореме 4.1 с очевидными
изменениями сохраняют силу и здесь. □
В выпуклых задачах (1), (2) в банаховых пространствах возможно
использование слабых стабилизаторов. Справедлива
Теорема 2. Пусть
1) В —рефлексивное банахово пространство, U0 — выпуклое
замкнутое множество из В, функции J(u), д{(и), г = 1,..., т, \д{(и)\, г =
= т + 1,..., s, выпуклы и полунепрерывны снизу на U0; Jt > —оо, Ut ф 0,
выполнено условие (5) с 0 < v ^ 1;
2) функция Щи) полунепрерывна снизу, строго равномерно выпукла
на U0;
3) приближения Js(u), giS(u), г = 1,..., s, удовлетворяют условиям (3);
4) параметры а(8), е(8), 6(8) удовлетворяют условиям (9),(12).
Тогда семейство точек {us, 8 > 0}, определенное методом (8) таково,
что
llmJ(us) = Jt1 Hm &+(«,) = 0,. i = 1,..., а,
lim Jl(«c) = fit, lim 11¾ — vA\ =0,
edevt —точка минимума функции Щи) на множестве Ut. Пределы в (19)
равномерны относительно выбора Js(u), giS(u), г = 1,..., s, из (3) и
выбора точки us из (8).
Доказательство опирается на уже доказанные оценки (15)-( 18),
на лемму 3.2 и проводится так же, как в теореме 4.2. □
666
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
2. Метод невязки с расширением множества заключается в определении
точки us из условий
useV(6) = {ueW(S): Js(u)^7St + a(6)}, (20)
fl(tO<fl,. + /i(S), 5>0, (21)
где 7,,= ^(^)+^)+101,(20(^^
>0, /i(5)>0. Если величина JSt или ее оценка JS:t+a(6), характеризующие
множество V(5), заранее неизвестны, то предварительно нужно решить
задачу первого типа
7,(«) = Js(u) + 6Щи) + |с|,(20(5))"(1 + fi(«))" .->inf, и е W(6),
и лишь затем приступить к поиску точки us, как приближенного решения
задачи первого типа: Щи) —> lnf, и G V(5).
Теорема 3. Пусть выполнены условия 1)-3) теоремы 1 и пара-
метры cr(S), /i(5), 0(5) таковы, что
ст(5)>0, м(*)>0, 0(5) ><5, lim(<r(5) + ^(5) + 0(5)) = 0, (22)
5 —> О
sup/i(5)<oo, ff(3 + fij<<r(ff), 5>0, (23)
«>о
где fi„ = тШ(«). Тогда множество V(6), определенное согласно (20),
непусто при всех 5 > 0, семейство {us, 5 > 0} из (21) таково, что
lImJ(u,) = J„- Umo+(u,)=0, i = 1,..., я; lim o(u„ 17J = 0. (24)
£суш, кроме того, Un = U0, функция Щи) полунепрерывна снизу на U0,
lim /х(5) = 0, то наряду с (24) справедливы равенства
8 —*0
\im Щие) = Щ, \imo(us,Uj = 0, (25)
где и„ = {и е Ц,: Щи) = Щ = mi Щи)}. Пределы в (21), (25) равномерны
относительно выбора Js(u), gi5(u) из (3) и выбора точки us из (20), (21).
До казательство. Из (3), (7) имеем: J s(u) > J(u)j- 5(1 + Щи)) +
+ 5^(^) + 101,(20(5))^(1 + ^(^))^^-5 VueW(6), т. е. J„> -оо. Далее,
по определению Ut для любого е, 0< е ^ 1, найдется точка we е С/п+ сЩ{),
Щгие) < Ц, + е. Тогда с учетом (3), (7) получаем Js(we)j^ J(we) + 5(1 +
+ ft(™JKJ(u) + |c|,(20(5)r(l + ft(u))" +5(1+^+^./^) + 5(3 + ¾)
Vw G W(5). Отсюда и из (23) следует, что Js(we) < JSt + ст(5). Это значит,
что we е V(5), т. е. У(5)^0 V5 >0.' Тогда точка «, из (20), (21) существует
по определению нижней грани. Для любой точки и. с учетом включения
we G V(8) имеем: Щив) ^Щгие) + ц(6) ^Щ + е + ц(6) Ve, 0< е^ 1. Отсюда
при е —»0 получим
%)<fi, + 7(«), 7(*) = М(«), *>0. (26)
§ 7. МЕТОДЫ РЕГУЛЯРИЗАЦИИ С РАСШИРЕНИЕМ МНОЖЕСТВА 667
Далее, из (3), (20), (21), (26), we е V(S) следует:
J(us) < Js(us) + 5(1 + Щи,)) ^7St + а(6) + 5(1 + Щ + М(5)) <
<7 s(we)+ а(6) +6(1+ Щ+ ^(6))^
^ J(we) + 6Щгие) + |с|,(20(5))"(1 + Щгие)У +
+ 5(1 + Щгие)) + а(5) + 5(1 + Пф + м(5)) ^ Jt + 5(1 + 2Щ + 2е) +
+ |с|,(20(5))"(1 + А, + е)" + а(6) + 5(1 + Щ+^(6)).
При е —» 0 отсюда приходим к оценке
JKKJ,+ /?(*),
/3(5) = 5(2 + ЗЯ, + м(5)) + |с|,(20(5)И1+ЯГ + а(5), 5>0. l ;
Оценки (17), (18), где величина /3(8) взята из (27), остаются
справедливыми и для метода невязки. Дальнейшее доказательство опирается на лемму
3.1 и проводится также, как в теореме 4.1. □
Теорема 4. Пусть выполнены условия 1)_3) теоремы 2,
параметры а(6), /i(5), 0(5) удовлетворяют условиям (22),(23), Нт/х(5)=0.
Тогда для семейства точек {us, 5 >0}, определенных методом (20), (21),
справедливы утверждения теоремы 2.
Доказательство опирается на уже доказанные оценки (26), (27),
(17), на лемму 3.2 и проводится так же, как в теореме 4.1. □
3. Наконец, кратко остановимся на методе квазирешений с
расширением множества. Этот вариант метода квазирешений также применяется при
выполнении предположения (6.1), когда известно число г такое, что
U^ n Qr ф 0, Qr = {и е Un: Щи) < г}. (28)
Тогда Untf)Qr QQrS = {ue W(6): Щи)^ г} ф0 V5 > 0. Суть метода: ищется
точка us из условий:
««eQrf, JtK)^4 + f(«)r (29)
где Jh = inf Je(«), £(5) > 0 V5 > 0.
Теорема 5. Пусть выполнены условия 1)-3) теоремы 1 и
параметры £(5), 0(5) таковы, что
£(5)>0, 0(5) > 5, lim(£(5) + 0(5)) = 0. (30)
о ~»0
Тогда точка us, определяемая условиями (29), существует при всех
6 >0 и
[imJ(us) = Jt; Hm-^K) = 0, * = 1,..., а; ПтР(ие, Ut) = 0. (31)
Пределы в (31) равномерны относительно выбора Js(u), giS(u), г = 1,...
..., s, из (3) и выбора точек us из (29).
Доказательство. Из (3), (7) и неравенства £}(«) ^.r Уие QrS имеем
Js(u) ^ J (и) - 5(1 + Щи)) >Jt- |c|,(20(5))"(l + Щи)У - 5(1 + г) >
£ J, - |с|,(20(5)Г(1 + г)" - 5(1 + г) "• Vu е QrS.
668
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Следовательно, JSt > -оо и точка us из (29) существует по определению
нижней грани. Возьмем произвольные точки и5 из (29), ut е J7n„n Qr. Тогда
fl(u,K ^ + 7(^), 7(*) = »"-а V5>0. (32)
Кроме того с учетом (3), (29) получаем
J(us) < Js(us) + 5(1 + Щие)) ^ JSt + £(5) + 6(1 + г) <
^ J(4) + 6(1 + fi(4)) + ¢(.5) + 5(1 + г) < J, + /3(5),
/3(5) = ^(5) + 25(1+r) V5>0. (33)
Оценки (17), (18) с j(6) из (32), /3(5) из (33) справедливы и для
метода (29). Дальнейшее доказательство опирается на лемму 3.1 и проводится
так же, как в теореме 4.1. □
Требуемое в теоремах 1-5 условие 0(5) > 5 формально можно заменить
на 0(5) ^ 5, однако при 0(5) = 5, как было замечено в § 2, входящие в
методы регуляризации вспомогательные задачи первого типа могут оказаться
неустойчивыми. Другие модификаций методов регуляризации задач
минимизации второго типа, основанных на сочетании идей расширения
множества и методов покрытий, можно извлечь из работы [592], в которой
рассмотрены более сложные по сравнению с (1), (2) многокритериальные задачи
и устойчивые методы их решения.
4. Для иллюстрации вышеизложенного рассмотрим каноническую задачу
линейного программирования:
J (и) = (с, и) -> Inf, ueU = {и^0: Au = b} =
= {и>0:д{(и) = (а{,и}-Ъ*=0, * = 1,..., m}, (34)
где A = {a(j} — матрица размера т х n, ai = (ап,..., ain) — г-я строка этой
матрицы, b = (b\ ..., Ьту, с = (с\ ..., с")т, Предположим, что U^0, Jt>
> -оо; тогда Ц, ^0 (теорема 3.5.1). Пусть вместо точных aij} Ь-., cj известны
их приближения aijS, bj, cf такие, что,
K«-ayl < 5» \bs~bi\^s, N-^'l^5, г = 1,...,т; j=l,...,n. (35)
Положим тогда
Js(u)=(cs,u), ди(и)=(аи,и)-Ц, г' = 1,...,т; aiS=(ails,.. .,ainS). (36)
Поскольку и ^ О, то стабилизатором в этой задаче можно взять функцию
Щи) = «' + ... + ип. Погрешности задания входных данных J(u), д{(и)
согласованы с этим стабилизатором:
|J,(u)-J(u)|<ffMO(l + fi(u)), ,
\9ц(и) ~ 9i(u)\ < 6(1+Щи)), Уи^О, г = 1, ..., т.
Ограничимся здесь рассмотрением лишь приближений вида (36), хотя
условия (37), конечно, допускают и другие функции Js(u), giS(u), г = 1,.,., т.
Тогда расширенное множество W(6) может быть представлено в виде
W(6) = {и^0: - 0(5)(1 + „1 + ... + „») ^ (аи, и) - biS ^
^ 0(5)(1 +«' + ... + «"), г = 1,..., т}. (38)
§ 7. МЕТОДЫ РЕГУЛЯРИЗАЦИИ С РАСШИРЕНИЕМ МНОЖЕСТВА 669
Метод стабилизации сводится к задаче
ts(u) = (cs,u) + a(6)(ul + ... + un)-+]ni, ueW(S), (39)
которая, как нетрудно видеть, также является задачей линейного
программирования. Задачу (39) можно решать приближенно в смысле
неравенства (8). Пусть параметры а(6), в(6), е(6) удовлетворяют условиям (9)
и lim а(ё)Е = ®- Функи.ия Лагранжа задачи (34) имеет седловую
точку (теорема 3.5.5), поэтому эта задача имеет сильно согласованную
постановку, и неравенство (5) может быть записано в виде: Jt <^ (с, и) -+-
т
+ S l^.*ll(ai) и) ~ ^*'| Vй ^0- Таким образом, все условия теоремы 1 выпол-
j = 1
нены, и для точек us из (8), (39) справедливы все равенства (11), (13).
Нетрудно убедиться, что методы невязки и квазирешений для задачи (34)
приводят к задачам (20), (21) и (29) соответственно, являющиеся также
задачами линейного программирования. Более подробно методы
регуляризации для общей задачи линейного программирования рассмотрены в [179],
там же приведены оценки скорости сходимости методов, показано, что эти
оценки неулучшаемы по порядку на классе задач линейного
программирования и их порядок совпадает с порядком погрешности задания входных
данных. Интересно отметить, что в задачах линейного программирования
понятия устойчивости по функции и устойчивости по аргументу в
предположениях (35), (36) равносильны [179], поэтому в линейном
программировании нет большого смысла различать задачи первого и второго типов,
строить для них отдельные методы регуляризации.
Замечания 6.1-6.4 с очевидными уточнениями остаются справедливыми
и для методов регуляризации, рассмотренных в этом параграфе. Отметим
также, что методы (8), (21), (29) могут применяться, например, в тех
случаях, когда использование методов из §§ 4-6 затруднительно из-за возможной
овражности вспомогательных задач, связанной с наличием в этих методах
неограниченно возрастающего штрафного коэффициента.
Перейдем к изложению других методов регуляризации, которые
представляют собой сочетание метода стабилизации из § 4 и уже известных нам
методов минимизации из гл. 5, § 8.4.
Упражнения
1. Применить методы невязки и квазирешений к канонической задаче линейного
программирования (34).
2. Применить методы (8), (21), (29) к задачам из примеров 1.6-1.9.
§ 8. Регуляризованный метод проекции градиента
Методы решения неустойчивых задач второго типа можно также строить
на основе обычных методов минимизации, подвергнув их некоторой
процедуре регуляризации. Для построения регуляризованных методов часто
поступают следующим образом: в общей схеме конкретного метода миними-
670
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
зации вместо целевой функции используют функцию Тихонова. Так,
например, если в итерационный процесс градиентного метода uk + i =Щ—^к^'(ик)<
к = 0, 1,..., вместо J'(uk) формально подставить градиент функции
Тихонова Ts(u) = J(u) + a(6)\\u\f в точке ик, то придем к регуляризованному
градиентному методу
«* + i=«*-A(^'(«*) + 2a*«fc), ак = а(6к), к =0,1,,..,
в котором надо согласованно выбрать параметры а.кфк. Именно по этой
схеме мы дальше будем проводить регуляризацию метода проекции градиента,
условного градиента и некоторых других методов минимизации из гл. 5. Для
исследования возникающих здесь трудных проблем согласования
параметров исходного метода минимизации с параметрами, входящими в функцию
Тихонова, для доказательства сходимости получившегося метода мы будем
пользоваться принципом итеративной регуляризации из [62; 63].
1. Начнем с метода проекции градиента для задачи
J(u)-»Inf, иеЦ (1)
U = {иЕ U0: д{(и)^0, г = \,...,т; д{(и) = 0, г=т + 1,..., s}, (2)
где U0 — заданное выпуклое замкнутое множество из гильбертова
пространства Н (возможно, U0 = H), считая, что функции J (и), gf(u)
дифференцируемы по Фреше на U0 (определение 8.3.3). Ограничения типа равенств и
неравенств из (2) будем учитывать с помощью штрафной функции (5.15.8):
P(«) = £(9t(«)Y> иеи0, Р>1. (3)
«•=1
Тогда точная функция Тихонова
Tk(u)=J(u)+AkP(u)+ak\\u\\\ ueU0, Ак>0, ак>0, £=0,1,... (4)
при каждом к дифференцируема по Фреше на U0, причем ее градиент равен
Tk(u) = J'(u) + AkP'(u) + 2aku, и е U0, к =0,1,,.-. (5)
Пусть вместо точных значений градиентов J'(u), Р'(и) известны их
приближения J'k(u), Рк(и). Тогда в качестве приближения для точного значения
градиента (5) можем взять
t'k(u) = Jk(u) + AkPk\u) + 2aku, ueU0, fc =0,,1,... (6)
Рассмотрим итерационный метод
«*+1=*ЧК-/КК)), &>о, ^=0,1,..., (7)
где Vv(z) — проекция точки геЯна множество U0. Метод (7) будем
называть регуляризованным методом проекции градиента. Приведем условия
на задачу (1), (2), условия согласования параметров ah,Ak,(5h с
погрешностью задания производных J'(u), Р'(и), обеспечивающие сходимость
последовательности {ик}, порожденной методом (7), к нормальному решению
задачи (1), (2) в метрике Н.
§ 8. РЕГУЛЯРИЗОВАННЫЙ МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 671
Теорема 1. Пусть
1) U0 — выпуклое замкнутое множество из гильбертова
пространства Н, функции J (и), д^и), г = 1,..., s, дифференцируемы по Фреше на
U0, функции J(u), gt(u), i = 1,.. ., т, |&(«)|, г = т + 1,..., s, выпуклы на
U0; J* > —оо, Ut Ф оо и справедливы неравенства
\\J\u)- J'(v)f^L (J'(u)-J'(v), u-v) Vu,veU0,
\\P'(u)-P'(v)\\2^L(P'(u)-P'(v),u-v) \/u,veU0, {)
где L = const > 0; задача (1), (2) имеет сильно согласованную
постановку, т. е. выполняется неравенство
при некоторых ct ^ 0, v > 0; параметр р штрафной функции (3) таков,
что р > 1, р ^ v) 2) при каждом фиксированном и €.U0 и каждом k ^
^0 вместо точных J'(u), Р'(и) имеются их приближения J'k(u), Рк(и) с
погрешностями:
||^(«)-^'(«)11<М1 + И), К(«)-Р'(«)КМ1 + Н) (9)
VueU0, 8к >0, к=0, 1,...;
3) числовые последовательности {ак}, {Ак}, {/Зк}, {8к}
удовлетворяют условиям
ак>0, Ak+l>Ak>0, 6к>0, 0<pk^4akJ+LAk, £=0,1,..., (10)
lim (ак+6к)=0, 11m Ак=+оо, lim akAr =+оо (11)
к —* оо ft —»оо к—»оо
(при р = v > 1 последнее условие не нужно),
lim *»"а* + '=0. lim А* + '"А*=0, Jim g» + g»A»=0. (12)
ft -.оо <*£/% ft->oo <*£/% 1:-.00 afc
Тогда при любом начальном приближении щ€.и0 последовательность
{ик}, определяемая методом (7), такова, что
lim J(uk)=J(ut)=Jt, lim gf(uk)=0, t = l,...,e, lim ||ufc-nj|=0, (13)
ft —*oo ft —*oo ft—»00
где щ —нормальное решение задачи (1), (2). Сходимость в (13)
равномерная относительно выбора реализаций Jj.(u), Pk(u) из условия (9).
Замечание 1. Из условия (8) следует, что J (и), Р(и) — выпуклые
функции и их градиенты удовлетворяют условию Липшица:
\\J'(u)-J'(v)\\^L\\u-v\\, \\P'(u)-P'(v)\\^L\\u-v\\, Mu,veU (14)
(теорема 4.2.16, достаточность). Заметим, что теорема 4.2.16 остается
верной и в гильбертовом пространстве, если int Uo^0, J(u)e C2(U0).
Замечание 2. В качестве последовательностей (¾}. {Ak}, {/¾}.
{6к}, удовлетворяющих условиям (10)-(12), можно, например, взять
ак = а(к + 1)-°, Ак = (к + 1)А, 6„ = Ь(к + \)-\
2 _ (15)
672
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
где постоянные а>0, Ь>0, а>0, А>0, 7>0, а+А< min-f^; 7}. ol<A—~.
Доказательство теоремы 1. При сделанных
предположениях множества Ц Ut выпуклы, замкнуты, и сильно выпуклая £2(^) = 11^112
достигает нижней грани на Ut в единственной точке ut (теорема 8.2.10),
т. е. нормальное решение щ задачи (1), (2) существует и единственно.
Кроме того, функция Тк(и), определенная формулой (4), сильно выпукла на
выпуклом замкнутом множестве U0, поэтому условия
vkeU0, Tk(vk)=mlTk(u) (16)
однозначно определяют точку vk. Покажем, что
lim J(vk)=Jt, lim gt(vk) = 0, lim \\vh - щ\\ =0. (17)
к —* 00 k—ioo к —* oo
Воспользуемся теоремой 4.3. Положим
a(s) = ak> Ms) = Ak> us = vk yS, 6k^S <Sk + l, k=0,l,...
Из (10), (11) следует, что так определенные функции а(8), А(8)
удовлетворяют условиям (4.51), а для такой точки us в силу (4), (16) выполнены
условия (4.53). Отсюда и из теоремы 4.3 вытекают равенства (17); из (4.56)
следует оценка
и и ^» J (WP + Hr^) прир>ц
ll«*N^ = < V "hAr' (18)
l ||ч.|| ПРИ V = v > !•
Поскольку
11¾ -",1К IK-«J + 1К-Ч.11» fc = 0,1,..., (19)
тоиз(17), (19) следует, что для доказательства равенства lim |К — ч|| = 0
к ~> оо
достаточно установить, что lim \\ик — vk\\ = 0. Обозначим wk = \\ик — vk\\2.
к —юо
Справедливо элементарное неравенство
(a+b)^(l + akpk)a2 + (l + akpk)^-kb2 Va, b, ак>0, & > 0. (20)
Из (20) имеем
w! +1 = IK +1 - % + ill2 < (К + i-«*ll + 11¾ -«* + ill)2 <
<(l+afciSJ||«fc+1-«J|a+(l+afcA)A-||«fc-«fc+1||2, fc=0,i',... (21)
Сначала оценим слагаемое \\vk — vk + l\\2. Из (16) следует
(Tk\vk),u-vk)^0 VueU0, к =0,1,... (22)
(теорема 8.3.3). Взяв в (22) u = vk + l, получим
(ТкЫ,Ч + 1-%)>0, к =0,1,...
Аналогично имеем
{Ti+l(vk + l),vk-vk+ ,)^0, fc=0, lf...
§ 8. РЕГУЛЯРИЗОВАННЫЙ МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 673
Из сильной выпуклости функции (4) с постоянной сильной выпуклости
я= \i = 2ак и теоремы 4.3.3 следует, что
2аЛч ~ vk + if ^ (Tk(vk + i) ~ Шч), vk + i ~ %), к = 0,1,...
Сложим последние три неравенства:
^^k\\vh-vk + l\\2^(Tk\vk + l)-Tk + l(vk + l),vk + l-vk), к=0,1,... (23)
Из (5) и (23) получаем
2а*К - vk + iF < (Ah - Ak + l)(P'(vk + l), vk + l - vk) +
+ 2(ak-ak + l)(vk + l,vk + l-vk), к =0,1,... (24)
Зафиксируем произвольную точку й eU0. Тогда из (14), (18) имеем
||Р'К + 1)|| < L\\vh + l - й\\ + \\Р'(й)\\ ^L(R + \\й\\) + \\Р'(й)\\.
Отсюда и из (18), (24) вытекает оценка
\\4+-vkHl-^^R + ^^[L(R^n)^P'(u)\\], fc=0,l,... (25)
Перейдем к оценке величины ||«fc + 1 — vk\\ из первого слагаемого правой
части (21). Примем в (22) и = ик + 1, получим
<2;'К),«* + 1-«*>^0, fc=0, 1,... (26)
Далее, из (7) следует (теорема 4.4.1)
<«* + i-«* + A**(«*)»«-«* + i>^° V«eC/0, fc=0, 1,...
Отсюда при u = vk имеем
<«* +1 - «* + ft**(«*)i vk ~ «* +1) > °» к =0,1,.. .
Сложим это неравенство с неравенством (26), умноженным на /Зк > 0,
получим
(uk + l-uk,vk-uk + l) + Pk(t'k(uk)-Tk[(vk),vk-uk + l),ZO, fc =0,1,--- (27)
С учетом формул (5), (6) для Тк(и), t'k(u) перепишем (27) в виде
0 ^ (ик +, - ик, vk-uk+l}+ 2акРк(ик -vk,vk-uk + l) +
+ РкШик) ~ J'(vk), «* - «*+i> +
+ PkAk(Pk{uk)-P\vk),vk-uk + x), к =0,1,... (28)
Оценим каждое слагаемое из правой части (28). Для первого и второго
слагаемых имеем
(Ч+1-^»^-%+1>=з11^-"^112_з11^+1_^112_211^_^+1112' ^=°.1. • ■ • (29)
674
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Для оценки третьего и четвертого слагаемых воспользуемся неравенствами:
(J'(u) - J'(v), v-w)^^ \\и - w\\2,
(Р'(и) - P'(v), v-w)^\b \\u - w\\2 Vu, v,we U0,
вытекающими из условий (8) (теорема 4.2.16). Из первого неравенства (31)
при и = ик, v = vk, w = ик + 1 и условий (9), (14) следует
<^К)-^К).«*-«*+1>=<(^(«*)-^К))+(^К)-^К)). «*-«*+!><
^k(l+\\uk\\)\\vk-Uk+l\\+\L\\Uk-Uk+lf. (32)
С помощью элементарных неравенств \ab\ < а2 + -^Ъ2, (а+ Ь)2 ^ 2(а? + Ъ2) и
оценки (18) из (32) имеем
<J»K) - J'(vk), «* - «* + i> < \L \\uk - uk+xf + 6k\\uk + l - vk\\2 +
+ 5У«*-«Л2 + .5М1 + Д)2> fc = 0,l,... (33)
Рассуждая также с учетом второго неравенства (31), получаем оценку
(Pk(uk)-p'(vk)ivk-uk + i)^\L\\uk-uk + l\\2+6k\\uk+1-vk\\2 +
+ 2^11^-^112 + 2^(1+Л)2> *=0,1,... (34)
Подставим оценки (29), (30), (33), (34) в (28). После простых
преобразований будем иметь
\\uk + l-vk\\2(l+2akpk-2pk6k-2pk8kAk)^
^\\«н-ч\\2(1-2<*нРн + РЛ + РЛАн) +
+ ||«* + 1 - ^Il2(-1 + 2<*kPh + \l<Pk + \LpkAk) +
+ (ДА + ДЛЛ)(1 + Д)8. fc=0,l,... (35)
В силу условий (10)--(12) справедливы1 неравенства:
(36)
-\+2akPk+±Lpk+lLpkAk=-l+f(4ak+L+LAkH0, к =0,1,..
l+2ahph-2phSh-2phShAh=l+2ah^[l-^^)>l Vfc^,
где fcg — достаточно большой номер. Поэтому из (35) следует
\\ч+1-ч\\2<\\ч-ч\\2^-^кРк + РЛ + РЛАк) +
+ pk(6k + 6kAk)(l+R)2 Vfc^V (37)
Подставим оценки (25), (37) в (21). Получим
wk + l^(l-sk)wk + dk, Мк^Щ, (38)
§ 8. РЕГУЛЯРИЗОВАННЫЙ МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 675
где
sk = akpkh+2akpk-(l + akpk)^±^-}, (39)
dk = akpk(l + ^/3,)(^^(1 + Л)» +
ак
\^^Jl±Ur +
«*/»*
+ ^2/^^ + 11^11 + 11^(^)11)1)- (40)
С учетом условий (10)-(12), взяв при необходимости номер fcg из (36) еще
большим, можем считать, что
0<в»<1 Vfc>V ■ (41)
Кроме того,
0<Ak + l-Ak = Ak + l2-AkalPk<ak(3k Ук^к,.
акРк
N
Суммируя эти неравенства по к от 1% до N, получим, что J2 акРк^-^м + [~
- АК -> +оо при iV -> оо, т. е. ^ oik(3k = +оо. Как следует из (39), тогда
оо fc=0
X} s^ =+оо. Наконец, из условий (10)-(12) и выражений (39), (40) для
%T?dt вытекает, что lim -*- = 0. Отсюда и из (38), (41) с помощью леммы
к " fc->oo sk
2.6.6 имеем wk = \\uk — vk\\ —>0 при k —» оо. Тогда, как следует из (17),
(19), lim 11¾ — «J = 0. Отсюда и из непрерывности функций J(u), д+(и)
fc-юо
вытекают и остальные равенства (13). Так как величины sk, dk из (38)-(40)
не зависят от выбора реализаций Jk(u), Pk(u) из (9), то предел lim wk =0,
а также все пределы из (13) равномерны относительно этих реализаций.
Теорема 1 доказана. □
2. В практических задачах исходные данные как правило задаются с
какой-то фиксированной погрешностью. В частности, в рассматриваемой
задаче (1), (2) вместо условия (9), где {6к}-+0, практически более
реальным представляется следующее условие: при каждом фиксированном и е U0
вместо точного значения градиентов J'(u), Р'(и) известны их приближения
Jg(u), Рё(и) такие, что
\\Js(u)-J'(u)\\^S(l + \\u\\), \\P'(u)-P'(u)\\^6(l + \\u\\), ueU0, (42)
где 6 >0 — заданное число. Тогда в методе (7) приближения Jk(u), Рк(и)
естественно заменить на J's(u), Pg(u) и вместо t'k(u) из (6) использовать
t'k(u)=Js(u) + AkPs(u) + 2aku, к =0,1,... ■ (43)
Однако при фиксированном уровне погрешности 6 >0 условия (10)-(12)
согласованного изменения параметров {ак}, {Ак}, {/Зк} и {8к = 6}, к =
= 0,1,..., заведомо будут нарушены, и поэтому процесс (7), (43) может
расходиться. Возникает интересный вопрос: до какого разумного номера
676
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
к — к(6) следует продолжать итерационный процесс (7), (43), чтобы
получившуюся точку uk(s) = u(6) можно было принять в качестве приближения
щ, соответствующего погрешности 6 > 0? Оказывается, опираясь на
теорему 1, можно дать ответ на этот важный для практики вопрос.
А именно, зафиксируем какую-либо начальную точку Uq е U0 и
последовательности {ак}, {Ак}, {/¾.}. {Ah удовлетворяющие условиям (10)-( 12);
можем считать, что 60^ 6 (например, можно взять последовательности (15)
при 60 = Ь ^ S). Подчеркнем, что поскольку выполнение условия (9) теперь
не предполагается (вместо (9) у нас имеется лишь условие (42) с
фиксированным 6 > 0), то последовательность {6к} будем считать параметром
метода (7), (43) (наряду с другими параметрами ак,Ак,/Зк), напрямую не
связывая {6к} с каким-либо условием вида (9). Можно предложить
следующее простое правило останова процесса (7), (43): при каждом 6, 0< 6 ^ 60,
итерации нужно продолжать до такого наибольшего номера к = к(8), при
котором выполняются неравенства
6к>6, к=0,1,..,,к(6). (44)
Поскольку {6к} —> 0, 60 ^ 6, то при любом 6 > 0 такой номер к(8)
непременно существует. Обоснование сформулированного правила останова (44)
процесса (7), (43) дается в следующей теореме.
Теорема 2. Пусть выполнены все условия теоремы 1, кроме
условия (9) и приближения J's(u), Pg(u) для J'(u), Р'(и) удовлетворяют
условию (42). Пусть точки и^щ,.. .,uk(S) получены, методом (7),(43),
где номер k(6) определен в соответствии с правилом останова (44).
Тогда точка и(6) = ик,Ь) такова, что
\im J (u(8))=Jti lim (?+(«(5))=0, г = 1,., ., s, lim \\u(6)-ut\\=0, (45)
S —»0 5 —»0 S —»0
причем сходимость в (45) равномерная относительно выбора J's(u),
pfiu) из (42).
Доказательство. Из (42), (44) следует, что
\\J'(u) - J'(u)\\ ^ 5,(1 + Н|), HP» -P'(«)ll < Ml + HI) 46)
v«e f/0, fc=o, 1,..., k(S),
так что функции Jk(u) = J's(u), Pk(u) = Pg(u) удовлетворяют условию (9)
при всех k =0, 1,..., k(6). Далее, согласно правилу останова номер k(S)
является наибольшим номером, для которого выполнено условие (44).
Отсюда и из {6к} —»0 следует, что к(6) —» +оо при 6 —»0. Это значит, что при
всех малых 6 >0 номер к(6) в (46) можно сделать как угодно большим.
Согласно теореме 1 при выполнении всех ее условий, включая
условие (9), последовательность {щ}, получаемая методом (6), (7), сходится
в норме Н к нормальному решению щ, т. е. для любого числа е > 0
найдется номер N — N(e) такой, что
\\ик-и>\\^е Vk^N(e), (47)
причем номер N(e) не зависит от выбора реализаций J'k(u), Рк(и) из (9).
Так как lim к(6) — +оо, то существует число <5(е)>0 такое, что k(S)>N(e)
§ 8. РЕГУЛЯРИЗОВАННЫЙ МЕТОД ПРОЕКЦИИ ГРАДИЕНТА 677
при всех 8, 0 < 8 < 6(e). Это значит, что для всех 8, 0 < 8 < 8(e),
метод (7), (43), (44) порождает точки 2,, ..., zk(s), которые могут быть
получены также и методом (6), (7) с реализациями Х(и) = J's(u), Pl(u) = Р^(и),
к = 0, I,..., к(6), удовлетворяющими в силу (46) условию (9). Поскольку
к(6) > N(e), то можем воспользоваться неравенством (47) при к = к(8)
и утверждать, что \\икт — щ,\\ < е при всех 8, 0 < 8 < 6(e). В силу
произвольности е > 0 отсюда приходим к равенству lim \\uk(S) - ut\\ =0. Приняв
u(6) = uk,Sj, с учетом непрерывности функций J(u),P(u) получаем
равенства (45). Теорема 2 доказана. □
Равенства (45) оправдывают сформулированное выше правило
останова (44) процесса (7), (43) при фиксированном уровне погрешностей 8 > О
в (42). Тем самым построен оператор Rs, который каждому набору входных
данных (Jg(u), Ps(u), 8) из (42) ставит в соответствие точку uk(s) = и(8),
определяемую методом (7), (43), (44). Равенства (45) означают, что такой
оператор Rs является регуляризирующим (определение 6.1). Подчеркнем,
что в этом определении оператора Rs параметры ак, Ак, (Зк, 8к из (10)-(12)
и начальная точка и0 предполагаются фиксированными и не меняются от
изменения 8, 0 < 8 < 80.
Замечание 3. В методе (7) операцию проектирования можно
выполнять с погрешностью, определяя точку ик + 1 из условий
«* + i ^ 1¾. ipk(uk + l)^ini<pk(u) + e2k, ек>0, ^=0,1,..., (48)
где yk(u)=\\u-(uk-(3kt'k(uk))f. Тогда получим \\uk+x-VUo(uk-(3kt'k(uk))f ^
< V*K+i)-V*(?4K-&*iK))) < El (СР- с (5.2.8)). Для
последовательности {ик}, определяемой из (48), справедливы все утверждения теорем 1, 2,
нужно лишь к (10)-(12) добавить условия: limefc=0, lim —^- = 0.
3. Кратко остановимся на задаче
J (и) -»inf, и е Ц (49)
где U — выпуклое замкнутое множество из Н, известное точно (например,
U = Н). Регуляризованный метод проекции градиента (7) здесь имеет вид:
«* + 1=^К-/М;Ы), *;(«)= «£(«) + 2а*«, fc=0, 1,... (50)
Теорема 3. Пусть
1) U —выпуклое замкнутое множество из Н, функция J(u) выпукла
и дифференцируема по Фреше на U; J„ > —со, Ut Ф оо и справедливо
первое из неравенств (8) при U0 = U;
2) вместо точного градиента J'(u) известно его приближение Jk(u),
удовлетворяющее первому из неравенств (9);
3) числовые последовательности {otk}, {fik}, {8k} таковы, что
ak>0, 8k>0, 0<&<г^, £=0,1,..., \im(ak + 8k)=0,
£akpk=+oo, HmJ»^l=0, llmU
fcTo k^°° akPk k^coak
678
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Тогда при любом начальном приближении щ£ U последовательность
{ик}, определяемая методом (50) такова, что
lim J(uk)=Jt, \im \\uk-ut\\=0, (51)
К —i oo ft —* oo
где ut —нормальное решение задачи (49). Сходимость в (51) равномерна
относительно выбора реализаций Jk(u) из (9).
Д о к а з а т ел ьс т в о проводится по той же схеме, как и в теореме 1,
надо лишь учесть,что здесь m = s = 0, U0=U, Р(и) = 0, Ak = Q, R = \\ut\\.
Из'(23) вместо (25) здесь получаем: ||«fc + i —«fc|| < а h + l IK II- Равенство
lim 11¾ — ч|| = 0 следует из теоремы 4.4. Интересно отметить, что в отличие
от теоремы 1, где lim /3k=0, здесь lim /¾. = Т > 0. □
к ->оо к-юо ■"
Замечания ,1-3 и правило останова (44) сохраняют силу и для
метода (5Q).
Упражнения
1. Применить метод (50) к задаче минимизации квадратичного функционала J(u) = \\Au —
- Ь|||, при условиях (4.33).
2. Применить метод (7) или (50) к задачам из примеров 4.3-4.5, из упражнений 4.3-4.5.
3. Пусть {ак} — последовательность положительных чисел, ak^ak+l, fc = 0, 1,...,
lim — 9 + = 0. Доказать, что тогда J3 <*к = +оо.
fc->oo ак к = о
§ 9. Регуляризованный метод условного градиента
1. Будем рассматривать задачу
J(u)-Hnfj иеЦ
U = {ue U0: gt(u)^0, 4 = 1,..., m; &(u) = 0, г = m + 1, ..., s},
(1)
где U0 — выпуклое замкнутое ограниченное множество из гильбертова
пространства Н, функции J{u), g{(u) дифференцируемы по Фреше на U0. Для
описания и исследования регуляризованного метода условного градиента
будет удобнее взять функцию Тихонова в следующем виде:
Tk(u) = jkJ(u) + P(u) + %ak\\u\\2, Ъ>0, ак>0, и е U0,
3
где Р(и)= YK9i~(u)Y — штрафная функция множества U, р> 1. Если раз-
делить функцию Тк(и) на jk и обозначить Ак = —, то придем к функции
Тихонова из § 8. Пусть вместо точных функций J(u),P(u) и их
градиентов J'(u), Р'(ц) известны их приближения Jk(u), Рк(и), Jk(u), Рк(и), тогда
вместо функции Тк(и) и ее производной
Tk\u)=%J'(u) + P'(u) + 2lkaku, и е U0,
§ 9. РЕГУЛЯРИЗОВАННЫЙ МЕТОД УСЛОВНОГО ГРАДИЕНТА 679
будем иметь их приближения
**(«) = ъМи) + Рк(и) + 7¾¾ 1М12>
*'Ли) = 7*Л'(«) + рк(и) + 2Ъаки> fc = 0, 1,.. .
Подчеркнем, что здесь элементы Jk(u), Рк(и) е Н необязательно
являются производными функций J(u), Р(и), так как они могут быть получены
на практике в результате отдельных измерений, возможно, напрямую не
связанных с измерениями самих функций J (и), Р(и). По этой же причине
t'k(u)eH необязательно равна производной приближенной функции tk(u).
Пусть начальная точка г^ известна. Если fe-e приближение ик е U0 при
некотором к ^ О уже известно, то сначала определим вспомогательное
приближение йк из условий
йк е U0: (^(ик), йк - ик) ^ inf {t'k(uk), и-ик) + ек, ек >О, (2)
и в качестве следующего приближения возьмем точку
«* +1 = «* + &(«* - ^)> °■< Рь < !> (3.)
где число (Зк таково, что
^К-нКо^^К+№-«*))+**. **>0- С4)
Регуляризованный метод условного градиента для задачи (1) описан.
Нетрудно видеть, что метод (2)-(4) получен из одного из вариантов метода
условного градиента (§ 5.4) формальной заменой J(u), J'(u) на tk(u), t'k(u)
соответственно.
Теорема 1. Пусть выполнены условия:
1) U0 —выпуклое замкнутое ограниченное множество из
гильбертова пространства Н, функции J(u), д{(и), i = 1,..., т, |&,(■«)], г = т +
+1,..., s, выпуклы на U0; J(u), д{(и), г = 1,..., s, непрерывно
дифференцируемы по Фреше, U, ф оо, производные J'(u), Р'(и) удовлетворяют
условию Липшица:
\\J'(u) - J'(v)\\ <: L \\и - «||, ||Р'(«) - *"(«)ll < L \\и - v\\ " Vu, v е U0; (5)
задача (1) имеет сильно согласованную постановку, т. е.
4<Л«)+Ес*(а+(«))". «etf0> сг.>о, 1/>о,-
параметр р штрафной функции таков, что р ^ v, р > 1;
2) вместо точных J(u), Р(и), J'(u), Р'(и) известны их приближения
Jk(u), Pk(u), Jk(u), Р'(и) такие, что
\Jk(u)-J(u)\^Vk, \Pk(u)-P(U)\^Vk, ueu0,
H4(«W(«)II<£*> K(«)--P'(«)ll<e*. «etf0, fc = 0,l,...;
3) числовые последовательности {ak}, {jk}, {6k}, {ek}, {%}, {£k}
таковы, что
ak^ak+l>0, 7*£7»+i>0, **>0, ek>0, %>0, £k>0, fc=0,l,2, (7)
680
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Пт(ак + ъ + 6к + ек+7]к + £к) = 0, lim ак1к '- = +оо (8)
к —i оо к —* оо
(при р = и > I последнее условие не нужно),
оо
«*7*-«* + i7* + i<Pb(7*-7* + i). «fcTt^Cifc"", Е(^ + ^)<°о» (9)
ft=0
7*-7* + i + ** + e*+»7/b+'f/b<c2fc-a'„ /с = 1,2,...
0</1<р<1, с. = const > 0, г =0,1,2.
Тогда при любом выборе начальной точки щ е U0 последовательность
{ик}, определяемая методом (2)-(4) такова, что
lim J(uh)=J(ut)=Jt, lim gf(uk)=0, z = l,...,s, lim ||«fc-«J|=0, (11)
ft —»oo ft—»00 ft —* оо
где ut —нормальное решение задачи (1). Сходимость в (11)
равномерная относительно выбора реализаций Jk(u), Pk(u), Jk(u), Рк(и) из
условий (6). ,
Доказательство. При сделанных предположениях множество U
выпукло, замкнуто, ограничено, Jt > —оо, множество Ц, непусто,
выпукло, замкнуто, ограничено, нормальное решение ut задачи (1) существует и
единственно (теоремы 8.2.8, 8.2.10). Функция Тихонова сильно выпукла на
U0, поэтому условия
чеи0, Th(vk) = \niTh(U) (12)
°
однозначно определяют точку vk. В теореме 4.3 положим
a(s) = ak, Ms)=%\ us = 4, Sk^s<Sk + u к =0,1,...
Из (7), (8) следует, что такие функции а(6), А(6) удовлетворяют
условиям (4.51), а для точки us в силу (12) выполнены условия (4.53). Отсюда и
из теоремы 4.3 следует
lim J(«i)=J(4)=Jt) Hm ft+(«fc)=0, (=1,...,a; lim ||v4-4||=0. .(13)
ft —»oo ft —* oo ft —* oo
По условию множество U0 ограничено, так что
sup ||u|| ^ D < оо, sup ||« — t71| ^ d < оо. (14)
Отсюда, из (5), леммы 2.6.1 имеем: | J(u)\ ^ | J(w)\ + || J'(tu)||||« — w\\ +
+ lL\\u-w\\2^\J(w)\+d\\J'(w)\\ + lLd2, \P(u)\<:\P(w)\+d\\pi(w)\\ + iLd2
Уи e U0, где w — какая-либо фиксированная точка из U0. Следовательно,
sup|J(«)| = J**<oo, sup|P(u)| = P** <oo, '
sup|T,(«)|^C3<oo, к = 1,2,..., ^
u0
здесь и далее через с,., как и в (9), (10), обозначаются положительные
константы, не зависящие от и, к. Далее, из условий (6) следует, что
l*ftH-2;(«)|^% + 7ft%, l*i(«)-г»(«)|<^ + 7*е*
Vu<=U0, к=0, 1,...
§ 9. РЕГУЛЯРИЗОВАННЫЙ МЕТОД УСЛОВНОГО ГРАДИЕНТА 681
Из (9), (14), (15) получаем
|21(«)-rfc + 1(«)|^(7*-7* + i)|J(«)| + (7*«*-7* + i«* + i)HI2< (17)
В силу (5), (7) имеем
\\Tk\u)-Tk(v)\\^(%L+L+2lkak)\\u-v\\^c5\\u-v\\
(1о)
Vu,veU0, к =0, 1,...
Введем числовую последовательность
ak = Th(uk)-Tk(vk), к =0,1,...
и получим для нее некоторые рекуррентные неравенства. Имеем
%+.-V.K+i)-^+.K+.H2;+1k+1)-t,k+1))+(2;k+1)-t,k))+
+(rfcK)-rfc(«*))+(rfc(«fc)-rfc(«fc+1))+(rfc(«*+1)-rfc+1(«fc+1)).
Заметим, что третье слагаемое из правой части этого равенства есть ак,
четвертое слагаемое неположительно в силу (12), а первое и пятое слагаемое
можно оценить с помощью неравенства (17). Поэтому
0^ак + 1^2с4(Ъ-Ъ + 1) + ак+(Тк(ик + 1)-Тк(ик)), £ = 1,2,... (19)
Оценим последнее слагаемое из правой части (19). Из условия (4) и
неравенств (16) имеем
21К + |)- Т»К) < ttK + 1)-t4K) + 2(4» +¾¾) ^ ^ + 2(%+7*%)- (20)
Наряду с (20) нам далее понадобится также и более тонкая оценка. Для ее
получения сначала установим, что
\im(Tk(uk + l)-Tk(uk)) = 0, (21)
Нт (Г„'Ю, «*-«*>= 0. (22)
к —* оо
С учетом (17), (20) имеем
Тк + 1(ик + 1)^Тк(ик + 1) + с4(ъ-ъ + 1)^
^ 21 К) + Sh + 2(¾ + 7¾¾) + с4(7* - 7* + i)-
В силу (15) последовательность {Тк(ик)} ограничена сверху, а в силу (7),
(9) получим
оо оо
Е [** + 2(¾ + ЪЪ) + сЛъ - Ъ + i)] ^ % Е (sk + Vk) + с47о < оо-
fc=i fc=i
Отсюда и из (23) с помощью леммы 2.6.2 заключаем, что существует
конечный предел lim Тк(ик). Тогда lim [Тк(ик) - Тк + 1(ик + 1)] =0. Отсюда и
к —* оо к —>оо
из (8), (17) имеем
\Тк(щ + 1)-Тк(ик)\^\Тк(ик + 1)-Тк + 1(ик + 1)\ +
+ |з;+1к+1)-г»к)Н0при к-*оо
Равенство (21) установлено.
682
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Далее, с учетом (4), (14), (16), (18) получаем
21К + .)-^К)^4К+1)-^К) + % + и)$
^ **К + Р(йк - ик)) - tk(uk) + 6к + 2(¾ + Ъг]к) ^ Тк(ик +Р(Ък - ик)) -
- Тк(ик) + 8к + 4(¾ + 7,¾) = 1(Тк(ик + Щй„ - ик)), (1(Ък - uk))dt +
о
+ S„ +4(¾ + %Vk) = l(Tk'(uk), /3(¾ - uk))dt + \(Tk(uk + Щйк - ик)) -
о о
Тк\ик), (1(йк - uk))dt + 6к+ 4(¾ + 7,¾) ^
.d* + 6k+4(Vk + %r,
VA 0</J<l, /е=0,1,... (24)
^ WK), Щ - «*> + \Р2съ^ + 8к+ 4(¾ + 7,¾)
Из (24) следует неравенство
(ПЫ, йк - ик) > ^(Тк(ик+1) - Тк(ик)) - ipc5cZ2 -
-^(^+4(¾+ 7,¾)) VA0</J<1, fc=0,l,...
Переходя здесь к пределу сначала при к —»оо, затем при /3 —» +0, с учетом
уже доказанного равенства (21) получим
Ш_(Тк\щ),йк-ик)>0. (25)
к —* оо
С другой стороны, в силу условия (2) и неравенств (14), (16) имеем
<21'Ю» «* - «*) ^ <*iK). «* - «,) + (£* + lktk)d ^4 + (£* + 7,£,)cZ;
здесь учтено, что inf (t'k(uk), и — ик)<^ (t'k(uk), ик — ик) = 0. Отсюда и из (8)
следует, что ueU°
\[т(Тк\ик),йк-ик}^0.
к —*оо
Совмещая это неравенство с (25), приходим к равенству (22).
Далее, из выпуклости Тк(и) (теорема 4.2.2), из (2), (14), (16) имеем
О ^ ак = Тк(ик) - Тк(юк) <: (Тк(ик), ик - v„) ^ (fk(uk), ик - vk) +
+ (f* + %£k)d < -<**(«*), «* - «*> + Ч + (f* + 7*f*)d =¾
^ -<Гк'Ы, «* - ик) + ек+2(£к + %£h)d
или
ак-Ч-Щк+ъ£к)<1<-(Тк\ик),Ък-ик), fc=0,l,... (26)
Множество натуральных чисел разобьем на два класса:
10 = {к:ак>ек+ 2(th + %£k)d}, I, = {к: ак <: ек + 2(£к + %th)d}.
Пусть сначала к е 10. Тогда в силу (26) получаем 0 < —(Тк(ик), йк — ик) —
= \{Тк\ик),йк — ик)\, и из неравенства (24) имеем
Тк(ик+1)-Тк(ик) <:-Р\(Тк\ик),йк-щ)\+Х-^с^+8к+ЦПк+ЪПк) , .
уд о</?^1, Уке10.
§ 9. РЕГУЛЯРИЗОВАННЫЙ МЕТОД УСЛОВНОГО ГРАДИЕНТА 683
Заметим, что функция %(/3) = -(3\(Тк\ик), ик - щ)\ + ^Р2^2 достигает
на числовой оси своего минимума в точке (3kt = —72 [(2^(¾)) % — ик)\. В
силу (22) lim f3kt = 0. Поэтому, беря при необходимости постоянную с5 еще
к —* оо
большей, можем считать, что 0^ /3kt^l У к ^ 0. Полагая /3 = /3kt, из (27)
тогда получим
Шч+1)-ШчК-^\(Щик),щ-ик)\Чбк+Цчк+Ъчк) vfcei0. (28)
Так как в силу (15) 0 ^ ак $: 2с3 = с?, то из (26) для к е 10 имеем
\(Тк\ик), Щ - ик)\2 > (ак -eh- 2d(£k + lk^k)f >
> а\ - 2o,[2d(ih + ъ^к) + Ч] > <А ~ c&(eh + £„), к е 1„.
Подставив эту оценку в (28), получим
Tk(uk+l)-Tk(ukX-^di+^iek+^k)+Sk+4(Vk+lkVk), kel0.
Отсюда с учетом условия (10) из (19) имеем
0 < а* +1 < а* - 4-~^2 + ^(¾ + f* + 6к + Vk + Ъ ~ Ъ+1) <
^a.-al^+c^k-'^a.-al^+Ak-^, A=max{c10;c„}, kel0. (29)
Пусть теперь к elx. Тогда подставив в (19) оценку (20), с учетом (10)
получим
ак + 1^ак+с12(ъ-Ъ + 1 + 6к+Чк)^ак+с1зк~2''> к €/,. (30)
Кроме того, по определению I,
0^ак*:ек+2(£к + Ъ£к)с1*:смк-2» Vfcel,. (31)
Таким образом, последовательность {ак} удовлетворяет условиям (29)-
(31). Отсюда и из леммы 2.6.5 следует, что
0 < afc = Тк(ик) - Tk(vk) ^ с15к~», к = 1,2,...
Из (12), теоремы 8.2.10 тогда имеем
«* 7* К - vk¥ < Г*Ю - г*(«») = % ^ci5fc~"> к = 1,2,...
Отсюда с учетом второго неравенства (9) получим
\\4-%\\2^с1ьк-р~-^с16к-»+», к = 1,2,..., 0<м<Р<1. (32)
Из (13), (32) следуют все утверждения теоремы 1. □
684
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
В качестве последовательностей, удовлетворяющих условиям (7)-(10),
можно, например, взять
ak = ai(k+ {)-<*, ^ = 0,(^ + 1)-^, 5fc = ^(fc + l)-«,
ек=а,(к + \)-% %=a5(fc + l)-*, £к=а6(к + \уъ, fc=0,l,...
/33)
at>0, г = 1,...,6; 0<a<7^T, 7>0, a+1<lx<p<\/2, v
0<5<=1, 0<Xl^l, 2/э<тт{1 + 7;5;е;х1;х2}.
2. Сформулируем правило останова в методе (2)-(4) для случая, когда
уровень погрешности в задании исходных данных фиксирован. А именно,
пусть при каждом и е U0 вместо точных значений J(u), Р(и), J'(u), Р'(и)
известны их приближения Jv(u), Pv(u), J^(u), Р^(и) такие, что
\Jn(u)-j(u)\^v, |РЧ(«)-Р(«)|<Ч, иеи0,
|jf'(u)-j'(«)l<£> |Pf'(«) - Р'(«)| < f, иеи0, { >
где ту > 0, £ > 0 — фиксированные числа. Тогда в методе (2)-(4) можно
взять
**(«)=7*^(«)+^(«)+7*«*||«||а, t'h(u)=4hJi(u)+P;(u)+2>yhahu. (35)
Возникает вопрос: до какого разумного номера к=к(г], £) следует
продолжать процесс (2)-(4), (35), чтобы получившуюся точку «(ту, 0—ик(п,о мож"
но было принять в качестве приближения к нормальному решению ut
задачи (1)? Для ответа на этот вопрос зафиксируем какую-либо начальную
точку u0e.U0 и последовательности, удовлетворяющие условиям (7)-(10),
считая, что ту0^ту, £0^£ (например, можно взять последовательности (33)
при ад ^ ту, а6 > £). Рассмотрим следующее правило останова процесса (2)-
(4), (35): при каждом фиксированном ту, £, 0 < ту < ту0, 0 < £ < £0, итерации
будем продолжать до такого наибольшего номера к = к(т], £), при котором
выполняются неравенства
VkZV, tk>b fc = 0, 1,..., Цту,0- (36)
Теорема 2. Пусть выполнены все условия теоремы 1, кроме
условия (6); пусть выполнены условия (34). Пусть точки и^щ,.. .,ик, к =
= к(г], £), получены методом (2)-(4), (35), (36). Тогда точка и(6) = uk{S),
8 = (Vi О такова, что
limJ(u(*)) = J„ limo+(u(*)) = 0, z = l,...,S; Hm ||(u(*)-4||=0.
Й —>0 0 —>U fl ->u
Доказательство опирается на теорему 1 и проводится также, как и
аналогичная теорема 2 из § 8. □
Из теоремы 2 следует, что оператор Rs, который каждому набору
(«/,(«), -^(^), Jf («), Р((и), 8 = (Vi О) входных данных из (34) ставит в
соответствие точку и(6) = (ту, 0 = wfc(,,,£)' определяемую методом (2)-(4), (35),
(36), является регуляризирующим оператором задачи (1) в метрике Н
(определение 6.1).
§ 9. РЕГУЛЯРИЗОВАННЫЙ МЕТОД УСЛОВНОГО ГРАДИЕНТА 685
Упражнения
1. Для задачи: J (и) —>inf, и е U, считая, что множество U известно точно, описать регу-
ляризованный метод условного градиента, сформулировать и доказать аналоги теорем 1, 2.
2. Применить регуляризованный метод условного градиента к задаче минимизации
квадратичного функционала J(u)= Щи — Ь|||. при условиях (4.33) и к задачам из примеров 4.3-4.5,
из упражнений 4.3-4.5.
§ 10. Регуляризованный проксимальный метод
1. Рассмотрим задачу минимизации
J(u)->inf, иец (1)
где U — выпуклое замкнутое множество из некоторого гильбертова
пространства Н, функция J(u) выпукла и полунепрерывна снизу на U. Введем
функцию Тихонова
Tk(u) = J(u)+ak\\u\\2, ак>0, к =0,1,...
В качестве начальной возьмем какую-либо точку uQ^U. Пусть известно к-е
приближение ик е С/ при некотором к^О. Составим функцию
Фк(и) = ^\\и-ик\\2 + ркТк(и) (2)
и определим следующее приближение ик + 1 из условия
% + ,еЦ **K + i)= inf *»(«). (3)
U Е U
Нетрудно видеть, что метод (2), (3) получен из проксимального метода
(см. § 5.6) заменой целевой функции J (и) на функцию Тихонова Тк(и).
Так как функция Фк(и) сильно выпукла и полунепрерывна снизу на
выпуклом и замкнутом множестве U, то точка ик + 1 условием (3) определяется
однозначно (теорема 8.2.10).
Теорема 1. Пусть U — выпуклое замкнутое множество из
некоторого гильбертова пространства Н, функция J(u) выпукла и
полунепрерывна снизу на U; «/„>—оо, Ц,^0. Параметры ак, (Зк таковы, что
оо
а* > 0, Рь> 0, sup (3k < оо, £ akPh = +оо,
к ^0 к = 0 /Л\
11т а» = 0, llm i^=j2|td=0, llm -^- = % > 0.
Тогда последовательность {ик}, определяемая методом (2), (3) при
любом выборе UqE-U обладает свойством
llm J(uk) = Jt, Нт ||ttj-tij=0,- (5)
к —* оо к —* оо
где и^ —нормальное решение задачи (1).
686
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Доказательство. При сделанных предположениях нормальное
решение щ задачи (1) существует и определяется однозначно (теорема
8.2.10). Рассмотрим последовательность {vk}, определяемую условием
Ч£Ц Tk(vk) = MTk(u), fc =0,1,.., (6)
Согласно теореме 4.4
IKKKII, ^=0,1,..., WmJ(vk)=Jt, lim |K-uJ|=0. (7)
к —* oo к —* oo
Поскольку
К-чИК-^Н + К-чН. fc = o,i,..., (8)
то для доказательства теоремы остается доказать, что Фк = \\ик — vk\\ —>0
при к —»оо.
Убедимся, что величины шк удовлетворяют неравенствам
0<4 + i<(l-e*K + d», fc =0,1,..., (9)
где
,, = 1-(1+2«,А)-'/», 4 = (^^7)1/2|К1|. (Ю)
Заметим, что
Ч + 1 = ||«* + 1-«* + 1||<11** + 1-'«*11 + 11«*-«* + 1||» fc=o, 1,... (И)
Оценим сверху первое слагаемое из правой части неравенства (11). Так как
функция Тк(и) сильно выпукла с константой сильной выпуклости х=2ак >
> 0, то из (6) и теоремы 8.2.10 получаем
ак\\и - vk\\2 ^ Тк(и) -Tk(vk) Уи е U
В частности, при u = vh + l отсюда имеем
«*ll«*+i-«JI2<2;(«v+1)-rj(«jj.
Аналогично устанавливается неравенство
"fc + ilK-^fc + ill2^ Th + i(vh)- Th + i(vh + l).
Сложим два последних неравенства и получим
(ак + ak + l)\\vk - vh + l\\2 ^ (ак - a* + i)(jk + i||a - |k||2) ^
< 1¾ - Q;ft + ilmax{||^||2, lk + i|i2}-
Отсюда с учетом (7) имеем
1К-Чц.1||<(|а*1а* + 11У/2|Ы1. fc=0, 1,.,. (12)
II к fc + lll -~- ^ ak+ak + l J " *И> > > \ /
§ 10. РЕГУЛЯРИЗОВАННЫЙ ПРОКСИМАЛЬНЫЙ МЕТОД 687
Оценим второе слагаемое из правой части (11). Функция (2) сильно
выпукла с константой сильной выпуклости х= 1 +2акРк, то из (3) и теоремы
8.2.10 следует, что
(5 + «*A)ll«-«*+.illa<**(«)-**K + i) v«gk (13)
Положим в (13) u = vk. С учетом (6) имеем
(5 + «*А)||«к-«» + 1||а<Ф*К)-Ф*К + ,)<
^ \\W - ик\? - 5К + 1 - «J* + Рк(ТкМ - 21K + i)) < ^11¾ - uk\\2
или ,
ll^-^ + iH(1 + 2^^)~5ll^-^ll *=0,1,... (И)
Подставив оценки (12), (14) в (11), получаем неравенства (9) с величинами
8к, dh из (10). Из условий (4) и формул (10) для sk, dk вытекает, что 0 < sk <
< l< ilim ^k = l< S sk = +00, Hm -£ = 0. Тогда шк = \\vk - uJ.-> 0 при
к —» oo (лемма 2.6.6). Отсюда и из (7), (8) следуют равенства (5). Теорема
1 доказана. □
2. Теперь изложим регуляризованный проксимальный метод в
предположении, что вместо точных значений функции J(u) нам известны
приближения Jk(u), удовлетворяющие неравенству
\Jk(u)-J(u)\^6k(l + \\uf) МиеЦ 6к>0, к =0,1,... (15)
Пусть при некотором к ^ 0 известна точка zk е U. Введем функцию
%(«)=2||«-^|2 + /ШЫ + «,Н|2), «е^ (16)
Допустим, что приближенно решая задачу минимизации: <pk(u)—y'mi, ueU
каким-либо методом нам удалось определить точку zk + l из условия
Як + \£Ц %(^ + i)^inf%(«) + £fc, е*>°- (I7)
Теорема 2. Пусть выполнены условия теоремы 1,
неравенства (15), параметры ак, (Зк, 6к, ек положительны и наряду с (4)
удовлетворяют условиям
lim -^4-=0, lim -|Ц=0, lim -^-=с,>0, lim J*-=c,>0,
fc-.oo/%a£ к-,<х>/Зкак к-юо Pk+l fc-.oo dfc+l /jg\
lim-^- = c3>0, a^25„ fc=0,l,..., lim 5, = lim e, = 0.
Тогда последовательность {zk}, определяемая методом (16), (17) при
любом выборе начального приближения z0€.U, сходится в норме Н к
нормальному решению ut задачи (1), lim J(zk) = Jt, равномерно отно-
k —* 00
сительно выбора реализаций Jk(u) из (15), точек zk^x из (17).
688
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Доказательство. Из (15), (16), (18) имеем
где функция hk(u) сильно выпукла на U с константой сильной выпуклости
хк = 1 + 2/3,.(¾ — 5fc) ^ 1. Поэтому inf %(«) ^ Inf /ifc(«) > -оо и при
любом ек > 0 существует точка 2fc + 1, удовлетворяющая условиям (17). Пусть
{zk} — произвольная последовательность, полученная методом (16), (17)
при каком-угодно выборе функции Jk(u) из условия (15). Введем
вспомогательную последовательность {wk}, определяемую условием
щ+х^Ц V'bK+iHinfV'fcM, (19)
где фк(и)= 211^-^1^ + /3^(7(^) + ^11^112). Так как функция грк(и) сильно
выпукла на U с константой сильной выпуклости як = 1 + 2ак(Зк, то
условие (19) однозначно определяет точку wk + l, причем (теорема 8.2.10)
(i + a,/3,)||«-^ + 1||2^^(«)-A(% + i) V«G К (20)
Кроме того, к рассуждениям привлечем также последовательность {ик},
определяемую условиями (2), (3) при u0 = z0. Тогда
11¾ -ч1К 11¾ ~wk\\ + \\щ-ик\\ + 1К-Ч.Ц, А; =0,1,... (21)
В силу (5) 11¾ — ut\\ —» 0 при к —»оо. Остается убедиться, что первое и
второе слагаемые из правой части (21) также стремятся к нулю. С этой
целью положим в (20) и = ик +,, в (13) — и = wk +, и сложим получившиеся
неравенства:
(1+2ак^к)\\ик + 1-тк + 1\\2^грк(ик + 1)-грк(тк + 1)+Фк(гик+1)-Фк(ик + 1) =
= j(K+i - zk\\2 - IK+i - ч\\2 + IK+i - иЛ2 - IK+i - uk\\2) =
= (uk + l-wk + l,uk-zk), k=0, 1,...
Отсюда, пользуясь элементарными неравенствами \ab\ ^. 2-(а2+Ь2), (a+b)2 ^.
^. (1 + е)( а2 + — ), У а, Ь, е > 0, имеем .
(l+2a>kPk)\\uk+l-wk+l\\2 ^ 5||^+1-^+1||2+5(||^-%|| + |hfc-2fc||)2 ^
или
(22)
(l+4afc/3J||ufc+1-^+1||2^(l+o;fc^)(||^-^||2+^^||^-.^||2),
fc=0,l,...
Далее, из (20) при u = zk + l с учетом (15)-(17) получим
(J + akPk)\\zh + i - wh + i\\2 < V»*(«*+i) - A(Wk + i) <
< ¥>k(zk +i) - %K +1) + /W2 + lk + ill2 + ||«»* + ill2) ^
^ek+2^k6k+pkSk(2\\zk+-wk+l\\2^wk+l\\2)^sk+2pk6k +
+2/3,5,||^+1-^+1||2+6/3,5,||^+1-^+1||2+6/3,5,||^+1||2, fc=0, 1,... (23)
§ 10. РЕГУЛЯРИЗОВАННЫЙ ПРОКСИМАЛЬНЫЙ МЕТОД 689
Так как в силу теоремы 1 имеем lim \\ик — ut\\ =0, то sup ||w,|| = R < оо.
к->°° к>0
Тогда из неравенства (23) с учетом условия ак ^2<5, получим
\\zk+l-wkJ\2ask+4Pk6k(l+3R2)+l2pk6k\\^k+i-^+i\\2, £=0,1,...
или
H**-«'*lla<2efc_14-4/5fc_1ffJb_1(l4-3-J22)4-12/3Jb_1ffJb_1||«»fc-«fc||2, £=0,1,... (24)
Подставим оценку (24) в правую часть (22). Получим
(1+4^/3,)11^,-^,11^(1+^/3, + 12^,^,(1+^/3,)^-)11^-^114
+ (2е,_, + 4/?,_А_,(1+ЗД2))(1 + а,/?,)-^-, fc = l,2,...
Отсюда заключаем, что величина w, = \\ик — wk ||2 также удовлетворяет
неравенству (9), где
4--^1 + *А)(^ + *%^(1+3*')).*-1,2,
Из условий (4), (18) следует, что 0<s,^l для всех достаточно больших
оо
номеров к. Поскольку lim —^-=3, то из J2 ак[Зк=+оо вытекает, что
к -1 оо ак "к , _ 0
У) s,=+oo. Кроме того, lim -*•= lim ^Л-=0. Тогда w, = \\щ - wk\\2 -+0
, _ п к-*оо ак к-* оо икРк
при к -+ оо (лемма 2.6.6), а из (24) имеем \\zk - wk || —» 0 при к -+ оо. Поэтому
из (5), (21) получим
lim ||z, - ч11 = °» ,lim J(zk) = J*-
к —too к—*оо
Заметим, что сходимость здесь равномерная относительно выбора
реализаций Jk(u) из (15), точек zk + l из (17), так как величины ак,/Зк, 6к,ек в (9),
(10), (24), (25) от перечисленных реализаций не зависят. Таким образом,
теорема 2 доказана. П
В качестве последовательностей, удовлетворяющих условиям (4), (18),
можно, например, взять
/3,=1, ak=2c(k + l)-«, Sk=c(k + l)-s, eh=(k + l)-', к = 0,1,... (26)
где 6 > 0, е > 0, 0 < 2а < тт{8; е; 1}, о 0.
3. В практических задачах (1) более реальным, чем (15),
представляется следующее условие: при каждом фиксированном и eU вместо точного
значения J(u) может быть вычислено его приближение Js(u) такое, что
\Js(u)- J(u)|0(l + H|2), иеЦ (27)
690
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
где 6 >0 известное число. Тогда в методе (16), (17) приближение Jk(u)
естественно заменить на Js(u) и вместо функции ipk(u) из (16) пользоваться
функцией
Wb(«) = 511«-** II + &(^(«) + «*Н1а)» ueU> * =0,1,--- (28)
Сформулируем правило останова процесса (17), (28) в зависимости от
уровня погрешности 6 в (27). Будем считать, что зафиксированы какая-либо
начальная точка и параметры ак, (Зк, 8к,ек, удовлетворяющие условиям (4),
(18) (например, как в (26)) и пусть 8 < 60. Тогда процесс (17), (28) можно
продолжать до такого наибольшего номера к = к(6), при котором
выполняются неравенства
8к>8, к=0,\,...,к(6). (29)
Поскольку {Sk} —> 0, 60> 6, то такой номер к(6) непременно найдется.
Оправданием сформулированного правила останова (29) процесса (17), (28)
служит
Теорема 3. Пусть выполнены все условия теорем 1, 2, кроме
условия (15), пусть приближение Js(u) функции J(u) удовлетворяет
условию (27). Тогда точка u(8) = zk(S), полученная методом (17),(28),(29),
обладает свойством
lim J(u(S)) = J, \im\\u(6)-u.\\=0,
S-,0 x x . «-.0м x "
где ut— нормальное решение задачи .(1),.
Доказательство опирается на теорему 2 и проводится также, как
и аналогичная теорема 2 из § 8. □
Из теоремы 3 следует, что оператор Rs, который каждому набору
(Js(u), 6) входных данных из (27) ставит в соответствие точку u(8) = zk(S),
определяемую методом (17), (28), (29), является регуляризирующим
оператором задачи (1) в метрике Н (определение 6.1).
Заметим, что для задачи (1), когда множество U имеет вид (8.2^ и задано
с погрешностью, аналогичный регуляризованный проксимальный метод в
сочетании со штрафными функциями был исследован в [168]. Другие более
тонкие варианты регуляризованного проксимального метода, в которых для
решения задач вида (16) используются те или иные конкретные методы
минимизации, изучались в [799].
§ 11. Регуляризованный метод Ньютона
1. Рассмотрим задачу:
J(u)-Hnf, ueU = H, (1)
где Н — гильбертово пространство. Введем функцию Тихонова
Tk(u) = J(u) + ak\\u\\2,ueU.
Если J (и) е С\Н), то Tk(u) е С\Н), причем
Тк(и) = J'(u) + 2аки, Тк"(и) = J"(u) + 2ак1,
§11. РЕГУЛЯРИЗОВАННЫЙ МЕТОД НЬЮТОНА
691
где I — единичный оператор в Я. Применяя к-к шаг метода (5.10.8) к
функции Тк(и), получим регуляризованный метод Ньютона для задачи (1)
с точными данными
Ч + 1=ик-(Тк"(ик))^Тк'(ик), £=0,1,... (2)
Пусть вместо точных J'(u), J"(u) известны их приближения Jk(u) е Я,
Jk(u) е £(Я -> Я) такие, что
\\jk(u)-j'(u)\\^6lk(l+\\u\\), I|J*(«W(«)II<«2*. «ея, fc=o,l,...(3)
Подчеркнем, что в (3) не предполагается, что Jk(u) обязательно получен
непосредственным дифференцированием Jk(u) — здесь не исключается
возможность, что приближения Jk(u), Jk(u) найдены в результате
отдельных независимых вычислений или измерений. В качестве приближений для
Тк(и), Тк(и) возьмем
*;(«) = •£(«) +2а*«, t'k(u)=Jk(u) + 2akI, и е Я, fc=0,l,...
Пусть существует обратный оператор (tk(u))~l и известно его приближение
Dk(u)e £(Я -> Я) такое, что
\\Dk(u) -(fk(u))-11|< S3k, ueH, £=0,1,... (4)
Теперь вместо (2) можем рассмотреть метод
«* + 1 = «*-ДЮ**Ю» *=0, 1,... (5)
Теорема 1. Пусть
1) функция J (и) е С2(Н), выпукла на Я; Jt > -оо, Ц, ф 0, щ,
—нормальное решение задачи (1)
\\J\u)-J"(v)\\^L\\u-v\\ Vu,v€H, L= const > 0; (6)
2) приближения Jk(u), Jk(u) производных J'(u), J"(u) удовлетворяют
условию (3), а для обратного оператора (t'k(u))~l известно его
приближение Dk(u) с погрешностью (4);
3) параметры ак, 61к, 62к, 8зк таковы, что
ak>0, 1<^-<2, (ak-ak+l)\\uMDal D=n^, lim ак=0, (7)
5U>0, 0<в24<а», ^>0, lim (5,, + ^) = 0, (8)
ft —>оо
12(^,, + ^ + ^)^1-7, * = 0,1,..., (9)
где 7 —фиксированное число, 0 < 7 < 1 (например, 7 = 1/2).
■2 1
2>
^ = ^ + 2^ + ^3^(1 + ¾)
'(1 + а,^) + 2(1 + afc^)2(l + ^)]L(l + K||) +
2k - 2*1 L
+ ^(2L||^|| + ||J"K)||+2aJ,
692
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
сз, = %1 + ak63k)(2L\\ut\\ + || J"K)II) + 2«*)L(1 + |Ы|) +
2
+ 1^(1 + ak63kyL\l + \\4t\\)2,
^ = ^ +^ +«»^ + 5*1*^; (1°)
4) начальные и0, а0, 610 таковы, что
11^(^)11+2^11^11 + ^(1 + 11^11)^^¾2. (И)
Тогда последовательность {ик}, определяемая методом (5),
существует и
lim J(uk)=Jt, lim К-ч||=0, -(12)
причем сходимость равномерная относительно выбора реализаций
•£(«). Л"(«). Дь(«) "з (3), (4).
Доказательство. Из выпуклости функции J (и) е С2(Н) следует,
что (J"(u)£, 0^0 V«, £ е Д (теорема 4.2.5), поэтому
(ТЛ^К,О^2¾||£||2 vu,£etf, £=0,1,--- (13)
Это значит, что функция Тк(и) сильно выпукла на Н. Тогда существует,
притом единственная, точка vk^H такая, что (теорема 8.2.10)
Tk(vk) = \n[Tk(u), к =0,1,... (14)
Согласно теореме 4.4
IKNIkll. ^=0,1,..., lim J(vk) = J„ lim 11^-4.11=0.. (15)
к —»oo h —* оо
Кроме того, из (14) следует, что 2^(1^)=0. Отсюда и из сильной выпуклости
Тк(и) имеем (теорема 4.3.3)
2«Ju-«J? < (Tk(u)-Tk(vh), u-vk)=(Tk(u), u~vk) ^ \\rh(U)\\\\U-Vl
k\
ИЛИ j
ll«-«*ll<2^llrt(«)ll У«6Я, £=0,1,... (16)
Из условий теоремы вытекает
l|21»-r;(«)||<L||«-«|| Vu,veH, £=0,1,..., (17)
\\Tk(uyt'k(u)\\^6lk(\+\\u\\), цг;(«)-*;(«)||<^ Уиен, £=o,i,... (is)
С помощью индукции докажем, что при сделанных предположениях
метод (5) действительно определяет некоторую последовательность {ик},
причем справедлива оценка
ак = \\Щик)\\^Аа1 A = -$r, £=0,1,... (19)
Из (11), (18) следует
% = II Го'(«о)|| ^ |К(«о)|| + 510(1 + К||) ^ Aal
§11. РЕГУЛЯРИЗОВАННЫЙ МЕТОД НЬЮТОНА
693
Пусть при некотором к ^0 известна точка ик и верна оценка (19). В
силу (15), (16) имеем
1Ы1<11«*-«*Н + 1Ы1< 2а*а* + 1КН- (20)
Из (18), (20) вытекает
Н*;ы11<м1 + к11)+1|з;'к)||<
<*.*(! +5^¾+ lkll) + a*= (l + ^)a* +Ml + KID- (21)
Далее, из неравенств (13), (18) с учетом (8) получим
<*;(«К, о = <г;(«)е, о + <(*;(«) - г;(«ж, о ^
>2^||e||2-52A||e||2 = (2aA-52A)||e|r^a,||e||2 V£ G Я. (22)
Из неравенств (13), (22) следует существование обратных операторов
(Ть(и))~\ (tl(u))~l и оценка их норм (см. упражнение 8.3.27):
пгаи))-1'!!^, ii(*;(«))-4i<4:- <23)
Таким образом, имеет смысл говорить об операторе Dh(u), являющемся
приближением к (**(«))"' в смысле неравенства (4), и о точке ик + и
определяемой формулой (5).
Оценим ah + l = \\T^+l(uh + l)\\. С учетом формулы Т^(и)= J'(u)+ 2аки
имеем
а* + 1^||^+,К+1)-Т;К + 1)|| + ||Т;К + 1)К 4
<||31'К + 1)||+2(а4-а4 + 1Ж + 1||.
Но в силу (15), (16)
lk+ill < lk+i - «J + Ikll < щ;\\Шик+1)\\ + Ikll- (25)
Подставим оценку (25) в (24). С учетом условий (7) получим
^+1^II^K+.)ll(l+^^)+2(^-^+0ll4N3||T^+1)||+2D^(26)
Для оценки ||3i'(«fc + i)|| воспользуемся равенством
2ГК + 1) = Т'(и„) + \ Тк"(ик + в(ик + 1 - ик))(ик + 1 - ик)йв =
= т:(ик){[(т:(ик))-1-(г'к(ик)Г]Тк(ик) +
+(*;(«*»-'№*) - *;к>]+[(*;(«*»-' - Dh(uk)]tk(uk)}+
+ \[T:(uh)-T:(uh + e(uk + l-uh))]Dh(uh)t'h(Uh)de (27)
о
(определение интеграла от функций со значениями в Н и формулу
Ньютона— Лейбница для них см. в [393; 557]).
694
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
С учетом оценок (18), (23) имеем
11(г;(«^)-1ч*;К))-1|| = ||г;к)-1(*;к)-г;к))(*;к))-1||<|^. (28)
Далее, из (4), (23) следует
цл*к)н < |1(*;к))-1и + s3h < ^(l + *лку (29)
Кроме того, с учетом (15)-(17) получаем
Ц2ГЮ11 < 1|г;ю - т;к)|| + ||г;(ч)|| <lk - ч|| + ||г;юц <
^ ь\\ик -vh\\ + L\\vh -чц + ||г;к)|| <
< 2^¾ + 2L ||«J + || J"(4)ll + 2ак. (30)
Пользуясь (4), (5), (17), (18), (20), (21), (23), (28)-(30), из (27) имеем
1|гл«*+1)И||г;(«^||(^а, + ^(1 + к||) + ^^|«;к)||) +
хЙа* + ^(1 + 25Га* + 1Н1) + М(1 + ^)«* + *.*М1 + 1к11)] +
+ {L -L(l + ак63кГ[{\ + ^)¾ + *u(l + HI)]2-
Перемножим выражения в квадратных скобках и получившийся
результат расположим по степеням сгк,ак,а°к. С использованием обозначений
ci* > с** > °зк > Ъ из (10) бУАем иметь
lr*'(«* + i)ll<iL ^ + ^^4 + 0^ + ^¾
2"
(31)
Поскольку clk = с2к = сЗА, =0 при <51А. = 62к = 63к =0, то первое слагаемое в
правой части (31), не зависящее от 8ik, представляет собой главный член в
этой оценке и поэтому выделен отдельно. Подставим оценку (31) в (26). С
учетом индуктивного предположения (19) получим
% + i ^ 3 (j^L ^ + L ^clk + ahC2k + ^¾2¾) + 2Da2k ^
^ §(L А2а2 + 2Da2) + 3(ЬА2а2с1к + Aafc, + jja2c3k):
^ A ak + (;
= Aa'A^) [{32LA + 2-§-)+3(LAclk+c2h + ^Ic3k)
здесь мы учли, что ®к ^2 в силу (7), \ьА + -д- = ^ по определению A, D
из (7), (19), a 3(LAclk +^ + ^¾¾) ^ 3(йс1* + ^ + 7¾) ^ "Г1 в СИЛУ
условия (9). Индуктивные рассуждения закончены, оценка (19) доказана.
§11. РЕГУЛЯРИЗОВАННЫИ МЕТОД НЬЮТОНА
695
Наконец, из неравенства (16) при и = ик с помощью оценки (19) имеем
\\uk-vk\\^2Z~hak^2^A<x2k = 5A<Xk> к =0,1,..., (32)
так что lim \\uh—vk\\ =0. Отсюда и из (15) следуют равенства (12). Заметим,
к —* оо
что правая часть оценки (32) не зависит от выбора реализаций Jk(u), Jk(u),
Dk(uk) из (3), (4). Это значит, что пределы (12) равномерны относительно
выбора указанных реализаций. Теорема 1 доказана. □
Замечание 1. Покажем, что последовательности {ак}, {8lk}, {S2k\,
{63к}, удовлетворяющие условиям (7)-(9) существуют. В качестве {ак},
например, можно взять
ah = (fc + l)a' ^=0)^---) 0<а^1, а>0. (33)
Тогда 1< ^=(l + ^)\2е <2. ДалееJ|4||(^^) = ^a(fc +
+ 1 + ву3~а ^ 2^-а ^ )о^ ■ если число а взять достаточно большим. Как
видно из формул (10), условия (8), (9) заведомо будут выполнены, если при
каждом к ^0 числа 81к, 82к, 83к взять достаточно малыми. Более того, при
любом выборе начального приближения щ, взяв в (33) число а достаточно
большим, нетрудно добиться выполнения неравенства (11). Это означает,
что регуляризованныи метод Ньютона свободен от известного недостатка
обычного метода Ньютона (см. § 5.10), требующего выбора хорошего
начального приближения, расширяет возможности этого метода. При выборе
параметров метода (5) в условиях (7)-(10) вместо трудновычисляемых
величин \\ut\\, || J"(m*)|| можно пользоваться их оценками
|К|| ^ d, \\J"(ut)\\ <= L||4 - w\\ + \\J"(w)\\ ^ L(d + \\w\\)+\\J\w)\\, (34)
где w — произвольная точка из Н, например, w = 0. Теорема 1 и ее
доказательство полностью сохраняются, если в них величины \\щ\\, ||^"(w*)ll
заменить их оценками (34).
2. В практических задачах (1) более реальной, чем (3), представляется
следующая ситуация, когда вместо точных J'(u), J"(u) известны
приближения Jg(u), Js(u), для которых
||j;(u)-J'(«)llO,(l + IN), ||.£(«)-«П«)11<«2 V«G Я, (35)
где 6Х, 62 — известные положительные числа. Тогда в методе (4), (5) можно
взять
t'k(u)=J^u) + 2aku, t'k(u) = Js(u) + 2akI. (36)
Сформулируем правило останова процесса (4), (5), (36) в зависимости от
уровня погрешностей 6и 62 в (35). Будем считать, что зафиксированы какие-
либо начальная точка uQ и параметры ак, 61к, 62к, 63к, удовлетворяющие
условиям (7)-(11), и пусть
Тогда процесс (4), (5), (36) можно продолжить до такого наибольшего
номера к = к(6), при котором выполняются неравенства
Slk>S{i 82к>62, fc=0, 1,..., k(S). (38)
696
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Поскольку {Slk} —>0, {S2k} —>0 по условию, и выполнены неравенства <510 ^
^ 5,, 520 ^ й2, то такой номер к(6) обязательно найдется. Обоснованием
правила останова (38) процесса (4), (5), (36) служит
Теорема 2. Пусть выполнены все условия теоремы 1,
кроме условия (3), пусть приближения J's(u), J's(u) для J'(u), J"(u)
удовлетворяют условию (35). Тогда точка u(6) = uk(S), полученная
методом (4), (5), (36), (38), обладает свойством
lim J(u(6)) = J, lim\\u(6) — uA\=0,
S-,0 x x " s->o" "
где ut —нормальное решение задачи (1).
Доказательство опирается на теорему 1 и проводится также, как
и аналогичная теорема 2 из § 8. □
Замечание 2. Покажем, что при любых 6{ > 0, (¾ > 0 из (35)
можно выбрать параметры а^., 6lk, 62k, 63k, удовлетворяющие всем
условиям (7)-(9), (11), (37), причем можно сделать так, что S3k = 63 для всех
к =0, 1,... Ограничимся рассмотрением последовательности {ак},
определенной согласно (33). Введем функцию <р(а, <5Р 82, 63), которая получена из
левой части неравенства (9) при ак = а, 81к = 6Х, 62к = 62, 63к = 63, т. е.
¥>(«*» sik, 82к, 63к)= 12(^c1Jk + ¾ + уСдЛ Зафиксируем любые 510) 620 из
условий (37). Заметим, что </?( о;, <510) 52о, (¾) —► 0 при а —► оо, <53 —* 0, ^¾ —* 0.
Поэтому можем зафиксировать а = а0 = а столь большим, а 53о столь малым,
чтобы выполнялись условия (7), (11), 0< 620 ^ а, и, кроме того,
у(«о> <V 520! &ю) < —J1- (39)
Таким образом, условие (9) при к = 0 выполнено. Далее заметим, что
при любых фиксированных а > 0, <53 > 0 функция р(а, 5,, 52, <53)
монотонно растет по каждой переменной 5, > 0, 52 > 0, а функция р(а,0, 0, <53) =
= 12( ^а63 + g(l + ^¾)2 ~~ 2 7 монотонно растет по а при каждом
фиксированном 63 > 0. Отсюда и из (39) имеем
<р(ак,0, 0, <530) ^ v>(a0 = а, 0,0, 630) ^ <р(а, <510, <520, 830) ^ 5(1 - 7К (40)
Далее, фиксируя а = ак, 63 = 630 > 0 и учитывая, что ^(¾) 6{, 62, 6Ж) —
(р(ак,0, 0, S30)—» 0 при (5И <52) —>0, при каждом fc ^ 1 выберем 61к, 62к столь
малыми, чтобы
Отсюда и из (40) следует, что
¥>(«*> V 52*,» 5зоК ! -7,
т. е. условие (9) выполняется. Тем самым доказано, что параметры
%i ^1*> ^2*> ^з* = ^30- & =0, 1,..., с требуемыми свойствами (7)-(9), (11),
(37) существуют. Следует, конечно, оговориться, что приведенные выше
рассуждения относительно выбора параметров метода (5), (36), (38) на
практике реализовать можно, лишь имея оценки (34) и оценку постоянной
L из (6). Но даже при отсутствии этих оценок мы можем быть уверены
в том, что для широких классов задач (1) «хорошие» параметры метода
Существуют и их имеет смысл искать, опираясь на эвристические и иные
соображения, на численный эксперимент.
§11. РЕГУЛЯРИЗОВАННЫИ МЕТОД НЬЮТОНА
697
Заметим, что для задачи (1), когда множество U имеет вид (8.2), U0 = Н,
и задано с погрешностью, аналогичный регуляризованныи метод Ньютона
в сочетании со штрафными функциями исследовался в [158].
§ 12. Регуляризованныи непрерывный метод проекции градиента
1. Рассмотрим задачу
J(u)->inf, иеЦ (1)
где U — выпуклое замкнутое множество из гильбертова пространства Н,
функция J(u) определена и дифференцируема по Фреше на Н. Введем
функцию Тихонова
Т(и, t) = j(«) + ja(t)||«||2, a(t)>0, t^O, иеН, (2)
которая также будет дифференцируемой по Фреше, и ее градиент равен
T'(u,t) = J'(u) + a(t)u, иеН.
Будем предполагать, что множество U известно точно, а вместо градиента
J (и) известно его приближение J'(u, t), зависящее от параметра t ^ 0 и
удовлетворяющее неравенству
\\J'(u,t)-J'(u)\\^6(t)(l + \\u\\), 6(t)>0, О 0, иеН. (3)
Пусть u = u(t), t ^0 — траектория дифференциального уравнения
uHt^VuiuityPiWiu^+aWuitW-uit), t > 0; «(0)=«,,, (4)
где Uq — произвольная фиксированная точка из Н, V^z) — проекция точ-
ки z£H на множество и, производная u'(t) = hm -* д| *-*, где
сходимость понимается в норме Н. Далее нас будет интересовать
поведение траектории системы (4) при t —> do. Регуляризованныи непрерывный
метод проекции градиента описан. Нетрудно видеть, что метод (4) получен
из метода (5.2.34) формальной заменой градиента J'(u) на приближенное
значение градиента функции (2).
Теорема 1. Пусть
1) U —выпуклое замкнутое мноокество из Н, функция J (и) выпукла
на Н; J(u) е Cl(H), Jt > -оо, Ц, Ф 0, справедливо неравенство
\\J'(u)-J'(v)\\2^L(J'(u)-J'(v),u-v) Vu,v<=H; L = const > 0; (5)
2) приближение J'(и, t) градиента J'(u) непрерывно no и при всех
t ^ 0, измеримо по t при всех и е Н (об измеримых функциях со
значениями из Н см., например, [557; 357]) и удовлетворяет условию (3);
3) параметры a(t),fi(t), S(t) метода (4) таковы, что
a(t),/3(t)eCl[0,+oo), 6(t)eC[0,+oo), a(t) выпукла на [0, +оо),
a(.t)>0, jS(t)>0, S(t)>0, a'(*K0, /J'(t)<0 Vt>0,
8|g + 2a(0)/3(0)^l, (1 + L )(/3(0)+ 4/3(0)5(4))^3 Vt^O, (6)
llm(a(t) + 0(t) + X&+ И«)1 ■ l/?'(«)l )=0
698
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
Тогда
lim J(u(t))=J„ Нт(|И*)-«,|| + |И*)11) = 0, (7)
t —i оо i —юо
где u(t) — решение задачи Коши (4), щ — нормальное решение
задачи^), причем сходимость в (7) равномерная относительно выбора
реализаций J'(u, t) из (3).
В качестве функций a(t), /3(t), 6(t), удовлетворяющих условиям (6),
можно, например, взять
а(*)=а,(1 + *)-1/8, P(t) = ai(l + t)-l'i, 5(*) = а3(1 + *)"'. *^°> (8)
где а( > 0, (¾ > 0, а3 > 0, 8— + 2^¾ ^ 1, ^а^^ + (1 + L)^ ^ 3.
Доказательство. Из условий теоремы следует, что функция
f(u, t) = Vu{u — /3(t)(J'(u, t) + a(t)u)) — и измерима no t при всех и е. Н
и непрерывна по и на Н для всех t ^ 0, ||/(«, £)|| ^ Cq(1 + ||«||). Отсюда
следует, что задача Коши (4) при любом начальном условии щеЕп имеет
хотя бы одно решение, определенное при всех t, 0 ^ t < оо [132; 208]. Так
как функция Т(и, т) сильно выпукла на U, то найдется единственная точка
v(t) такая, что
v(r)eU, r(«(T),T) = Infr(«,T), т^О, (9)
(теорема 8.2.10). Положим т = j, ts(u) = Т(и, jj, S > 0. Тогда точка us =
= v(j), 6 >0, является решением задачи
ts(u) = J(u) + a(j)\\u\\2-+'m[, иеЦ
так как ts(us)= t(v(j),j) = T(v(t),t) = M T(u, r) = inf ts(u). Посколь-
ку a (j J > 0, lim a (j J = 0, то из теоремы 4.4 имеем
1ИТ)Н = 1Ы1<1Ы1 Vt>0, lim J(v(t))= lim J{us) = Jt,
т"°^ „ (10)
lim \\v(t) - uA\ = lim \\us - ut\\ =0.
t—* oo S —»0
Далее, из условия (9) следует (теорема 8.3.3):
(Г'(«(т),т),«-«(т))=(J\v(t))+ol(t)v(t),v-v(t))^0 VweLJ Vt^O. (И)
Из свойства оператора проектирования (неравенство (4.4.1)) с учетом (4)
имеем:
(«/(t)+j8(t)(J'(«(t),t)+a(t)«(t),t«-«/(*)-«(*)>^0 VwG£( t^O. (12)
В неравенстве (11) положим г> = «'(£) + «(£) G С/, умножим его на (3{t) и
сложим с (12) при w = v(t) е С/. После простых преобразований получим
\\u'(t)\\2 + (l + a(t)P(t))(u'(t),u(t)-v(T)) + a(t)P(t)\\u(t)-v(r)\\2^
^ P(t)((J'.(u(t), t) - J'(u(t))) + (J'(«(*)) - J'Wt))) +
+ (а(*)'-а(т))«(т),«(т)-«(*)-«<(*)> Vt,r^0. (13)
§ 12. РЕГУЛЯРИЗОВАННЫЙ НЕПРЕРЫВНЫЙ МЕТОД
699
Из условия (5) следует, что (J'(u(t)) — J'(v(t)), v(t) — u(t) — u'(t)) ^.
^. -^L\\u'(t)\\2 (теорема 4.2.16). Учитывая это неравенство и условие (3),
из (13) имеем
\\U'(t)\\2 + (l + a(t)P(t))(u'(t),u(t)-v(r)) + a(t)P(t)\\u(t)-v(r)\\^
^ lL/3(t)||«'(*)ll2 + №)S(W + И*)Н)(1И*)11 + N*) - «ООН) +
+ P(t)\a(t)-a(r)\\\v(r)\\(\\u'(t)\\ + \\u(t)-v(r)\\) Vt,r>0. (14)
Пользуясь элементарными неравенствами |ab| ^ gea2 +^Ь2, (а+Ь)2^2а2 +
+ 2Ь2 У а, Ъ, е>0, и, учитывая, что ||«(т)|| < ||«J, a(0)^a(i)>0 Vt ^0,
получим:
(1 + ||«<*)||)(||«'<*)|| + КО) - «<т)||> < (1 + ||«(т)|| + И*) - «(т)||) X
х (|и*)Н +КО) - «ООН) = 0 + КО)||)(|И*)П + КО) - «ООН) +
+ \\u(t) - «(т)||||«'(*)11 + КО) - «ООН2 < (1 + К(т)||)2 + ±(K0)ll +
+ ||«0) - u(t)||)2 + J||«'0)ll2 + jll«0) - «ИИ2 + IN*) - «ООН2 <
< О + KID2 + K'0)ll2 + 2||«(t) - «ООН2 Vt, т ^ 0;
|a(t) - a(r)| ||«(t)||(||«'(*)II + IN*) ~ «(^)ll) <
^ |a(t) - a(T)|||4||||«'(t)|| + \a(t) - а(т)|К||||«(*) - v(r)\\ ^
£ |a(t) - a(T)H|4||* + £||«'(*)||2 + |a(t)a^"(T)|2|l4l|2 +
+ Ja(*)||u(t) - u(t)||2 £ |a(t) - a(T)HK||*l±^ +
+ гК(*)112 + г«(*)Н*)-"(т)Н2 v*,t^o.
Подставим эти оценки в правую часть (14). После простых преобразований
будем иметь
J(l + a(t)iS(t))^||«(t)-«(T)ir + (l-iS(t)ff(t)-J(L + l))8(t))||«'(*)l|2 +
+ a(t)P(t)(l-^$)\\U(t)-v(T)\\^(l + \\ut\\yP(t)6(t) +
+ /?0)Н%"(т)Г К1Г0 + "(О)) < ct &(*■ т) V*,t^0, (15)
где с, = тах{(1 + |К||2; (1 + а(0))||ч||2}.
b(t,r) = /3(t)5(t)+fg|a(t)-«(r)|2, t,T^0. (16)
Умножим неравенство (15) на функцию /x(i) = expf J а(в)(3(в)<М)\ >0 и
700
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
проинтегрируем на отрезке [0, t]. Первый интеграл преобразуем по частям.
Получим
1(1 + a(t)P(t))\\u(t) - «(т)||2М(*) + JO - 0(8)6(8) - \(L + 1) x
X
P(s)Ms)\\u>(s)\\2ds + \[a(a)P(a)(l - 2|g)M(e)
1 d
i^((l -h а(8)(3(8))ц(8Щи(8) - v(t)\\4s ^ c, I b(8, r)Li(s)ds + (¾.
c2 = I(l + a(0)/3(0))(|K|| + ||«J|)2. (17)
Из условий (6) вытекает, что подынтегральные функции в левой части
неравенства (17) неотрицательны, поэтому из (17) следует
i(l + a(t)P(t))n(t)\\u(t) - v(t)\\2 ^ с, \ b(s, r)ii(s)ds + с, Щ,т £ 0.
о
Полагая т = t, отсюда имеем
i(l + a(i)/3(*))M(*)|H*)-u(*)||2^cJb(MMs)^ + C2 Vt^Q. (18)
о
Так как функция a(t) выпукла и монотонно убывает, то
0<a(s)- a(t)^a'(s)(s-t) Vt, s, O^s^t
(теорема 4.2.2), поэтому |a(s)— a(t)| ^ |a'(s)||s — t|, 0< s < t. Отсюда и
из определения (16) функции b(s, t) получаем
b(s,t)^P(s)6(s)+^(a'(s)r(s-t)2 Vt,s, O^s^t.
Тогда из (18) с учетом неравенства 1 + a.(t)(3(t)^ 1 имеем
*
■ Plilfni'fsWt *-t.\2\n.( sWs+ -%■
Ht)-«(t)||2<2c,^ S(/J(0*W+§g(aW(*-0>(0<k+;$) (19)
Vt ^0.
Совершим в (19) предельный переход при t —»оо. Сначала докажем две
леммы.
Лемма 1. Пусть функция v(t)e С"[0,+оо) такова, что
i/(t)>0, !/'(*) <0 Vt>0, lim 4^-=0-
Тогда . t N
lim i/»(t)expf j i/(6»)d(9) =+oo (20)
( -lOO \ Q /
при каждом n = 0, 1,...
Доказательство. Зафиксируем произвольное целое число п ^ 0.
По условию леммы |У2' ^1 = — ^j~- —»0 при £ —> оо, поэтому найдется £n ^ О,
что что — 2 ^ . Vs^tn. Интегрируя это неравенство на отрезке [tn, t],
t^tn, получим
•4 v2(t)J J ds\u{s)J v(t) v{tn)^n+l -" "
§ 12. РЕГУЛЯРИЗОВАННЫЙ НЕПРЕРЫВНЫЙ МЕТОД
701
Следовательно,
Отсюда имеем
q t n 'n °n \ n /
Из (21) и последнего неравенства следует
«/»(*) exp(f ,/(6l)d6l) £ ^#(t - tn + cn) Vt> tn.
ч0 ' cn
Отсюда при t —» oo приходим к равенству (20). Лемма 1 доказана. □
Лемма 2. Пусть функция u(t) удовлетворяет условиям леммы 1
и n(t) = expK i/(6»)d6»y Тогда
lim%W)) = l Vn = 0,l,... (22)
(-.oo i/n + 1(i)M(i) v '
Доказательство. Зафиксируем любое целое число n ^ 0. Заметим,
что £t(vn(t)p(t)) = rw'(t)vn-l(t)iM(t)+ vn + l(t)!J,(t) = (w'(t)pn-[(t) +
+ un + l(t))^(t), поэтому „+1- — »-2^ + 1- Учитывая условие
lim v ' = 0, отсюда получаем равенство (22). Лемма 2 доказана. □
( —* oo v (£)
Продолжим доказательство теоремы 1. Положим i/(£) = a(t)/3(t). Из
условий (6) следует, что i/'(*) = «'(*)/?(*)+ «(*)/?'(*) <°. lim -^4 =
/ »4t^ e'(t\ \ !->со V (t)
= lim "^ + /^ у = 0. Согласно лемме 1 тогда
!^ooVa2(i)/3(i) a(t)p2(t)J
lim an(t)/T(t)/i(t) = +oo Vn = 0, 1,... (23)
( -too
Из леммы 2 для функции v(t)= a(t)/3(t) имеем
lim [«1*М*)Г+1**) =L (24)
Пользуясь равенством (23) при n = 0, заключаем, что второе слагаемое в
правой части неравенства (19) стремится к нулю при t —»оо. Далее, трижды
применяя правило Лопиталя с учетом (6), (23), (24), получим:
$(/?(*Ж*)+Щ("'(*))2(*-*)2)/Ф)<28 /, /ч
lim S _ = lim j ^4(a'(s))2(*-s)M(«)^+
\ 2S |^(a'(s))V(s)ds
+ e(t)8(t)u(t)) ...J.. ,,, = lim -¾ + lim ^i =
702
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
a2(i)/32(i)M(t) «-» £(«(*)/?(*)/*(*)) i-oo ^L(a2(i)/32(i)M(t))
= lim Д^И'»'"*') . Ит «'(*)/»'(«M«) = nm 2^ «'(«) ^ =0
i^oo a3(i)/33(i)M(i) f^oo £(a2(i)/32(i)M(i)) I-» \a2{t)f3(t)j
Отсюда и из (19) следует, что lim \\u(t) — v(t)\\ =0. Тогда с учетом (10)
t —* оо
имеем ||«(*) — иА\ ^ ||гх(*) — г;(*)||Ч-||г^(^) — -гх^|| —»-0, J(u(t))—» Jt при t.—юо.
Наконец, из (6), (15), (16) при т= t получаем
i||«'(*)ir<cib(*,*) + (i + «(*)iS(t))K(*)llll«(*)-«(*)ll<
^ClP(t)a(t)^\\u'(t)\\2+±(l+a(t)P(t))2\\u(t)-v(t)\\2 Ve>0, vt^o.
Примем здесь е = ±. Тогда ^Пг*^*)!!2^C!/3(t)cx(*)+2(H-CK(*)/3(t))2||t*(*) —
— г>(*)||2 V£ ^0. Отсюда с учетом уже доказанного имеем: lim ||«'(t)|| =0.
t —* оо
Равенства (7) доказаны. Равномерная сходимость в (7) относительно выбора
J'(u, t) из (3) следует из того, что в (15), (19) коэффициенты при степенях
}[«(£)—г>(т)|| , ||«'(*)||2 не зависят от конкретных реализаций J'(u, £)из(3).
Теорема 1 доказана. П
2. Сформулируем правило останова процесса (4) для случая, когда
уровень погрешности в задании градиента фиксирован и вместо J'(и, t) из (3)
имеем приближение J's(u) е Ц такое, что
\\J's(u)-J\u)\\^8(\ + \\u\\) VuGtf, (25)
где 6 >0 — известное число. Заменяя в уравнении (4) J'(u, t) на Js(u)
получим процесс
z'(t) = Vu(z(t)-p(t)(J^(z(t))+a(t)z(t)))-z(t), t^0, 2(0) = ^.(26)
Будем предполагать, что параметры a(t), /3(t), 8(t), удовлетворяющие
условиям (6), как-то зафиксированы, пусть 5(0) > 6. При каждом
фиксированном 6, 0< 6 < 6(0), процесс (26) будем продолжать до момента t = t(S),
определяемого условием
t(<5) = sup{t: S(s)>S,0^s^t}. (27)
Поскольку S(t)—>0 при t —>оо, S(0)> 6, то такой момент t(S) будет
конечным при каждом 6 >0 и, зная S(t), его можно заранее вычислить с нужной
точностью. Обоснованием сформулированного правила останова (27)
процесса (26) служит
Теорема 2. Пусть выполнены все условия теоремы 1, кроме
условия (3), пусть приближение J's(u) градиента J'(u) удовлетворяет
условию (25). Пусть z(t), 0^ t ^ t(6), траектория процесса (26), момент
t(6) определен согласно (27). Тогда
\imJ(z(t(S))) = Jt, lim||*(t(*))-4||=0. (28)
Доказательство. Из (25), (27) следует, что
\\Js(u)-J'(u)\\^6(t)(l + \\u\\) УиеН, 0< *<*($), (29)
§ 12. РЕГУЛЯРИЗОВАННЫЙ НЕПРЕРЫВНЫЙ МЕТОД
703
так что функция J'(u, t) = J's(u) удовлетворяет условию (3) при всех t,
0^.t^t(S). Далее, согласно правилу останова (27), из 5(£) —>0 при t —>оо
следует, что t(S)—> оо при 5 —»0. Это значит, что при всех малых 5 >0
момент t(6) в (29) можно сделать сколь угодно большим.
Согласно теореме 1 при выполнении всех ее условий, включая
условие (3), траектория u(t), порождаемая методом (4), сходится в норме Н к
точке ut, т. е. для Ve > 0 Э момент Т = Т(е) такой, что
\\u(t) - %\\ < е V* ^ Г(е), (30)
причем момент Т(е) не зависит от выбора реализаций J'(u, t) из (3). Так
как lim t(6) = оо, то 35(e) > 0, что *(5) > Т(е) при всех 5, 0 < 5 < 5(e).
5 —* 0
Это значит, что для всех 5, 0< 5 < 5(e), метод (26) при 0^ t ^ £(5), где
£(5) определен согласно (27), порождает траекторию z(t), 0< t < *(5),
которую можно получить также и методом (4) с реализациями J'(6, t)= J's{u)
при 0^ t ^ t(5), удовлетворяющими, в силу (29), условию (3). Поскольку
£(5) ^ Т(е), то, используя неравенство (30) при t = t(S)6 получаем
неравенство \\z(t(6)) — ut\\ < е, справедливое при всех 5, 0 < 5 < 5(e). В силу
произвольности е > 0 приходим ко второму равенству (28). Отсюда и из
непрерывности J(u) следует первое равенство (28). Теорема 2 доказана. □
Из теоремы 2 следует, что оператор Rs, который каждому набору
(Jg(u), 5) из (25) ставит в соответствие точку и(6) = z(t(6)),
определяемую методом (26), (27), является регуляризующим оператором
(определение 6.1).
Для задачи (1), когда множество U имеет вид (8.2) и задано с
погрешностью, аналогичный регуляризованный непрерывный метод проекции
градиента в сочетании со штрафными функциями исследован в [522].
В заключение отметим, что при отборе материала в §§ 8-12 мы
руководствовались желанием пошире продемонстрировать разнообразие
технических приемов, используемых при исследовании регуляризованных методов
минимизации.
Другие регуляризованные методы вида (4), использующие
дифференциальные уравнения более высоких порядков и их разностные аналоги, а
также регуляризованные варианты других методов для задач минимизации и их
обобщений, см., например, в [62-64; 147; 149-153; 155-159; 168; 171-174;
176-178; 185; 389; 522; 537].
§ 13. Метод динамической регуляризации
Рассмотрим процесс, динамика которого описывается системой
x(t) = Ax(t) + Bu(t), 0<t^T; ¢(0) = ¾. (1)
где * — время, х = x(t) = (xl(t),..., xn(t)) — фазовая траектория, 3¾ е
6 Еп — начальная точка, и = u(t) = («'(*),..., ur(t)) — управление,
А, В — заданные матрицы размера п х п, п х г соответственно, момент
Т задан. Управление u = u(t) будем называть допустимым, если
и 6 U = {u = u(t) б Lr2[0,T]:u(t)eV почти всюду [0, Т]}, (2)
где V — заданное множество из Ег.
704
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
При исследовании задач оптимального управления, связанных с
системами вида (1), нам до сих пор приходилось определять траекторию (решение)
x(t) = x(t; и), 0^ t ^ Т, задачи (1) по известному управлению ueU.B этом
параграфе мы займемся исследованием обратной задачи, когда траектория
x(t; и) задана и ищется допустимое управление (или одно из таких
управлений), которое порождает эту траекторию. Эту задачу, постановка которой
ниже будет уточнена, мы кратко будем именовать обратной задачей (1).
Подобные задачи, когда по наблюдаемой траектории (или ее элементам)
требуется восстановить какие-либо характеристики (коэффициенты,
параметры) динамической системы, имеют широкие приложения и относятся
к обратным задачам, теория и методы которых составляют интенсивно
развивающуюся область математики (см., например, [17; 60; 127; 230; 236;
268-270; 300; 365; 403; 405; 438; 439; 474; 482; 556; 557; 618; 619; 621;
651; 708; 771; 782; 788; 812]). Обратные задачи, вообще говоря,
неустойчивы к ошибкам наблюдения и для их решения нужно пользоваться методами
регуляризации.
Пример 1. Рассмотрим задачу: x(t) = u(t), O^t^T, ж(0) = 0;
и = u(t) е V = {и е Е1: \и\ < 1}. Предположим, что ведется
наблюдение за траекторией x(t) = 0, соответствующей допустимому управлению
ut = ut(t) = 0. Пусть из-за погрешностей наблюдения вместо точной
траектории аз(*)=0 получено ее приближение xs(t)= 6 sin j, 0^ t < T; 0< 6 < 1.
Так как u(t) = x(t), то по аналогии в качестве приближения к искомому
управлению «,(£) = 0 можно попытаться взять и6 = us(t) ~ x(t) = cos j,
0^ t ^ Т. Однако |K-4||i2 = Mcos}) dt=l(T+f (sin т~))->у^0 при
6—>0, т. е. обратная задача неустойчива в метрике L2[0, Т] (ср. пример 1.4).
Для решения обратной задачи (1) воспользуемся методом динамической
регуляризации, разработанным Ю. С. Осиповьщ и его учениками [421; 556;
557; 808]. Уточним постановку задачи. Будем предполагать, что наблюдения
за траекторией x(t) = x(t;u) проводятся в некоторые дискретные
моменты времени t{, i =0,..., N - 1, 0= t0 < t, < ... < tN_i < tN = T, причем
из-за погрешностей измерений вместо точных значений x(t.) известны их
приближения хи такие, что
>«-3(t,)l<4 * =0-;..., JV- 1, 0<8^80. (3)
Пусть величины xso,..., xSN_x измеряются и поступают в наше
распоряжение последовательно во времени. Управление us(t), являющееся
приближением к искомому управлению, будем строить последовательно на отрезках
[*05 *i]> [*1)*2])->ч [^лг-и^лг] по мере поступления информации об
измерениях, используя при построении us(t) на частичном отрезке [£,., ti + l]
лишь значения xs0,..., xSi и не предполагая знания остальных значений
% + 1,..., xSN_lt которые в момент t{, возможно, еще не измерены.
Приведем индуктивное описание метода динамической регуляризации. В этом
методе наряду с управлением us(t) на каждом шаге еще строится
вспомогательная функция zs(t), помогающая отслеживать наблюдаемую траекторию
x(t) по ее приближенным значениям xsi из (3).
Пусть при г=0 известно наблюдаемое значение xs0 начальной точки
ж(0)=а%. Положим zs(0)=xso. Решая вспомогательную задачу минимизации
ts0(u) = 2(zs(0)-xS0,Bu) + a(6)\u\2-*ini, ueV; a(S)>0,
§ 13. МЕТОД ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
705
определим точку щ&У такую, что <в0(г^) = inf ts0(u). Затем полагаем
и ё V
««(*) = «о. zs(t) = zs(0) + (Axm + Buft)t Vt е [*ь = 0, *,].
Пусть для некоторого г, 0< г < iV— 1, уже определены us(t), zs(t), 0<i < tt,
и пусть нам стало известно измерение xSi наблюдаемой траектории x(t) в
момент tt. Тогда решаем вспомогательную задачу минимизации
^(и) = 2(г^)-хя,Ви) + а(6)\и\2-^Ш, ueV (4)
и находим точку щ е V, £«(ч) = inf tSi(u). Затем полагаем
«,(*) = «*, ъМ = гМ + (Аха + Ви{№-Ь), te[t0ti + i]. (5)
Далее, по мере поступления информации xSi + l,..., хт^{
последовательно определяются us(t), zs(t) на следующих отрезках [ti + l,ti + 2],....
Описанный метод представляет собой сочетание принципа
экстремального прицеливания Н. Н. Красовского [414] и метода регуляризации А. Н.
Тихонова (см. метод стабилизации, § 4) [695]. Вспомогательную траекторию
zs(t) из (5) принято называть поводырем, а условие (4) выбора ut
называется правилом экстремального прицеливания. Для построения поводыря
использован аналог разностного метода Эйлера для решения задачи Кб-
ши (1), отличающийся от классического метода Эйлера [74; 89] тем, что
в (5) правая часть Ах + Ви вычислена в точке х = xSi, управление и =и{
взято из (4). Заметим, что задача (4) является конечномерной задачей
минимизации и для ее решения могут быть использованы, например, методы
из гл. 5. Функция tSi(u) в (4) сильно выпукла, квадратична и на выпуклом
замкнутом множестве V достигает своей нижней грани в единственной
точке иг. В частности, если V — многогранное множество, то задача (4)
превращается в задачу квадратичного программирования (см. § 5.8). Отметим,
что при г=0 функция ts0(u) имеет особенно простой вид: ts0(u) = a(S)\u\2.
Важно также заметить, что в точном определении точки минимума и{ в (4)
нет необходимости — достаточно найти и. из условий
ЩеЦ t«(tO< Inf *«(«) +е(% г(*)>0. . (6)
, ueV •
В дальнейшем будем предполагать, что функции us(t), zs(t) построены по
формулам (5) с использованием точек щ из (6).
Покажем, что если параметры а(6), е(6), h(6)= max {ti + l - tj
метода (4)-(6) согласованно стремятся к нулю при 8 —>0, то построенное
по формуле (5) управление us(t), 0< t ^ Т, при 6 —»0 сходится в
метрике L£[0, Т] к нормальному решению обратной задачи (1). Поясним, что
здесь понимается под нормальным решением этой задачи. Введем
множество Ut = {u = u(t)eU: x(t) = x(t;u),0^t ^ Т}, где x(t), 0< * <Т
—наблюдаемая траектория, U — определено согласно (2). Таким образом,
множество Ut состоит из всех допустимых управлений, порождающих одну и ту
же траекторию x(t) системы (1). Из самой постановки обратной задачи (1)
следует, что Ut ф 0, так как предполагается, что наблюдаемая траектория
x(t) действительно является траекторией системы (1),! порожденной хотя
бы одним управлением v = v(t) е. U, т. е. x(t) = x(t; v), 0^ t < Т. Однако
706
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
множество Ut может состоять более, чем из одного элемента v.
Управление ut = ut(t), 0 ^ t < Т, называется нормальным решением обратной
задачи (1), если
uteUt,
Л*\\ь;
■ inf 11« I
ueU." '
Если V — выпуклое замкнутое множество, то нормальное решение этой
задачи существует и единственно. В самом деле, тогда U — выпуклое
замкнутое множество в L£[0, Т] (пример 8.2.9). Нетрудно проверить, что
множество U также выпукло. Далее, если «,. = -и,. (*) —> «^ = %(t) при fc-юов
норме L£[0, Т], то lim x(t; uk) = x(t;ut) Vt б[0, T] (теорема 6.3.1). Поэто-
к—>оо
му если ик б Ц,, то щ е Ц,, т. е. Ц, замкнуто в L|[0, Т]. Применяя теорему
8.2.10 к задаче: J(u) = \\u
inf, и 6 Ц,, убеждаемся, что нормальное
решение обратной задачи (1) существует и определяется однозначно.
Теорема 1. Пусть V — выпуклое замкнутое ограниченное
множество из Ег, приближенные значения хн наблюдаемой траектории
x(t) в момент tit г=0,..., N— 1, удовлетворяют условию (3),
параметры а=а(6), е=е(6), h—h(S) положительны, стремятся к нулю при
5"°" Итшш+-ш=0. (?)
Тогда функции us(t), zs(t), 0< t ^. Т, определяемые методом (4)-(6)
таковы, что
lim ||«,-«J|rr=0, lim max |z,(t)-a;(t)Ln=0, lim \\zs-x\\[n,aT,=0, (8)
где w„ — нормальное решение обратной задачи (1), ж = ж(£) = ж(£, ut) —
наблюдаемая траектория системы (1).
Доказательство. Прежде всего убедимся, что
|ж(*;и)|в„^<оо Vte[0,T] У«бЦ (9)
|ж(*;«)|^с,<оо, \х(Ь;и)-х(т;и)\^ф-т\ Vt, те[0,Г], VueLT (10)
Неравенство (9) нетрудно доказать, пользуясь леммой Гронуолла 6.3.1
(см. аналогичную оценку (8.2.8)). Отсюда и из уравнения (1), а также
из ограниченности V следует: |ж(*;«)| < ||А||со+ |J5|| • \V\ = с, < оо, где
|V| = sup|u|. Тогда |яв(*;«)-я!(т;«)|= $&'(£;«)# <с,|*-т| Vt, те[0, Г].
uev
= 0,...,^-1.
(И)
Из (3), (9) получаем
1ж«г1^5+ ШаХ |Ж(*г)1 ^ ^0 + ^ = ¾ <°° ^г'
0<s <JV- 1
Аналогичные оценки верны и для поводыря zs(t). Из (5) следует, что
функция zs(t) непрерывна на [0, Т] и кусочно дифференцируема: zs(t) = AxSi +
+ Вщ V* б [*;>, ti + l], г =0,..., N - 1. Отсюда и из (11) имеем
ИЛ*)К1Нк + 1И1Л = сз Vte[0,T]. (12)
Тогда ,
!**(*)! = !Ш« + »,
«о
^СдТ + Сг,
К(*)-*А)1 = К(£К <ф-т\ У*,те[0,г].
о
(13)
§ 13. МЕТОД ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
707
Введем теперь функцию (функция Ляпунова):
w(t) = \zs(t)-x(t)\l„ + a(8)\\us(T)\4T, 0<i<T (14)
о
Зафиксируем произвольный момент времени t е (О, Т] и вычислим
производную w(t) этой функции. Пусть для определенности t б (*{, ti + l]. Тогда
w(t) = 2(zs(t) - x(t), zs(t)- x(t))B. + a(6)\us(t)\%r =
= 2{zs(tt)-xH,zs(t)-x(t))+2{(zs(t)-zs(tt)) + (xu-x(ti)) +
+ (x(t{) - x(t)), zs(t) - x(t)) + а(6)\щ\%г. (15)
Второе слагаемое правой части (15) в силу неравенств (3), (9)-(13)
оценивается величиной
2(сзМ5) + s + c(4s))(ci+c3) < с4(5 + h(S)). Поэтому
из (15) с учетом уравнений (1), zs(t) = AxSi + Ви( имеем:
гЬ(^2(гв(г{)-хбаАхВ{+Ви-Ах(г)-Ви^))+с,(8+Ц8))+а(6)\и{\1г=
= 2{zs(ti) - xSi,Bu{ - JE4(t)> + a(S)\Ui\%r + 2<*,(t.) - xSi, A(xSi - x(t{)) +
+ A(x(%, 4) - x(t, 4)> + c4(5 + h(S)), te(t{, ti + l].
Отсюда и из (3), (4), (6), (10), (И), (13) следует
™(0 < *«М - *«К(0) + «(*)1ч(011- + <%(* + 4S)) <
^a(5)|4(t)ll'+c6(5 + /i(5)+e(5))
почти для всех t е[О, Т]. Интегрируя это неравенство на отрезке [0,t] с
учетом равенства w(0) = 0 получим
tu(t) < а(6) \ \и,(т)\Чт + с6Т(6 + h(S) + е(6)) V* 6 [О, Г].
о
Отсюда с учетом определения (14) функции w(t) имеем
\zs(t)-x(t)\l„ + a(6)\\us(T)\4T^
т.. °
^a(S)]\ut(T)\2dT + c6T(S + h(S)+e(S)) V* 6 [О, Г]. (16)
о
Из оценки (16) следуют два важных неравенства:
m^zS)-x(t)\%.^a(S)\\ut\\li+c6T(S + h(S)+e(S^ V5, 0<5^50, (17)
0шкг$|«,(т)|»*-=$|«А^ (18)
V5, 0<5^50.
Второе из равенств (8) вытекает из (17) при 5 —> 0. Из (18) с учетом
/т\ II ПО ^ II МО i m б + h(6) + б(6) . Т1
условия (7) имеем \\us\Кг < р» |rr + sup CgT Ч^т—*—*■ = с, < оо. 1о-
гда существует последовательность {8к} —> 0 такая, что ик = uk(t) = us (t)
708
Гл. 9. МЕТОДЫ РЕШЕНИЯ НЕУСТОЙЧИВЫХ ЗАДАЧ
слабо в L£[0, Т] сходится к некоторому управлению vt = vt(t), причем
% б U в силу слабой компактности U (теорема 8.2.3, 8.2.6). Кроме того,
iim x(t, ик) = x(t, vt) Vt 6 [0, Т] (примеры 8.2.14-8.2.17). Покажем, что
к-,оо (. + 1
«, 6 Ц,. Из (5) при t = t,- + 1 имеем 24(*,. + 1) = г4(*,.) + I (Axsj + Bu^dt,
j = 0,..., N — 1. Суммируя это равенство по j от j = 0 до некоторого
j = i — I ^.N — 1 с учетом начального условия zs(0) = xs0 получим
zs(ti) = xso + ,f:'l\AxSj + BUi)dT. (19)
Введем кусочно постоянную функцию 5Гв(т) = жвя те[*,-,*,- + |]. Учитывая
определение (5) функции us(t), равенство (19) теперь можем переписать в
виде
'<
*«(*i) = xso + HAxs(T) + Bus(r))dT.
■ о
Сложим это равенство с zs(t) из (5). Получим
*«(*) = Ъо + \(Лхе(т) + Bus(r))dr. (20)
о
В силу (3), (10) притер, *■, + ,] имеем: \хе(т)-х(т)\^\х^-х(^)\ + \х(^)-
-х(т)\ ^ 6 + c,h(6) —>0 при <5 —>0. Это значит, что жв(*)—> ж(£) при <5 —>0
равномерно на [О, Т]. Кроме того, lim [ Bus (r)dr= J Bvt(r)dT Vt e[0, T],
fc-»oo 0, * 0
так как {«s } —► i>„ слабо в L£ [О, Т]. Тогда из (20) при 6 = 6к -> 0 с учетом (3)
и уже доказанного второго равенства (8) получаем
x(t) = x0+ \(Ах(т) + Bvt(r))dT V* 6 [О, Г].
о
Это означает, что x(t) — x(t, vt), 0 < t ^ Г, т. е. и, 6 f/, = {и = u(t) е U:
x(t, и) = x(t), 0 < t < Т}. Так как ut = ut(t) е Ut — нормальное решение
обратной задачи (1), то из оценки (18) при 6 = 8к —> 0 с учетом слабой
полунепрерывности снизу функции ||«|р и равенства (7) имеем:
Н«Лг' ^ ll^llr' =¾ 1'т 11¾ IIг' =% lim 11¾ ||г- < |1ч11г'-
II * 11 jC2 11 *||£2^£—_ II VIL2 ^ fc_,oo" \M-bj ^ N *И^2
Следовательно, существует предел lim \\us |||г = ||ч|||.- = IKllir- Отсюда вы-
к —>оо к 2 t 2 2
текает, что vt также является нормальным решением обратной задачи (1).
Однако нормальное решение единственно, поэтому vt = ut. Тем самым
доказано, что семейство {us(t), 6 >0} при 6 -> 0 слабо в L£[0, Т] сходится к
Ч и 1¾ KIIlj = Kill;- ТогАа 11«* -.ч11ь,' = Klli; - 2<Ч. ««bj + Kllij -4 °
при 8 —» 0. Первое из равенств (8) доказано.
Наконец, дифференцируя равенство (20), имеем: zs(t) = Axs(t) + Bus(t)
Vt б [О, Т], t ф tt, i = 1,..., N — 1. Правая часть этого равенства в силу уже
доказанных соотношений при 6 —» 0 сходится в норме L£[0, 2"1] к Ax(t) +
+ BuAt) = x(t). Это значит, что lim ||гл — х\\г, =0. Теорема 1 доказана. □
*\ / \ / ^ _, о 2
§ 13. МЕТОД ДИНАМИЧЕСКОЙ РЕГУЛЯРИЗАЦИИ
709
Из этой теоремы следует, что оператор Rs, который каждому набору
измерений {%, ъ =0,..., N — 1; 8} ставит в соответствие управление us(t),
0< t < Т, определенное методом (4)-(6), является регуляризирующим
оператором обратной задачи (1).
Возвращаясь к описанию метода (4)-(6), приведем соображения,
поясняющие откуда возникла задача (4). Роль поводыря, как было замечено выше,
заключается в том, чтобы отслеживать наблюдаемую траекторию x(t) по ее
приближенным значениям xs, из (3) с тем, чтобы затем строить управление
us(t) = и., t б [£г, ti + l], г =0,..., N — 1, выбирая ui наилучшим образом в
смысле (4). Эту идею наилучшего выбора ut можно реализовать несколько
иначе, сделав его, возможно, более понятным, если и{ выбирать из условия
минимума уклонения значения поводыря zs(ti + l) = zs(ti + l, и) от
наблюдаемого значения %, считая щ решением задачи
k(*i+i,«)-z&l2->inf, ueV. (21)
С учетом (5) имеем:
1^(^ + 1^)-^^ = 1^(^) + (-^^+^^)(^ + 1-^)-½^
= |*«(*«) - ^«|2 + 2<г,(*4) - xsi, Bu)(ti + l - t{) +
+ 2{zs(tt) - xu, AxK)(ti + l- t{) + \AxSi + Bu\\ti + l - t.)2. (22)
Как видим, первое и третье слагаемые из правой части (22) от и не
зависят и не влияют на выбор точки минимума и. в задаче (21), поэтому они
могут быть опущены без ущерба для задачи (21). Если теперь пренебречь
и четвертым слагаемым из правой части (22), имеющим порядок 0(h2), то
от задачи (21) придем к задаче: 2(z,(t) - xSi, Ви) —> inf, и 6 V. Применив
к этой задаче метод стабилизации (§ 4), получаем задачу (4).
Метод динамической регуляризации выше мы изложили для простейшей
обратной задачи (1). Применение этого метода к более сложным задачам,
включая обратные задачи для уравнений с частными производными см.,
например, в [403; 421; 474; 556; 557; 808].
ГЛАВА 10
Аппроксимация экстремальных задач
Численная реализация многих методов решения задач оптимального управления
процессами, описываемыми системами обыкновенных дифференциальных уравнений или уравнений с
частными производными, невозможна без использования тех или иных методов приближенного
решения возникающих здесь начально-краевых задач, приближенного вычисления
встречающихся интегралов.
Для решения начально-краевых задач часто применяют такие методы, как разностный
метод, метод конечных элементов, метод прямых, метод характеристик, методы Ритца или Га-
лёркина и т. д., для приближенного вычисления интегралов используют формулы
численного интегрирования [74; 89; 480; 481; 630-635]. В результате исходная задача оптимального
управления заменяется некоторой последовательностью вспомогательных аппроксимирующих
экстремальных задач. Здесь возникают естественные вопросы: будут ли сходиться решения
вспомогательных экстремальных задач к решению исходной задачи, каким условиям должны
удовлетворять аппроксимирующие экстремальные задачи для обеспечения сходимости?
Аналогичные вопросы возникают, когда исходные данные — целевая функция и множество —
известны с погрешностью.
В этой главе мы ограничимся рассмотрением разностных аппроксимаций для простейших
задач оптимального управления и, кроме того, приведем общие условия аппроксимации
экстремальных задач. Вопросам аппроксимации различных классов экстремальных задач посвящены,
например, работы [2-4; 111; 114; 120; 129; 140; 141; 152; 153; 170; 184; 303; 339; 340; 360;
362; 363; 402; 461; 462; 464; 467; 501; 502; 504; 593-599; 607; 700; 720].
§ 1. Разностная аппроксимация квадратичной
задачи оптимального управления
Рассмотрим следующую задачу оптимального управления:
J(u) = \x(T,u)-y\2-*m[, (1)
x(t)=A(t)x(t)+B(t)u(t)+f(t), to^t^T, х(Ъ)=Хо, (2)
u(t)€ U={u=u(t)eL'[t0, T]: u(t)€ У почти всюду на [t0,T]}, (3)
где A(t) = {a{-(t)} — матрица порядка п х п, B(t) = {bi;j(t)} — матрица
порядка пхг, /(*) = {/'(*)} матрица порядка п х 1, т. е. вектор-столбец;
моменты времени t0, Т, а также точки 3%, у6.Е" заданы; V — заданное
множество из Er, x(t, и) = x(t) = (xl(t),..., xn(t)) — решение (траектория)
задачи (2), соответствующее управлению u = u(t) = (ul(t),..., ur(t)) е
G Ll[t0, Т]. Будем предполагать, что элементы a{j-(t), bf-(i),/*(*) матриц
A(t), B(t), f(t) кусочно непрерывны на отрезке t0<^.t <:Т.
Напоминаем, что задача (1)-(3) уже рассматривалась в § § 8.2-8.4.
Здесь мы займемся исследованием разностных аппроксимаций этой
задачи. Разобьем отрезок t0^t ^ Т на N частей точками {t{,i =0,.. .,N}:
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 711
t0 <*[<...< tN_, < tN = Т, приняв эти точки в качестве узловых,
уравнения (2) заменим разностными уравнениями с помощью простейшей явной
схемы Эйлера. В результате придем к следующей задаче:
^([«U=l^([«U-y|2-*inf, (4)
х,+ 1 = х{ + Ы{(А{х, + В{и{ + /{), * =0,...,^-1, (5)
[u]Ne UN = {[u]N = (u0,ul,...,uN_l): u{eV, i =0,..., N -I}, (6)
где bt{ = ti+l-t{,A{ = A(t{ -№),B{=B(t{+0),f{ = f(tt-№),i=0,...,N-U
[x([u]N)]N = (x^u]^),..., xN([u]N)) — решение задачи (5),
соответствующее управлению [u]N.
Введем пространство L\N дискретных функций — управлений [u]N =
= (uq, uu ..., uN_x), [v]N = (v0,..., vN_i),... — со скалярным произведением
ЛГ-1
([«У [«Уь„ = E Д*1<«*.«1>д'
и с нормой '~°
,N-\ ч1/2
Ц[«У1ь„ = «[«У[«и)1/2=(Е а**1«4||Л .
Пространство L^N является разностным аналогом пространства L%[t0, Т],
соответствующим разбиению {if) i = 0,..., N} отрезка [t0, Т].
Таким образом, задаче (1)-(3), рассматриваемой в пространстве L£[*oi Т]
при каждом целом N ^ 1 и разбиении {tt, i = 0,..., N} отрезка [t0, Т],
соответствует дискретная задача оптимального управления (4)-(6),
рассматриваемая в пространстве L%N.
При каждом фиксированном N ^ 1 и разбиении {t{, i = 0,..., N}
задачу (4)-(6) можно решать с помощью разностного аналога методов проекции
градиента, условного градиента и других методов из § 8.4; при
вычислении градиента функции (4) можно пользоваться результатами § 8.6; здесь
возможно также использование метода динамического программирования
(гл. 7).
Предположим, что при каждом N^ 1 и заданном разбиении {t{,i = 0,...
..., N} с помощью какого-либо метода минимизации получены
приближенное значение IN + eN нижней грани IN функции (4) при условиях (5), (6)
и дискретное управление [u]Ne = (г^£,..., uN_ 1е): uit eV, i = 0,..., N — 1,
такие, что
!n, < MM*.) < Tn, + %> (7)
где {eN} — положительная последовательность, сходящаяся к нулю.
Возникают вопросы, будет ли сходиться последовательность {IN} к Jt
нижней грани функции (1) при условиях (2), (3), если неограниченно
измельчать шаг разбиения {i{, i =0,..., N}, т. е.
lim max At. =0,
и можно ли принять дискретное управление [u]Ne из (7) в качестве
некоторого приближения оптимального управления задачи (1)-(3)?
Для ответа на эти вопросы нам понадобятся некоторые свойства решений
задач (2) и (5). Приведем эти свойства. Будем пользоваться обозначениями
Amax= sup ||Л(*)||, Бтах= sup ||B(t)||, /тах= max |/(t)|.
712
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Если W — произвольное ограниченное множество из Lr2[t0, Т], т. е.
sup||w||L < R < оо, то тогда
«Elf !
sup max \x(t, и)\ ^. С0, " (8)
где
С0 = e^-Wf^l + Бтах(Т - *0)'/2Д +/max(T - to)].
В самом деле, по определению решения задачи (2) имеем
t
x(t, и) = $[Л(т)ас(т, «) + В(т)и(т) + /(r)]dr + 2¾. (9)
При всех t, t0 ^ t ,^ Т, тогда справедливо неравенство
N*, «)| < ^max S |Я!(Т, «)|ЙТ + Бтах J |«(т)|ЙТ + /тах(Т - *0) + К|.
Отсюда с помощью леммы 6.3.1 получаем оценку (8).
Далее, если W — произвольное ограниченное множество из L£[i0, Т\, то
sup \х(Ь,и)-х(т,и)\^С№-т\х1\ t0^t,r^T, (10)
где
С, = АтщС0(Т - *0)'/2 + БтахД + (Т - О"2/™»,
постоянная С0 взята из (8). Действительно, из (9) с помощью оценки (8)
имеем
t
\x(t, и) - х(т, и)\ = $[А(£)х(£, и) + В(0«(0 + ДОЖ
£
1/2
^ AmaxC0\t - т| + BmJt - г|'/2Д + \t - r|/max <: C,(t - г)
при всех £, т 6 [£0, Т] и « е W\
Если"W — ограниченное множество из L^[t0, Т], то вместо (10) можно
аналогично получить более лучшее неравенство
sup \x(t, и)- х(т, и)\ ^ Cx\t — т\, t0^t,r^T, (11)
«ElC
где С, = АШХС0 + Бтах sup ||«||ь + /тах.
ueW
Далее, докажем, что если последовательность {uk~uk(t)} сходится к
и = u(t) слабо в Lr2[tQ, Т], то {x(t, ик)} сходится к x(t, и) равномерно на
отрезке; [£0,Т], т. е.
lim sup \x(t,uk)-x(t,u)\=0. (12)
Сначала покажем, что {x(t, иЛ} сходится к x(t, и) при каждом t €[0, Т].
Обозначим zk(t) = x(t, ик) — x(t, и), t0 ^ t <С Т. Из равенства (9) имеем
**(*)= f Mr)h(r)dr + J В(т)[ик(т) - u(r)]dT, i0<:t<:T.
Тогда
t„
t
K(*)l ^Лтях I \zk(T)\dT+ I B(r)K(T)-«(T))dT
<0 <0
t0^t^T.
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 713
Отсюда с помощью леммы 6.3.1 получим
^)\<:Атах1ък(т)еА^-тЫт+Ъ(1), t0^t^T, (А.12)
где (°
М*)= \в(т)(ик(т)-и(т))ат\ = (±\\(Ъ((т),ик(т)-и(т))^\У'2, 40<4^
Ь{(т) — г-я строка матрицы B(t). В силу слабой сходимости {uk(t)} к u(t)
имеем
!(^(г), ик(т)-и(т))йт= $(с,.(т), ик(т)-и(т))с1т-+0 V4e[40, Т], fc->oo,
где с((т) = Ь.(т) при 40^т^4, с,.(т)=0 при 4 <т< Т. Поэтому lim ^.(4)=0
V4 G [40, T]. Кроме того, lim J 6fc(T)eA»»((-T)dr = 0 в силу теоремы Лебега
к —*оо .
о предельном переходе под знаком интеграла [695]. Отсюда и из (А.12)
получаем lim zk(t) = 0 или lim аз(4,-^) = аз(4, «) V4 е [40, Т].
к —» оо fc —* оо
Допустим, что {x(t, ик)} не сходится к x(t, и) равномерно на [40, Т].
Это значит, что существует число Sq > 0 такое, что для любого номера
m ^ 1 найдутся номер fcm > m и точка tk е [40, Т], для которых \x(tk , «д. )-
- x(tk , и)\ ^ е. Можем считать, что кх < /¾ < ... < кт < ... Заметим
также, что слабо сходящаяся последовательность {ик} ограничена по
норме L£[40, Т], т. е. sup||«J|L ^ R < оо. Согласно оценкам (8), (10) тогда
семейство функций {x(t, ик )} равномерно ограничено и равностепенно
непрерывно на отрезке [40, Т]. В силу теоремы Арцела [695] из {x(t, ик )}
можно выбрать подпоследовательность, которая равномерно на [40, Т]
сходится к x(t, и). Без умаления общности можем считать, что сама
подпоследовательность {x(t,uk )} равномерно сходится к x(t, и). Это
означает, что для любого е > 0, в частности, для е = е0, найдется номер 77¾
такой, что \x(t, ик ) — x(t, и)\ < е0 для всех m ^ 77¾ и всех 4 G [40, Т].
В то же время по "определению подпоследовательности {x(t,uk )} имеем
\x(tk ,ик)— x(tk ,и)\^ Sq. Противоречие. Равенство (12) доказано.
Далее,"для любых и, v G ££[4,,, Т] справедлива оценка
sup 133(4,^)-03(4,^)1^(^11^-^11^, (13)
где- ,.>;•.■ •
C2 = eA^T-»(T-t0)^Bmax.
В самом деле, из (9) следует, что
' I
|аз(4, и) - x(t, v)\ = 1[А(т)(х(т, и) - х(т, v)) + В(т)(и(т) - ю(т))]ёт\ ^
t ,Т х 1/2
^ Amax \ \x(r,u)-x(r,v)\dr+Bmax(T-t0y/2(l \u(t)-v(t)\4t) .
Отсюда с помощью леммы 6.3.1 получаем оценку (13).
714
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
На любом ограниченном множестве W из L2[t0, Т] функция (1)
удовлетворяет условию Липшица
\J(u)-J(v)\^C3\\u-v\\L2, u,veW, (14)
где C3=(4C0+2\y\)C2, постоянные С0,С2 взяты из (11), (13). Действительно,
| J(u) - J(v)\ = \\х(Т,и)- у\2 -\x(T,v)- у\2\ =
= \2(х(Т, v)+6(x(T, и)-х(Т, v))-y, х(Т, и)-х(Т, v))\, 0 < в < 1,
так что
| J(«) - J(v)\ < 2(\х(Т, и)\ + \х(Т, v)\ + \у\)\х(Т, и) - х(Т,у)\.
Отсюда и из оценок (8), (13) следует неравенство (14).
Если WN — произвольное ограниченное множество из L2N, т. е.
SUP IIMjvII < -R < оо, и, кроме того,
W
dN= max At^ {Т~УМ, Af = const>0, (15)
TO
SUP п^Л I^CMjv)! < <^4. (16)
где
C4 = еА^т~^.(Ы + Бтах(Т _ to)U2R + /max(T _ to)).
В самом деле, из (5) имеем
xi + l = ±At].{A].x. + B.uj + fj) + x0, i=0,...,N. (17)
Следовательно,
K+.l^max^ Е |^| + ^ах(Г-<о)1/2||[«к11^ + (Г-<о)/тах + к|1
3 ° *=0, . . .,JV—1.
С помощью леммы 8.6.1 отсюда получаем
|Ж^(1+Атах^)ЧК|+Бтах(Т-*о)1/2Д+/тах(Т-*0)), *=0, ...,К (18)
Поскольку 1 + х ^ ех при всех действительных х, то с учетом условия (15)
имеем
(1 + AmaKdNy <: (еА^У < eA"»V <: еА""(т-'о)М. (19)
Отсюда и из (18) следует оценка (16).
Для исследования связи между задачами (1)-(3) и (4)-(6) нам ниже
будут полезны следующие два отображения QN и PN. Отображение QN,
действующее из пространства L2[t0, Т] в L2N определяется так:
1 (,'+|
Qtf(«) = K)«i,--4%-i):«i = 5r $ u(*)d*> *=°>--М'Д_ ^. (20)
отображение PN, действующее из L2N в L2[t0, Т] определяется следующим
образом:
^([«U = «.- ПРИ *••<*<*» + >. *=0,...,JV-1. (21)
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 715
Из (20), (21) непосредственно следует, что
Ш«)\\1„ = Nt\-KT. Y u(t)dt)\ti = Е1 st:(Y u(t)dt)2 <
< е' Y |«(*)l2d* = ? |«(*)|2^ = Hl!2, (22)
ll^<[«Ulli = ?I^([«UI2A= e'Thl2d*= e'^KIHIMJL- (23).
Ниже докажем несколько лемм, связанных со свойствами отображений
Qn и Pn-
Лемма 1. Пусть V — выпуклое замкнутое множество из Er, а
управление и = u(t) принадлежит L£[*oi Т\ и w(*) б V почти всюду на
отрезке [t0, Т]. Тогда
1 '<
при всех t{,ti + le[t0,T], t.<ti + l.
Доказательство. Сначала установим, что всякое выпуклое
замкнутое множество У из Ег является пересечением полупространств,
образованных всевозможными опорными гиперплоскостями к множеству У и
содержащих У (см. определение 4.5.2). Возьмем произвольную граничную
точку v множества У. Пусть с„ — опорный вектор множества У в точке v,
т. е. с,^0и (с„, и - v) ^0 при всех и б У. Обозначим
W= П {u:(cv,u-v)>0}.
veYpV
Надо показать, что W = V. Если и б У, то (си, и — v) ^0 для всех v G ГрУ,
поэтому и eW. Это значит, что V C.W.
Покажем, что справедливо включение W C.V. Допустим противное: пусть
существует точка го е W, но го $ У. Тогда по теореме 4.5.1 множество У и
точка го сильно отделимы, и гиперплоскость (с„, « — г>)=0, где v = Pv(w)~
проекция точки го на множество У, обладает свойствами: (с„, u — v) ^ 0 при
всех и G V", а (с„, го —г>) <0. Но поскольку v еТрУ и го 6 W, то (с„, w — v) ^
^ 0 по определению множества W. Противоречие. Следовательно, W С У.
Требуемое равенство W = V доказано.
Возьмем произвольное управление u = u(t), удовлетворяющее условию
леммы. Пусть v — любая точка из ГрУ, с„ — опорный вектор к У в точке v.
Тогда (с„, u(t)-г>) ^ 0 почти всюду на [t0, Т]. Интегрируя это неравенство
на отрезке [t., ti + l], получим
■Х- '((cv, u(t))dt = (cv,^ "f u(t)dt) = (е., и.) > (е., v)
или (с„, «; - г>) ^ 0 для всех г> е ГрУ. Следовательно, uceW = У. Лемма 1
доказана. D
Лемма 2. Пусть матрицы A(t), B(t), f(t) кусочно непрерывны на
отрезке t0 ^ * < Т, разбиения {tt, i=0,...,N} отрезка [t0, Т]
удовлетворяют условию (15). Пусть W и WN —произвольные ограниченные
716
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
множества из L£[i0, Т\ и L^N соответственно, т. е. sup||«||L ^Д <оо,
supIIMjvIIl ^-R < оо. Тогда w
w 2"
sup max \x(t{, и) - x.(QN(u))\ <: SN, (24)
SUP "V^N*,, ■?*([«]*)) - ^([«Ы! < *jv. N=1,2, ..., (25)
где
rN- 1 (i + l
E J (И(7-)-А4|| sup™ \x(t, u)\+
-i=0 (.
t„<t<T
+ Amax SUp |Ж(Т, u)-^^, «)| + |/(т)-/4|)ЙТ
^JV-l'i + i ч 1/2
+
+Л(Е I ||-В(т)-В4||2йт) -»0 при N-+oo. (26)
Доказательство. Возьмем произвольные M6i2r[*oi ^1 и [^Lv^^jv
для которых ||«||L ^ R, \\[u]N\\L ^R, и соответствующие им решения
ж(£,«) и [^([^]^)]^ задач (2) и (5). Из равенств (9) и (17) следует
1^(^+.^)-^+.(^1^)1= Е 1 [(A(T)-A].)x(T,u)+Aj(x(T,u)-x(ti,u))+
з=о tt
+A3ix(t.,u)-xMu]N))+(B(T)-B3.)u(T)+B3iu(T)-u.)+(f(T)-f.)]dT
N- 1 (; + l
^
^ AmaxdN E N*y, «) - x,.([U]N)\ + E S (И(т) - А,\\\х(т, «)| +
i=o 3=0 tt
+ AmJx(r,u)-x(tJ.,u)\+\f(r)-fJ.\)dr+(Y! Tl|5(0--By||2dT)I/2||«||bi +
V = 0 (, '
ЛГ-1 ' '
+ E IIA-II l(u(T)-Ui)dr
3=0 t.
, i=0,...,N-l.
Отсюда с помощью леммы 8.6.1 и неравенств (18),получаем
(27)
\x(t{, u)-x{([u]N)\ < SN+eA^T-^MBmmj: 'f (u(T)-u,)dT
з=о t.
i=0,...,N,
для всех и, [u]N, \\u\\L ¢. R, \\[u]N\\L <C Д. Однако, если \\u\\L < R, то
• «Л i
в силу (22) имеем 11^(^)1^ ^R. Поэтому, учитывая, что $ («(т)—
(.
-QN(u))dr = 0, j = 0,..., N - I, из (27) при [u]N = QN(u) получим
оценку (24). Аналогично, если Ц[«]^||£ ^ R, то согласно (23) тогда
Н-РлЛМлг)!!^ < R и поэтому, учитывая, что J (Pn([u]n) ~ u.)dr = 0, j =
*j
= 0,..., N — 1, из (27) при и = PN([u]N) получим оценку (25).
Остается доказать, что величина 6N, определяемая равенством (26),
стремится к нулю при N —» оо. Пусть 0,,.. .,¾ — точки разрыва элементов
матрицы A(t) на отрезке [t0, Т]: £0 = 0О < 0, <... < 0а < Т = 0а+,. Доопределим
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 717
матрицу A(t), в{ < t < в{±1, при t = в{ и t = 6i + l предельными значениями
при t —» 0г+О и t —» 04+ ,-0; тогда А(£) будет непрерывной и, следовательно,
равномерно непрерывной на отрезке [ва 0i + l], i = 0,..., s. Отсюда следует,
что для любого е > 0 можно указать номер iV0 = N0(e) такой, что как только
N ^ N0, 0 < ti+l — t. = At{ ^. dN и отрезок [i4) ti+l] не содержит ни одной
точки {0J разрыва A(i), то ||А(т)-А,-|| < е для всех т, *4<т^*4+1. Имеем
е' Y ||А(т)-Л4||йт=Е' Y И(т)-А4||йт+Е' t ||A(r)-At.||dr, (28)
где E' означает суммирование по тем номерам г, для которых отрезок
г
[t{, ti + l] не содержит ни одной точки разрыва A(t), а Е' — суммирование
по остальным номерам г. Тогда «'
Е' f И(т)-А4||йт<Е' I edT^(T-t0)e для всех N^N0.
i t. i t,
Взяв при необходимости номер iV0 еще большим, можем сделать
Е" t ||А(г) - A4||dr < 2АтахЕ"А*г ^ 2Amax(S + \)dN < е
i tt i
для всех N ^ N0. Отсюда и из (28) следует, что
Ё '1'\\А(т)-А{\\<1т->0 при N-+oo.
Аналогично доказывается, что
Г' Т \\В(т) - В{\\Чт - 0, е' Т |/(т) - /4|dr - 0
г = о <( г = о (.
при N —» оо. Отсюда и из неравенств (8), (10) следует, что 6N —> 0 при
iV —» оо. Лемма 2 доказана. □
Лемма 3. Пусть выполнены все условия леммы 2, пусть и = u(t) —
произвольное управление из W. Тогда
|^(Q*(«)W(«)|<CiA> Cb = 2C0 + 2C4 + 2\y\, N=1,2,... (29)
где С*, С4 — постоянные из (8),(16), а величина 6N определена
формулой (26).
Д о к аз а т е л ь ст в о. Заметим, что
\iAQM) ~ J(u)\ = \MQN(U)) - у\2 - ЫЪ и) - у\2\ =
= \2(х(Т, и) + e(xN(QN(u)) - х(Т, и)) - у, xN(QN(u)) - х(Т, «))|,
0< в < 1. Отсюда и из оценок (8), (16), (24) следует утверждение леммы 3. □
Лемма 4. Пусть выполнены все условия леммы 2 и пусть [u]N —
произвольное управление из WN. Тогда
\J(Pn([u]n))-In([u]n)\^C66n, С6 = 2С4+2С0 + 2\у\, N = 1, 2,..., (30)
где С0, С4 — постоянные из (8), (16), SN определена формулой (26).
718
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Доказательство. Имеем
\J(PA[«]n)) ~ In(Mn)\ = |2<^([«к) + 0(х(Т, PN([u]N)) -
^xA[«]n))-V,x(T,Pn([u]n))-xn([u]n))\, 0<6»<1.
Отсюда и из оценок (8), (16), (25) следует утверждение леммы 4. □
Теорема 1. Пусть матрицы A(t), В (£), /(£) кусочно непрерывны
на отрезке t0<^t^T, V — выпуклое замкнутое ограниченное
множество из Ег, разбиения {tt,i =0,.. .,N} отрезка [t0, Т]
удовлетворяют условию (15). Пусть Jt— нижняя грань функции (П при
условиях (2), (3), INt —нижняя грань функции (4) при условиях (5), (6),
последовательность {[u]Nc] определена из условий (7). Тогда lim INt = Jt и
справедливы оценки я^°°
-C6SN^Im-J^C5SN, N=1,2,..., (31)
0<J(PN([u]Nc))-J^(Cb + C6)6N + eN, N=1,2,..., (32)
где постоянные С5, С6 взяты из оценок (29), (30) при W = U и WN= UN
соответственно, а величина SN определена формулой (26).
Доказательство. При сделанных предположениях Ut ф 0 (пример
8.2.15) возьмем какое-либо управление ut е Ut. Согласно лемме 1 имеем
QN(uJ G UN. Отсюда и из леммы 3 следует
IN^IN(QN(4))^JM + C5SN = Jt + C5SN, N=1,2,... (33)
Далее, функция (4) конечного числа переменных [u]N = (и0,..., uN_,) на
компактном множестве UN достигает своей нижней грани, т. е. INt > — оо,
итф®. Возьмем какое-нибудь управление \и\^ G UNt. Из (21)
непосредственно следует, что PN([u]m) G U. Из леммы 4 тогда получим
J^J(Pn([u}n*))<In([u]n*) + C68n = In* + C66n, N = 1,2,... (34)
Из неравенств (33), (34) следует оценка (31). Так как согласно лемме 2
имеем lim SN = 0, то lim Im = Jt.
N —* оо N —* оо
Рассмотрим последовательность {[«]«*} из (7). Тогда PN([u]Ni) £ U и
N= 1,2,... Отсюда и из неравенств (7), (30), (31) следует оценка (32).
Тем самым установлено, что {PN([u]Ns)} — минимизирующая
последовательность задачи (1)-(3). Рассуждая так же, как при доказательстве
теоремы 8.2.4, можно показать, что любая точка vt, являющаяся слабым пределом
какой-либо подпоследовательности из {^([^)^))1 принадлежит Ut. О
Заметим, что множество U, определяемое условиями (3), при
выполнении условий теоремы 1 ограничено в метрике Ь£,[£0> Т] и, следовательно,
справедливо неравенство (11). Поэтому, если матрицы A(t), B(t),/(£) на
интервалах непрерывности удовлетворяют условию Липшица (например,
если эти матрицы не зависят от времени), то из (8), (11), (26) и (31)
следует оценка
l/^-Jj^d^C^max^AV (35)
Заметим также, что при доказательстве теоремы 1 неравенства (29), (30)
были использованы не полностью: для получения оценки (31) оказалось
§ 1. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 719
достаточно справедливости неравенств (33), (34). В следующем параграфе
будет выяснено, что неравенства (33), (34) в некотором смысле являются
необходимыми для справедливости равенства lim INt = Jt.
N —* оо
В заключение предлагаем читателю в качестве упражнения доказать
оценки типа (31), (32) в предположении, что в задаче (1W3) элементы матриц
A(t), B(t), f(t) принадлежат !„[<„, Т], а в (4)-(6) принято
A-^-'lA^dt, B^fBi^dt, ft=^.'lf(t)dt, i=0,...,N-l.
§ 2. Общие условия аппроксимации
Перейдем к рассмотрению общей задачи минимизации и сформулируем
критерий аппроксимации по функции. Пусть X, Хи Х2,..., XN,... —
некоторые множества произвольной природы. Элементы множества X будем
обозначать через и, а элементы XN — через [u]N. Пусть U — некоторое
непустое множество из X, UN — непустое множество из XN, N = 1,2,...
Пусть функции J(u), Ii([«]i), •.., IN([u]N),... определены соответственно
на множествах U, Ux, ..., UN,. :. Рассмотрим задачу
J(«)->Inf, и<=Ц (1)
и последовательность «аппроксимирующих» ее задач
i„([«U-»inf, [u]NeUN, N = l,2,... (2)
Определение 1. Обозначим
J. = InfJ(u), INt = inUN([u]N), N = 1,2,...
и uN
Скажем, что последовательность задач (2) аппроксимирует задачу (1) по
функции, если
lim INt = Jt. (3)
N —*оо
Нетрудно видеть, что в схему задач (1), (2) укладываются задачи (1.1)-
(1.3) и (1.4)-(1.6), в которых роль множеств X и XN играют пространства
■^П^О) Т] и L^N соответственно, множества U и UN описываются
условиями (1.3) и (1.6),¾ причем в теореме 1.1 сформулированы условия,
гарантирующие аппроксимацию по функции. Заметим, что в задачах (1.1)-(1.3)
и (1.4)-(1.6) множества X и XN имеют различную природу: в задаче (1-1)-
(1.3) управления и траектории зависят от непрерывного времени, а в (1.4)-
(1.6) — от дискретного времени.
В § 1 для задачи (1.1)-(1.3) аппроксимирующая последовательность
задач (1.4)-(1.6) была получена с помощью разностной аппроксимации
уравнений (1.2) и множества (1.3). В этой и других задачах оптимального
управления, рассмотренных в гл. 6-9, при конструировании аппроксимирующих
задач наряду с разностными методами могут быть использованы и другие
методы, такие, как например, метод конечных элементов, метод прямых,
возможна аппроксимация управления с помощью частичных сумм ряда,
представляющего собой разложение по каким-нибудь базисным функциям
720
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
или по степеням какого-либо параметра,и т. п. Все эти методы
аппроксимации экстремальных задач также укладываются в схему задач (1), (2).
Разумеется, в (1), (2) не исключается и такая возможность, когда
множества X и XN имеют одну и ту же природу, а множества UN и функции
IN([u]N) = IN(u), N = 1,2,..., представляют собой приближенно заданные
множество U и функцию J(u) соответственно.
Таким образом, задачи (1), (2) позволяют охватить широкие классы
экстремальных задач и их аппроксимаций. Возникает важный вопрос: каким
условиям должна удовлетворять последовательность задач (2) для того,
чтобы она аппроксимировала задачу (1) по функции, т. е. чтобы выполнялось
равенство (3)?
1. Следующая теорема дает один из возможных ответов на этот вопрос,
указывает подход к построению последовательности аппроксимирующих
задач в конкретных экстремальных задачах, к исследованию сходимости в
смысле равенства (3).
Теорема 1. Для того чтобы последовательность задач (2)
аппроксимировала задачу (1) по функции, необходимо и достаточно,
чтобы существовали отображения QN: X -^ XN и PN: XN —» X такие, что
1) для любой точки и G U справедливо включение QN(u) е. UN, N =
J^-(IN(QM)-J(u))<0; (4)
N —* оо
2) для любой точки [u]N е UN справедливо включение PN([u]N) е U,
N = 1,2,..., и
Jim (J(PN([u]N)) - /„(№)) ^ 0- (5)
Если выполнены условия 1), 2) и, кроме того, последовательности {PN},
{Тлг} неотрицательны, стремятся к нулю и таковы, что
In(Qn(u))-J(«)£Pn, иеЦ N=1,2,..., (6)
J(Pn([u]n))-In([u]n)^1n, [u]n£Un, N = 1,2,..., (7)
то справедлива оценка
-1n^In*-J*^Pn, N=1,2,... (8)
Наконец, если последовательность {[u]Nc} такова, что
Ыт € U„, INt ^ /„([«k) ^ In. + %> Jim % = 0. (9)
N —* оо
то при выполнении условий 1),2) lim J(.PN([u]Ne)) = Jt, а из усло-
N —*оо
вий (6), (7) следует1 оценка
0^J(PN([u)m))-J^PN + lN + £N, N=1,2,... (10)
Доказательство. Необходимость. Пусть
последовательность задач (2) аппроксимирует задачу (1) по функции, т. е. справедливо
равенство (3). Возьмем произвольные последовательности {%}, {Млг} та~
кие, что
vNeU, N=l,2,...; lim<(J(%)-JJ = 0, .(11)
N —>оо
[v]n£Un, N=1,2,...; Jim (!„([«]*)--^.) = 0. (12)
§ 2. ОБЩИЕ УСЛОВИЯ АППРОКСИМАЦИИ
721
Существование таких последовательностей вытекает из определения
нижней грани. Определим отображения QN и PN следующим образом:
QN(u) = [v]N при всех иеХ, N=1,2,...
Pn([u]n) = vn при всех [u]N£XN, N = 1,2,...
Ясно, что QjJu) £ UN при всех и£ U, PN([u]N) £ U при всех [u]N £ UN,
N =1,2,... далее, так как J„ ^ J (и) при и £ U, то
IAQn(«)) - Пи) = VAQA«)) ~ iN*) + (V - J.) +
+ (J, - J(u)) < (IN([v]N) - IN.) + (INt - J.)
при всех и £ U, N = 1, 2,... Переходя в этом неравенстве к верхнему
пределу при N —» оо, с учетом условий (3), (12) придем к неравенству (4).
Наконец, поскольку INt ^ IA\u]n) пРи [u]n е UN, то
J(PAMn)) ~ IAWn) = (J(PA№n)) ~ J*) + U ~ In*) +
+ (In* ~ IAWn)) < (J(»n) ~ J*) + U ~ In*)
при всех [u]N £ UN, N = 1,2,... Переходя в этом неравенстве к верхнему
пределу при N —» оо, с учетом условий (3), (11) получим неравенство (5).
Необходимость доказана.
Достаточность. Пусть для некоторых отображений QN, PN
выполнены условия 1), 2). Докажем, что тогда справедливо равенство (3).
Поскольку QN(u) £ UN при всех и £ U, то INt ^ IN(QN(u)) и
In*-J* = (In*-In(QnM)) + (In(QnM)-J(u)) +
+ (j(«) - j.) ^ (iAQAu)) - J (и)) + №) - J*)
при всех ие U и N =1,2,... Переходя в этом неравенстве к верхнему
пределу при N —» оо, с учетом условия (4) получим
lim (V - J.) ^ J (и) -Jt,u£U.
N —* оо
Левая часть этого неравенства не зависит от и, поэтому, переходя в правой
части к нижней грани по и£ U, будем иметь lim (1^ - JJ ^ Jt - Jt =
N —* оо
= 0. С другой стороны, поскольку PN([u]N) £ U при всех [u]N £ UN, то Jt ^
< ПРАЫ*)) и
J* - In* = (J* ~ J(Pn([«]n))) + (J(PA[«]n)) ~ IAWn)) +
n) L N* n) ■'лг*/
для всех [u]N £UN, N =\,2,... При N -»оо отсюда с учетом условия (5)
получим
lim (J, - Im) <: lim (IN([u]N) - INt)
N —* oo N —»00
при любом выборе [u]N £ UN, N = 1, 2,... В частности, если, пользуясь
определением нижней грани INt, при каждом N = 1, 2,... взять [u]N £ UN
так, чтобы IN([u]N)^INlr+l/N, то из предыдущего неравенства будем иметь
lim(J,- V)s= lim l/N = 0.
N —* оо N —>оо
722
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Итак, из вышеизложенного следует, что
О ^ -lim (J, - INt) - _Hm_(I„. - JJ ^ lim (INt ~ JJ ^ 0,
N —* oo N—too N—* oo
т. e.
JiHL( V ~ J*) = Jim (IN. - JJ = 0.
Отсюда следует, что предел lim JN существует и равен Jt. Достаточность
N -*оо
доказана.
Докажем оценку (8). Так как QN(u) е UN при всех и £ U, то с учетом
оценки (6) имеем INt ^ IN(QN(u)) ^ J(«) + /3^, или 1^ ^ J (и) + PN для
всех u£U, N = 1,2,... Переходя в правой части последнего неравенства к
нижней грани по и£ U, получим INt^Jt + PN, или INt — Jt^PN, N = \, 2,...
Правое неравенство (8) доказано. Далее, так как PN([u]N) £ U при всех
[u]N е UN, то с учетом оценки (7) имеем Jt ^ J(PA[u]n)) =¾ JN([u]N) + jN,
или Jt < In([u]n) + 7лг ЛЛЯ всех [u]n е UN, N —1,2,... Переходя в правой
части этого неравенства к нижней грани по [u]we UN, получим Jt 4lIn* + 1/n>
или —7лг ^ In* — J*> N = 1,2,... Левая оценка (8) также доказана.
Итак, пусть последовательность [u]Ne удовлетворяет условиям (9). Тогда
0 < J(PN([u]m)) ~J. = (J(Pn([«]n.)) ~ IAMn.)) + (1АЫп) ~ In*) +
+(IN*-J*) < (^(^([«k))-^([«k))+%+(V-^), N=1,2,...
Отсюда и из (3)-(5) следует, что последовательность {-^([«]№)} является
минимизирующей для задачи (1), а из оценок (6)-(8) вытекает оценка (10).
Теорема 1 доказана. □
Нетрудно видеть, что проведенное в § 1 исследование поведения
разностных аппроксимаций (1.4)-(1.6) задачи (1.1)-(1.3) укладывается в схему
теоремы 1. В самом деле, отображения QN и PN в этой задаче были
определены формулами (1.20), (1.21), в леммах 1.3 и 1.4 были установлены
неравенства (4), (5) и оценки (6), (7), а оценки (1.31), (1.32) являются
следствиями оценок (8), (10).
2. Для иллюстрации теоремы 1 кратко остановимся здесь еще на
задаче (1.1), (1.2) при условии
« = «(*)€ U = $u(t) е Lr2[t0, Т]: l\u(t)\4t ^Д2}, (13)
где R > 0 — заданное число. В качестве аппроксимирующей
последовательности для задачи (1.1), (1.2), (13) возьмем разностные аппроксимации (1.4),
(1.5) при условии
[«]*е UN = \[u]N = («„,«„...,«„_,)eL2V: е'а^КР^Д2}. (14)
В качестве отображений QN и PN возьмем отображения, определяемые
формулами (1.20), (1.21). Справедлива
Теорема 2. Пусть матрицы A(t), В (t),f(t) кусочно непрерывны
на отрезке [t0, Т], разбиения {tt;i =0,..., N} отрезка [^, Т] таковы,
4modN= max Д*, ^ IT - ЬЛМ/N, N = 1, 2,..., М-const >0. Пусть
0 < г ^ N - 1
Jt — нижняя грань функции (1.1) при условиях (1.2), (13), INt — нижняя
§ 2. ОБЩИЕ УСЛОВИЯ АППРОКСИМАЦИИ
723
грань функции (1.4) при условиях (1.5),(14), а последовательность
{[и]т} определена из условий (9). Тогда справедливы оценки
-C66N^INt-J^C56N, TV =1,2,...,
О ^ J(PN([u]Ns)) -J.£ (С5 + C6)6N + ею N = 1,2,...,
где постоянные Съ, С6 взяты из оценок (1.29), (1.30) при W = U и WN =
= IL, соответственно, величина 6N определена формулой (1.26).
Доказательство. Из соотношений (1.22), (1.23) следует, что
отображения (1.20), (1.21) таковы, что QN(u)e UN при всех и е. U и P„([u]N)E U
при всех [u]N е Un, N= 1, 2,... Далее, оценки (1.8), (1.10), (1.16) и леммы
1.2-1.4 остаются справедливыми и для множеств (13), (14). Поэтому из
лемм 1.3 и 1.4 имеем неравенства (4), (5) и оценки (6), (7). Отсюда и из
теоремы 1 следуют все утверждения теоремы 2. □
3. Следует оговориться, что в более сложных задачах минимизации
построение аппроксимирующих задач, удовлетворяющих условиям теоремы 1,
может оказаться непростым делом. Так, например, даже в простейших
задачах оптимального управления вида (1.1)-(1.3) или (1.1), (1.2), (1.3) при
наличии фазовых ограничений не всегда бывает ясно, как строить разностные
аппроксимации, обеспечивающие непустоту множества UN и
удовлетворяющие условиям теоремы 1. Для определения возникающих здесь трудностей
иногда полезно работать с расширениями IIе и сужениями U~e множества,
на котором имеется минимум. Приведем два критерия аппроксимации по
функции, использующие упомянутые расширения и сужения множества U.
Теорема 3. Для того чтобы последовательность задач (2)
аппроксимировала задачу (1) по функции, необходимо и достаточно,
чтобы при некотором £q > 0 существовали семейства непустых множеств
IIе С X, U~e QX, 0 < е < £о> и отображения QN: X —» XN, PN: XN —> X
такие, что функция J(u) определена на объединении множеств Ue, U~e
по всем е, 0 < е < Sq, и, кроме того:
П для любого е, 0 < е < е0, найдется номер N{ =iV,(e) такой, что
QN(u) е UN при всех и е U~E и N ^.Nx и при каждом фиксированном е,
0 < е < е0, для всех и е U~e выполняется неравенство
ТЕГ(1^(«))-7(«))<0; (15)
N —* оо
2) для любого е, 0 < е < е0, найдется номер N2 = N2(e) такой, что
PN([u]N)е IIе для всех [u]N eUN и N^ N2 при любом выборе [u]N е UN,
N^\, выполняется неравенство
TtaT(J(^([«U) - In(Mn)) < о; (16)
N —*оо
3) справедливы неравенства
HmJ,(e)£J,, (17)
M4(-0<4> (18)
е->0
где Jt(e) = inf J (и), Jt(-e) = inf J(u).
Доказательство. Необходимость. Пусть
последовательность задач (2) аппроксимирует задачу (1) по функции, т. е. справедливо
724
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
равенство (3). Положим Sq = 1, Ue = U~e = U, 0 < е < е0. Тогда J„(e) =
= J*(-e) = J», 0 < е < Sq, и условия (17), (18) тривиально выполняются.
Выберем произвольные последовательности {vN}, {[v]N} такие, что
vNeU, N=1,2,,.., lim(J(vn)-Jt) = 0, (19)
N —юо
М^еЦ,, N=1,2,..., lim (!„([«]„)-1„,) = 0. (20)
N —*оо
Определим отображения (¾ и Pw следующим образом:
<?*(«) = [«]*. «ех; р„(М*) = %, Niv.e^, ^ = 1,2,.,.
Ясно, что QN(u) G С/^ при всех и G £/~е = U и всех е, 0 < е < е0, N^l = Nlt
PN([u]N) eU* = U при всех [wjjy е [/„ и всех е, 0 < е < е,,,• JV > 1 = N2:
Далее, так как J„ ^ J(«) при и е ?У = С/-6, то
^(<?*(«)) " ОД = (^(Мл) -I*.) + (In, -J.) +
+ (J, - J(u)) <= (IN([v]N) - Im) + (V - J.)
при всех ueU = U~e, 0 < e < Sq, N =1,2,... Переходя в этом
неравенстве к верхнему пределу при N —» оо с учетом условий (3), (20), придем к
неравенству (15).
Наконец, поскольку INt ^ IN([u]N) при [u]N е UN, то
•W([«U) - In(["]n) = (ОД) ~ 4) + (4 ~ In,) +
+ (In* ~ IAMn)) ^ (ОД) ~ J.) + (J, ~ In,)
при всех [u]N G UN, N = 1, 2,... Отсюда с учетом условий (3), (19) при
N —» оо получим неравенство (16). Необходимость доказана.
Достаточность. Пусть выполнены условия 1)-3). Докажем, что
тогда справедливо равенство (3). Зафиксируем произвольное число е, 0 <
< е < е0. Так как QN(u)eUN при всех ueU~e и iV>iVlf то Im^IN(QAu)) и
V - 4 = (In* ~ IAQn(u))) + (In(Qn(u)) ~ •/(«)) + (ОД " J.) &
<:(lN(QN(u))-j(u)) + (J(u))-Jt), иеи-% N>NV
Отсюда при N —» оо с учетом условия (15) получим
lim (INt - JJ ^ J(u) - Jt, ueU~e, 0<e<e0.
N —* oo /
Левая часть этого неравенства не зависит от и eU~e, поэтому, переходя в
правой части к нижней грани по и е U~e, будем иметь
J™~(In* ~ J*) < ^(-е) - •/» 0 < е < е0.
При е —> 0 отсюда с помощью условия (18) получим lim (INt — JJ ^ 0. С
N—*oo
другой стороны, поскольку PN([u]N) G U£ при всех [u]N G UN, N ^ JV2, то
Ш^АРАЫм))*
J*(£)-In* = (J*(£)-J(Pn([u]n))) + (J(Pn([u]n))-In(Mn)) +
+ (In([u] n) 1N* )<(J(Pn([u]n))-In([u]n)) +
+ (IAHn)-In*), Mn£Un, N>N2.
§ 2. ОБЩИЕ УСЛОВИЯ АППРОКСИМАЦИИ
725
Отсюда с учетом условия (16) при N —»оо непосредственно получим, что
jimV.(e) - Ъ*) < JM-WMjv) - 1№)
N—*oo N-*oo
при любом выборе [u]N G C^f JV ^ 1, и любом фиксированном е, 0<е <е0.
В частности, если, пользуясь определением INt, при каждом N ^ 1 взять
[ujjy G Ujy так, чтобы /^([u]^) ^ INt + l/N, то из предыдущего неравенства
будем иметь
TmT( J,(e) - V) = J.(e) + TST(-J№) < ТШП/JV = О
N—*oo N—iOo N—юо
при любом e, 0 < e < e0. Отсюда с помощью условия (17) при е —>0 получим
ТПй"( J, - iN.) = J. +ТШГ(-1„.) ^ 0.
^ ЛГ—*оо JV —»оо
Итак, показано, что
О < - Hm (J, - V) = _Ит_(1№ - J.) ^ Ит (1„, - JJ ^ О,
N-юо ЛГ-too JV->oo
т.е. Jiin_V = Jim INt = Jt.
Отсюда следует равенство (3). Достаточность доказана. □
Теорема 4. Для того чтобы последовательность задач (2)
аппроксимировала задачу (1) по функции, необходимо и достаточно,
чтобы существовала последовательность непустых множеств UE"QX,
N=1, 2,..., и отображения QN:X^>XN, PN:XN^>X такие, что функция
J(u) определена на объединении множеств ( (J Ue><)uU и, кроме того:
\JV=1 /
1) при всех и е. U справедливо включение QAU) £ UN, N = 1,2,..., и
выполняется неравенство
JuT(in(Qn(«))-J(«))^0;
N —»00
2) npuecex[u]Ne UN справедливо включение PN([u]N)eUe", N = 1, 2,...
..., и выполняется неравенство
N —* ОО; .
3) справедливо неравенство
ЛГ-.00 U"
Если же выполнены условия 1)-3) и, кроме того, имеются
неотрицательные последовательности {PN}, {iN}, {vN}, сходящиеся к нулю и
такие, что
IAQA«))-J(«)£Pn, и^Ц N=1,2,..., (21)
J(PA№n)) ~ IAMn) < 1ю Mn£Un, N = 1,2,..., (22)
J*-J*(eN)<vN, N=1,2,..., (23)
то справедлива оценка
-1n-Vn<In*-J*^Pn, N = 1,2,... (24)
Доказательство того, что условия 1)-3) необходимы и достаточны для
выполнения равенства (3), проводится так же, как в теореме 3, нужно лишь
726
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
в этих рассуждениях заменить U~e на U, IIе на {U*»}. Докажем
оценку (24). Из того, что QN(u) G UN при всех и € U, N = 1, 2,..., и из
условия (21) следует, что INt ^ IN(QN(u)) ^ J (и) + (3N, или INt ^ J(«) + (3N при
всех «е U, N = 1,2,...
Переходя к нижней грани по и е U, отсюда получим 1т ^ J„ + Ду, iV =
= 1,2,... Правое неравенство (24) доказано. Далее, так как ^([^]^) G Ue"
при всех [u]N G UN, N = 1, 2,..., то с учетом условий (22), (23) имеем
J.-vN^ Jt(eN) ^ J(PN([u]N)) ^ In([u]n) + 7лг,
или Jt - vN ^ 1м([и]м) + ^ при всех [u]N еЩ, N=1,2,... Отсюда следует,
что Jt - vN ^ 1т + 7лг. iv = 1, 2,... Оценка (24) доказана. □
Приложения критериев аппроксимации, приведенных в теоремах 1, 3, 4,
рассмотрим ниже. Наряду с теоремами 1, 3, 4 существуют и другие
варианты критериев аппроксимации по функции [114; 303; 363; 501]; некоторые
такие критерии сформулированы далее в виде упражнений.
Упражнения
1. Равенство (3) имеет место тогда и только тогда, когда выполнены следующие два условия:
1) для любого числа 6 > 0 существует номер JVj = N\(6) такой, что для всех N >Щн ueU
найдется точка [u]NS g UN, удовлетворяющая неравенству IN{[u]NS) < J{u)+ 6; 2) для любого
числа 6 > 0 существует номер N2 = JV,( 6) такой, что для всех iv > JV2 - и [u]N G UN найдется
точка ит G U, для которой J(um) < IN([u]N) + S. Доказать.
2. Для того чтобы имело место равенство (3), необходимо и достаточно, чтобы
существовали отображения QN: X —> XN и PN: XN —> X такие, что: 1) для некоторой
последовательности {uN} g U, lim (J(uN) — Jt) — 0, выполняются условия: QN(uN) е UN, N = 1, 2,...,
N —* ро f
и lim (IN(QN(uN)) - J(uN)) ^.0; 2) для некоторой последовательности [«]„£[/„, AT =
N —* оо
= 1,2,..., lim (/^(Mjv) - /№) = 0, выполняются условия: PN([u]N) &U, N = 1, 2,..., и
N —* оо
lim (,7(Р„([и]„))-/„([и]„))«0. Доказать.
JV —* оо
3. Равенство (3) имеет место тогда и только тогда, когда при некотором Sq > 0 существуют
семейства непустых множеств Ue С X, U~e CI, 0 < е < Sq, и отображения QN: X —> Х^-
и Pjy-: XN^>X такие, что функция J(u) определена на объединении множеств Ue, U~e
по всем е, 0 < е < 6q, и, кроме того: 1) для некоторого семейства {м£}, ие g U~s, 0 < е < е^,
lim (J(u ) —J (—е)) = 0, при каждом е найдется номер JV[ = ATL(е) такой, что QN(u )g t/дг при
е —»О iL!
всехЛГ^ЛГ! и lim (^(¢^(^))-7(^))^0: 2) для некоторой последовательности [uJ^G г/дг,
JV = 1, 2 lim (-^лг([и]лг) "~ In*) = Oi и любого е, 0 < е < 6^, найдется номер Щ — JV2(e)
такой, что Рлг([и]лг)б{7£ при всех N^N2n lim (7(Рлг([и]лг))—/#(["]#)) <0; 3) выполнены
ТУ—» оо
условия (17), (18). Доказать.
§ 3. Разностная аппроксимация для
квадратичной задачи с фазовыми ограничениями
1. Рассмотрим следующую задачу оптимального управления:
J(u) = \x(T,u)-y\2->inl, (1)
x(t)=A(t)x(t)+B(t)u(t)+f(t), *b<t<3J ¢(^)=¾. (2)
u = u(t)eU = {u(t) G Lr2[t0, T]\ u(t) G V
почти всюду на [t0) T], x(t, и) e G(t), t0 < t ^ T}, (3)
§ 3. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ КВАДРАТИЧНОЙ ЗАДАЧИ 727
где G(t)— заданные множества из Еп при каждом t €.[1^, Т], 3¾ е G(t0).
В качестве аппроксимирующих задач возьмем последовательность задач:
In([u]n) = M[«U - У\2 ~* inf» (4)
xi + x = xi + Ati{Aixi + Bi «« + /«), * = 0, ...,JV— 1, (5)
[u]N = (vQtult...tuN_l)eUN =
={[«]NeLT2N-- ui^ i=0,...,N-l; х{([и]м)еО{ = 0^), i=0,...,N}
(все обозначения здесь взяты из § 1).
Для того чтобы задача (1)-(3) имела смысл, естественно требовать,
чтобы U ф 0. Возникают вопросы: можно ли тогда гарантировать, что при
достаточно мелком разбиении отрезка [t0, Т] множество UN также будет
непустым, и при каких условиях последовательность задач (4)-(6) будет
аппроксимировать задачу (1)-(3) по функции?
Как показывает следующий пример, из того, что U ф0, вообще говоря,
не следует, что UN Ф 0.
Пример 1. Пусть требуется минимизировать функцию J(u) = ж2(1)
при условиях x(t) = x(t)-u(t), O^t^l, ж(0)= 1, и = u(t) G U = {u(t) G
eL2[0, 1]: 0^«(t)^ 1 почти всюду на [0, 1]; x(t, «)> е( при всех t е[0, 1]}.
Поскольку x(t, и) = е( (1 — $ ети(т)<1т\ ^ е(, 0 ^ t ^ 1, при всех u(t) G
^ о '
GL2[0, 1], 0^.u(t)^ 1, то условие x(t, и) ^ е\ 0^ t < 1, выполняется лишь
при u = u(t) = 0. Следовательно, множество С/ непусто и состоит из
единственного управления u(t)=0.
Рассмотрим следующую разностную аппроксимацию этой задачи:
ММлг) = aft -» inf> Ж» + 1 = Ж» + А*(а;» -«<). * = 0,..., JV — 1, ж0 = 1,
MW = K, «,,..., uN_l)eUN = {[u]NeL2N: 0^u{ <-l, г=0, ...,N- 1;
a^e(', * =0,..., JV}, At = l/JV, JV = 1,2,...
Из0<«. ^1 следует, что (1 + Д*)ж. - Д* ^ ж. + 1 = (1 + Д*)аз. - АЩ ^ (1 +
+ At)xit г = 0,..., N — 1, 3¾ = 1. Отсюда по индукции нетрудно получить,
что 1 ^'xf ^(1 + Д*)\ i=0,...,N. Так как 1+Д* < еЛ( при всех Д* >0,
то х{ < егЛ( = ei; для всех г = 1, ..., N при любом выборе [u]N = (и0, «,,...
■ ■ ■, uN_{), 0^. и{ ^ 1, г =0,..., JV- 1. Это значит, что множество £/^ пусто
при всех N — 1, 2,...
2. Таким образом, важно выяснить, при каких условиях из непустоты
множества (3) следует, что множество (6) также не будет пустым, а также
указать способы аппроксимации задачи (1)-(3) для случаев, когда условие
U ф 0 не гарантирует, что Щ ф 0. Здесь мы ограничимся изложением
результатов, принадлежащих М. М. Потапову (теорема 1) и Е. Р. Авакову
(теорема 2). Для упрощения выкладок задачу (1)-(3) будем рассматривать
при дополнительном предположении, что множество G(t) не зависит от t,
т. е. G(t) = G, <о<* <Г.
Ниже нам понадобятся так называемые е-расширения Ge и е-сужения
G~e множества G, определяемые так:
Ge = {х е Еп: р(х, G) = inf \х - z\ ^ е}, е ^ 0,
G~e = {xeG: inf \x-z\^e}, e ^ 0,
zeTpG
728
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
где TpG — совокупность граничных точек множества G. Кроме того, мы
будем широко пользоваться оценками и соотношениями (1.8)-(1.26),
считая, что встречающиеся в них константы С0, С{,... отвечают множествам
управлений
W = {u(t)<=L'[t0, Г]: u(t)<=V почти всюду на [*0) Г]},
WN = {[u]N = (ik>,uu...,uN_l)eLr2N:u{eV, г =0,..., N-l}. (8)
Теорема 1. Пусть матрицы A(t), В (t), f(t) кусочно непрерывны
на отрезке t0^t^.T, V — выпуклое замкнутое ограниченное
множество из Er, G —выпуклое замкнутое множество из Еп с непустой
внутренностью, причем существуют число е0 > 0 и управление й=й(£) е £/
такие, что
x(t,n)eG-e", t0^t^T. (9)
Пусть, кроме того, разбиения {t{, г = 0,..., N} отрезка [t0, Т]
удовлетворяют условию
dN= max At{^(T- t^M^/N, M0 = const >0, /V=l,2,...
Тогда множество UN, определяемое условиями (6), при всех
достаточно больших N непусто и lim Im = Jt, где Jt — нижняя грань функ-
N —*оо
ции (1) при условиях (2), (3), INt —нижняя грань функции (4) при
условиях (5), (6).
Доказательство. Положим X = Lr2{t0, Т], XN = Lr2N, N =1,2,...,
Ue = {u = u(t)eW; x(t,u)<=GE, t0^t^T},
U~e = {u = u(t) e W: x(t, u) e G'e, t0^t^T},
где 0<е<е0, число e0 взято из условия теоремы, множество W — из (8).
Определим отображенияQN:X-*XN vi.PN:XN-^X формулами (1,20), (1.21):
! «. + ■
QN(u) = (u0,ul,...,uN_l):u{ = -Ki- $ и(т)<1т, %=0,...,N-l, .
Pn([u]n) = 4 при *,<*<*,'+!, i =0,..., N-I.
Проверим, что для введенных множеств Ue,U~e и отображений QN,PN
выполнены все условия теоремы 2.3. Зафиксируем произвольное число е,
0 < е < е0. Возьмем какое-либо управление и е С/_£. Согласно оценке (1.24)
max \x(t{, u)-Xi(QN(u))\^SN, N=1,2,... (11)
Так как SN —> 0 при N —> оо, то найдется номер JVj = iV,(e) такой, что SN ^
< е при всех N > TV,. По определению (7) множества G~e шар \х — z\ ^ е
принадлежит множеству G при всех z е G~e. Тогда для любого и е U~e шар
\х — x(tt, и)\ ^ е принадлежит множеству G при всех i =0,..., N и N^N{.
Отсюда и из оценки (11) следует, что xt{QN{u)) еС при всех г =0,..., N,
и е U~e, N^NX. Кроме того, Qm(u) принадлежит множеству WN из (8) при
всех и е W согласно лемме 1.1. Тем самым показано, что QN(u) е UN при
всех и е [7_£ и N ^ N{. Кроме того, из леммы 1.3 имеем
lim(IN(QN(u))-J(u)) = 0, ueU".
N —>оо
Таким образом, условие 1) теоремы 2.3 выполнено.
§ 3. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ КВАДРАТИЧНОЙ ЗАДАЧИ 729
Далее, согласно ранее приведенной оценке (1.25), получаем
omaxw \x(t(, Рдг([«]дг)) - Я5(([«]дг)| ^ 6N, JV = 1,2,...,
а из оценки (1.11) имеем
\x(t, Рдг([«]дг)) - X(t{, Рдг([«]дг))| ^ CxdN
при всех t, t{^t ^ ti+l, г = 0,..., N - 1, [u]N е UN, N = 1, 2,... Тогда
N*. PAMn)) ~ в«(Млг)1 < SN + C,dN (12)
для всех t, t{ ^t ^ti + l, г =0,..., N - 1, [u]N e UN, N = 1, 2,... Однако
5N —»0, dN-+0 при iV —> oo, поэтому найдется номер iV, = iV2(e) такой, что
5N + Q^ ^ е при всех iV ^ N2, Отсюда, из оценки (12) и определения (6)
множества UN следует, что x(t, Pm([u]n)) е Ge при всех t, t0 4 * =¾ Т, т. е.
PN([u]N) е С/£ при всех N % N2. Кроме того, из леммы 1.4 имеем
lim(J(P„([«U)-I„([4,)) = 0.
N -too
Таким образом, условие 2) теоремы 2.3 также выполнено.
Наконец, проверим, выполняется ли условие 3) теоремы 2.3. Сначала
установим, что lim J„(e) = Jt, где J„(e) = inf J(u). Заметим, что если 0<
е —»0 UE
< е, < е2 < Eq, то If С С/£| С U4 и, следовательно, J,(e2) ^ ^*(ei) ^ J*- Отсюда
следует, что существует предел lim J„(e), причем
е —»0
llmJ.(e)<J.. (13)
е—»0
При каждом е, 0<е<е0, выберем uceUe так, чтобы ljm(J„(e)- J(«e.))=0.
Так как множество W из (8) слабо компактно в Ll[t0, Т] и {ие} е W,
0 < е < е0, то существует последовательность {ек}, сходящаяся к нулю,
0 < ек < е0, и такая, что последовательность управлений {ик = ие } будет
слабо сходиться к некоторому управлению v = v(t)eW. Согласно (1.12)
последовательность {x(t, ик)} сходится к x(t, v) равномерно на отрезке [£0, Т],
т. е. sup \x(i,uk)—x(t,v)\=£k-+0 при к —>оо. Поскольку x(t, ик) G G£*, то
x(t,v)€G^ + ^, t0^t<:T, к = 1,2,... (14)
Однако efc + £fc —>0 при к —>оо, траектория ж(£, -и) от номера fc не зависит,
множество G замкнуто. Отсюда и из (14) следует, чтб x(t, v)eG при всех
t, t0^.t^.T. Это значит, что ve U и J(v)> J„. Поскольку (¾} сходится kv
слабо в Ь2[*0) Т], а функция J(«) слабо непрерывна, то lim J(«fc) = J(v)^
^ J„. С учетом определения последовательности {ик =ис } тогда получим
lim J.(e) = lim Jt(ek) = J(v) ^ Jt.
e —»0 к —* oo
Отсюда и из (13) следует, что lim J„(e) = J».
Теперь покажем, что lim J„(-e) = J„, где J„(-e) = inf J (и). Заметим, что
е —* 0 С/"~*
если 0 < е, < е2 < е0, то С/-"2 С U~e> С С/ и, следовательно, J„ ^ J„(e,) ^ J„(e2).
Отсюда следует, что существует предел lim J„(—е), причем
е —»0
• HmJ.(-e)^J.. (15)
730
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Возьмем любую последовательность управлений {ик} е U, lim J(uk) = Jt,
к —* оо
и числовую последовательность {ак}, 0< ак < 1, lim afc =0. По условию
к —* оо
теоремы существует управление u = u(£)e U, для которого справедливо
включение (9). Составим последовательность vk = акй + (1 — ак)ик, к =
= 1,2,..., и покажем, что vk е [/-¾¾. fc = 1, 2,... Так как n, ик е W, то
«te^, fc = 1, 2,..., в силу выпуклости W. Остается показать, что
x(t,vk)eG~^, t0^t<T, к = 1,2,... (16)
Заметим теперь, что
x(t,vk) = akx(t,u) + (l-ak)x(t,uk), t0£t^T, к = 1, 2, .,. , (17)
Из условия (9) следует, что при каждом t е [£0, Т] и к = 1, 2,... шар 5(£) =
= {ж: |ж — x(t,u)\ ^ е^} принадлежит множеству G. Покажем, что тогда
шар Sk(t) = {х; \х — x(t, vk)\ ^ е0ак} также принадлежит G при всех t е
G [£0, Т] и fc = 1, 2,... Возьмем произвольную точку х е 5fc(t) и положим
z = x(t,u) + (х — x(t, vk))/ak. Так как \z — x(t, й)\ = \х — x(t, vk)\/ak ^. е0,
то z е S(t) е. G, Из определения точки z и равенства (17) тогда имеем
х = x(t, vk) + ak(z - x(t, и)) = a.kz + (\ - ak)x(t, uk), где ze G, x(t, uk) G G,
0 < ak < 1. В силу выпуклости множества G отсюда следует, что х е G.
Таким образом, Sk(t) е G при всех t е [t0, Т], к = 1, 2,... Отсюда и из
определения шара Sk(t) вытекает включение (16). Тем самым показано,
что vke £Г-£°а\ к = 1,2,...
Зафиксируем некоторый номер к и возьмем число е таким, чтобы 0 < е <
< е0ак. Тогда vk G U~ate° С £/~£ и J„(-e) ^ ^(¾) при всех е, 0 < е < (¾¾.
Отсюда при е —> 0 получим
lim J„(-e) ^ ^(¾) при всех /г = 1,2,... (18)
е—»0
Так как lim afc=0, sup||«|| ^ R < оо, то с учетом оценки (1.14) име-
fc->oo w
ем \J(uk) - J(vk)\ ^C3\\u,-vk\\ = C3ak\\uk-u\\ ^2RC3ak-*0 при к ->oo.
Следовательно, lim .7(^.)= lim J(«fc) = jt. Отсюда и из неравенства (18)
к —* оо fc —* оо
вытекает, что lim J„(—е)^ J„. Сравнивая полученное неравенство с (15), за-
е —»0
ключаем, что lim Jt(—e) = Jt. Таким образом, условие 3) теоремы 2.3 также
е —»0
выполнено. Из теоремы 2.3 следует, что lim JNt = Jt. Теорема 1 доказана. □
N —*оо
3. При доказательстве того, что множество (6) непусто, в теореме 1 было
существенно использовано условие (9). Однако это условие не всегда легко
проверяемо и не всегда оно выполняется. Поэтому при аппроксимации
задачи (1)-(3) вместо задачи (4)-(6) можно попытаться рассмотреть задачу
минимизации функции (4) при условии (5) на несколько расширенном по
сравнению с (6) множестве
UN = {[u]NeW:x{([u]N)eGt», г =0,..., TV}. (19)
Оказывается, если исходное множество (3) непусто, то при достаточно
большом £N и множество (19) не будет пустым, и, кроме того, если £N-+0 при
N —> оо согласованно с dM = max Д*.., то последовательность задач (4),
о < г < я -1 *
(5), (19) будет аппроксимировать задачу (1)-(3) по функции. А именно,
справедлива
§ 3. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ КВАДРАТИЧНОЙ ЗАДАЧИ 731
Теорема 2. Пусть матрицы A(t), В (/),/(£) кусочно непрерывны
на отрезке *„ ^ t ^ Т, V — выпуклое замкнутое ограниченное
множество из Er, G —замкнутоемножество из Еп, множество (3) непусто.
Пусть, кроме того, разбиения отрезка [t0, Т] удовлетворяют условию
dN = max А% ^ (Т - t0)M0/N, М0 = const > 0, iV = 1,2,...,
и lim £w = 0, £N~^8N, N = 1,2,..., где величина 6N определена фор-
N —* оо
мулой (1.26). Тогда множество (19) непусто при всех iV = l,2,... и
lim /дг, = J», где Jt —нижняя грань функции (1) при условиях (2), (3),
N —*оо
INt —нижняя грань функции (4) при условиях (5), (19). Если, кроме
того, множество G выпукло, имеет непустую внутренность и выполнено
условие (9), а также £N ^ MX8N, М, = const ^ 1, N = 1, 2,..., то
справедлива оценка
ЖС3{Щ+11\+гС1$2 - C6SN < Im - J. < C5SN, N= 1,2,..., (20)
где постоянные С,, C3, C5, C6 взяты из (1.10), (1.14), (1.29), (1.30)
соответственно, sup ||«|| < R.
w
Доказательство. Положим X = L£[£0, T], XN = LlN, N — 1, 2,...,
[/¾ = {«(*) e W: ж(*, «) G Ge"}, где e^ = ^ + 6N + C^dlf (кстати, здесь
можно было бы воспользоваться оценкой (1.11) и всюду ниже принять
eN = ^N + 6N+CldN). Определим отображения QN, PN формулами (10).
Проверим выполнение условий теоремы 2.4.
Возьмем произвольное управление u£U. Согласно оценке (1.24)
max \x(t{, и) - xt{QN{u))\ ^SN, N = 1, 2,...
Отсюда, учитывая, что x(t, u)eG, t0^t^T,nSN^. £N, N= 1, 2,..., имеем
включение х(((2м(и)) £ G(» при всех г =0,..., N, N = 1, 2,... Это значит,
что QN(u) £ UN при всех и е U и N =1,2,... Кроме того, из леммы 1.3
имеем оценку
In(Qn(u)) -J(u)^C56n = (3n, и£Ц TV = 1,2,...
Таким образом, выполнение условия 1) теоремы 2.4 проверено и, кроме
того, установлена оценка (2.21).
Далее, согласно оценке (1.25), имеем
max Ы^,Рм([и]м))-ъ([и]„)\^6м, [u]N£UN, N=1,2,...
Из оценки (1.10) следует
N*> ЗД«Ы) ~Фп Рк(Ын))\ ^ cxdU2
при всех t, *,. ^ t ^ t,+ 1, г =0,.. .,N - 1, [u]N £ UN, N= 1,2,... Тогда
732
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
для всех t, t{ ^t ^. t{ + l, г = 0,..., N — 1, [u]N G UN, N = 1, 2,... Отсюда,
учитывая, что по определению множества UN точки x{([u]N) принадлежат
G(", г = 0,..., N, имеем
^(*,a«W)eGE» при + 8N + Cxdl/2
для всех [u]N е С/дг, N = 1, 2,... Тем самым показано, что PN([u]N) е Ue"
при всех [u]N eUN, N = 1, 2,... Кроме того, из леммы 1.4 следует
J(Pn([u]n))-In([u]n)^C66n = 1n, [u]NeUN, TV = 1,2,...
Таким образом, выполнение условия 2) теоремы 2.4 также проверено и,
кроме того, установлена оценка (2.22).
Далее, рассуждая так же, как при доказательстве равенства lim Jt(e) = j
е —* 0
в теореме 1, можно показать, что lim Jt(eN) = Jt. Это значит, что условие
N —* оо
3) теоремы 2.4 также выполнено. Из теоремы 2.4 следует, что lim INt = Jt.
N —* оо
Дополнительно предполагая, что G — выпуклое множество и существует
управление n = u(t) G U такое, что x(t, й) G G-£°, t0 ^ t ^ Т, е0 > 0,
докажем оценку (20). Так как множество Ue" слабо компактно в L~[t0, Т],
а функция (1) слабо непрерывна на U6", то в силу теоремы 8.2.4 при
каждом фиксированном N = 1, 2,... существует управление uNt е [7£"
такое, что Jt(eN) = J(uNt). Составим управление vN = aNu + (l — aN)uNt, где
aN = eN/(e0+eN), N=1,2, ... Так как W — выпуклое множество, 0<aN< 1,
а п, «дг,, е W, то % G W при всех JV =1-,2,,.. Далее, в силу определения (7)
сужения множества G~4 -((2^)^0 + %)— это (е0 + £дг)-сужение множества
Ge". Тогда x(t, и) е G~e° = (G£")_(£o+£''), x(t, uNt) e G£". Повторив
рассуждения, проведенные при доказательстве включения (16), получаем, что
x(t, vN)e(Ge")-^+e")a"=Ge"-a''(e°+e'')=G0=G, t0^t^T, N=1,2,...,
поскольку £дг—адг(е0+едг)=0 в силу определения aN. Следовательно, vNe.U
и J(vN) ^ Jt> N = 1,2,... С учетом оценки (1.14) тогда имеем 0 ^ Jt -
- Це„) =J.~ J(un*) = (J* - J(vn)) + (J(vN) - J(uNJ) < J(«at) - J(uNt) S$
^C3||%—%„||. Из определения vN следует \\vN—uNt\\ = aN\\u—uNt\\ ^.aN-2R,
так что
0^Jt-Jt(sN)^2RC3aN = 2RC3sN/(e0 + eN) =
= 2RC3(£N + 6N + C,^2)/(e0 + £N + 6N + CxdU2), N = 1, 2,...
Поскольку 6N ^ £N ^ Ml6ti, то 0 ^ J„ - Jt(eN) ^ vN = 2RC3((Ml + l)6N +
+ CxdU2)/(eQ + 2SN + С,йЛ, N=1,2,... Оценка (2.23) получена. Теперь
ясно, что оценка (20) является следствием оценки (2.24). Теорема 2
доказана. □
Предлагаем читателю самостоятельно убедиться в справедливости
теорем 1, 2, когда вместо множеств (3), (6), (19) берутся соответственно
множества
U = {u(t)eL;[t0,T]:\\u\\Li^R, x(t,u)eG, $,<*<Г},
UN = {[u]N e Lr2N[t0, T]: \\[u]N\\Lw ^ R, x{([u]N) e G, i =0,..., N},
UN = {[u]NeL^N[t0,T]:\\[u]N\L<R, x(H)eG4 i = 0,...,N}.
§ 3. РАЗНОСТНАЯ АППРОКСИМАЦИЯ ДЛЯ КВАДРАТИЧНОЙ ЗАДАЧИ 733
§ 4. Регуляризация аппроксимаций экстремальных задач
Пусть X — заданное множество, на котором введена некоторая топология
f (см. определения в 8.2, п. 7), функция J (и) определена на X. Рассмотрим
задачу
J(u)-»inf, иеЦ (1)
где U — заданное подмножество из X. Предположим, что
Jt = inf J (и) > -оо, Ut = {ue U: J(u) = JJ ф 0.
Пусть последовательность задач
**([«]*)-> inf, ueuNcxN, TV =1,2,..., (2)
где XN, UN — заданные множества, 1ц([и]м) — заданные функции на UN,
N = 1, 2,..., аппроксимирует задачу (1) по функции.
Возникает вопрос: нельзя ли провести регуляризацию
последовательности задач (2) или, иными словами, нельзя ли с помощью задач (2) построить
минимизирующую последовательность для задачи (1), сходящуюся к
множеству Ut в топологии т?
1.' В следующей теореме, принадлежащей Е. Р. Авакову, указываются
достаточные условия для регуляризации последовательности задач (2).
Теорема 1. Пусть выполнены следующие условия: ,,
1) J„>-oo, Ut^0, функция Щи) определена и неотрицательна на X;
2) последовательность {[v]Nj определена из условий
[v]neUN, Гд^Мдг) < Г*. + млм -^=1,2,..., (3)
где
TN([u]N) = In(Iu]n) + «A([«]w)« Nat e UN,
— функция Тихонова задачи (2), QN([u]N) — заданная на UN функция,
TNt = inf TN([u]N); {/½}. {<%} — положительные последовательности,
сходящиеся к нулю (если нижняя грань Тт достигается в какой-либо
точке из UN, то в (3) не исключается возможность ры = 0);
3) существуют последовательность множеств Ue" с X"и
отображения PN:' XN —» X такие, что
PN([v]N)eU*», N =1,2,..., , (4)
J(Pn(Iv]n))-In([v]n)<jn, N= 1,2,..., (5)
ВД№)К£МЬи + £лм ^=1,2,..., (6)
где {7лг}, {£N} — последовательности, сходящиеся к нулю;
4) существуют отображения QN: X —> XN такие, что для всех ut е Ut
выполняются соотношения
QN(ut)eUN, N =1,2,..., (7)
IAQNM)-J(«.)£PN, n =1,2,..., (8)
nN(QN(%))^tt(ut) + VN, N= 1,2,..., (9)
734
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
где {/Здг}, {%} — последовательности, сходящиеся к нулю;
5) имеются оценки
J, - J.forK "лг. 4(%) = infJ(«), N =1,2,..., (10)
U w
где {vN} — последовательность, сходящаяся к нулю.
Тогда
Um J(PN([v]N))=J,. (11)
Пусть наряду с условиями 1)—5) выполняются еще следующие условия:
6) функции J(u), Щи) т-секвенциально полунепрерывны снизу на X;
функция Щи) является т-стабилизатором, т. е. множество С1^ = {ие
е X, Щи) <С С} т-секвенциально компактно при любом С > 0; всякая
точка veX, являющаяся т-пределом какой-либо последовательности
{uN}, uNeUe", N= 1,2,..., принадлежит U; (см. определения 8.2.9,
8.2.10, 8.2.13);
7) справедливо равенство
\im(PN + lN + ^N + uN)/aN = 0. (12)
N —*оо
Тогда последовательность {PN([v]N)} т-сходится к множеству Utt =
= {weUt: Щги) = т{Щи) = Щ} и lim ЩРм([у]„)) = Щ.
Ц N -юо
Доказательство. Возьмем произвольную точку ut е Ut. Из
условий (3)-(10) следует цепочка неравенств
J* ^ JA£n)+Vn ^ J(Pn([v]n))+vn ^ J(PN([v]N))+aNn(PN([v]N))+PN ^
< TN*+PN + lN + vN + aNtN < TN(QN(nt))+fl.N + 'yN + VN + aNCN =
= In(Qn(u*)) + «A(QatK)) + /½ + 7N + vN + aN£N ^
=¾ JM + Pn + «аг^(ч) + aNVN + /½ + JN + vN + aN£N ^
=чУ*(елг) + 2¾ + PN + «дг^(ч) + /½ + In + vn + aN^N + Vn) <
<^(^([«]дг))+«агП(ч)+2«/дг+А»г+Маг+7аг+«аг(% + ^). ^=1.2, ■ • ■
Отсюда с учетом произвола в выборе ut е Ut имеем
J.-uN^ J(PN([v]N)K 4+«лгП.+0лг+7лг+Млг+«лг(£лг+%). #=1,2,... (13)
^(Pn([^]n))^^MPn+1n+^n+^n)/^n+^n+Vn, #=1,2,... (14)
Из (13) следует равенство (11), причем неравенства (13) представляют
собой оценку скорости сходимости в (11).
Далее предположим, что выполнены все условия 1)-7) теоремы. Для
краткости обозначим % = PN([v]N), N=1, 2,... Из (14) имеем fi(%)^S\ +
+ const=C<oo. Кроме того, согласно (4) имеем % е ие" С.Х, N= 1, 2,...
Это значит, что {vn}eQ,c. По условию, множество ис т-секвенциально
компактно. Поэтому последовательность {%} имеет хотя бы одну т-сходящу-
юся подпоследовательность. Возьмем произвольную точку vt, являющуюся
§ 4. РЕГУЛЯРИЗАЦИЯ АППРОКСИМАЦИЙ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ 735
т-пределом какой-либо подпоследовательности {vN }. По условию теоремы
vt G U. Тогда с учетом т-секвенциальной полунепрерывности снизу
функции J (и) и равенства (11) имеем J„ ^ J(vt) ^Jim_ J (% )= lim J(vN)=Jt,
к-юо k N->oo
т. e. J(vt) = J„, или vt G Ut. Далее, из т-секвенциальной
полунепрерывности снизу функции С1(и) и неравенства (14) вытекает, что fi» ^ "(%) ^
^ lim Cl(v„ ) < lim Q(vN )^Qt, т. e. lim Cl(vN )=Q =Щу\ или vteUtt. Тем
f, -too k fc —*oo k k—too k
самым показано, что любая точка vt, являющаяся т-пределом какой-либо
подпоследовательности {vN }, принадлежит множеству Utt и {£}(% )}—» Q,t.
Отсюда получаем, что последовательность {%} т-сходится к множеству Utt
и {£}(%)} —» О* при N —» оо. Теорема доказана. □
2. Для иллюстрации теоремы 1 рассмотрим задачу
J(u) = \x(T,u)-y\2-+inl, (15)
x(t) = A(t)x(t) + B(t)u(t) + f(t), t0<:t^T, ж(*0) = % (16)
u = u(t)eU = {u(t)eL£[t0, г]: u(t)eV
почти всюду на [*0, Т]; ж(*, u) е G, t0^. t ^. Г}; (17)
все обозначения здесь взяты из § § 1, 3. Так же, как в § 3, для
аппроксимации этой задачи рассмотрим последовательность разностных задач
M[«U=M[«U-y|a-*lnf, (18)
х{ + 1 = х{ + М,(А,х{ + В{«. + /,.), *=0,...,#-1, (19)
[«]дг G UN = {[u]N = (uq, «„ ..., «„_,): щ е К
*=0 JV- 1; s.([H,)eG4 *=0 JV}, #=1,2,... (20)
(обозначения см. в § § 1, 3). Если в задаче (15)-(17) фазовых ограничений
нет, т. е. G = En, то в (20) нет необходимости рассматривать расширения
G^N и можно принять
^ = 0, G^=E\ #=1,2,...
Положим X = Lr2[t0, Т], XN = Lr2N, N= 1, 2,..., в качестве стабилизатора
Т N-1
возьмем Щи) = I \u(t)\4t = \\и\Ц2, SlN([u]N)= £ А*»К12 = l|[«LJiw и
(0 г = 0
определим отображения QN: X —> XN, PN: XN-+X формулами
1 *,+1
QN(u) = (u0,ul,...,uN_l): u. = -gj- J u(t)dt, г =0,..., N- 1,
^(Mw) = ^, *,<*<*< + !, *=0,...,'#-l. ,
Из соотношений (1.22), (1.23) следует, что
Паг(^аг(«)) <"(«). П(^([«]дг)) = паг([«]дг) (21)
при всех и eL^to, Т], [u]NeLi2N.
736
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Заметим также, что ниже мы будем пользоваться соотношениями (1.8)-
(1.26), считая, что встречающиеся в них константы С0, С,,...
соответствуют множествам
W = {u(t) € Lr2[t0, Г]: «(t)G V почти всюду на [*0, Г]},
WN = {[u]NeLr2N:UieV,i=0,...,N-\}, N=1,2,... (22)
Теорема 2. Пусть матрицы A(t), В(t),f(t) кусочно непрерывны
на отрезке [t0, Т]; V — выпуклое замкнутое ограниченное множество
из Er; G —выпуклое замкнутое множество из Еп, int G ^0;
существуют число (¾ > 0 и управление й = u(t) е U такие, что x(t, й) G G~e°,
t0^t ^ Т. Пусть разбиение {iit i =0,..., N} отрезка [^, Т]
удовлетворяет условию
dN= max_ At^(T-t0)M0/iV, N= 1, 2,..., M0 = const >0,
и, кроме того,
6N < £N < M, SN, M,= const >1, N= 1,2,...,
где величина 6N взята из (1.26), а последовательности {<%}, {/%} та~
ковы, что
Urn ^ + ^ + ^=0, (23)
Наконец, пусть последовательность {[v]N} определена условиями
[v]N£UN, TN([v] + ^N, N =1,2,..., (24)
где
TN([v]N) = IN([v]N) + aN e' A*,l4f, TNt = inf TN([u]N).
1=0 UN
Тогда последовательность {PN(\v\N)} сходится к Q-нормальному
решению ut = ut(t) задачи (15)-(17) по норме LT2[t0, Т].
Доказательство. Из условий теоремы следует, что множество (17)
непусто, выпукло, замкнуто и ограничено, а функция (15) выпукла и
непрерывна в метрике Ь£[*о> Т] (она даже слабо непрерывна в Ll[t0, Т]). В
силу теоремы 8.2.8 множество Ut непусто, выпукло, замкнуто и ограничено.
Тогда сильно выпуклая функция 0,{и) = \\и\\\ на множестве Ut согласно
теореме 8.2.10 достигает своей нижней грани тШ(м) = £}„ в единственной
точке ut = ut(t) G Ut. Таким образом, ^-нормальное решение задачи (15)-
(17) существует и единственно.
Определим множество
U'« = {u(t) е W: x(t, и)е Ge», t0^t^ т},
где eN = £N + SN + С, dN (если G = En, то eN = 0), N = 1, 2,... Заметим, что
поскольку множество W из (22) ограничено в метрике L^[t0, Т], то можем
пользоваться оценкой (1.11). Рассуждая так же, как при доказательстве
теоремы 3.2, можно показать, что в рассматриваемом случае для введенных
множеств Ue", отображений QN, PN справедливы включения (4), (7) и
неравенства (5), (8), (10) при PN = C56N, lN = C&8N, pN = 2RC3e0-\(M, + l)6N +
+ C^dN), N =1,2,... Тогда из условия (23) вытекает условие (12). Из (21)
следуют неравенства (6), (9) при £N = t]N = 0, N = 1, 2,...
§ 4. РЕГУЛЯРИЗАЦИЯ АППРОКСИМАЦИЙ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ 737
Далее, функция J(u) слабо непрерывна, С1(и) неотрицательна и слабо
полунепрерывна снизу на Ljfio, Т], множество С1с = {и еЬ^о» Т]; С1(и)^
^ С} слабо компактно при любом С ^0.
Наконец, всякая точка v = v(t) е ЬЛ*0) ^]> являющаяся слабым
пределом какой-либо последовательности {?%}, uN G t/e", iV= 1, 2, ,..,
принадлежит множеству U. В самом деле, условие uN G С/е" означает, что uN е W,
x(t, uN) е Ge", t0^t ^. Т, N =1,2,.,, Из слабой замкнутости множества
W следует, что v Е W. Далее, согласно (1.12),
sup \x(t,uN)-x(t,v)\ = xN-*°
при N-+oo, поэтому x(t, v) е Ge"+X", ig^t^T, iV=l, 2,... Так как eN +
+ Xn~*0> множество G замкнуто, а ж(£, г») не зависит от iV, то последнее
включение возможно только при x(t, v)£G, t0^t^T. Следовательно, veil.
Таким образом, в рассматриваемом случае все условия теоремы 1
выполнены, если в качестве топологии т в ней взять слабую топологию
пространства LT2[t0, Т]. Из теоремы 1 тогда следует, что последовательность
{Рлг([г»]лг)} сходится к ut слабо в Ь2[Ь0, Т] и, кроме того,
11^<[«Ьг)11£, = п(Р„(Ш) - Kill, - п(ч)
при N —» оо. Но
11^^)-ч11! =2(||^([<)|1!,+1к111,)-11^(М№)+ч11а£{, ^=1.2,...
Отсюда, пользуясь слабой полунепрерывностью снизу нормы в Lr2[tQ, Т],
получаем, что последовательность {^(Млг)} сходится к щ по норме
Ll[t0, Т]. Теорема 2 доказана. □
3. Прокомментируем условие (23). Оно означает, что шаг dN =
= max At,, разбиений отрезка [t0, Т], а также точность решения задачи
минимизации функции Тихонова TN([u]N) на множестве UN в смысле
неравенства (24) должны быть согласованы с параметром регуляризации aN.
В частном случае, когда матрицы A(t), B(t),f(t) на интервалах
непрерывности удовлетворяют условию Липшица (например, когда эти матрицы
не зависят от t), пользуясь оценкой (1.11) из (1.26), имеем 6N ^ C8dN,
С& = const > 0. Тогда условие (23) запишется в виде
Urn 4sL±f!tt=o. (25)
ЛГ-.00 aN
Заметим, что теорема 2 остается верной и в случае, когда в задачах (15)-
(17) и (18)-(20) множества U и UN отличны от множеств (17), (20) и
имеют, например, вид
U = {u(t)ELr2[t0,T]:\\u\\b2^R, x(t,u)eG, t0^t^T}, (26)
UN={[v]NeL'2N: \\[u]n\\Lin^R, х<([и]„)еС^, * = 0,...,N},N= 1,2,...
Однако для множеств (26) условие (23) нужно заменить на
SN + f*N + dU2 = q
lim °"-г""■*»# =0. (27)
ЛГ->оо aN
738
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Подчеркнем, что если при регуляризации разностных аппроксимаций
задач оптимального управления параметр регуляризации aN и шаг dN
разбиений отрезка [t0, Т] стремятся к нулю несогласованно, то получающаяся
при этом последовательность {-^([г»]^)} может не сходиться к множеству
^-нормальных решений в нужной метрике. Это видно из следующих
примеров [359].
Пример 1. Рассмотрим задачу
1
J(u)= х{\, и) - $(ж(£, и)+ tu(t))dt —»inf,
о
x(t) = u(t), 0<t<l, ж(0) = 0,
u = u(t)e U = {u(t) eLp[0, 1], \u(t)\ ¢, 1 почти всюду на [0,1]},'
где р — фиксированное число, 1 < р < оо.
1 1 1
Поскольку §tu(t)dt= §tx(t)dt=x(l)— §x(t)dt, то J(u)=0 при всех и€
0 0 0 1
G U. Следовательно, Jt=0, Ut=U. Возьмем стабилизатор Cl(u)=§\u(t)\p dt.
о
Тогда Utt={v е Ut: Cl(v)=in[Cl(u)}={0}, т. е. П-нормальное решение
единственно и равно ut = 0. и'
Рассмотрим следующую разностную аппроксимацию этой задачи:
JV— 1
in([u]n) = xn - Е (¾ + *^)Д* -> inf,
г=0
Xi + i = xi + ^tui, i=0,...,N-l, х0 = 0,
Njv е Z/jv = {[«]№ = К, «,,..., «*jv_i): k-|^ 1, i =0,..., N- 1},
At = l/N = d„, N=1,2,...
Введем разностную функцию Тихонова
tAWn) = xn - E (¾ + *,«,)Д* + «№ E А* КГ, Mjv e uN.
i=0 1=0
JV- 1 JV- 1 JV-1 JV- 1 ,
Так как xN- E Atxi=xN- E (*,+1-*.К=а^- £ **^-i+ E ^=¾ +
1=0 г = 0 i=0 1=0
+ E *Д^-^-.)-^-.-Е *i(^-^-.)= Ё *.•+.Д*««, то г„(м„)= Ё a* x
i=l i=l 1=0 1=0
x(Atu{ + ак\щ\р). Следовательно,
JV- 1
min TN([u]N) = TNt = E A* min(Atu + aN\u\p) = mln(Atu + aN\u\").
•=o
<1 \u\<\
Отсюда, исследуя поведение функции ip(u) = Atu + cxN\u\p на отрезке
[—1, 1], нетрудно установить, что
-^jv*
At ( At у/*"-1) At ^ i / i\-i
-At + aN при ^ >1,
§ 4. РЕГУЛЯРИЗАЦИЯ АППРОКСИМАЦИЙ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ 739
v,= <
причем нижняя грань достигается при [v]^ = (v0, v{, ..., vN_l), где
{paN) ПРИ paN - ' ,-^0,...,^-1.
-1 при AL>1,
Таким образом, если Д* = dN= 1/N-+0, aN-*0, но г^—> 1, то PN([v]N) =
= —1 при всех i, 0< i ^ 1, iV= 1,2,..., и последовательность {-Ry([v]jv)}
не может сходиться к нормальному решению и„=0в метрике Ьр[0, 1] ни
при каких р, 1 < р < оо. Остается рассмотреть случай, когда At = dN —» 0,
а"-0, ^ < 1. Тогда PN([v]N) = -(£-yW~P) при всех t, 0< t < 1, и
ifta.w-4^-j(&r-"*-(£),ft. ^=1.2,...
Отсюда ясно, что для сходимости последовательности {i#([«]w)} к«,=0в
метрике Lp[0, 1], 1 <р<оо, необходимо и достаточно, чтобы ^ = Ж« ^
при N —» оо.
Пример 2. Рассмотрим задачу
1
J(u) = 4x(l,u)-3S)u(t)dt-*in[, x(t) = u(t), O^t^l, ж(0) = 0,
о
1
и = u(t) е U = {«(t) е L [0,1]: \\и\Ц = J |«(*)Г<** ^ 1,
р о
u(t)^0 почти всюду на [0,1]}, 1<р<оо.
1
Поскольку x(t, и) = J и(т)йт, то
о
1 1 1
J(«) = 4 J «<*)d* -3 J «<*)d* = J «(t)d* ^0
0 0 0
при и eU. Отсюда ясно, что Jt = 0, Ц, = {0}. В качестве стабилизатора
возьмем fi(u) = \\u\\pL .
Рассмотрим следующую разностную аппроксимацию этой задачи:
^(hL) = 4(^^)-3E'A4-,inf,
\ * / <=о
ж. + 1 = а;<+Л*по i=0, ...,N, Xq = 0,
[u]N£UN = {[u]N: £\*K.|P^1, u,£0, *=0,..., JV-1},
»=о
At = l/N, N=1,2,...
Введем разностную функцию Тихонова
ад4) = 2К + ^-|)-зЕД*«( + а» £ А*КГ-
г=0 г=0
740
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
j
Так как х-+, = J2 Atuit j = 0,..., N — 1, то получаем
г = 0
>А*(-«№_1 + а№|«№_1Г), [u]NeUN.
Отсюда, исследуя поведение функции ip(u) = —u +aN\u\p при |«|pAt ^ 1,
и ^ 0, или при 0 ^ и ^ (At)~''p, нетрудно получить, что
[ -(At)'/« + «„ при At>(paiV)?,
причем нижняя грань TNt достигается в точке
(0,0, ...,0,(Д*)-1/') при At>(paN)q,
(0,0,...,0,(^^)-^-1)) при At^(paN)".
Таким образом, если At = \/N, aN—» оо, N —» оо, но At > (£><%)*, то
pjv(hLy) = ° при 0^t ^1-At, PjV([v]iV) = (At)-1/p при 1-At < t ^ 1 и
Н-^ЬЬЖ =1. JV =1,2,..., так что {PjvU^D} не будет сходиться к ut=0
в метрике ЬР[0, 1] ни при каких р, 1 < р < оо.
Остается рассмотреть случай At ^(paN)4. Тогда ^([^1^) = 0 при 0^ t ^
<1-At, Pn([v]n) = (p<Xn)1,11-p) при 1-Д*<*<1и||Р„(М„)||£= ^ =
= т—^wj, JV = 1, 2,... Следовательно, для сходимости {-^(1¾]^)} к ut = 0 в
\PaN>
метрике LJ0, 11, 1 < р < оо, необходимо и достаточно, чтобы -f- = -^-^ —> 0
при N —у оо. л л
Любопытно, что в примере 2 условие сходимости {-^(Mjv)} в метрике
Ьр[0, 1] зависит от р, а в примере 1 такое условие -^ > 0 не зависит от
р, но зато С/ с Ьр[0, 1] при всех р, 1 ^ р ^ +оо. N
Приведенные примеры показывают, что при регуляризации разностных
аппроксимаций задач оптимального управления условия типа (23), (25)
или (27) являются существенными.
4. При построении разностной задачи (18)-(20), аппроксимирующей
задачу (15)-(17), были использованы расширения множества G,
согласованные с шагом dN разбиения {t{}. Следуя Е. Р. Авакову, покажем, что при
выполнении условий теоремы 2 регуляризованную аппроксимирующую
задачу можно построить и без расширений множества G. А именно, в
качестве множества UN вместо (20) введем множество
UN = {[u]N = (и0, «„ ..., uN_ ,): ц. е V,
г =0,..., TV-1, х&и]„)еО, i=0,...,N} (28)
и возьмем число N0 столь большим, чтобы
6N < е0 при всех N ^ N0, (29)
где величина 6N взята из (1.26), а е0 — из условий теоремы 2.
§ 4. РЕГУЛЯРИЗАЦИЯ АППРОКСИМАЦИЙ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ 741
Прежде всего покажем, что тогда множество (28) непусто при всех
N ^ N0. Будем пользоваться теми же отображениями <Х, PN, а также
множествами (22), которые были введены в п. 2. Возьмем Гг-нормальное
решение ut задачи (15)-(17) и положим
В силу (29) имеем 0< Cw< 1. Отсюда и из выпуклости множества W
следует, что wN е W. Так как x(t, й) е G~e\ x(t, ut) £ G, t„ < t < T, то,
рассуждая так же, как при доказательстве включения (3.16), получим,
что x(t, wN) е G~Cw%, t0 ^. t ^ Т. Отсюда и из оценки (1.24) следует, что
xt(QN(wN)) € G~c"£o + *'» = G, i =0,..., N. Это значит, что
Qn^n)^Un^0, N^N0. (30)
Далее, 11^-^11 = ^11^-^11^2^^ = 2^5^/¾. где R = sup ||u|| < оо.
w
Поэтому
\Sl(wN) - Щц)\ = ||KI|2 - |К||2| ^ AR4N/s0 (31)
и, кроме того, из оценки (1.14) имеем
\J(wN)-J(ut)\^2RC3SN/s0, N>N0. (32)
Наконец, согласно оценке (1.29)
In(Qn(™n))-J(™n)<C56n = (3n, N>N0, (33)
Теперь возьмем последовательность {[г)]^}, определенную условиями (24)
для множества (28). Тогда ж;([и]„) е G, i=0,N. Из оценок (1.11), (1.25)
получим x(t, Pm([v]n)) е Ge", t0 < t ^ T, где eN= 5у + CxdN. Положим vN =
= XNu+V-XN)PN([v]N), XN = sN/(eQ+eN)> N^N0. Так как ueW, P^([v]„)e
G W, 0 < Хлг < 1. то % G W. По условию теоремы 2 имеем x(t, и) G G %,
t0^t^T. Однако G~e" = (^-^-^ + ¾) = (Ge« )-<% + »«) — это ^ + е^)-сужение
множества G~e". Поэтому, рассуждая так же, как при доказательстве
включения (3.16), получим x(t, vN)е(Ge")~x"(e° + !:'') = G, t0<t < Т. Это значит,
что vNeU, N ~£ N.
Далее, \\vN-PN([v]N)\\ = xN\\u-PN([v]N)\\^2RxN. Из оценки (1.14) тогда
имеем
\J(vN) - J(PN([v]N))\ < 2RC3Xn ^ 2RC3(6N + С,dN)/e0 = vN.
Следовательно,
Jt^J(vN)<J(PN([v]N)) + vN, N>N0. (34)
Наконец, согласно оценке (1.30)
J(PN([v]N))-IN([v]N)^C66N = lN, N>N0. (35)
Из соотношений (21), (24), (30)-(35) следует цепочка неравенств
J, < J(PN([v]N)) + pn< J(PAMn)) + <*Nn(PN([v]N)) + vN ^
< jjv([«1jv) + 7лг + « A(Mjv) + "* < Г№ + /% + 7лг + ^ ^
742
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
^ J(wn) + aN^AWN) + Pn + /½ + 7лг + »N ^
^ J(ut) + aNQ(ut) + 2R(C3 + 2RaN)6N/e0 +
+ Pn + /½ + 7лг + vN < J(PA[v]n)) + <xNCL(ut) +
+ 2R(C3 + 2RaN)6N/e0 + f3N + ^ + 1n + 2vN, N > N0.
Отсюда имеем
■/,-«/„< J(PAWn)) < 4 + «*П(ч) +
+ 2R(C3 + 2RaN)6N/e0 + PN + ^N + jN, N > N0,
WPAWn)) < ^. + (2R(Cs + 2RaN)SN/e0 + (3N + nN + >yN + vN)/aN ^
^Q,t + const(8N + dN + iiN)/aN, N ^ N0.
Следовательно, lim J(PA[v]n)) = J*- Кроме того, повторив рассуждения,
N -юо
проведенные выше, получаем, что последовательность {i^([«h\r)}
сходится к и, слабо в Lo[*0) Т] и {Cl(PN([y]N))\-* Qt = Q(ut), что равносильно
сходимости {-Pjvdwjjv)} к щ в метрике L£[£0, Т].
§ 5. Разностная аппроксимация квадратичной
задачи с переменной областью управления
1. Рассмотрим задачу
J(u) = \x(T,U)-y\*-4inl, (1)
x(t) = A(t)x(t) + B(t)u(t) + f(t), t0^t^T; ¢(¢,) = ¾. (2)
u=u(t)eU={u(t)eL2[t0, T\. u(t) e V(t) почти всюду на [t0, T]},(3)
где V(t) — заданное семейство множеств, зависящих от t E[t0, Т]. Для
аппроксимации этой задачи введем последовательность разностных задач
^([«W=IM[«U-y|a-*lnf, (4)
х{ + 1 = х, + А^(А(х, + В{и,+/,), i=0,...,N-l, (5)
[u]NeUN = {[u]N = (u0,ul,...,uN_ly. ще
еУ{ = У(%), i =0,..., N-l}, N=1,2,... (6)
(обозначения см. в § 1).
Для исследования поведения решений задачи (4)-(6) при N —»оо
ниже будут использованы теорема 2.1 и схема рассуждений из § 1. Однако
из-за зависимости области управления от времени в рассматриваемой
задаче не все результаты из § 1 сохраняют силу. Например, для отображения
1 (,+1
QN(u) = (u0,ul,...,uN_l),meui = -Sj- $ u(t)dt, i =0,..., iV-1 (см. фор-
. г *•
мулы (1.20)), включения ui£~Vi = У(^) могут нарушаться, несмотря на то,
что и = u(t) G V(t) почти всюду на [^, Т] и V(t) выпукло при каждом
t е [t0, Т]. Аналогично, для отображения PN([u]N), определяемого форму-
§ 5. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 743
лами (1.21), включение PN([u]N)€ U может соблюдаться не при всех [u]N из
множества (6). В то же время, кажется, что если множества V(t)
непрерывно зависят от t, то упомянутые включения, по-видимому, будут нарушаться
незначительно. Однако пока неясно, что значит, что множества V(t)
непрерывно зависят от t, как понимать близость между множествами, что такое
расстояние между множествами. Перейдем к обсуждению этих вопросов.
2. Из различных возможных подходов к определению понятия расстояния
между множествами здесь мы остановимся на понятии расстояния в смысле
Хаусдорфа или, короче, хаусдорфова расстояния.
Определение 1. Пусть М — метрическое пространство с
расстоянием р(а, Ъ) между точками а, Ь G М, и пусть А и В —два множества из
М. Хаусдорфовым расстоянием между множествами А и В называется
величина
h(A, В) = max{sup inf р(а, b); sup inf p(a, b)}. (7)
абЛЬеВ ЬбВаеА
Поясним геометрический смысл хаусдорфова расстояния, считая, что
множества А и В замкнуты в метрике М. Напомним, что величина
p(a,Z)= ini:p(a,z)
называется расстоянием от точки аеМдо множества Z сМ. Кроме того,
как и в § § 3, 4, введем е-расширение множества Z так;
Ze = {zeM: p(z,Z)^e}, е ^ 0.
Тогда величина
sup inf р(а, b) = sup р(а, В)= 6(А, В) = (3,
называемая уклонением множества А от множества В, равна
минимальному числу, на которое надо расширить множество В, для того чтобы
получившееся после расширения множество содержало множество А, т.е.
А С Ве при всех е ^ (3 и А ¢ Ве при 0 ^ е < (3. Аналогично, величина
sup inf р(а, b) = sup p(b, A) = 8(B,A) = j,
ъеВаеА ЬеВ
называемая уклонением множества В от множества А, такова, что В С
С.Ае при всех e^7и5¢A£ при 0 ^ е < j. Таким образом, хаусдорфово
расстояние h(A, В) между множествами А и В равно нижней грани всех
тех чисел е >0 таких, что А С.Ве и В С.Ае.
Отсюда следует, что если h(A, В) ^ е, то справедливы следующие два
включения:
АСВ% ВСАе, е>0. (8)
Рассмотрим несколько примеров.
Пример 1. Пусть М = Е\ А = {иеЕ1: а^и^Ь}, В = {и е Е1:
с ^.и ^.d}. Пользуясь приведенной выше геометрической интерпретацией
хаусдорфова расстояния, нетрудно вычислить, что
h(A, В) = тах{\а— с\, \b -d\}.
Пример 2. Пусть M = RT00 — r-мерное линейное пространство с
метрикой p^iu, v)= max lu'—v'l, соответствующей норме 11^11^,= max |«'|,и
А = {и = (и1, и2,..., иТ): а' ^ и' ^ b\ i = 1,..., г},
B = {u = (ul,u2,...,ur): с'^и1 ^d\ i = 1,..., г}.
744
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
В рассматриваемой метрике Ае — е-расширение множества А — имеет вид
Ае = {и = (и1,..., иг): а1 — е ^.и' ^.b' + е, i = 1,..., г}. Тогда ясно, что
h^A, В) = max{\a—cl^lb —d\0o} = max{ max \а{ — c'l; max Ш — d*\},
где a = (a1,..., аГ), b = (b\ ..., bT), с = (с1,..., c% d = (d',..., dr).
Если те же множества А и В рассматривать в евклидовом пространстве
/г ч 1/2
М = Ег с метрикой р(и, v)= ( ^ \и* — v'\2) , то для соответствующего
хаусдорфова расстояния имеем оценку
h^A, В) ^ h(A, В) <: hJA, BK/F,
или
тах{|а- сЦ, \Ъ - d^} ^ h(A, В) ^ ч/г тах{|а- сЦ, \Ъ - d^}
Эти оценки следуют из неравенств 1«^ ^ \и\Е, ^ v^l^U-
Пример 3., Пусть M = Er, V(t) = {« = («',...,ur)eEr: аД*)<
< и' ^ &(*), * = 1,..., г}, t0 ^ t < Т, где a(t) = (a,(t),..., ar(t)), /J(t) =
= (Д(£),..., /3r(t)) — заданные функции, аД'*Х/ЗД*), t0 < t < Т.
Пользуясь результатами примера 2, имеем
^ max{|a(t) - а(т)|я,; |/J(t) - 0(т)|я,} < ft( V(t); У(т)) ^
<дА:тах{|а(*)-а(т)|яг; |/5(*) — 0(т)|я,}, *0 < *, т ^ Tl
Пример 4. Пусть М = Е2, А = {и = (х, у): х2 + у2 ^ 1}, £ = £(*) =
= {и = (ж, у): (ж — 2t)2 + у2 ^ £2}, i ^ 0. Из геометрических соображений
нетрудно получить, что 6(А, В) = t + 1 при всех £ ^ 0;
Я/В м_/ 0 при0^*^1/3, fi + 1 при,0^*<1,
5(В'А)-\3*-1 при *> 1/3, h{A'B)-\3t-l при*>1.
Заметим, что здесь h(B(t), B(f)) = 3\t - т\ при всех £, т^О.
Покажем, что хаусдорфово расстояние обладает следующими тремя
замечательными свойствами [428]:
1) Если А и В —замкнутые множества из метрического пространства
М, то h(A, В) = 0 тогда и только тогда, когда А = В. В самом деле, если
замкнутые множества А и В не совпадают, то либо <5(А,1?)>0, либо
6(В, А)>0, поэтому h(A, B) = max{6(A, B))'6(B, А)} >0. Если жеА=В,
то, очевидно, /i(.A, 2?) = 0.
2) Хаусдорфово расстояние симметрично, т. е. h(A,B) = h(B,A). Это
свойство следует из определения (7) и симметричности расстояния р(а, Ь)
в исходном метрическом пространстве М.
3) Справедливо неравенство треугольника
h(A,B)^h(A,C) + h(C,B), А, В, С е М. (9)
В самом деле, из неравенства треугольника для исходного пространства М
имеем р(а, Ъ) ^ /э(а, с) + р(с, Ъ) при всех ае А, Ъ еВ, с £ С. Тогда
р(а, В)= inf /э(а, Ь) ^ /э(а, с) + inf р(с, Ъ) = р(а, с) + р(с, В) ^
< р(а, с) + sup р(с, В) = р(а, с) + 6(С, В) < р(а, с) + ЦС, В)
сб с
§ 5. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 745
для всех а£ А, с Е.С. В силу произвольности с G С отсюда получаем
/о(а,В)< inf р(а, с) + h(Q В) = р(а, С) + h(C, В) ^
^6(A,C)+h(QB)^h(A,C) + h(C,B), аеА.
Следовательно,
6(А, В) = supр(а, В) < h(A, С) + ЦС, В).
aS А
Поменяв в предыдущем рассуждении множества А и В ролями, будем
иметь
6(В, А) ^ h(A, С) + h(C, В).
Из последних двух неравенств следует неравенство (9).
Приведенные свойства 1)-3) хаусдорфова расстояния показывают, что
множество всех ограниченных замкнутых подмножеств метрического
пространства в свою очередь также образует метрическое пространство с
метрикой h(A, В).
3. Изучим некоторые свойства множеств, зависящих от времени.
Определение 2. Пусть V(t), t0 < t ^. Т,— некоторое семейство
множеств из метрического пространства М. Говорят, что это семейство
множеств непрерывно по Хаусдорфу в точке t, если для любого е>0
найдется число 6 > О такое, что h(V(t), V(t)) < е для всех т, для которых
\t-r\<6.
Лемма 1. Пусть V(t), t0^.t^.T, —семейство множеств из Ef,
причем в каждой точке t е[£0> Т\ множество V(t) замкнуто,
ограничено и непрерывно по Хаусдорфу. Тогда множества V(t) ограничены
равномерно по t е [t0, Т], т. е. найдется постоянная R >0 такая, что
sup sup \и\ ^.R.
Доказательство. Пусть, вопреки утверждению, множества V(t)
не являются равномерно ограниченными на [^, Т]. Это значит, что для
любого натурального числа те найдутся tn е [t0, Т] и ип е V(tn) такие, что
\ип\ ^ те, гг = 1,2,... Так как отрезок [t0, Т] — ограниченное замкнутое
множество на числовой оси, то из последовательности {tn} можно
выбрать подпоследовательность {tn }, сходящуюся при пк —» оо к некоторой
точке те[*0, Т]. Без ограничения общности можем считать, что сама
последовательность {tn} стремится к т. Так как семейство V(t), t0^.t^.T,
непрерывно по Хаусдорфу в точке т, то для любого е > 0 найдется номер 7¾
такой, что h(V(t ), V(t)) < е при всех п ^ щ. Согласно (8) это означает,
что V(tn) С (У(т)У, п^гц,. Но V(t) — ограниченное множество,
поэтому его е-расширение (V(t)Y также ограничено. Тогда последовательность
{ип}: ипе V(tjc(V(T)y, гг = 1, 2,..., будет ограниченной. В тоже время
по"построению |ип| ^ те, те = 1, 2,... Полученное противоречие доказывает
лемму 1. □
Лемма 2. Пусть V(t), t0 ^. t < Т, —семейство множеств из ЕТ,
причем в каждой точке t е [t0, Т] множество V(t) замкнуто,
ограничено и непрерывно по Хаусдорфу. Тогда это семейство равномерно
непрерывно на отрезке [£0, Т], т. е. для любого е > О найдется 6 > О
такое, что h(V(t), V(t)) < е для всех t, т€[*0> Т], лишь бы \t - т\ < S.
746
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Доказательство. Пусть множества V(t) не являются равномерно
непрерывными на [t0, Т]. Это значит, что существует число е0 > 0 такое,
что для любого натурального числа те найдутся точки tn, т„е>[£0> Т], для
которых хотя \tn — т < 1/те, но h(V(tn), V(rn)) ^ е0, те = 1,2,... Из
последовательности {£„} выберем подпоследовательность {£„}, сходящуюся
к некоторой точке t е [^, Т]. Так как |tn — тп\ < 1/те, то {тц } также сходится
к t. Из непрерывности V(t) по Хаусдорфу Следует, что h(V(tn ), V(t)) —>0,
M^(Tn )) ^Х*))-* 0 ПРИ к -+оо. Тогда, пользуясь неравенством
треугольника (9), получим
4V(tUk), V(rnk)) < h(V(tJ, V(t))+h(V(rnk), V(t))-0
при к —> oo. В то же время по построению h(V(tn ), V(rn )) ^ е0 > 0, к =
= 1,2,... Полученное противоречие доказывает лемму 2. П
Определение 3. Хаусдорфовым модулем непрерывности
семейства множеств V(t), t0 ^. t ^ Т, называется функция ш-Ad) =
= sup h(v(t), V(t)), где верхняя грань берется по всем t, те [t0, Т], для
которых |* — т| < d.
Нетрудно видеть, что uv(d) не убывает при возрастании d. Если
выполнены условия леммы 2, то ojv(d) —» 0 = wy(0) при d —> 0.
Заметим, что для множеств i?(£) из примера 4 модуль непрерывности
равен wB(d) = 3d. Для множеств V(t) из примера 3 для модуля
непрерывности V(t) справедлива оценка u)v(d) < */r max{oja(d); Wg(d)}, где
u)a(d), u)p(d) — модули непрерывности функций a(t), /3(t), t0 ^ t < Т. В
частности, если а(£), P(t) удовлетворяют условию Гельдера \a(t)—а(т)\ ^
^L|t-T|a, \{3(t) - /3(т)\ ^ L\t - т\а, 0 < а ^ I, то uv(d) ^ J?Lda.
Лемма 3. Пусть V(t), t0^.t < Т, — семейство множеств из Ег,
причем в каждой точке t е[£0, Т] множество V(t) выпукло, замкнуто,
ограничено и непрерывно по Хаусдорфу. Если функция u(t) = (ul(t),...
..., ur(t)), t0 < t ^ T, непрерывна в точке t, то функция
v(t) = Pv(t)u(t), t0<t<T, (10)
где PV(t)z — проекция точки z б ЕТ на множество V(t), также
непрерывна в точке t. Если функция u(t) кусочно непрерывна на отрезке
[t0, Т], то функция (10) тоже кусочно непрерывна на этом отрезке.
Доказательство. Пусть t е [£0, Т] — какая-либо точка
непрерывности функции u(t). С учетом (10) имеем
\v(r)-v(t)\ = \Pv(T)u(T)-v(t)\^
^\Pv(T)u(r)-Pv(j)u(t)\ + \Pv^u(t)-v(t)\, теК, Г]. (И)
Операция проектирования обладает сжимающим свойством (теорема 1.4.2):
\Pv(t)u(t) - Pv(T)u(t)\ ^ \и(т) - u(t)\.
Отсюда и из непрерывности u(t) в точке t следует, что первое слагаемое в
правой части неравенства (11) стремится к нулю при т—> t. Покажем, что
и второе слагаемое стремится к нулю при т—> t.
§ 5. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 747
По лемме 1 семейство множеств V(t) ограничено равномерно по т е
G [t0, Т]. Следовательно, множество точек {Pv^T)u(t)} е V(t), t0^r < Т,
ограничено и имеет хотя бы одну предельную точку w при т—> i. Это значит,
что существует последовательность {тк} —» £ такая, что wfc = Ру(г)«(*)—»
—» w при к —» оо. Покажем, что w = Py(j)«(t) = v(t). Сначала убедимся в
том, что ш G V(t). В силу непрерывности семейства множеств V(t) по
Хаусдорфу для любого е > 0 найдется номер fcg такой, что h(V(rk), V(t)) ^
< е при всех к ^ к^. Согласно (8) тогда V(rk) С (V(0)s при всех
Поэтому ал е (^(0)Е> к ^ Icq. Так как V(t) замкнуто, то (V(0)s также
замкнуто. Отсюда и из того, что {и)к} —» w, следует, что ше(У(*))£. В силу
произвольности е >0 и замкнутости V(t) последнее включение возможно
лишь в случае w£7(i).
Далее, имеем
К - u(t)| = |^(гь,«(*) - «(*)l =,,^, lw - w(*)l < 1^(гь,«(*) " «(*)| <
< |«(0 - «(01 + \pv(rk)v(t) ~ «(*)1. * = 1, 2,...
Поскольку
\Pv(Tk)v(t) - «(01 =umf^ |« - «(0| = р(«(0. V(rh)) <
^ sup p(v,V(rk))^h(V(t),V(rk))^0
»eV(()
при fc —» оо, то, переходя к пределу при к —»оо, из предыдущего
неравенства получим | w — «(0| ^ |щ(0 — w(*)l С ДРУГ0И стороны, по определению
проекции точки и условию (10) с учетом ш е V(t) имеем
|«(0-«(0|= inf |«-«(01<к-«(01-
Следовательно,
| ш - «(01 = КО - «(*)l = |JV(«,«(*) -«(*)!■
Однако проекция точки «(О на выпуклое замкнутое множество V(t)
определяется однозначно (см. теорему 1.4.2), т. е. и = v(t) = PV(t)u(t).
Тем самым показано, что любая точка ш, являющаяся предельной для
семейства точек {Pv^T)u(t)} при т—> £, совпадает с «(О- Это значит, что
указанное семейство сходится к v(t), т. е. \Pv(T)u(t) — «(01 —>0 при т—» £.
Таким образом, второе слагаемое в правой части неравенства (11) также
стремится к нулю при т—»t. Следовательно, если «(О непрерывна в точке
£, то и функция «(О из (10) также непрерывна в этой точке. В частности,
если u(t) непрерывна на отрезке [t0, Т], то «(О также непрерывна на этом
отрезке.
Наконец, из приведенного доказательства видно, что если существует
предел lim и(т) = и(Ь ±0), то существует lim v{r) = Pv(l)u{t ±0). Это
значит, что если u(t) кусочно непрерывна на отрезке [t0, Т], то «(О также
кусочно непрерывна на этом отрезке. Лемма 3 доказана. □
4. Вернемся к задачам (1)-(3) и (4)-(6). Через Jt обозначим нижнюю
грань функции (1) при условиях (2), (3), через INt — нижнюю грань
функции (4) при условиях (5), (6).
Теорема 1. Пусть матрицы A(t), В (<),/(*) кусочно непрерывны
на отрезке [t0, Т], множества V(t) выпуклы, замкнуты, ограничены и
748
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
непрерывны по Хаусдорфу при всех t е [t0, Т]. Пусть разбиения {£,-, г =
= 0,..., N} отрезка [t0, Т] таковы, что
dN=max M<(T-t0)M0/iV, iV = 1,2,...
Тогда lim INt = J* и справедлива оценка
TV—юо
-Q^r^J^-J^Q^, N = 1,2,..., (12)
где С5 = 2С0+2С4+2\у\ = С6, постоянные С0, С4 взяты из (1.8), (1.16) при
W = U, WN = UN соответственно, а величина SN определяется формулой
6N = е^Т-М Ео' )\\\А(т) - А{\\С0 + Am^dN + |/(r) - Д | +
l~°+' sup sup М||В(т)-^ + Вш„и>(<*дг))<*т; (13)
!„< !<Г «Е V(t)
здесь u(d) — хаусдорфов модуль непрерывности множеств V(t), t0^t ^
<T,.Amax = sup ||A(t)||, J5max= sup ||J5(t)||, постоянная С, взята из
оценки (1.11) при W = U.
Доказательство. Положим X = LT2[t0, Т], XN = LT2N. Отображения
QN: X —» Хдг, i^: Хдг —» X определим так:
1 !,+1
Qn(u) = (Щ, «ii-.-i«at-i): «i=-Pvj («<)• «< = ЯГ S «(*)d*, (14)
^([«]дг) = -Ру(|)«* ПРИ *<<*<*< + !, *=0,...,JV-1, (15)
где Ру(2) — проекция точки ze.Er на множество У. Как видим, в
рассматриваемом случае отображения QN, PN имеют несколько более сложный
вид, чем в предыдущих параграфах, в которых задача вида (1)-(3)
исследовалась при V(t) = V, t0<* <Т. При V(t) = V, t0^t^T, формулы (14),
(15) превращаются в формулы (1.20) и (1.21) соответственно.
Так как множества V(t) выпуклы и замкнуты при каждом t £[t0, Т],
то отображения QN,PN из (14), (15) определяются однозначно.1 Функция
v(t) = PN(\u]N) = Pv(l)uN(t), полученная проектированием кусочно
постоянной функции uN(t) = uit t{^.t<ti + l, i =0,..., N — I, согласно лемме
3, кусочно непрерывна на [t0, Т] и, следовательно, PN{[u\N)^Ll[t0, Т] при
всех [u]N G LlN. Отсюда и из (14), (15) вытекает, что
QN(u)eUN, Рдг([«]дг)е и при всех иеЦ [u]NeUN, N = 1,2,...
Заметим также, что согласно лемме 1
sup sup \и\ ^R < оо,
откуда следует, что множество (3) ограничено в метрике Ь^0, Т], и мы
можем пользоваться оценкой (1.11) при W = U, а также оценками (1.8),
(1.16) при W = U, WN = UN.
Покажем теперь, что справедливы оценки
sup max \х(г{,и)-х4((2м(и))\^8м, иеЦ N = 1,2,..., (16)
SUP ™axJ^**'P"(Mw))-MMw)№, [u]n£Un, N=\,2,... ,(17)
§ 5. РАЗНОСТНАЯ АППРОКСИМАЦИЯ КВАДРАТИЧНОЙ ЗАДАЧИ 749
где величина SN определяется формулой (13). Рассуждая так же, как при
получении неравенства (1.27), с помощью оценок (1.8) и (1.11) имеем
\x(t{, и) - x{([U]N)\ < еА^т~ № е' \'Ч\\\А(т) - А,\\С0 + AmmCxdN+
г = О L !,
+ \\В(т) - B(\\R + |/(т) - f{\)dr + 2?max| Y(«(т) - u()dr
иеЦ [u]NeUN, (=0,.).,N, iV = 1,2, (18)
Зафиксируем какое-либо управление «ив (18) примем [u]N = QN(u).
Поскольку по условию h(V{r), Vt) < и(\т — tt\) < u)(dN) при t( < т < ti + 1,
то согласно (8) имеем V(t)c VJw(dw) при всех те[£г, ti + 1], г =0,..., N — 1.
Тогда из включения и(т) С V(t) следует, что и(т) G Т^"^») почти всюду
на IA> *i + i]- Отсюда, замечая, что множество Vi ^ выпукло, замкнуто и
не зависит от т, с помощью леммы 1.1 получаем v-x = тт- J «(t^tgV^'H
г = 0,..., JV— 1. Следовательно, ''
\pVi(vi)~vi\ = P(vi,vi)^h(vr^,vi)^w(dN), 1=0,...,^-1.
Отсюда и из (14) имеем
1'(«(т) - tOdr = A*.>i - ««I < A*i<"(<*„), * =0,..., JV - 1.
г,
Тогда из (18) при [u]N = QN(u), и e.U, получим оценку (16).
Далее, возьмем какое-либо [u]N е UN и в (18) примем и = PN([u]N).
Из того, что h(V(r), V{) ^ ш(\т — t{\) < u(dN) при t( < т < ti + 1,
согласно (8) следует, что VJ c(V(t))'"'(''w) при всех re[t{, ti + l]. Поскольку [«]# =
= (uq, щ, ..., uN_,) G UN означает, что ut е Vv то «,. G (У(т))ш<<;'') при всех
те[*(, *< + 1], г =0, ...,N- 1. Следовательно, |Ру(г)«. - «4| = р(и{, У(т))<
< Ч^ЫГ'Ч ^)< «(йдт); отсюда и из (15) имеем "f СРлг(Млг)-«<)*г <
^ Д*,. u(dN), г =0,..., N -I. Тогда из (18) при и =PN([u]N), [u]N е UN
следует оценка (17).
Далее, рассуждая так же, как в леммах 1.3 и 1.4, из оценок (16), (17)
получаем, что
\In(Qn(u))-J(u)\^C56n = I3n, иеЦ N=1,2,...,
\J(Pn([u]n))-In([u]n)\^C66n = 1n, [u]NEUN, N = 1,2,...
Таким образом, выполнены все условия теоремы 2.1, из которой следует
оценка (12). Остается заметить, что величина SN из оценки (12),
определяемая формулой (13), стремится к нулю при N —» оо; это доказывается так
же, как аналогичное утверждение в лемме 1.2. Теорема 1 доказана. □
Предлагаем читателям самостоятельно рассмотреть задачи (1)-(3) и (4)-
(6) при наличии фазовых ограничений
x(t,u)eG(t), *b<t<3J zt.([«UeG(*,.), г =0,..., TV,
где G(t) — замкнутые множества, непрерывные по Хаусдорфу на отрезке
[t0, Т], и доказать аналоги теорем из § § 3, 4.
750
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
§ 6. Аппроксимация задачи быстродействия
1. Пусть процесс описывается условиями
x(t) = A(t)x(t) + B(t)u(t) + f(t), t^t0, x(t0) = x0, (1)
w=w(£)eL£[£0,a] при любом a>t0, u(t)e.V(t) для почти всех t^t0, (2)
где A(t), B(t), f(t) — матрицы порядка rixn, nxr, те x 1 соответственно,
определенные при всех t ^ t0 и кусочно непрерывные на любом конечном
отрезке [t0,,a]; начальный момент t0 и точка а% е Еп известны; V(t) —
заданное при t ^ t0 семейство множеств из Е . Через x(t, и), t ^ £0, как
обычно, будем обозначать траекторию задачи (1), соответствующую
управлению и = u(t), t ^ t0.
Пусть Y и G(t), t > t0, — заданные множества из Еп.
Определение 1. Скажем, что система (1), (2) (Т, G(t), Y)-ynpae-
ляема, если существуют хотя бы одно управление u = u(t), t ^ t0,
удовлетворяющее условиям (2), и момент t = t(u), t0 ^ t(u) ^ Т, такие, что
x(t,u)eG(t), t0^t^t(u), (3)
x(t(u),u)eY, x(t,u)£Y при t0^t<t(u). (4)
Момент времени t(u), удовлетворяющий условиям (4), назовем временем
первой встречи траектории x(t, и) с множеством Y.
Таким образом, (Т, G(t), У)-управляемость системы (1), (2) при некотб-
ром Т ^ t0 означает, что множество U(T), которое состоит из всех
управлений u = u(t), удовлетворяющих условиям (2)-(4), непусто. Напоминаем,
что задача управления системой (1) при G(t) = En, Y = {х1} и специальном
выборе множества V(t) исследовалась в §§ 8.11, 8.12.
Будем рассматривать задачу
*(«)-> inf, ueU(T), (5)
представляющую собой задачу быстродействия, в которой требуется за
наименьшее время попасть из точки 3¾ на множество Y, двигаясь по
траекториям системы (1), (2) с соблюдением фазовых ограничений (3).
Величину i„ = inf t(u) называют оптимальным временем задачи (1)-(5);
управление ut=ut(t)eU(T), для которого t(ut) = tt, называют
оптимальным управлением, а x(t,ut)— оптимальной траекторией задачи (1)-(5).
2. Приведем достаточные условия, при которых в (5) нижняя грань
достигается.
Теорема 1. Пусть матрицы A(t), В (£), /(*), t^t0, кусочно
непрерывны на любом конечном отрезке, множество V(t) при каждом t
выпукло, замкнуто и sup sup \и\ ^ R = R(a) < оо при всех а > t0; мно-
t„<t<auEV(t)
жества G(t), t^t0,uY замкнуты; система (I), (2) (Т, G(t), Y)-ynpae-
ляема при некотором Т > t0. Тогда tt = inf t(u) < Т и в задаче (1)-(5)
существует оптимальное управление.
Доказательство. По условию множество U(T)^0, и при любых
ueU(T) справедливо неравенство t0 ^ t(u) ^ Т. Поэтому t0 ^ tt ^ Т <
<оо. По определению нижней грани (5) существуют последовательность
§ 6. АППРОКСИМАЦИЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ 751
**} -4 *♦. т ^ ** > **> к = 1,2,..., и управления uk=uk(t), ^ ^ t < Т,
= 1,2,..., такие, что
x(t,uk)eG(t), *b<t<tfcJ яв(*Л> 11^)6 IT
<Ф,«*)£1Т *о^*<**> fc = l,2, ...
Заметим, что множество
W(T) = {u = u(t)eL2r[t0, T]:u(t)€V(t) почти всюду на [*0, Т]} (6)
выпукло, замкнуто и ограничено в метрике LT2[t0, Т] (пример 8.2.9) и,
следовательно, слабо компактно в LT2[t0, Т] (теорема 8.2.6). Поэтому, выбирая
при необходимости подпоследовательность из {ик}, можем считать, что
сама последовательность {ик} сходится к некоторому управлению ut = ut(t)e.
G W(T) слабо в Ll[tQ, Т]. Тогда {x(t, ик)} сходится к x(t, и^) равномерно
на [t0, Т]. Однако x\t, ик)е G(t) при всех t, t0^.t^tt^.tk^.T, поэтому в
силу замкнутости G(t) справедливо включение x(t, ut)e G(t), tQ^t < £„.
Далее, в силу оценки (1.11) имеем
sup \x(tk,u) —x(t^,u)\^Ci\tk —tt\-+0 при к —» оо.
U€W{T)
Тогда \x(tk, ик)- x(tt, ut)\ 4 \x(tk, uk) - x(tt, uk)\ + \x(tt, uk)- x(tt, uj| -»0
при к -> оо, т. e. {x(th, uk)j -> x(tt, ut). Однако x(tk,uk)eY, k = l, 2, ...,
причем Y — замкнутое множество. Следовательно, x(tt, ut) e Y. Таким
образом, ut e U(T) и время первой встречи t(ut) траектории x(t,ut) с
множеством Y таково, что t(ut) < t . С другой стороны, tt < t(ut) в силу
определения tt. Это значит, что t(uj = tt, т. е. ut — оптимальное управление в
задаче (1)-(5). Теорема 1 доказана. □
3. Для аппроксимации задачи (1)-(5) для каждого натурального числа
N ^ 1 на полуоси t ^ £0 введем точки t0 = t0N < tlN < ... < tiN < ..., lim Ъш =
i —* oo
= oo. Положим A{N = A(tiN+0), B{N = B(tiN+0), flN = f(tiN+0), ViN = V(t(N),
GiN = G(tiN), AtiN = ti + lN — tiN, и рассмотрим следующую аппроксимацию
системы (1), (2):
Xi + IN = XiN + ^iN\-™-iNXiN + BiNUiN + /w)> *' = 0, 1,..., %y = 3¾) (7)
[u]N = (u0N,ulN,...,uiN,...):uiNeViN, i=0,l,... (8)
Через [x([u]N)]N = (:%{[«]*) = %,..., x{([u]N) = xiN,...) будем обозначать
траекторию дискретной задачи (7), соответствующую управлению [u]N.
Введем расширение множеств G(", Y"N, где {£N}, {vN} — положительные
последовательности, стремящиеся к нулю. Напоминаем, что согласно (3.7)
е-расширением множества Z с Еп называется множество
ZE = {x<= Еп: р(х, Z) = inf lac - г| < е}.
«Е Z
Определение 2. Систему (7), (8) назовем (T,G^, Y"N)-ynpaeAK-
емой, если существуют хотя бы одно управление [u]N, удовлетворяющее
условиям (8), и точка tt N е {tiN}, t0^t{ N < T, такие, что
xi([u]N)eG^, i=0,...,iN, (9)
V([«We^. хЛЫм)фУ/\ при о< *<*„-!. (Ю)
752 Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Момент времени t{ N = tN([u]N), удовлетворяющий условиям (10), назовем
временем первой встречи дискретной траектории [x([u]N)]N с
множеством У".
Таким образом, (Т, Gjf, У/")-управляемость системы (7), (8) означает,
что множество UN(T), которое состоит из всех управлении [u]N,
удовлетворяющих условиям (8)-(10), непусто.
Рассмотрим дискретную задачу быстродействия
tN([u]N)-*mt, [u]NeUN(T). (11)
Величину tN = inf tN([u]N) будем называть оптимальным временем
задачи (7)-(11). и"(Т)
Приведем достаточные условия, при которых из (Т, G(t),
^-управляемости системы (1), (2) следует (Т, G^, У")-управляемость системы (7),
(8) и последовательность задач (7)-(11) аппроксимирует задачу (1)-(5) по
функции, т. е. lim tNt = tt.
N —* оо
Теорема 2. Пусть матрицы A(t), В (£), /(£) определены при t ^
^ t0, кусочно непрерывны на любом конечном отрезке [t0, а]; множество
V(t) при всех t ^ t0 выпукло, замкнуто, ограничено и непрерывно по
Хаусдорфу, множество G(t) при всех t ^ t0 замкнуто и непрерывно
по Хаусдорфу; система (1), (2) (Т, G(t), YJ-управляема для некоторого
Т, 1^ ^ Т < оо. Пусть разбиения {tw} = (t0N = t0 < tlN < ... < tlN < ...}
таковы, что
dN = dN(T) = max AtiN = (T-t0)M(T)/(mN + l), N =1,2,...,
О < г < mN
где mN — число, определяемое условием tm N < T ^ tm +lN, M0(T) =
= const > 0; последовательности {£N}, {vn) из (9),(10) стремятся к
нулю и таковы, что
£n^sn, vN^8N + CxdN + wG(dN), N= 1,2,...,
где величина SN определяется формулой (5.13), постоянная С1
взята из (1.11) при W = W(T), а u>G(d) — хаусдорфов модуль
непрерывности множеств G(t) на [t0, Т]. Тогда дискретная система (7),(8)
(Т, Gfo, Уи«)-управляема при N =1,2,... и lim tNt = tt.
N —* оо
Доказательство. Положим X = L£[*0> Т], XN = Lr2N = {[u]N =
= (%, «1аг. • • -i <4w): E «wA*w = ll[«LJi„ < °°}- Напоминаем, что
i = 0
*тилг < T ^ *m +i,w Ниже будем считать, что tmN + lN = Т; узловые точки
tiN > Т нам не понадобятся, так как все рассуждения будут проводиться на
отрезке [t0, Т]. Введем отображения QN: X —> XN, PN: XN—> X следующим
образом:
Qn\U) = \U0N> UlNi • • ■) иткы)[ UiN = PviN\ViN)y
viN=At^ $ u(t)dt, i=0,...,mN, (12)
^([^^) = -^(1)(^)1 *w<*<*< + iat. i=0,...,mN, (13)
где Pv(z) — проекция точки ze ET на множество V.
§ 6. АППРОКСИМАЦИЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
753
Дальнейшие рассуждения, представляющие собой проверку условий 1)-
3) теоремы 2.4, оформим в виде трех лемм.
Лемма 1. Пусть выполнены условия теоремы 2. Тогда
QN(u)eUN(T), tN(QN(u))^t(u) при всех ueU(T), N=1,2,...
Доказательство. Возьмем произвольное управление и €U(T).
Тогда существует момент t(u) — время первой встречи траектории x(t, и) со
множеством Y, определяемый условиями (3), (4). Возьмем точку ts N€.{tiN}
такую, что ts N < t(u) ^..t +1<N. Рассмотрим задачу (7) при [u]N= QN(u).
Покажем, что соответствующая дискретная траектория x{(QN(u)), i = 0,...
..., mN + 1, такова, что
3i(QAr(«))eG&, * = 0,..., sN, xSii(QN(u))eYv". (14)
В самом деле, согласно оценке (5.16)
\х(Ь{,и)-x((QN(u))\^SN, i =0,..., mN+l. (15)
Так как x(t, и) G G(t) при t0 ^ t ^ t(u), то x(t{, и) е GiN и x{(QN(u)) £
G G^f с СщГ при всех г =0,..., sN. Далее, согласно оценке (1.11) и выбору
узла ts N имеем
\x(t(u),u)-x(tSitN,u)\^Cl(tSit + lN- *,ждг)<С1Йдг.
Отсюда и из (15) с учетом включения x(t(u), u)eY получаем хп (QN(u))€
G y*w + cidw с Y"". Включения (14) доказаны. Отсюда следует, что время
первой встречи tN(QN(u)) траектории [x(QN(u))]„ со множеством Y""
удовлетворяет неравенствам tN(QN(u)) ^ ts N < £(«)< Т. Кроме того, QN(u)e.
е UN(T), так что система (7), (8) (Т, G«f, У1/")-управляема и дискретная
задача быстродействия (7)-(11) имеет смысл. Лемма 1 доказана. □
Лемма 2. Пусть выполнены все условия теоремы 2, и пусть
UE"(T)—множество всех управлений u = u(t), которые
удовлетворяют условиям (2) и для которых существует момент t(u), t0^. t(u) ^ Т,
такой, что
x(t,u)eGE»(t), *„<*<*(«),
x(t(u),u)eYE», x(t,u)<£YE» при t0^t<t(u).
Пусть eN = £n + vn, N = 1,2,... Тогда
^(Млг) e UE»(T), t(PN([u]N)) < tN([u]N)
при всех [u]N e UN(T), N = 1,2,...
Доказательство. Возьмем произвольное управление [u]Nе UN(T).
Тогда существует момент tN([u]N) = t^N ^ Т, определяемый условиями (9),
(10). Рассмотрим задачу (1) при и = PN([u]N) и покажем, что
x(t,PN([u]N))eGE»(t), V<*<V" х(\м,Рм([и]м))е^. (16)
Согласно оценке (5.17)
N*i,^([«U)-MMW)l< V i =0,..., iN. (17)
754
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Отсюда и из (9) следует, что x(tt, PN([u]N)) е G^ + s", i =0,..., iN. Далее
из оценки (1.11) имеем
N*. ^аг([«]дг))- х(%,Рм(Ыы))\ < C,|t - tw| < C,dN
при всех £, tiAr < t < t< + iw, г =0,..., »w. Это значит, что x(t, PN([u]N)) G
G Gjf+ *"+c'\ tw < t < *< + 1ДГ, *=0 iN. Наконец, из h(G(t), G(tw)) <
^ ua(dN), *w< * < *< + !*- следует, что GftJcG^Wft), или G^ + S"+C'd" С
С GE»(*), *w< * < ti + lN, г =0,..., v. Тогда z(i, Рдг([и]„))е G*»(t), ^ f<
< ^дг. Кроме того, из (10) и (17) имеем ас(*<„лп Рдг([«]дг)) € Y"« + s« с FE".
Включения (16) доказаны. Отсюда следует, что PN([u]N) G US"(T) и время
*(РЛГ([«]ЛГ)) первой встречи траектории x(t, PN([u]N)) со множеством YB"
не превышает *w([«]w). Лемма 2 доказана. П
Наряду с задачей (1)-(5) рассмотрим расширенную задачу
быстродействия. Для этого при каждом е >0 введем множество UC\T) всех управлений
u = u(t), t ^ t0, которые удовлетворяют условиям (2) и для которых
существует момент t(u), £0 ^ t(u)^ Т, такой, что
x(t, u)<=GB(t), ^<t<t(u), (18)
x(t(u),u)eYs, x(t,u)¢YE при t0^t<t(u). (19)
Рассмотрим задачу
*(«)-» Inf, ueU'(T). (20)
Обозначим через i,(e)=inf t(u)—оптимальное время задачи быстродейст-
вия (1), (2), (18)-(20). и'^
Лемма 3. Пусть выполнены все условия теоремы 2, Тогда
lim t,(e) = t,.
Доказательство. Поскольку G(t)cG!(t)cG7(i), 7cYI(t)cP
при всех 0 < е < 7> то U(T)Q Ue(T) С £/7(Т). Отсюда следует, что
система (1), (2), (Т, Gs(t), Уе)-управляема при всех е>0и **(7)^ **(е)^ ** ПРИ
О< е< 7- Тогда существует lim tt(e) = T0^tt. Покажем, что T0 = tf. Возьмем
Е—>0
какую-либо последовательность {ек} —» 0, efc > О, А; = 1, 2,... Заметим, что
из замкнутости множеств G(t), Y следует замкнутость Ge(t), Уе. Отсюда
и из теоремы 1 с учетом уже установленной ГЦ Gs(t), Уе)-управляемости
системы (1), (2) вытекает, что в задаче (1), (2), (18)-(20) существует хотя
бы одно оптимальное управление ust = ust(t)eUs(T). Положим uk = uE^{t),
t0^.t^T, к = 1,2,.., Таким образом,
ukeW(T), x(t,uk)eG^(t), t0^t^tk = tt(ek),
*(**>«*) еУ\ x(t,uk)iY^, (21)
Поскольку множество И^(Т), определяемое условиями (6), слабо
компактно в Lr2[t0, Т], то, выбирая при необходимости подпоследовательность из
{uh}, можем считать, что сама последовательность {ик} слабо в Ll[t0, Т]
сходится к некоторому управлению % G W(T). Согласно (1.12) тогда
sup \x(t,uh)-x(t,vt)\=pk-^0 при fc->oo.
§ 6. АППРОКСИМАЦИЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
755
Отсюда и из (21) следует, что
x(t,vt)eG^ + ^(t), *«,<*<*», x(th,v,)eY*>+», £ = 1,2,--. (22)
Кроме того, согласно оценке (1.11)
поэтому
x(t,v,)eG*>+»+ib(th), tk^t^T0, (23)
ж(Т0,«»)еУ£'+"'^, fc = l,2,... (24)
Далее, учитывая, что множество G(t) непрерывно по Хаусдорфу и
ft(G(t),G(r0))<wo(r0-t)<wo(r0 -**) = 7* при всех*, tfc ^ t ^ Т0,
имеем G(tk)eG%(t) при 4, tfc < t =¾ Т0, Отсюда и из (23) получаем
включение x(t, vt) G (3^+^+^+^(4) при tk^t ^Т0. С учетом первого из
включений (22) тогда будем иметь, что
я(*,%)еОв'+"»+А+ъ(*) при всех 4, 40^4^Т0, fc = l,2,... (25)
Поскольку ек + р,к + /¾. + 7* -+ 0 при fc -> 00, а множества G(i), Г
замкнуты, то из (24), (25) при к ->оо получим, что ж(4, i>J G G(t), t0^.t^T0,
х(Т0, vt) £ Y. Таким образом, vt eU(T) и время первой встречи t(vt)
траектории ж(4, vt) со множеством У таково, что tt < 4(¾) ^ Т0, Отсюда имеем
неравенство t^^Ty. Выше было установлено, что Т0 ^ 4„. Следовательно,
tt= Т0 = lim 4„(е). Лемма 3 доказана. П
е —> О
Таким образом, если принять J(u) = t(u), и£ U = U(T), IN([u]N) =
= *w(Mw)> IXU e Un = Щ[Т), то тогда из лемм 1-3 вытекает выполнение
условий 1)-3) теоремы 2.4. Отсюда следует справедливость утверждения
теоремы 2. □ '
4. Таким образом, показано, что при выполнении условий теоремы 2 для
приближенного решения задачи быстродействия (1)-(5) может быть
использована последовательность разностных аппроксимирующих задач (7)-
(11). В свою очередь, для решения разностной задачи (7^-(11) при каждом
фиксированном N можно рассмотреть следующее семейство задач:
минимизировать функцию
при условиях (7), (8) и
в,([«ЫеС<Ч * = 0,..., л yeY,, (27)
где j — фиксированный номер, последовательно пробегающий значения
j =0, 1,..., mN; здесь номер mN определяется условием t N < Т < 4 + UN,
момент Т взят из теоремы 2. Для решения задачи (26), (27), (7), (8) при
каждом фиксированном j могут быть использованы известные методы
минимизации функций конечного числа переменных или дискретные аналоги
методов из гл. 8.
Обозначим pjN = iniIN([u]N,y), где нижняя грань берется по всем
([u]N, у), удовлетворяющим условиям (7), (8), (27). Может случиться, что
р .дг > 0 при всех j, 0 ^ j < к > а PkN = ° — эт0 значит, что tNt = tkN. Если же
p.N>О при всех j =0,..., mN, то ясно, что tNt^T> t^. Отсюда следует,
756
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
что, взяв номер N достаточно большим, согласно теореме 2 в принципе
можно получить достаточно точное значение оптимального времени
задачи (1)-(5). Однако нужно заметить, что такой подход к решению задачи
быстродействия на практике может оказаться не очень удобным, поскольку
с ростом N растет число задач вида (26), (27), (7), (8) и, следовательно,
вообще говоря, растет и объем вычислений. Поэтому желательно иметь
другие более удобные методы решения задачи (1)-(5), не требующие перебора
всех задач вида (26), (27), (7), (8).
5. Остановимся на одном из таких методов. Для простоты ограничимся
рассмотрением задачи быстродействия (1)-(5) при дополнительных
предположениях, когда фазовые ограничения отсутствуют, множество Y состоит
из одной точки, а множество V(t) не зависит от времени, т. е.
G(t) = E\ V(t) = V при А) < * < Г, Y = {y}. (28)
Как и выше, будем предполагать, что матрицы A(t), B(t), f(t) кусочно
непрерывны на любом конечном отрезке [t0, а], множество V выпукло,
замкнуто и ограничено.
Возьмем некоторое достаточно большое число Т > t0, зафиксируем t,
t0 < t ^ Т, и рассмотрим задачу
J(u, t) = \x(t, и)-у\2~>Ы, (29)
х(т) = А(т)х(т) + В(т)и(т) + /(т), to<T<t, x(t0) = x0, (30)
u = u(T)eW = W(T) = {u(T)eLr2[t0,T]:
и(т) e V почти всюду на [t0, T]Jk
Заметим, что значения управлений и[т) при ^т^Тна задачу (29)-(31)
не влияют. Но тем не менее мы здесь рассматриваем множество (31), так
как в дальнейшем нам будет удобно считать, что управления доопределены
на всем отрезке [t0, Т]. Обозначим
o(t)= inf J (it, t), t0<t^ T; (32)
u e W
при t = t0 положим p(t0) = \x0 — y\2. Будем считать, что p(t0) > 0, так как
при p(t0) = 0=\x0 — у\2 задача (1)-(5), (28) становится тривиальной: tt = t0.
Так как множество W слабо компактно в Lr2[t0, Т] и функция J (и, t)
слабо непрерывна на W, то в (32) нижняя грань достигается, т. е.
существует управление и = ut е W такое, что p(t) = J(ut, t) = \x(t, ut) — y\2
(пример 8.2.15). Отсюда ясно, что для того, чтобы момент tt был
оптимальным временем задачи (1)-(5), (28), необходимо и достаточно, чтобы
p(t.) = 0, p(t)>0 при t0^t<tt,
т. е. tt — минимальный корень уравнения p(t) = 0. Это значит, что для
поиска tt могут быть использованы известные методы решения уравнений.
В частности, здесь может быть использован метод, описанный в § 5.18
(см. процесс (5.18.20) и пояснения к нему). Этот метод был описан в
предположении, что функция p(t) удовлетворяет условию Липшица. Покажем,
что в рассматриваемой задаче это условие выполняется. Пусть
p(t) = \x(t,ut)-y\2, р(т) = \х(т,ит)-у\2, ut,u-eW.
§ 6. АППРОКСИМАЦИЯ ЗАДАЧИ БЫСТРОДЕЙСТВИЯ
757
Тогда из определения (32) функции p(t) с учетом оценок (1.8), (1.11) имеем
P(t) ~ Р(т) < 1Ж(*> ит) ~ У? ~ \х(т> ит) ~ У\2 <
^ 2(С0 + \y\)\x(t, ит) - х(т, ит)\ < 2(С0 + \ybCy\t - т\,
p(t) - Р(т) ^ N*> ut) - у? - Ыъ щ) - У? >
> -2(С0 + \y\)\x(t, щ) - х(т, щ)\ ^ -2(С0 + \y\)Cx\t - т\.
Следовательно,
И*)-р(т)|<Ь|*-т|, ^<*,t<3J Ь=2(С0 + |2/|)С,. (33)
Для вычисления приближенного значения p(t), удовлетворяющего
условию (5.18.20) можно воспользоваться разностными аппроксимациями
задачи (29)-(31), описанными в § 1.
Заметим, что метод (5.18.20) поиска минимального корня уравнения p(t)
может быть модифицирован на случай функций p(t), удовлетворяющих
более общим, чем (33), условиям
И*)-/Ф-)|<Ц|*-т|), t0^t,r^T,
где u(d) — неубывающая функция переменной d ^ 0, w(0) = 0, и применен
для решения нелинейных задач быстродействия [141].
О других аспектах задач быстродействия, различных приложениях, о
дифференциальных играх преследования — уклонения, обобщающих задачи
быстродействия на случай конфликтных ситуаций, см., например, в [10; 39;
82; 97; 98; 100; 138; 140; 141; 212; 241; 244; 245; 287; 288; 310; 312; 333;
336-338; 380; 382-384; 400; 440; 504; 505; 530; 551-554; 569-571; 589;
637; 647; 719; 755; 801; 809; 815].
§ 7. Разностная аппроксимация задачи
об оптимальном нагреве стержня
1. Рассмотрим задачу
J(u)=S |яв(в, T;u)-b(s)\4s-*ini, и € Ц (1)
о
где х = x(s, t) = x(s, t;u) — решение краевой задачи
дх
*=0+„(«,*), (s,t)eQ = (0,l)x(0,T), (2)
= 0, 0<*<Т; ас|,ш0 = 0, O^s^l, (3)
_ дх
, = о ~ ds
i = i
управление и = u(s, t) принадлежит множеству
U = {u(s,t)eL2(Q): §u2(s,t)dsdt^R2}, (4)
Q
Ъ = b(s) е L2(0,1) — заданная функция, R = const > 0.
Напоминаем, что близкую задачу о нагреве стержня мы уже
рассматривали в § 8.7.
758
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Определение 1. Обобщенным решением задачи (2), (3),
соответствующим управлению и е L2(Q) будем называть функцию х = x(s, t;u)£
GH1,0(Q), имеющую следы х(-, £) еL2(0,1) при всех t е(0, Т),
непрерывные в метрике L2(0,1), и удовлетворяющую интегральному тождеству
\ x(s, Т)ф(8, T)ds - й (х% - gf W = Ц fi/xladt
\/rl>=%(s,t)eW(Q)
(ср. с определением 8.7.1).
Существование и единственность обобщенного решения задачи (2), (3)
при каждом фиксированном u£L2(Q) доказана, например, в [441; 492].
Отметим, что эта задача на самом деле имеет более гладкое решение, чем
это указано в определении 1 — этот вопрос кратко будет обсуждаться
ниже. Так же, как это делалось в § 8.7, можно доказать, что множество Ut
решений задачи минимизации (1)-(4) непусто.
2. Сформулируем разностную задачу минимизации, аппроксимирующую
задачу (1)-(4). На прямоугольнике Q = [0,1] х [0, Т] зададим сетку ujhT =
= {(s{, t.): s{ = ih, t- = jt, i = 0,..., M, j = 0,..., N}, где h,r — шаги сетки,
hM = l, tN=T. Для функции yhT = {yijt i = 0,..., M, j = 0,..., N},
заданной на сетке ш,1Т, введем разделенные разности
Ущ = ~^\Vii ~ Уц - 1/> Vaij = /Г'% ~ Уг- lj')> УзЦ = /Г \У{ + \j ~ 2/у))
У*»ч = h^y^i ~ У>ч) = ft2 \У( + \j ~ ^Уц + 2/i - \j)-
Рассмотрим разностную задачу минимизации:
М-1
Ar(«ftr) = Е h \уш - Ъ{|2 ->inf, uhT G UhT, (5)
где yhT = yhT(uhT) — решение разностной краевой задачи
Ущ = Ушз + иц, г' = 1,...,М-1, j = 1,...,N, (6)
%i,-=0, %м; = 0, j = 1,..., JV, %0 = 0, * =0,..., M; (7)
разностное управление uhT = {щ-, г' = 1,...,М— I, j = I,..., N}
принадлежит множеству
N М-1
UhT = {uif. E E hrul^R*}. (8)
j = i »= i
Задача (6), (7) при каждом фиксированном uhT = {uii) представляет
собой систему линейных алгебраических уравнений относительно
неизвестных yhT = {у{Л, для нахождения ее решения можно воспользоваться методом
прогонки [89; 635]. При каждом фиксированном h, т задача (5)-(8) является
задачей минимизации непрерывной функции конечного числа переменных
{«^■} на компактном множестве UhT, множество UhTt ее решений непусто.
Для поиска решений задачи (5)-(8) могут быть использованы методы гл. 5.
Обозначим Jt = inf J (и), IhTt = inf IhT(uhT). Следуя [362], ниже покажем,
что при специальном выборе Ък = (Ъх,..., Ьм_,) и (h, т) —» 0 решение
разностной задачи (5)-(8) сходится к решению задачи (1)-(4) по функции,
§ 7. Разностная аппроксимация
759
т. е. lim IhTt — Jt. С этой целью сначала нам нужно будет получить апри-
(/&, т) —> О
орные энергетические оценки решений краевых задач (2), (3) и (6), (7), а
также оценить близость решений этих задач.
3. Начнем с доказательства следующих двух оценок для достаточно
гладких классических решений задачи (2), (3):
/
max J x2(s, t; u)ds + Й x2(s, t; u)dsdt ^. С $ u2(s, t)dsdt, (9)
"=*'=*- 0 Q Q
max \ ^¾^ ds+ll(\^^- \ d2x^\2)dsdt^C^(s,t)dsdt. (10)
o«f«r0 Q \\ as I / Q
В оценках (9), (10) постоянные С, зависящие лишь от I, Т, но не
зависящие от выбора и е L2(Q), конечно, разные. Однако конкретные значения
этих постоянных в дальнейшем для нас несущественны, поэтому здесь и
далее подобные константы мы будем обозначать одной и той же буквой С.
Кроме того, далее без дополнительных оговорок будем пользоваться
неравенством Коши — Буняковского для сумм и интегралов и элементарными
неравенствами
\аЪ\^%а2 + ±Ъ2, (а+Ъ)2^2а2 + 2Ъ2,
(а + Ъ + с)2^3(а2 + Ъ2+с2) \/а,Ъ,сеШ Ve > 0.
Заметим, что оценка (9) аналогична оценке (8.7.15) и доказывается
аналогично. А именно, умножим уравнение (2) на x(s, t;u) и полученное
равенство проинтегрируем по прямоугольнику QT = {(s, t): 0^s^l,0^t ^ т},
где т — произвольный фиксированный момент времени, 0 ^ т ^ Т:
й ^ xdsdt - й ^xdsdt = й uxdsdt. (11)
С учетом условий (3) имеем
Ц %xd8dt = \(\ ^(x2)dt)ds = ±\x2(S,T)ds,
Qr 0 V 0 ' 0
0^-^-5^.-1(^)^-5(¾)^
Qr as 0 ч » = 0 о \ / / Qr '
Подставим эти равенства в (11). Получим:
I \ x2(s, r)ds + Ц (^Ydsdt = й uxdsdt ^
о Qr ' Qr
т I ' \ V2 / ' \ '/2 / ' „ \ '/2
< Ш x4s, t)ds) К u2(s, t)ds) dt ^отахД$ x2(s, t)dsj X
т , l ч 1/2 / ' \ 1/2
xS J«2(S,t)<iS d*< max(Sa!a(e|t)de) Vt|Hw (12)
Отсюда следует
' I ' \ '/2 .—
j aj2(e, r)de < max (\x2(s, t)ds) ■ 2y/T\\u\\ LAQ) Vt e [0, Г],
760
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
поэтому I
max [ x2(s, r)ds =
/ / ' \ 1/2ч 2 / ' \1/2 ,
MIIl2(Q)>
или
maxJx\s,t)ds^4T\\u\\l,Q). (13)
о<(<г о " ' ' " " ,lL2(Q)'
Далее, из (12), (13) имеем
' \ '/2
й(£)лЛ<(отахг$я!а(в,*)л) VT||«||bi(g)<2r||«||ii(g) Vtg[0,T].
Сложив это неравенство при т= Т с (13), придем к оценке (9) с постоянной
С = 6Т.
Докажем оценку (10). Умножим уравнение (2) на х^ ' и
проинтегрируем по области QT:
.... о чо ч ч / ' ' о
то из (14) имеем
S (£). dsdt = S У &*й = S «£dscft. (14)
Поскольку в силу условий (3)
я $***-{(*£[_.-j £&*)*-
=-|(Й((й)>')*-^(^Ь
g(*)drft+is(^%^)&=ss»*^t<i||„||!,w)+iB(*)**
ИЛИ 2/2
S (¾) dsdt + I (¾^) ds < ||„||» Vr € [0, T].
Отсюда имеем два неравенства
S(w)8**<INi,M). $(^)*<NIU Уг€[о,г].
Пользуясь произволом в выборе т е [0, Т], получаем
S (*)'** < ||n|||2(Q)) omaxr J (^fe^)'cfa < ||«||ijW). (15)
Кроме того, из уравнения (2) с учетом (15) имеем
S (ff)5ы* = й (S-«)'cW*<2 S (g)5w*+2 S«»cW*<4||«|||iM). (16)
§ 7. Разностная аппроксимация
761
Сложив неравенства (15), (16), придем к оценке (10) с константой С = 6.
Приведем два следствия из оценок (9), (10):
max_\x(s,t;u)\2^C\\u\\lm, (17)
(s, ( ) £ Q
Для доказательства оценки (17) заметим, что
„2/
Ч / 2 «
^2/5(¾^) de + 2a!a(e,t) V(e,t)GQ, V£e[0,J].
о v '
Интегрируя это неравенство по £ на [0, /], с учетом оценок (13), (15)
получим ( 2 (
lx2(s, t)<2Z max ПМ|^1) ж,+2 max U2(s, t)ds^
<(2Z+8r)||«||i>(g) V(M)eQ.
Отсюда получаем оценку (17) с С= [2 + 8—J. Оценка (18) следует из (16)
и неравенства
о ч0
4. Опираясь на оценки (9), (10), нетрудно доказать, что решение
задачи (2), (3) представимо в виде ряда Фурье
х(8, t; и) = £ eh(s) J ик{т)е-^-тЧъ (19)
fc = l о
где et(s) = yj cos Afcs — собственные функции оператора — —^ при у?'(0) =
= p'(l )=0, соответствующие собственному числу А к = (-y-J, /г = 1,2,...;
г%(*) = J u(s, t)eft(s)ds е L2[0, Т]. Функции {ек(а)} образуют полную ор-
о
тонормированную систему в L2[0, Т] (см., например, [492; 557], и ряд
оо
w(s,*)= ^С uk(t)ek(s) сходится в метрике L2(Q) ив метрике L2[(V] ПРИ п0"
m t
чти всех te[0,Т]. Частичные суммы xm(s, t)=J2 ek(s) S «fc(T)e_A*(<~T)*r>
4 = 1 о
m = 1, 2,..., ряда (19) являются классическим решением задачи (2), (3),
и для них справедливы априорные оценки (9), (10), (17), (18). Из этих
оценок следует, что последовательность {xm(s, £)} фундаментальна в
пространствах C(Q), H2'l(Q), ряд дх^'81\ полученный формальным
дифференцированием ряда (19), сходится в пространствах С([0,T],L2(0,l)),
,1 ч 1/2 ,Т ч 1/2
C([0,l],L2(0,T)) с нормами max K/2(s,t)ds) , max К /2(s, t)dt) со-
762
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
ответственно. В силу полноты перечисленных пространств сумма ряда (19)
при каждом фиксированном и = u(s, t) G L2(Q) является непрерывной
функцией на Q, принадлежит H2<l(Q), почти всюду на Q
удовлетворяет уравнению (2), почти всюду на [0, Т] следы gg при s = 0, s = I и
след x(s, •) при t =0 удовлетворяют условиям (3), т. е. ряд (19)
представляет собой почти классическое решение краевой задачи (2), (3); для него
справедливы оценки (9), (10), (17), (18).
5. Покажем, что для решения разностной задачи (6), (7) справедливы
следующие оценки
М-1 - N М-1 ! ' N М-1
,max £ hy\ +ЕЕЧ^СЕЕ Л™§, (20)
М-1 w М-1 я М-1
, max Е^+ЕЕ hriyl, + y]sij) < С £ £ Лти*, (21)
являющиеся разностными аналогами энергетических оценок (9), (10)
соответственно. Оценки (20), (21) доказываются по той же схеме, что и
оценки (9), (10). Для доказательства (20) умножим уравнение (6) на hry.. и
просуммируем по г от 1 до М — 1:
М-1 М-1 М-1
Е тЪ-УщУц ~ Е тЬу^Уц = Е ThuijVij, j = l,...,N (22)
»=i <=i t=i
Нетрудно проверить, что
тУщУц = (Уц ~ Уц-\)Уц = ФЪ ~ Vij-i) + 2(¾ - %- l)2 >
?>lM-vl-i) i = l.-..,M-l, j = 1,...,JV. (23)
Поэтому
М-1 . М-1 . М-1
Е ^2ЗД > j Е Ч- - § X) Ч-м i = !> • ■ ■> ^ (24)
г=1 2 = 1 i=l
Для преобразования второго слагаемого из левой части равенства (22)
воспользуемся известной формулой суммирования по частям:
М-1 М-1
Е ha3ibi = - £ haibs-i + aMbM_l-alb0, (25)
где asi = °i + 'fe °', ЬЛ- = *' ,/~'. Отсюда при a; = %-iy, b{ = yi} с учетом
граничных условий (7) имеем
М-1 М-1
Е тЪУщУц = ~ £ rhy^, 3 = 1,..., К (26)
Подставим (24), (26) в (22). Получим
, М-1 . М-1 М-1 М-1
ЕЦ- ЕЦ-1+Е hry% < £ /тзд, j = 1,..., ЛГ.
<=i i=i i=i i=i
§ 7. Разностная аппроксимация
763
Просуммируем эти неравенства по j от 1 до некоторого п, 1 ^ n ^ N. С
учетом начального условия ую=0, г =0,..., М, получим разностный аналог
неравенств (12):
. М-1 п М-1 п м-\
2J2hyfn+j:j: Thy% ^ Е Е hTuijVij <
i=\ j s= 1 { *= 1 j s= 1 г = 1
<J2t EK max E Щ <
/М-1 ч 1/2 / W М-1 ч 1/2
^тахДЕМ}) V^(E E K) Vn, U»<JV. (27)
= i ' v=i » = i
Тогда
М-1 /М-1 ч 1/2 , , N M-l ч 1/2
Е^.тахДЕМО ^(ЕЕЦ) Vn, l<n<JV.
Отсюда имеем
М-1 ,. /М-1 \1/2\2
Т. hyl = { max ( У) Ли*) ) £
М — 1 / /М — 1 ч 1/Z4 i
/М-1 ч 1/2 , у N М-1 ч 1
^ max Е ВД 2л/г(Е Е Л™*)
М-1 N М-1
max Е^^ТЕЕ Л™*- (28)
Кроме того, из (27), (28) получаем
N М-1 N М-1
Е Е Лт$,-<2ГЕ Е л™*-
,-=i <=i ,-=i .-=1
Сложив это неравенство с (28) придем к оценке (20) с С = 6 Т.
Докажем оценку (21). Умножим уравнение (6) на hryu- и просуммируем
по i от 1 до М — 1:
М-1 М-1 М-1
Е Thy}{j - Е тЪу^Уц = Е hrUijy{ij, j = l,.. .,N, (29)
i = 1 . = 1 г = 1
Второе слагаемое из левой части (29) преобразуем с помощью формулы (25)
при а{ = %г, Ь{ = уцу С учетом граничных условий (7) имеем
М-1 М-1 М- 1
- Е Thys.sljyUj= Е ^УщУиц-{УацУш-и-УщУ^)'Г=11 тКУщУИц-
< =1 .=1 .=1
Правую часть этого равенства оценим теперь снизу с помощью неравенства
вида (23):
т%< .,■%;,- = (½¾ — Уи)-\)Уи) £■ 2^У"з ~ Щ»-\г . .. .
Получим
М-1 , М-1 . М- 1
- Е тЬУ/и,-У{ц > ъ Е hylj-2 £ Л$,--1-
.- = 1 « = i . = 1
764
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Подставим эту оценку в (29):
М- 1 , М-1 . М-1 М- 1
Е тъ-vh + 5 Е Ыц- \ £ л<_, < Е 4¾. i = 1»• • ■»м
г = 1 г = 1 г = 1 < = i
Отсюда, суммируя по j от 1 до некоторого п, 1 ^ n ^ N, с учетом равенств
y..Q = 0, г = 1, ..., М, получим
п М-1 . М-1 W М-1
Е Е ?%?<,■ + 5 Е %L ^ Е Е ^г/д, <
,-=1 « = 1 < = 1 ,-=11=1
< ЕЕ Лт$,- + ЕЕ ЛЧ
Z ,-=1 <=1 ^ ,'=1 <=1 J
ИЛИ
п М- 1 М-1 W М-1
Е Е rhylj + £ hyjin ^ £ Е л™*- Vn> U n < jv. (30)
,-=i <=i i=i ,-=i i=i
М-1 W М-1
Отсюда следует, что £ ^Ут <Е Е ^™у Vn' 1 ^ n ^ -^- поэтому
.= 1 ,-=i >=1
М-1 N М-1'
max Е ha?to<£ Е ^4- (31)
l<n<W i=, у=1 г=1
Кроме того, из (30) имеем
N М-1 W М-1
Е Е Лтг4 <ЕЕ л™*~ (32)
,-=1 г=1 y=i i=l
Наконец, из уравнения (6) с учетом (32) получаем
N М-1 N М-1
Е Е Ля&<,- = £ Е М%<,--««,■)*<
,-=1 »=1 ,'=1 i=l
W М-1 W М-1 N М-1
^2Е Е Ч + 2Е Е ^4<4Е Е л™§- (33)
,-=1.= 1 ,'=1 i = l ,- = 1 i»l
Сложив неравенства (31)-(33), придем к оценке (21). Отметим, что
справедливы и разностные аналоги оценок (17), (18), однако они нам ниже явно
не понадобятся.
6. Оценим разность между решениями задач (2), (3) и (6), (7).
Введем гильбертово пространство L2hT, являющееся разностным аналогом
пространства L2(Q). Элементами пространства L2ltT являются сеточные
функции fhT = {f.., г = 1,..., М -1, j = 1,..., N}, скалярное произведение и
норма в L2hT равны
N М-1 / N М-1 ч 1/2
(Л„^)^ = Е Е hrfij9ij, ||Лг||,2лг=(Е Е л^-) ■
,-=i»=i n,-= 1 .-=1 '
Через phTfhT будем обозначать кусочно-постоянное продолжение сеточной
функции fhT по правилу
Phrfhr = (Phrfhr)(S, t ) = fij .
(s,t) e Qiy={(s,t): s{^s< al + 1, '*y_, < t ^ t.}t * = 1,..., Af-1, j=l,.. .,N.
§ 7. Разностная аппроксимация
765
Область определения функции phTfhT обозначим Qh = {(s, t): h < s < Z, 0<
< t ^ T}. Нетрудно видеть, что
N M-l
й Р^Л.йвЛ = Е Е hrfip
N M-l
{PhrfliT^PhTdhT/L2(Qh)= E E ",Т/уА,ч=(Лт)А,Лт)^]№г> ||^Лг/лг1и2(дд) = ||Аг1им/
У = 1 t = 1
Разностное уравнение (6) теперь можем записать в виде
Pfrrft-fcr - ^ЛгУааЛг = Ar«hr> (*» * ) ^ Qft- (34)
Из уравнения (2) вычтем (34), полученное равенство умножим на x(s, t) —
— Ph-rVhr и проинтегрируем по области Qh:
й (Чг1 ~ Mi*) <<Ф. *) - Д^)<*«** -
^ 2
- fi (¾11 -Аг»«г)И«, t) - PhTyhT)dsdt =
= S(«(S> *) - PhTUhr)(X(S> *) - PhTyhr)dsdt- (35)
Первое слагаемое из левой части равенства (35) оценим тогда следующим
образом:
fi (¾11 - Аг»Лг)<*<«. *) -^%,)^* =
N M-l Ь s( + i , а, .ч \
= EES $(5%^-У£«)(»(-,*)-»«)ЛЛ =
W M-l (i *i+i г ,
/=1 1=1 tj_, S;
,-=1 <=1 tj_,», L ч '
M-l si + i . N I (,
= E $5Е(^*)Ч*-^-»Д.( ds +
dsdt =
» = 1 s. ,',= 1
N M-l (i 'i+'ir» ; .4
,-=1 i=l tj_l O;
M- 1 si + i . N
dsdt =
= EI E К<Ф> *,) - %,)2 - (<Ф. *,--.) - *<»■- .)2]ds +
<=i
,-=1
+ EES И*,*)(*-*,Ы;ц ,- S x(8,t)y{iidt-yiv $(*-*,)<**№=■
1=1 »=1
°i
M- 1 si+i
E
» = 1
ЛГ M-1SI + I
= j E S" N*. tN)- yiN\4s + E E S [rx(s, t._ ,)^ -
,- = 1 i = 1 sj
*j 2 , M-lsi+i
j X(S, t)yUjdt + ^yl^ds ^E S И*. **) - 2/гЛг)2^ +
N M-l Ь si + l
lEES И^»*,-.)-^.*))^^*- (36)
766 Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Преобразуем теперь второе слагаемое из левой части (35). Предварительно
заметим, что
M-lsi+i г / „2„
Е S (5^-v^)И-,*НО* =
+ (^.(*п*)-^)И**у*)-^)]л vt, ty_i<*<*y» з=1.---.Д (37)
где использованы обозначения: a;s-s(s0 t)= -^(xs(s{, t) — xi(si, £)), xs(s{, t) =
= 1(ж(«» + 1» *) - <Ф<, *)). M^» *) = ^ОФо *) - яв(в*_1, *))• Первое
слагаемое из правой части (37) можно представить в виде
t S ^[(^Й^-(«-«,К.(«о*)-^(«„*))и«,*)-^)
t = 1 Sj L /
- T (¾^ "(-- «Х.<-,, *) - <%<"«, *)) ^%^
rfs :
"1 + 1
s =s.
M-lr/
^K + n*)
.(«%*i-^ejl *))(*(,„ ¢)-^)+(^¾^.^^. *))(%+Iy-y
M- 1 s. + i
i = 1 si. '
= (^5^-^(¾. <>)«%, t)-yul)- (^^-3,(.,, 0).СФ„ <)-!/«)+
+ E\^%^-^, + ,,OK-^f(^-M»„*))^* +
» = 1
M-l s<+l
+ t I *,.('„ t)(a - з{)Ц^с1з Vt, *,_,<* < *., У = 1,..., N. (38)
» = 1 S;
Третье слагаемое из правой части равенства (37) преобразуем с помощью
формулы (25) при а{ =-яв,(я„ *) - %-у, Ъ{ = x(sif t) - уц:
M-l si + i
Е S (^.(«1» *) - У/*)Ы8н *) - y«)d* =
i = i ..
M-l
= £ М3^». t) - y<,),,(ac(««, t) - %,) =
м-i < = '
= - E M^Ai *) - Via? + (xAsm, *) - Уяц)(х(аи-1. *) - 2/m- iy) -
< = i
- (s,(S„ t) - %,,.)(я!(0, t) - y0j) Vt, t._, < t ^ *., 3 = 1,..., N. (39)
§ 7. Разностная аппроксимация
767
Неравенство (36) и равенство (37) с учетом (38), (39) подставим в левую
часть (35). Получим:
. М-1 s, + i ЛГ М-1 'j 10
2 Е S (<Ф, *n) ~ ViN?ds + Е Е М (в,(*о *) " Ун]?М < £ Д«, (40)
где
^=1 S; Д = 1 * = 1 * _ , » = 1
лг м-1 Ь si+i
Д, = Е Е j j (яв(я. *) - яв(«, tj-i))ytijdsdt,
i =
N Ь
Д4=Е е' S (^^-^,+,, *)W*A
Д5 = -Е Е1 ] Yi^-x^tti^dsdt,
3 = 1 . = 1 (,_, Sj ч /
ЛГ М-1 (У »< + ! „ , ..
Д6=Е Е S S *.-.(«„ ¢)(--¾)¾1^.
ЛГ М-1 (; si + i
Д7=Е Е S !к(«()0-й.«)ИМ)-Ф„0)Н
331] I
j = l i=l fy_, Sj
ЛГ
Л8=Е J (zs-(«m> *) - Мгад)(я!(вм - и *) - Ум- n)dt,
^9 = -E ЙЖа(*1> *)-%li)HO,*)-%y)d*.
ЛГ М-1 (i si+i
Д.о = Е Е S J И*. *)-««)(*(*» *)-*«)<*«**•
j = l » = 1 ty_, s.
Оценим сверху каждую из величин \R{\, г = 1,..., 10. Для этого наряду с
оценками (9), (10), (20), (21) нам понадобятся еще несколько
вспомогательных неравенств. Приведем их. Начнем с неравенства:
/М-1 \
(<Ф«, *) - Уц? < ^( £_ h[(xs-(sm, t) - ys-mjf +,(х(8п, t)- ymjf]) (41)
V* = 1,...,M-1, j=\,...,N, tG[0,T].
Напоминаем, что через С, как и в оценках (9), (10), (20), (21), мы здесь
и далее обозначаем постоянные, которые не зависят от h, т, и, uhT. Будем
считать, что h < 1, h < 1/2, т< 1. Нетрудно проверить, что
x(st,t) = £ hx-(sm,t) + x(sp,t) VtG[0,T],
то = р + 1
t
2/у= Е hys-mj + ypj У] = 1,..., N,
га = р + 1
768
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
где 1 ^ р ^ г < М — 1; при г = р по определению считаем Ё ат = 0. Тогда
т = р + 1
ОФо *)-%,)*=( Е ММЪ*)-!/™,') + (ФР,0-!/И'))^
m=p+1 м-i '
< 2 Е Цх,(8т, t) - ySmjf + 2(x(sp, t)- yvjf.
m— 1
Умножим это неравенство на h и просуммируем его по р от 1 до М — 1.
Получим
М-1
(Z - h)(x(s{, t) - 2/,,)2 ^ 2(1 - h) Е h(xs-(sm, t) - ys-.f +
M-l
m= 1
+ 2 E 4x(sp,t)-ypj) Уг = 1,...,M-l, ^ = 1,...,^, tG[0,T],
p = i
что равносильно неравенству (41) с С = max< 2; у L Для г = 0, i=M с
учетом граничных условий (7) имеем:
(х(0, t) - y0jf = ((¢(0, t) - аф„ *)) + (аф„ t) - у,,))2 ^
<2hJ ^¾11 ^+2(^,,0-2/,,)
j' '.
(x(sM, t)- yM,)2 = ((x(sM, t)- x(sM_u t)) + (x(sM_u t) - 2/m-w))2 <
<2Л I
sM-l
0a>lt,t)
ds
dt+2(x(au_ltt)-yu_li)\ (42)
Заметим также, что
ЛГ *j М-1 ЛГ М-1 *1 Sm + I
j = 1 m= 1 t , sm
+ (аф, t) - аф, t.)) + (Ф, *v) ~ vjffdadt ^
N M-l (i Sm + lr/S
2 /j fe(S,r)] ^2
jv jh — i -j "m + i r / я а ,f .■. \г / i а , s \г п
^з ЕЕ $ 1[(1^*е)+(1^*т)+(х(а,ь)-у«г]ыг
j'=lm=ltM »m A, ' N( ' J
ЛГ M-l (j sm+i r sm+i, я /> ,4 |2 Л i я / \ |2 1
^зе E X SM ЙИ^+Т J ^^Mr+Hs,*,)-^)2!^^
j=\ m = 11 sm
'J-1
<3/i5
cte
+ 3т2
ЛГ M-l Sm + 1
Ь2(У) ^(У) j = 1 m= 1 a
ЛГ M-l Си
<C(/l2 + r2)||«|||2(Q) + 3E E r J (x(s,tj)-ymj)4s (43)
j = 1 m = 1 sm
в силу (9), (10). Из (41)-(43) следует, что
лг Ь лг м-1г (i
Е И^.*)-^)ал<с-Е Е л H^(sm,t)-ys.mj)4t+
j=\ ts_
J = l m=l (,
+r \(x(s,t.)-y\4s +C(h + r)\\U\\* *=0,...,M (44)
§ 7. Разностная аппроксимация
769
Далее заметим, что
VsG[0,1], te[0,T], i = l,...,M.
Отсюда для всех s, s{_, ^ s ^. si + l, i = 1,..., M — 1 имеем
N ll I a„i 4\ \2 N li , , si /si+iia2 / 4\ I \ \2
V-i °i-i i'-i
ЛГ i s' + i я2 / + \ 12
aE M 5Н5Р M* (45)
j=i (.-~i «i.
5s
Из (45) и оценки (10) получаем
лг V /
" J / Я / +\ \ Z VV 1 1
Е S (5¾^-*,<-„*)) л <2Л£ X S
И я2 I 2
ох
д2х(ц, t)
8s'
drj =
= 2h
ij(Q)
<лС||«11ь,(в) Vs> Vi<*<*<+i» *=!,...,Af-l. (46)
Кроме того, с учетом (45), (10) имеем
ЛГ М-1 'у s, + i /я, .. N2
Е Е S S Р^-^*) "^
т = I 4. = I * в ^ '
J = l <=1 tj_, »j
ЛГ М-1 *у si + i .. si + i, „2
я м-1 -j -i + i , "1 + 1 | „2 / .viz \
^Е Е S lU J^dr,^^
<2h!
o2„||2
Й .<*'<«.(<.>■ (47)
& \\Lt(Q)
Наконец, из равенства
S( 8,_, 8j
-^^^^^)=^(1¾^^)¾. .=1,...,^-1, *e[0,r]
и оценки (10) следует
ЛГ М-1 'у si + i ЛГ М-1 (j . ,»1 + 1 , ( o2„(„t\ \ \2
Е Е М (%^,*))2^* = Е Е J А( S ($ ^-g^W) <
1 = 1 г=1 (.. , ,, з = 1 •=' <■ , Ч », Ч-Л "S 7 '
!•' / С я2
и я-1 ■ , "i + i / ! я2 / +\ \ -г
ЕЕ $ Л J ( $ ^И^И^
/=1 «=1 (.,Л », v-л os '
',-i °i
Я М-1 '/ . "i + i si + l я2
Л Ш-1 7 . ~f + l "i+1 QZ / ^\ 1^
< Е Е S i S М *^H *#л
ЛГ М-1 Ь si + i „2 / +ч 2
Е Е М i4Sdi ^*^2
,-=1 »=i t
д2х
7-1 1-1
£,(<Э)
<C||«||ii(g). (48)
770
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Теперь можем перейти к оценкам величин R{, i = 1,..., 10, из (40). Начнем
с оценки i?,:
лг м-i Ь si+i / <
1Д,
ЛГ М-1 Ч ai + i / t а i ч \
ЕЕ!! I d-^dr)yujdsdt
J- 1 i - 1 *j_, в, *
'# s: . i . 'v
ЛГ М-1 '/ 3i + l / V I „, v I ч
<EES i i^^l^"^
* HII^IL)+ ^JIU < ^dl«lli.M) + IKIIiJ; (49)
здесь мы учли оценки (10), (21). Далее, с помощью оценок (44) при г =М,
(46) при i = М, s = sM имеем
V = 1 ts
2 ч 1/2
r ЛГ M- 1 *j Sm + 1
■j- 1 m- 1 t , s.
+ (T + b)Hii(g)
4_ Arrilttll2
+ 2e°IPIlL2(Q)
Ve>0. (50)
Аналогично с помощью тех же оценок (44) при г = 1, (46) при г = 1, s = s,
получаем
г ЛГ М-1 *l Sm+1
ЕЕ! S((^*)-yJ2+
Lj=lm=l «. , s„
|-из I ^ 2
+ ^C-||«IIU, Vs>0. (51)
IIl2(Q)
Из оценок (10), (20), (21), (47) следует
№K(E'Y(E 1((^^-^) +
г- 1 s, J- 1 «,_,
+ (¾11 - ж^> *)) - hxt.(st, t)ydt)dsy2\\yshT\\Lihr <
УзИтПЬ,
/ ЛГ M-l li s< + \ , ,s: + \ я2„,с 4\ \2
<3EE J S ((J ^-¾^) +
+ (¾11 - **<*«, *))' + Ь.\хл(8„ t))a)dedt)I/a||%
< bC-|HLl(e,ll«JlLllr < ftC(||«||ii(g) + KJ! J. (52)
Из (9), (47) имеем
, ЛГ М-1 '/ *<+1/я_/ ,> \2 \ 1/2)1 о
|Д.1<ЕЕ S S ^-M^)W) Й
ь,(Я)
^hC\\u\\lAQ). (53)
§ 7. Разностная аппроксимация
771
Далее, с учетом оценок (9), (10), (48) получаем
ЛГ М- 1 (i s.' + i ч 1/2 и Q_ 2
■Rfi
^(её i '{\х3-м,t)\\s-Si)4sdt) II§
\y=i i=i t^_i Sj / ii
= (E E S !*,.<-«. *)1'тл)
4j=i i=i i,, ° /
3 . \'/2||to
5s
MO)
<2/i
a2*
fie'
i„(Q)
I dx
Ids
L2(Q)
L2(Q)
<hC\\u\\li(Q).- (54)
Из (9), (10), (21), (48) следует
, N M-,1 Ь «< + i v 1/2
I^KlE Е S S(k.(en*)l + I%^|)aded*)
N M-l (i si + l /S
X
2 \ 1/2
(E E X $ S^e «
4=1 < = 1 (, , .. V ' '
/ II я2 w ЛГ M-l Ь «f + i 'itiiw, .4 2 v 1/2
<1SfLM)+||*-M ?,E, * ^ (s-s<> ^ ^ d*dsdt) *
< C(IMIl,w> + MLJh\\g\\ < ЛС(||«|||,М) + IKHiJ. (55)
При оценке |Д8| воспользуемся тем, что xa-(sM, t)—ys-Mj = x-(sM, t)- x(s^'
в силу граничных условий —^' = 0, уш. = 0, неравенствами (44) при
г = М— 1, оценками (46) при i = М, s = sM:
y/V" W&^t)
Д81< E X И%-.,*)-2/м-1,-)2^) (E И-
sj=1 (.
<fc
У = 4.
_Ж1
5s
2 v 1/2
,-(%,*)) dt)
At M-l h Sm+I
ЕЕ \ U(^m,t)-ys-mjr + (x(s,tj)-ym,f)dsdt +
j'= 1 m= 1 (
+ (^+^)^11^+4^11^) V£>0- (56)
Аналогично с учетом равенства xs-(su t) — ySXj = xs-(su t) - -g~,
вытекающего из граничных условий (3), (7), с помощью тех же оценок (44) при
г =0, неравенств (46) при i = 1, s — 0 получаем
- ЛГ М- 1 *i Sm + I
ЕЕ X U^s-(sm,t)-yimir + (x(s,t.)-ym.r)dsdt +
\R9\ ^2^
•j = 1 TO = 1 ( .
Hr + h)\\u\\lilQ) +tCHMQ) V£>0- (57)
Наконец, для |Д10| с учетом оценки (10) имеем
. лг м-1 Ь Vi l,: , лг м-i Ч si+i
|Д.о|4Е Е S l{u(s,t)-UijYdsdt+\Y, E S И0Ф.*)-в(М,))+
J = 1 i = 1 (,
,-=1 <=1 (,_,
ЛГ M-l Ь «i+i , Л
+И«,*,-)-%))2^*<2^-^^И™+ЕЕ S S((S^Pdr) +
У = 1 i = 1 (, , s, N N ( '
772
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
+ И«> %) - VijY^dsdt ^ ^\\и - PhTuhT\\liiQh) +
ЛГ М-1'i + i
+ т2С\\ч\\1лд) + Е т Е S (<Ф. *,) - У«,)а<** (58)
3 — 1 г = 1 s(
Подставим оценки (49)-(58) в (40). Получим
. М- 1 3! + t N М-1 *1
5 Е $0Ф>**-%лг))а<**+Е Е л S(^(**.*)-W2d*<
i = l s( У-=-1* = 1
ЛГ М - 1 (i
о^ЕЕ S MMW)-%*0ad*H4l«-^«Jlal(%) +
у =1 г = 1 (
+ т(1 + еС)Е(Е $(^,^)-^ +
у = 1 v < = 1 «, '
+ С(т+ h)(l + е + 7)(Н«1111(д, + IKIIIJ
/, ч M-1'l + l
1-т(1 + еа))Е 1(^^)-8/^ +
' г — 1 s, i
ИЛИ
М- 1 Vi
ЛГ М- 1 (j
+ (1-еС)Е Е h S(^(ei.*)"Wadt<
y = i <=i t,_,
JV - 1 /M - 1 "i + l v
<T(i + ec)E(E И^*у)-%)2^) +
j = l M=l s. ' .
+ C(T+h)(l+e+i)(||«||ii(g)+|K|||iir)+||«-pfcr«hT||!i(gi) V£>0. (59)
Зафиксируем e >0 столь малым, чтобы 1-еС >0. Кроме того, будем считать
i-r(l + eC)>i.
M-lsi + i JV-l/M-lVi
т столь малым, что ~ - т(1 + еС) > д. Тогда из (59) имеем
Е И*(Млг)-Ы2^4т(1+еС)Е(Е И<Ф.*у)-у«,)аЖ) +
i=i », y=i 4=1 ., /
+а(т+/1)(1+е+1)(||«|||2(д)+||«Лг|||мг)+||«-^Лг|||2(%).
Отсюда, пользуясь леммой 8.6.1, получаем
М- 1 3! + 1
Е !(^,д-ал<
i=l S,
< (1 + ^,Hlk - длИ!,^ + (т + MQflMIU, + ll«JI£, J),
гдеС,=4(1 + еС), C2 = cfl + e+jV Поскольку (1 + тС,)^ e^, (Ц-тС,)"^
^e70', то м-н,+>
E И<Ф. **) - ViN?ds <k
i = i s, (60)
^ c(||« - PhTuhT\\li(Qk) + (t + ft)(||«||ii(g) + Ml J)-
§ 7. Разностная аппроксимация
773
Отметим, что из (59), (60) нетрудно вывести оценку [362]:
ЛГ М- 1 Ь "i + i , _ . . ч 2
Е Е S I (^ - у*) dsdt *
^ C(||u - ЙЛг|||2№) + (т + ft)(HI£l(g> + \WJ\IJ).
7. Пользуясь оценкой (60), докажем, что задача (5)-(8) аппроксимирует
задачу (1)-(4) по функции. ,,+1
Теорема 1. Пусть в задаче (5)-(8) Ьг = \- \ b(£)d£, г = 1,..., М-1.
Тогда Hm /^ = J..
(ft, т)->0
Доказательство. Оценим разность J(w) — LT(uhT), считая, что ие
е U, uhTe Uh . Учитывая оценки (9), (10), (17), (20), (21), (60), определение
множеств (4), (8), неравенство
М-1 М-1 , , s, + i ч 2 М-1 si + i
Е Щ= Е htt J ЧО#) < Е S ba(e)de<||b|IU«i
имеем
I j(«) - 1,ЛщТ)\ = S 1<Ф. ^;«) - b(s)Ns + Е S (И*, **;«) - 2½) +
0 г = 1 ,,
+ (Ь,-Ь(в)))(я!(в.*№;«)-Ь(*)+Уда-Ь4)^< J 2(\x(s,T;u)\4b\s))ds +
о
r/M-lei + i ч 1/2 /М-1 »i + i ч l/2-i
+ Е S И*,**;u)-yiN\4s) +(j: UHs)-bi\4s) X
r/f ч 1/2 /M- 1 ч 1/2 /М-1 ч I/2-1
x[[lx\s,tN]u)ds) +(E^) +1|Ь|к[о,,1+(Е ЛЬ?) J^
/ . /M-lVl ч1/2ч
^(lu-^L.w+^ri+ii: s(M«)-bi)ad«) ) +
• i=1,,
+ /1СД2 + 2 J b2(s)ds. (61)
Заметим, что о
М - 1 "i + l Ш - 1 "( + 1 / . "i + 1 ч Z
Е ИМ*') - &«)*<.* =Е S(i Иь(«)-ь(ОК)л<
* = 1 ,, 1 = 1 8, Ч ,, '
М- 1 "i + l / . h .
< Е И h l(b(a + z)-b{s)fdz)ds =
i = i ,, \ -h '
, ft ,M-1 "i+l ч (
= ^(^ HHs+z)-b(s))4sjdz^maxJ\b(s+z)-b(s)\2ds^0 (62)
при /i-*0b силу непрерывности в среднем функции b(s) е L2(0,1) [371;
393; 648]; здесь предполагается, что b(s) = 0 вне [О, I].
Выше было отмечено, что задачи (1)-(4), (5)-(8) имеют решение, т. е.
Ut^0, UhTt^<Z>. Зафиксируем какие-либо ute Ut, uhTte UhTt. Поскольку
\\Pkr^hJ\b2(Qh) = KJIl„ < Д. то- приняв PhTuhn = 0 вне Qh, можем считать,
что phTuhn G U. Для управления «„ G Ut построим его дискретный аналог
774
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
<2лтЧ=-К»у> г'=1 М-1, i=l,.. .,N} по правилу ин.=-^ Ц ut(s,t)dsdt.
Так как Qti
N М- 1 / . \ 2
IQ^IIL = E Е ftrUpSK^Ocfadt ^
У = 1 » = 1 \ ; Qtf /
в»
ЛГ М- 1
< Е Е S ч2(«. *)ded* = Klli^g,) < lkll!2(Q) <я2,
■ ... . С. J = l »=1 Qtf
то QhTu, G C/hT. Нетрудно проверить, что phTQhTut G С/. Кроме того,
(Allm Q К - йЛчНь.ю,, = 0. (63)
что доказывается также, как аналогичное утверждение (62). Из оценки (61)
имеем
<Ch/f+7T+(E j \Ца)-Ь,\2ааЛ ) + hCR2 + 2$b2(s)ds. К° '
Из (64) с учетом (62) получаем
Jm~U-IhJ<0. (65)
(ft, т) —> 0
С другой стороны, из той же оценки (61) следует
,M-lsi + i \ l/2\ h
+ ( E I \b(8)-bt\2d») ) - hCR2 - 2 $ b2(s)ds. (66)
\ i = 1 . //. n
,M-lsi + i ч 1/2
E " "
t=i
Отсюда и из (62), (63) имеем
■_Щп_(.7.--0^0. (67)
(Л, г) -> О
Из (65), (67) вытекает утверждение теоремы 1. Неравенства (64), (66)
можно считать оценкой скорости сходимости для Jt — IhTt. Если b(s), ut = ut(s, t)
достаточно гладкие, например, b(s)eff'[0,1], uteHl(Q), -^щЕ. L2(Q), то
из (64), (66) следует, что Jt - IhTt = 0(vV + h). О
Вопросы аппроксимации для задач оптимального управления процессами,
описываемыми уравнениями с частными производными, изучались,
например, в работах [120; 170; 339; 360-363; 464; 467; 504; 593; 596-599; 607;
700].
Упражнения
1. Рассмотреть задачу (1)-(3), считая,.что ,
U = {u(s, t)£L2(Q): a ^ u(s, t) ^/3 почти всюду на Q}, > (68)
где а, (3 — заданные постоянные. В задаче (5)-(7) принять UhT = '{uy: а ^ и{]- ^ Д г = 1,...
..., М — 1; У = 1 N}. Доказать, что получившаяся разностная задача минимизации
аппроксимирует исходную по функции. У к а з а н и е: воспользоваться оценкой (60).
§ 7. Разностная аппроксимация
775
2. Рассмотреть задачу (1)-(3), считая, что u(s, t) = d(s)u{t), d(s)£ L2[0,l]— заданная
функция, управление u = u(t) принадлежит множеству
г
J7,={u(t)GL2(°. Т): \u2(t)dt^R2} (69)
или о
U2 = {u(t) е L2(0, Т): а < u{t) < (3 почти всюду на [О, Г]}. (70)
, «(+1
В задаче (5)-(8) взять u(j = dlu;j, ^ = -^ \ d(£,)d£, г = 1,..., М-\, j = 1,.. .,N;управление
ит = (u[,..., ujy) G J7lr = {u/. X) f"! < Л } в случае множества (69) и ur g J72r = {ur: а < u;. <
3 = 1
^^, j = 1,..., N} — в случае (70). Доказать, что полученная разностная задача минимизации
аппроксимирует исходную по функции. Указание: воспользоваться оценкой (60).
3. Доказать дифференцируемость функций (1), (5) в пространствах L2(Q), L2h,
соответственно. Описать методы проекции градиента, условного градиента для задач (1)-(3), (5)-(7),
считая, что множество U имеем вид (4) или (68). Те же проблемы рассмотреть для
множеств (69), (70). :
4. Опираясь на представление решения краевой задачи (2), (3) в форме ряда (19), описать
метод моментов для задачи управления x{s, Т; u) — b{s); рассмотреть случаи, когда множество
U имеет вид (4), (68)-(70); дать обоснование метода [287; 802].
5. Рассмотреть задачу (1)-(3), когда в (3) граничные условия заменены на a;|s = g = a;|s = i =0,
и множество U определяется одним из равенств (4), (68)-(70). В задаче (5)-(7) граничные
условия в (7) заменить на у0, =0, yMj- = 0, j = l,...,N, аппроксимирующие множества UhT,
U взять соответственно из (8) или из упражнений 1, 2. Исследовать сходимость по функции
полученных разностных задач минимизации. Указание: получить аналоги оценок (9),
(10), (20), (21), (60).
§ 8. Об аппроксимации максиминных задач
1. Пусть X, Y — множества произвольной природы, U,V—заданные множества, U QX,
V QY, функция J(u, v) переменных и, v определена при всех (и, v) G U х V.
Рассмотрим задачу: найти величину
sup inf J(u,v) = Jt. (1)
ueuveV
Задачи такого типа возникают в теории игр и исследовании операций, в вопросах
приближения функций, при исследовании влияния погрешности исходных данных на решение задачи
минимизации и т. д. [2-4; 26; 30; 153; 218-220; 310-313; 340; 392; 399; 402; 419; 431; 432;
479; 501; 532; 537; 551-554; 569-571; 594; 595; 650; 687; 689; 720; 754; 755; 801].
Пусть XN, YN, N = 1,2,..., — некоторые множества произвольной природы, UN,VN —
заданные множества, Щ С X*,, 1^С У^, функции IN([u]N, [v]N) определены при всех
(Млг> Млг) £UN xVN, N=1,2,... Рассмотрим последовательность задач: найти
sup , ini IN([u]N,[v]N) = INt, N=zl,2,... (2)
Возникает интересный для приложений вопрос: каким условиям должны удовлетворять
множества UN, VN и функции Ipj{[u]N, [v]N) для того, чтобы последовательность задач (2)
аппроксимировала задачу (1) по функции, т. е.
lim INt = JJ (3)
N —> оо
Следующая теорема дает ответ на этот вопрос.
Теорема 1. Для того чтобы последовательность задач (2) аппроксимировала
задачу (1) по функции, необходимо и достаточно выполнения следующих двух условий:
1) для каждого натурального числа N ^ 1 существует отображение PN: XN -* X и
для любого [u]N G Uy существует отображение QN: Y -* YN такие, что fN([u]N) g U
при [u]N G UN, QN(v) G VN при v G V и
lim [IN([u]N, QN(vN)) - J(PN([u]N), v„)] < 0 (4)
N —>oo
776
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
при любом выборе [и]ц 6¾ и vN G V [подчеркнем, что отображение QN в (4), вообще
говоря, зависит от [u]N е uN);
2) для каждого натурального числа N ^ 1 существует отображение QN: X —♦ XN и
для любого uN£U существует отображение PN: YN -* Y такие, что QN{u) g Un при
и g U, PN([v]N) G V при [v]N g VN,
J™JJ(uN, PN([v]N)) - IN(QN(uN), [v]N)] < 0 (5)
при любом выборе uNzU и [v]N g Vn {подчеркнем, что отображение P N в (5), вообще
говоря, зависит от uN g J7).
Доказательство. Из определений величин Jt, INt следует, что
1) существуют uNt g U, N = 1,2 такие, что
Jim (Jt-J(uNt,vN))<0 (6)
при любом выборе vN G V;
2) существуют [ш]^, G UN, N = 1, 2 такие, что
lim (/^-/„([uWHvJKO (7)
JV —*оо
при любом выборе [v]N g VN;
3) для каждого фиксированного uN G J7 найдется точка и^, G V такая, что
lim (J(uN, vNt)- Jt)*0; (8)
N —*oo
4) для каждого фиксированного [u]N g £/^- найдется точка [v]Nlf G V^- такая, что
N\imJIN([u]N,[v]m)-Im)^0. (9)
В самом деле, из определения верхней грани следует существование таких uNt g U и u^* G
G UN, что
infJ(u№,ii)>J,-l/tf, inf /„([и]№, [«]„) >INt-l /N, N=1,2,...
"» l«lN 6 vN
Вспоминая определение нижней грани, отсюда при любом выборе vN G V, [v]N g Vn имеем
или
J,-J^Nt,v„)^l/N, INt-IN([u]Nt,[v]NXVN, N=1,2,...
Отсюда при N —> oo получим неравенства (6) и (7).
Далее, зафиксируем произвольные uN g U и [u]« G t/^. По определению величин
inf J(uN, v), inf g V^i^fu]^, [v]N) найдутся vNt G V, \v]Nt g V^ такие, что
vev " [v\„
J(uN, vm) ^ My J{uN, v) + l/N^Jt + l/N,
IN(MN' Mjv.) * . ^ ^(Mjv. Mjv) + ^^ ^ Im + l/N,
[v\N S VN
ИЛИ
J^n>vn*)-j*^1/n> ^(Mjv.Mjv.) -IN,<l/N, N=1,2,...
Отсюда при N -* oo получим неравенства (8), (9).
Необходимость. Пусть задачи (1), (2) таковы, что выполнено равенство (3). Покажем,
что тогда необходимо выполняются условия 1), 2). Определим отображение Рщ". XN —> X
так: PN([u]N\ = ит при всех [u]N g XN, N = 1,2 где %, G J/ взяты из (Б). Тогда из
неравенства (6) следует, что
Jim (J,-J(PN([u]N),vN))^0, [u]NeUN, vNzV.
N —»oo
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
777
Зафиксируем произвольный элемент [u]N g UN, возьмем соответствующие ему [v]Nt g Vn
из (9) и определим отображение QN: Y-* YN так: QN{v) = [v]Nt при всех v g Y, N = 1, 2,...
Отсюда и из (9) имеем
Jim (IN{[u]N, QN{vN)) - Im) < 0, [u]N G U„, vNzV. (11)
Из (3), (10), (11) тогда следует, что
Jim (IN([u]N, QN{vN)) - J{PN{[u]N), vN)) < Jim {INt - Jt) +
N —> oo N —> oo
+ Jim (IN([u]N,QN(vN))-INt)+\\m (Jt-J{PN{[u]N),vN))^0
jv —* oo JV —* oo
при любом выборе [u]N g Un и vn g V. Необходимость условия 1) установлена.
Далее, определим отображение Q N: X -* XN так: Qm{u) = [и]^» при всех uel, ЛГ =
= 1,2,..., где [u]Nt взяты из (7). Тогда из неравенства (7) следует, что
Jim (INt-IN(QN(u),[v]N))$0, ug4 [v]NeVN. (12)
N —*oo
Зафиксируем произвольный элемент u^. е ^возьмем соответствующий ему vNt G V из (8) и
определим отображение РN: YN -* Y так: PN{[v]N) = vNt при всех [v]N g Yn, N = 1, 2,...
Отсюда и из (8) имеем
Jim (J(uN,PN([v]N))-Jt)^0, %6Ц [v]NeVN. (13)
JV—* oo
Из (3), (12), (13) тогда следует, что
Jim (J(uN, PN([v]N)) - IN(QN(uN), [v]N)) ^ Jim (J, - Im) +
N —юо N —юо
+ ^limj J(uN, PN([v]N)) - Jt) + MJIN, - /ff(Q„(%), Mjv)) ^ 0
при любом выборе uN g U, [v]n g V^. Необходимость условия 2) также установлена.
Достаточность. Пусть выполнены условия П, 2) теоремы. Покажем, что тогда имеет
место равенство (3). Возьмем точки [u]Nt G UN из (7) и положим «« = Рм([и]м+), а затем
из (8) возьмем точки v„t G V, соответствующие именно точкам uN = PN([u]Nt), N = 1, 2,...
Тогда, полагая в (4) [u]N = [u]Nt, vn~vn* и взяв в качестве отображения QN то, которое
соответствует точке [w]jw с учетом неравенств (7), (8) получим
Jim (Im-Jt)^ Jim (INt-IN{[u]m,QN{vNlf))) +
N —юо N —юо
+ Jim (IN([u]m, QN(vNJ) - J(PN([u]Nt), vNt)) + Jim (J{PN{[u]Nt), vNt) - J.) < 0.
fy —>0O JV —ЮО
Далее, возьмем точки uNt g J/ из (6) и положим [u]^_== Qpf(uNt), а затем из (9) возьмем точки
Млг* е^лг' соответствующие именно точкам [u]N=QN(u^t), N=1,2,... Тогда, полагая в (5)
иЛГ = иЛГн,, Mjv = M.iv* и взяв в качестве отображения PN то, которое соответствует точке
uNlf, с учетом неравенств (6), (9) получим
umJJ, - INt) < UmJJt - J{um, P„([v]Nt))) +
+ Jim (J(uNt, PN([v]Nt)) - IN(QN(uNt), [v]Nt)) + Jim (IN{QN{uNt), [v]Nt)-INt) < 0.
N —* oo JV —* oo
Таким образом, имеем
0 $ - Jim (J, - INt) = JmJINt - J*) < "«• (^. - Л) < °.
ЛГ-.00 JV->oo JV->oo
или lim IN„ = lim Im = Jt, т. е. равенство (3). Теорема 1 доказана. D
ЛГ-.00 ЛГ-too
2. Для иллюстрации теоремы 1 рассмотрим задачу: найти
sup inf J(u, v) = Jt, (14)
где
J(u,v) = \x(T,u,v)-y\2 (15)
778
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
при следующих условиях:
x(t) = A(t)x(t) + B(t)u(t) + C(t)v(t) + f{t), tQ^t^T; x(t0) = x0, (16)
u = u(t)£U = {u(t)£L2[t0,T]:u{t)£P почти всюду на [*,,, Г]}, (17)
« = «(t)G V = {«(*) еЬ|[/о, Г]: «(*)gQ почти всюду на [*,,, Г]}, (18)
где A(t), B(t), (7(t),/(t) —матрицы порядка п х п, пх г, п х q% пх 1 соответственно:
моменты t0> Г, точки жц, j/ е Е" заданы; Р к Q — заданные множества из Ег и Eq
соответственно; x(t, и, v) — решение задачи (16), соответствующее управлениям и = u{t) е ££[*<)■ Т],
v = v(t) е Ь|[*0" ^1- Будем предполагать, что матрицы A(t), B(t), (7( t), /(t) кусочно
непрерывны на отрезке [*0> Т].
Разобьем отрезок t0 ^ t ^ Г на N частей точками t0 < t] < ... < tN = Т и, приняв эти
точки в качестве узловых, уравнения (16) заменим разностными уравнениями с помощью
схемы Эйлера. В результате придем к следующей разностной аппроксимации задачи (14)-
(18): найти
SUP , ,injT, 7tf([4v>MtfW№. (19)
1*1« s uN M» e vN
где
^(Mjv. Mw) = MM*. Mjv) - И2 (20)
при условиях
*, + 1 = *,+At,(i4,*, + B,u, + C,ii,+/,), 1=0,...,^-1, (21)
M*6 4f = {[«l* = (4i %-i)6*«(^ i =0,..., N-I}, (22)
[^5^41^ = (¾....¾.^¾¾^. *' = 0...., N -1}; (23)
здесь At, = t,+ , - t„ Л, = A(t, + 0), S, = В(Ц + 0), С, = C(tt + 0), /, = /(t, + 0),
W[«]ff, Mw)Lv = (¾. ^(Mjv Mw)> ■ ■ •■ xN(luh> ["]«)) — решение задачи (21),
соответствующее управлениям
NivG^V. МК*Чю- N=1,2,...
Опираясь на теорему 1, сформулируем условия, при которых последовательность
задач (19)-(23) аппроксимирует задачу (14)-(18) по функции.
Теорема 2. Пусть матрицы A(t), B(t), C(t), f{t) кусочно непрерывны На отрезке
[t0, Т], мноокёства Р сЕТ, Q £ЕЧ выпуклы, замкнуты и ограничены, разбиения {t,, г =
= 0,..., N} отрезка [t0, Т] таковы, что
dN = Q^x_iAti^(T-i0)M0/N, N=1,2,...
Тогда ы ,._ r т
Jim INt = Jt.
Доказательство. Заметим, что
sup sup max \x(t, и, v)\ ^ (70 < oo, (24)
u 6 U v 6 v *o <(< T
sup sup max Ш[и]м,[ь]м)\ < C4 < oo, (25)
[»lwe4»HweVwo<«<^
sup sup \x(t, u, v) — x{t, u, v)\ ^ C[|t - r\, t0^.t,r^.T, (26)
ueu vev
где Cq, (7], (74 — положительные константы. Оценки (24)-(20) доказываются так же, как
соответствующие оценки (1.8), (1.16), (1.1 Г).
Положим X=Ll[t0,T], XN = L\N, У=_Ь^[*о, Т], Yn = L%n. Определим отображения
~QN: X -* XN, QN: Y -* YN, PN: XN-*X, PN: YN-*Y следующим образом:
¢^) = (^0.^1.---.^-1):^ = 7^ $ «(*)*. * =0 JV- 1,
г t,
1 <, + 1
QN(v) = K.«i>---.¾.i)-vi = sj: S v(t)dt, * = o jv-i,
ЗД*Ы = "{. ?*([«Ы = «< ПРИ */**<*< + !> i=0,...,N-l.
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
779
С помощью леммы 1.1 получаем, что
^N(u) g UN при всех иеЦ QN(v) G VN при всех v g V,
PN([u]N) <= U при всех [u]N<=UN, PN([v]N)<= V при всех [v]NeVN, JV=1,2,...
Справедливы оценки •
sup sup max \x(ti)PN([u]N),v)-xi([u]N, QN{v))\^SN, (27)
sup sup max |я(*{, «,Р^(Млг)) - *»(Qjv(u)> Млг)1 < 5лг> (28)
где ^ (
^ = е^-«Д 'l\\\Mr)-Ai\\qi + AttmCldtl +
sup|u|||B(r)-Bi|| + sup|1;|||C(r)-Cj| + |/(r)-/i|)dr-»0
P Q
при N->oo. Оценки (27), (28) доказываются с использованием оценок (24), (26) совершенно
так же, как аналогичные оценки (1.24), (1.25).
Рассуждая так же, как в леммах 1.3 и 1.4, с помощью оценок (24)-(28) получаем, что
Ы"У. «*(«)) - 'ШЫю v))\ * съ %■ (29)
I J(u,PN([v]N)) - IN(QN{u),[v]N)\ $C56N (30)
при всех [u]N G UN, vzV,uzU, [v]NzVN,N=l,2 где C5 = 2C0 + 2C4 + 2\y\.
Из оценок (29), (30) следуют неравенства (4), (5). Таким образом, все условия теоремы 1
выполнены. Отсюда следует, что lim INt = ■/„. Теорема 2 доказана. D
ЛГ —* оо
3. В рассмотренной выше максиминной задаче (1), (2) множества U, V, а также их
«аппроксимации» UN, VN не связаны между собой, поэтому такие задачи принято называть мак-
симинными задачами с несвязанными множествами. В приложениях, например в теории игр с
непротивоположными интересами [220; 650; 720], часто встречаются максиминные задачи, в
которых множества U, V и их «аппроксимации» связаны друг с другом. Такие задачи называют
максиминными задачами со связанными множествами.
Рассмотрим простейшую задачу такого типа. Пусть X, У — множества произвольной
природы, U — заданное подмножество из X, и пусть каждой точке uet/ поставлено в соответствие
множество V(u) С У. Пусть функция J(u, v) определена при всех (и, v)zU х У. Рассмотрим
задачу: найти величину
• SUP '?£ ,^^) = ^ , (31)
Пусть XN, YN, N = 1, 2,..., —некоторые множества произвольной природы, UN —
заданное множество из XN, и пусть каждому [u]N g UN поставлено в соответствие множество
VN([u]N) С YN, функция IN([u]N, [y]N) определена при всех {[u]N, [v]N) zUNxYN.
Рассмотрим последовательность задач: найти величины
sup inf IN([u]N, [v]N) = INt, N = 1,2,... (32)
[ul„ e q, Mw e vw(Mw)
В следующей теореме даются условия, при которых последовательность задач (32)
аппроксимирует задачу (31) по функции, т. е. lim INi = Jt.
N —* оо
Теорема 3. Для того чтобы последовательность задач(32) аппроксимировала
задачу (31) по функции, необходимо и достаточно выполнения'следующих двух условий:
1) для каждого натурального числа N ^ 1 существует отображение PN: XN -* X и
для произвольного фиксированного [u]N g UN существует отображение QN: Y-* YN
такие, что
PN(luh)£u при всех [u]NcUN, (33)
Qn(v) е ^лг(Нлг) при всех ug V(PN([u]N)), (34)
lim (IN([u]N, QN(vN)) - J(PN{[u]N), vN)) < 0 (35)
N —* OO :
при всех vN e V(PN{[u]N)), [u]N e UN;
780
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
2) для каждого натурального числа N ^ 1 существует отображение QN: X —♦ XN и
для любого фиксированного uN G U существует Р N: YN —*Y такие, что
CJN(u) g UN при всех и G Ц (36)
Fjv(Mjv) е v(un) при всех [v]NzVN(QN{uN)), (37)
J™JJ(uN, PN([v]N)) - IN(QN(uN), [v]N)) < 0 (38)
при всех [v]N g VN(QN(ujA), uNzU.
Доказательство. Из определений верхней и нижней граней, величин Jt, INt
следует, что
1) для каждого натурального N ^ 1 существуют uNt G U такие, что
Jim {Jt-J(uNt,vN))^0 при всех vNeV(uNt); (39)
N —* oo
2) для каждого N ^ 1 существуют [п]лг+ е UN такие, что
^ШМ/№-/„([и]№,М„)К0 (40)
при всех [v]„ G VN([uyt);
3) для любого uN G и существует элемент vNt g V(uN) такой, что
Ш^{июУт)-^)^0; (41)
4) для любого [u]N g UN существует [v]Nt G VN([u]N) такой, что
JimJIjfdny, [v]m) - INt) < 0. (42)
Справедливость соотношений (39)-(42) устанавливается так же, как и аналогичных
соотношений (6)-(9).
Необходимость. Пусть lim INt = J„. Определим отображение PN: XN —» X так:
PN([u]N) = и^ при всех [u]N g XN, N =1,2,..., где uNt g U взят из (39). Ясно, что тогда
включение (33) выполнено и, кроме того, согласно (39)
lim (J, - J{PN{[u]N), vN)) < 0, vNe V{uNlf).
14 —* oo
Возьмем произвольный элемент [u]N g Un, по нему из (42) найдем соответствующий [u]jy„ G
£ ^лг([и1лг) и определим отображение Q»,: У -* YN так: QN(v) = [и]„ при всех иеУ, AT =
= 1,2,... Тогда справедливо включение (34) и, кроме того, согласно (42)
lim (IN([u]N, QN(vN)) - INt) sC 0.
Отсюда следует, что
lim (IN([u]N, QN(vN)) - J(PN([u]N), vN)) < lim (INt - Jt) +
14 —* OO iV —* OO
+ lim VNttu]N,QN(vN))-INt)+\im {J*-J{PN([u]N),vN))^0
14 —* OO TV —* 00
при всех ид, G V(PN([u]N)), [u]N G_t^f. Необходимость_условия 1) доказана.
Далее, определим отображение QN: X -* XN так: QN(u) = [u\Nt при всех uel, ЛГ =
= 1, 2,..., где [u]Nt взят из (40). Ясно, что тогда включение (36) выполнено и, кроме того,
согласно (40)
lim (IN,-IN(QN(uN),[v]N))^0.
TV —* oo
Возьмем произвольный элемент uN g U, по нему из (41) найдем соответствующий vNt g V(uN)
и определим отображение P~N: у, -* У так: PN([v]N) = vN при всех [v]N G Удг, N = 1, 2,...
Тогда справедливо включение (37) и, кроме того, согласно (41)
JlmJJ(uN, Р„([*]„))-JJH0.
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
781
Отсюда непосредственно следует, что
Jim {J(uN,PN([v]N))-IN{QN{uN),[v]N))<$ Jim {Jt-INt) +
iv —* oo iv —* oo
+ MJJ^, -Pjv(Mjv)) - J.) + ^J^* - Wn(un)- Mn)) < °
при всех [v]N g V^Qjv (■%)). un e ^- Необходимость условия 2) также доказана.
Достаточность. Пусть выполнены условия 1), 2). Возьмем [ukrt G UN из (40),
положим uN = PN([u]Nt) и из (41) возьмем vNt G V(uN) - V(PjJ[u]Nt)). Обозначим [v]N =
= QN{vnJ. Из (34) тогда имеем [v]„ е V„{[u]Nlf), JV = 1,2,... Пользуясь условием (35) при
[u]N = Нлг*, ujv = vNt,c учетом (40), (41) получим
+ Jim (^(Mw*, Qn(vn*)) - ^(-Pjv([«]jv*). %*)) + Jim (^("лг. %*) - J*) < 0-
iV —► OO iV —' OO
Далее, возьмем uNt G U из (41), положим [u]^ = Qn{un*) и из (42) возьмем
соответствующий элемент [v]„t G ^([u]^) = ^(^(и^)), Обозначим г^ = PN([v]Nt). Из (37) тогда
следует, что vN g v(unJ, ЛГ = 1,2,... Пользуясь условием (38) при u^ = uNt, [v]N = [v]Nt,
с учетом (39), (42) имеем
J'™JJ* ~ Jn*) < J'™JJ* ~ J(un*> %)) +
+ Jim (J(u„„ PN([v]Nlf)) - IN(QN(uNt), [v]Nt)) + \\mJIN([u]
iv —» OO i\ —* oo
Таким образом, Пт/дг,, = Пт/^^, = Jt, т. е. lim /^ = Jt. Теорема 3 доказана. D
Для иллюстрации теоремы 3 рассмотрим задачу (31) для случая, когда
J{u,v) = \x(T,u,v)-y\2,
где x(t,u, v) — решение задачи (16), uG X = Ll\tQ,' Т], v gY = L%[t0, T], множества U и V
имеют вид (17), (18), а множество V(u) при каждом ueU определяется так:
V(u) = {veV: JsHt),«(*))* $о}. (43)
Эту задачу кратко будем называть задачей (31), (15)-(18), (43).
Для аппроксимации этой задачи рассмотрим последовательность задач (32), где
^(МлгЛЧлгНЫМлг.Млг)-?/!2; MHw.Mjy). i = 0,...,ЛГ, —решение задачи (21),
соответствующее управлениям [u]N g XN = L\N, [v]N G УЫ = ЩЫ; множества UN, VN имеют
вид (22), (23), а множество VN([u]N) при каждом [u]N = (щ,щ,..., uN_l)&UN строится так:
VN{[u]N)={[v]N = (v0,vu...,vN_l)zVN: Е?К,«()А^о). (44)
Эти задачи кратко будем называть задачами (32), (20)-(23), (44).
Оказывается, если выполнены все условия теоремы 2 и, кроме того, функция д(и, v)
непрерывна по совокупности (и, v) g Р х Q, выпукла по переменной «eQ при каждом
фиксированном и G Р и вогнута по переменной u G Р при каждом фиксированном v g Q, то
последовательность задач (32), (20)-(23), (44) аппроксимирует задачу (31), (15)-( 18), (43) по функции.
Для того чтобы убедиться в этом, достаточно проверить выполнение условий теоремы 3.
Определим отображения PN, ТN, QN, ~Qm так же, как в задачах (14)-(18) и (20)-(23).
Тогда условия (33), (36) будут выполняться. Проверим справедливость включений (34), (37).
С этой целью заметим, что из выпуклости д(и, v) по переменной v следует неравенство
s(«.^7 Т «(*)*) *2J7 '?'»(«.«(*))«". <=0.-".Л-1. «еЧ
(45)
782
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
(т \ т т
и, 2 ajvj) ^ £ 9(u,vj)aj' ау^0> £ аз = 1 (см- неравенст-
3=1 3=1 3=1
во (4.2.2)). Аналогично, из вогнутости д(и, v) по; переменной и получаем
5J" S ff(u(t),u)dt, г = 0,..., JV-1, vzV. (46)
Зафиксируем некоторое [u]N = («q uw_i) и возьмем произвольное управление »е
т .
zV{PN([u]N)), т. е,ие7, l9(PN{[u]N),v{t)) dt <°- Тогда для QN(v) = (v0, vx vN_{),
v, = -r-7- S u(i)di,i=0 AT - 1, с учетом неравенства (45) имеем
лг-1 лг-i . , (,+1 .
^¾1 'f ffK. "(*))<** =Ы^([«Ы, "(* ))<2i<0.
» = 0 (, . *о ,
Это означает, что QN{v) g ^([u]^). Включение (34) доказано^
Далее, зафиксируем некоторое uN = uN(t)^U, найдем Q N{uN) = {u0,Ti:v,. ..,uN_ j),
1 'i+1
иг = -л- J uN(t)dt, г = 0 ЛГ-1, и возьмем произвольное управление [u]w = {v0,...
•• •. «jv- i) G М<2лг(илг)). т. е. Hjv G VN, Y, S«(ui.'"»)Ai« <°- c Учетом неравенства (46)
»=o
тогда имеем
$9(uN(t),PN([v]N))dt=N±] "f'ff(M*К"*)* <
(„ i=0 (,
j = o ч^гг (, Л >=o
Это означает, что -Pjv-(M.iv) G ^(uw)- Включение (37) также доказано. Неравенства (35), (38)
являются следствием неравенств (27), (28).
Таким образом, все условия теоремы 3 выполнены. Согласно этой теореме
последовательность задач (32), (20)-(23), (44) аппроксимирует задачу (31), (15)-(18), (43) по функции.
4. В конкретных максиминных задачах построение аппроксимирующих задач,
удовлетворяющих, условиям сформулированных, выше теорем, далеко не всегда является простым1 делом.
Например, в_задачах вида (31),, (32) может встретить трудности построение отображений
P'n> Qn'Pn'Qn' удовлетворяющих условиям (33), (34), (36), (37), обеспечение непустоты
множеств UN, VN([u]N). Для преодоления указанных трудностей часто бывает полезно
работать с расширениями множеств, встречающихся в исходной и аппроксимирующей
максиминных задачах [3; 153; 594; 595]. Проиллюстрируем эту идею на примере задачи (31).
Теорема 4. Для того чтобы последовательность задач (32) аппроксимировала
задачу (31) по функции, необходимо и достаточно, чтобы существовали
последовательности множеств {U "} С X, {Vх"(и)}, {К7»(«)}еУ таких, что Ue» ф 0 и Ух»(и)ф0
при и G U, V7,»(u) ф 0 при и 6 U ", N = 1)2,;.., функция J(u, v) определена при всех
(и, v)€ (( (J U£" J (J U) х У, и, кроме того, выполнены следующие условия:
1) для каждого натурального числа N ^ 1 существует отображение PN: XN—> X и
для произвольного фиксированного [u]N g Un существует отображение QN: Y —>YN
такие, что .,••■•! --.i
ЩН»)Е^| (47)
Qn(v) 6 vnUuU) при всех v&V"(PN([u]N)), (48)
11m (IN([u]N, QN(vN)) - J(PN([u]N, vN)) < 0 (49)
iv —* OO
при всех vN G Vy"{PN([u]N));
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
783
2) для каждого натурального числа N > 1 существует отображение QN: X —♦ XN и
для любого фиксированного uN е J7 существует отображение РN: YN-*Y такие, что
Qn(uN)zun> (50)
^лг(Млг) е ^*"Кг) при всех [v]NeVN(QN(uN)), (51)
lim (J(uN, Р„([»]„)) - IN(QN{uN), [v]N)) < 0 (52)
iv —> OO
при всех [u]„ G VN(QN(uN));
3) справедливы неравенства
_!кп_Л(о.х*)>Л. (53)
JV—»oo
lim Jt(eN,-/N)^J*, (54)
iv —> OO
где 4(^, 7лг) = sup inf J(u, «), J,(0, Хлг) = sup inf J(u, v).
Доказательство. Из определений величин 4(елг- 7дг). 4(0. Xw)i -^лг* следует, что
1) для каждого N ^ 1 существуют uNt g U такие, что
lim (JtV,XN)-J(uNt,vN))iiO (55)
N —* оо
при любом выборе vN е Vx"{uNt);
2) для каждого N > 1 существуют [и]^,,, G J/jv такие, что
„HmJ/№ - 1„{[и]„„ [v]„)) < 0 (56)
при любом выборе [v]N е VN([u]Nt);
3) для каждого фиксированного элемента uN G J7£" найдется элемент u^ G У"т"(илг)
такой, что
lim (J(uN,vNt)-Jt{eN,"/N))^0; (57)
N —* оо
4) для каждого фиксированного элемента [u]N G UN найдется элемент [v]Nt G VJv([u1jv)
такой, что ■ ... . '
lim {IN{[u]N,[v]Nt) -lN,)*0. (58)
jv —* оо
Справедливость соотношений (55)-(58) устанавливается так же, как и аналогичных
соотношений (6)-(9) или (39)-(42).
Необходимость. Пусть lim INt = Jt. Положим Ue" = U, V7"(u) = Vx"{u) = V(u)
N —юо
при всех и g U, N = 1, 2,... Тогда
4(^,7*) = 4(0,Х„)=4, ^=1,2 (59)
и условия (53), (54) тривиально выполняются. Определим отображение PN: XN-*X так:
PN([u]N) = uNt при всех [u]N G Xjy, AT = 1, 2,..., где элемент uNlf&U = Ue" взят из (55).
Ясно, что тогда включение (47) выполнено и, кроме того, согласно (55), (59) имеем lim (Jt —
- J(fy(Mw). %)) < 0 ПРИ вс« % 6 ^%(%.) = V(uNt) = V(PN([u]N))= V»{PJ$\N)),
[u]N G Щ. Далее, зафиксируем любой элемент [u]N g Удт, по нему из (58) найдем
соответствующий [vLj,, G ^(Mjy) и определим отображение Q^: Y ->YN так: QN(v) = [v]Nt при
всех v g Y, AT = 1,2,... Тогда справедливо включение (48) и, кроме того, согласно (58) имеем
1ET(IN([u]N, QN(vN)) - INt) < 0 при всех vN G V"y«(PJV([u]jV)). Отсюда следует, что
JV—»оо
lim (I„([ii]N, QN(vN)) - J(PN([u]N), vN)) < lim (/^ - 4) +
i\ —> oo J" —' oo
+ ~M~(IN([u]N, QN(vN)) - INt) + Tm~(4 - J(PN([u]N), vN)) < 0
iv —* oo JV —> oo
при всех «jy g V"T»'(Piv([u]iv)), [ujjv G [/дг. Необходимость условия 1) доказана.
784
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Далее, определим отображение Q N: X -* XN так: QN(u) = [u]Nt при всех «el, N =
= 1,2 где [u]Nt взят из (56). Тогда включение (50), очевидно, выполнено и, кроме того,
согласно (56) имеем Jim' (IN*-IN(QN(uN), [v]N))^0 при всех [v]N g VN(QN(uN)), uN g U.
N —* oo
Зафиксируем произвольный элемент uN£U = U6", по нему из (57) найдем соответствующий
vNt G V"T"(u/v) = Vx"(uN) и определим отображение 7*,'- YN->Y так: PN([v]N) = «», при
всех [v]N€YN, N=1,2,... Тогда справедливо включение (51) и, кроме того, согласно (57), (59)
имеем lim (J(u„,P„([«L))-J)^0 при всех [v]NeVN(QN(uN)). Отсюда следует, что
N—»оо
Jim (J(uN, PN([v]N)) - IN(QN(uN), [V]N)) < lim (J, - INt) +
iv —* oo iV —> oo
+ lim (J(uN, PN([v]N)) - Jt) + lim {Im - IN{QN{uN), [v]N)) sC 0
N —* oo N —*oo
при всех [u]w G VN(Qn(ujj)), uN g J7. Необходимость условия 2) также установлена.
Достаточность. Пусть выполнены условия 1 )~3). Покажем, что тогда lim INt = Jt.
Возьмем [u]Nt G UN из (56), положим uN = PN([u]Nt), а из (57) возьмем vNt g V"t"(ujv) =
= Vy"(PN([u]^rt)) и обозначим [v]N = Q„(vNt). Из (48) тогда имеем [v]N e VN([u]Nt),
iV = 1,2,... Пользуясь условиями (48), (49) при [u]N = [u]Nt, vN = vNt, с учетом
соотношений (54), (56), (57), получим
lim (INt-Jt)*i Jim {INt-IN{[u]Nt,[v]N))+ lim (M[«W Qjv(%*)) ■
JV —» OO JV —» OO JV —» oo
- J(*V(Mjv*). vN*)) + Jim (J(un> %*) - J*(eN- Tiv» + Jim (•/„,(%. 7лг) - Л) < 0-
jv —* oo TV —* oo
Далее, возьмем u„t g J7 из (55), положим [и]^ = QN(uNt), а из (58) возьмем [u]^, G
e vn([u]n)= vn(Qn(un*)) и об°31 ~ ""
G Vx»(uNt), JV= 1, 2,... Пользуясь ;
соотношений (53), (55), (58) имеем
G Vjy([uLv) = vn(Qn(un*)) и обозначим «^ = РЛГ([и]ЛГ,). Из (51) тогда следует, что vN G
eF'ftijr,), ЛГ=1,2,... Пользуясь условиями (51), (52) при uN = uNt, [v]N = [v]Nt, с учетом
lim (J, - INt) < lim (IN([u]N, [v]Nt) - INt) + lim (J(uNt, PN([v]Nt)) -
N—iOo N —юо N—* oo
■ WjvKt.). [«Ы) + „'M'7.*0' Xff) - J(«№. «*)) + ^limjЛ - -W X*)) < 0.
Таким образом, lim /„„ = lim INt = Jt, т. e. lim /№ = Jt. Теорема 4 доказана. D
ЛГ-too JV->oo JV-too
Для иллюстрации теоремы 4 рассмотрим задачу (31) для случая, когда J(u, v) = \х(Т, и, v)—
— у\2, где x{t, и, v), t0^.t ^. Т, — решение задачи (16), соответствующее управлениям иеХ =
W = {u = u{t)^L^[t0, Т]: u(i)GP почти всюду на [t0, Г]}, (60)
V = {v = v{t)zL%[t0, Т]: v(t)&Q почти всюду на [t0,T]}, (61)
V(u) = {v = v(t)zV:x(t,u,v)zG, tQ^t^T}, (62)
J7 = {и g W: V(u) ф 0}; (63)
здесь Р, Q, G — заданные множества из евклидовых пространств Er,Eq,En соответственно.
Эту задачу кратко будем называть задачей (31), (15), (16), (60)-(63). Для аппроксимации этой
задачи рассмотрим последовательность задач (32), где IN{[u]N, [v]N) = \xN([u]N, [v]N) — y\ ,
xi(lu]N> Млг)> г'=0,..., N — решение задачи (21), соответствующее управлениям [u]N£XN =
= 4nAv]n£yn'=4n-
Wn = {[u]n = {vq,...,и„_л)сЬ^: и. zP,i =0,...,N-l}, (64)
VN = {[v]N = (v0,...,vN_\)zLlN:v{cQ,i=0,...,N-l}, (65)
VN([u]N) = {[v]N5VN:xi([u]N,[v]N)^G^, i = 0,...,N}, (66)
^лг= {[и1лг e wn'- существует [v]N G Vn такой, что
хг{[и]ю[у]„)са*»,{=0,...,Щ, N=1,2,... (67)
Эти разностные задачи кратко будем называть задачами (32), (20), (21), (64)-(67).
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
785
Для исследования поведения аппроксимирующих разностных задач определим
отображения PN, QN, PN, QN так же, как в задачах (14)-(18), (19)-(23). Будем предполагать, что
выполнены все условия теоремы 2 и, кроме того, G выпукло и замкнуто. Тогда справедливы
включения QN(u) е WN при uzW, QN(v) g VN при v g V, PN([u]N) g W при [u]N g Wn,
PN([v]N) G V при [u]jv G VN. Кроме того, нетрудно видеть, что здесь по-прежнему сохраняют
силу оценки (24)-(30) с заменой в них U на W, UN на WN, где W, WN взяты из (60), (64).
Имеют место также неравенства
sup sup \хг([и]п,[у]м)-х{^,Рх([и]к),Р~х([у]м))\^ 6N, (68)
sup sup max hj(QN(u), QN(«)) - i(i,., u, «)| ^ «„, (69)
где SN взято из (27), (28).
Для того чтобы задача (31), (15), (16), (60)-(63) имела смысл, естественно предполагать,
что множество (63) непусто. Оказывается, что тогда при достаточно больших fj.N, £N
множества (66), (67) также непусты. А именно, выберем y.N, £N в (66) так, чтобы
«лг^лг^Млг, ЛГ=1,2,... (70)
Возьмем какие-либо и g U, v g V(u). Тогда x(t,u, v) g Gs, t0 ^ t < Т. Отсюда в силу (69),
(70) имеем x{(QN(u), Q*AV)) £ GN С G(", i=0 N. Это значит, что QfAu) G Uy, т. e.
UN Ф 0. Кроме того, из (70) следует, что VN([u]N) ф 0 при всех [и]ц g UN. Таким образом,
задачи (32), (20), (21), (64)-(67) имеют смысл, и величины INt, N = 1,2 определены.
В дальнейшем будем предполагать, что выполнено условие: существуют число (3 >0 и
управления щ G W, v0 G V такие, что x{t, щ, v0) g С"Л t0 ^ t ^ Т. Введем множества
V1»(u) = {veV:x(t,u,v)eG'1'', i0<isCT}, (71)
U£»={u£U; Уе"{и)ф0}, (72)
где
BN>tN+6N + CldN> -Г„ = Ще^/(Р + е„), AT =1,2,... (73)
Здесь M2 = 2Я(Т- t0)'/2M,, Я —диаметр множества Р, а константа М1 взята из неравенства
(см. (1.13)) sup sup \x(t,u,v)-x(t,w,v)\^.Ml\\u-w\\L .
vsV (|,<(<Т 2 ■ '-■'
Будем предполагать, что
»n>sn + 1N' XN>t*N+SN + CidN> N=1,2,..., N\imooXN=0- (74)
Проверим выполнение условий теоремы 4. Заметим, что V(u) с Vе"(и) при всех u е £Л Это
значит, что U С Us", т. е. Us" ф0. Непустота множеств V7<»(u) при всех «е и*" будет
установлена ниже перед проверкой условия (54).'
Зафиксируем N ^ 1 и [u]N G U„. Согласно (67) это значит, что существует [v]N G
eVN такой, что x{([u]N, [v]N)£_G«», г=0 N. Отсюда с учетом соотношений (26),
(68), (73) имеем x(t,PN([u]N),P„([v]N))e Ge», t0^t^T. Это значит, что PN([v]N) е
G V£"(Piv([u]iv)) и Р#(М#) е Р». Включение (47) установлено. Далее, возьмем любое
v G V7"(PN([u]N)). Согласно (71), тогда x(t, PN([u]N), v) G G7", t0 < * < Т. Из (27),. (74)
следует, чтог.([и]„, Qjv(u)) e G*N + 7" С С", г =0 N. Отсюда и из (66) заключаем,! что
QN(v) G Vy([u]N). Включение (48) доказано. Неравенство (49) является следствием
неравенства (29). Условие 1) теоремы 4 выполнено. i
С помощью соотношений (26), (28), (30), (60)-(67), (69)-(74) аналогично убеждаемся
в справедливости условий 2) этой теоремы. В самом деле, возьмем произвольный элемент
uN G U. Это значит, что существует v G V такой, что x(t, uN,v) G G, t0 4 t ^T. Отсюда
и из (69), (70) имеем x.(QN(uN), QN{v)) 6 Gs" С <?Ч г = 0,..., N, т. е: Q^(uN) 6 UN.
Включение (50) установлено. Далее, возьмем произвольный элемент [v]N g VN(QN(uN)).
Согласно (66), это значит, что x{(QN(uN), [v]N) eG_^,i=0 N. Из (26), (28), (74) следует,
что x(t, uN, PN([v]„)) G Gx», t0 < t < T, т. e. PN([v]N) G Vх» (^)- Включение (51)
доказано. Неравенство (52) является следствием неравенства (30). Условие 2) теоремы 4 также
выполнено.
786
Гл. 10. АППРОКСИМАЦИЯ ЭКСТРЕМАЛЬНЫХ ЗАДАЧ
Остается проверить выполнение условия 3). Сначала докажем неравенство (53). По
определению величины 7t из (31) для любого к > 1 существует uk&U такой, что inf J(uk, v) ^
v€V(tlk)
^ 7„ — 1/fc. Далее, по определению нижней грани найдутся элементы 1¾^ 6 Vх"(ик) такие,
что J(uk,vkN)^ inf J(ufcl«) + l/fc<Jt(0,xJV)+1/fc. Тогда
v e V " (uk)
Л - Л(0, XN) $ inf 7(^,11)-7(^,11^) + 2/¾. (75)
AT, fc = 1, 2,... Выбирая при необходимости подпоследовательности, можем считать, что
lim J(un"w)= 1™ J{uk,vkN), а {^ыу} слабо сходится в L|[t0, Г] при ЛГ -* оо к
ЛГ-.00 ЛГ-.оо v
некоторому элементу 1¾ G V. Так как 1¾^. е V (ик)> т0 ^(^ u*=> ^wv) е ^ > *о ^ * ^ Т,
N = 1, 2,... Поскольку a;(i| u^., iw) -* x(t, ик, vk) равномерно на [t0, Т] при ЛГ-* оо, а
множество G замкнуто, то x(t, и^, vk) eG, t0^.t^T. Это значит, что 1¾ g V(uk), и поэтому
inf J(uk, v) < 7(¾. vk). Тогда, учитывая, что lim 7(ид.> vm) = f{uk, vk), из (79):при
v€V(uk) N-юо
ЛГ-*оо имеем lim (7„-7 (0, Хлг)) < int J(ufc> ^)-^(^.^) + 2/^ ПРИ всех fc = l, 2,...
N->oo veV(uk)
Наконец, устремляя здесь fc -* оо, получим lim (7„ - 7„(0> Хдг)) < 0, что равносильно
условию (53). N^°°
Заметим, что выше мы пользовались тем, что У"(и) ф 0 при всех и g Ue". Докажем это.
Пусть ue Ue", ue Ve"(u). Положим 14^ = /3^ + (1 - J3N)u, vN = /3Nv0 + {l - PN)v, где
0<PN = eN/(P + eN)<l. (76)
Так как x(t, и, v) £ Ge", x(t,VQ,v0)£G~P, то с учетом (76) имеем x(t, uN, v„) g G. Ho
\x(t, u, vN)-x(t, uN, vN)\ ^. M^u - uN\\L ^.M2PN, и поэтому с помощью (73), (76) получаем
x(t, и, vN) g GM2I3n = Gy". Следовательно, Vlrl(u) ф 0 при всех и g Us". По определению
j*^n> 7лг) существует uNt g Us" такой, что J(e№ 7лг) - 1/N <! inf 7(иЛГн,, и). Возьмем
v е V w (uw,)
некоторый элемент io^g V*" (*%*). Положим им = /3Кщ+{\-^^)и^, vN = p„vQ+(\-pN)vaN,
где /Здг взято из (76). Как и выше, получаем, что x(t, и^> vN) G G, т. e. V(uN) ф 0.
Возьмем vNt G V(uiv) таким, чтобы inf 7(иЛГ, v)+l/N ^ 7(1%, u№). Так как \x{t, uN, vNt) -
ve V(uK)
- x(t, um, vNt)\ < M2PN и x(t, uN, vNt) G G, то x(t, uNt, vNt) G G7", т. e. vNt G V7"^).
Таким образом,
Л(%. 7jv) < jnf J(um, v)+l/NH J(um, vNt)+ \/N < J{uN, v^ +M3/3N + l/N ^
< inf J(uN,v) + M4eN + 2/N ^Jt + MiSN + 2/N, JV > 1.
Отсюда при ЛГ-* оо получаем условие (54). Таким образом, при сделанных выше
предположениях согласно теореме 4 последовательность задач (32), (20), (21), (64)-(67) аппроксимирует
задачу (31), (15), (16), (60)-(63) по функции.
Вопросы аппроксимации более сложных задач, содержащих кратные максимины с
несвязанными и связанными множествами, исследовались в [2-4].
5. Заметим, что в настоящей книге'мы обсуждали проблемы оптимизации (в основном,
поиска минимума), подразумевая, что целевая функция у нас одна. Однако на практике
чаще встречаются более сложные, так называемые многокритериальные задачи, когда целевых
функций (критериев полезности) несколько, их аргументы между собой связаны, и нужно
найти какой-то оптимум по этим критериям. Но что такое оптимум в таких задачах? Ведь
критерии, как правило, противоречивы, отражают реально существующую конфликтную
ситуацию, и ожидать, что все критерии будут достигать своего, скажем, минимума в одной и той
же точке, не приходится. Понятие оптимума в многокритериальных задачах должно вводиться
на принципиально новой основе, оно должно содержать в себе некий компромисс, как-то
учитывать характер конфликта, который может быть весьма разнообразным (антагонистическим,
коалиционным, иерархическим и т. п.). На сегодняшний день выработано несколько разумных
принципов оптимальности в многокритериальных задачах (например, оптимальность по Паре-
то, по Нэшу и т. д.), которые получили признание и находят широкие применения. В рамках
данной книги мы не в состоянии даже мало-мальски останавливаться на возникающих здесь
интересных и актуальных проблемах и отсылаем читателя к специальной литературе по
исследованию операций, теории игр, теории принятия решений, теории и методов равновесного
§ 8. ОБ АППРОКСИМАЦИИ МАКСИМИННЫХ ЗАДАЧ
787
программирования [30; 31; 182; 183; 194; 218-220; 240; 241; 244; 245; 255; 310-313; 373; 375;
410; 412-414; 423; 440; 466; 473; 482; 500; 511; 566; 567; 569-571; 580; 581; 589; 590-592;
608; 643; 647; 650; 663; 686; 749-751; 755; 762; 763; 794; 809; 810]. К сказанному добавим, что
задачи оптимизации, составившие предмет настоящей книги, являются необходимой
ступенькой к познанию многокритериальных задач, теория и методы которых пока еще переживают
пору становления и, несомненно, будут бурно развиваться.
В заключение хочется сказать, что невозможно «объять необъятное» и создать более-менее
полное пособие по вопросам оптимизации. Остается лишь процитировать следующие
утешающие слова из книги [75]: «При выборе способа решения конкретной задачи всякое пособие
играет роль лишь общего руководства, отталкиваясь от которого исследователь анализирует
свои проблемы», надеясь, что настоящее пособие кому-то поможет в таком анализе.
Список литературы
1. Абрамов Л. М., Капустин В. Ф. Математическое программирование. — Л.:
Изд-во ЛГУ, 1981. ■ ""'
2. А в а к о в Е. Р. Об условиях аппроксимации кратного максимина. — Вестник Мо-
сковск. ун-та. Сер. вычислит, матем. и киберн., 1977, № 3, С. 37-43.
3. Аваков Е. Р. Об условиях аппроксимации максиминных задач со связанными
множествами.—Ж. вычислит, матем. и матем. физики, 1978, 18, № 3, С. 603-613.
4. Аваков Е. Р. Об условиях аппроксимации кратного максимина по связанным
множествам. — Вестник Московск. ун-та. Сер. вычислит, матем. и киберн., 1979, № 2, С. 16-
25.
5. Аваков Е. Р. Условия экстремума для гладких задач с ограничениями типа равенств
// Ж. вычислит, матем. и матем. физики.— 1985, Т. 25, № 5, С. 680-693.
6. Аваков Е. Р. Необходимые условия минимума для нерегулярных задач в банаховых
пространствах. Принцип максимума для анормальных задач оптимального управления. Труды
матем. ин-та АН СССР. — 1988, Т. 185, С. 3-29.
7. Аваков Е. Р. Необходимые условия экстремума для гладких анормальных задач с
ограничениями типа равенств и неравенств. Матем. заметки, 1989, Т. 45, № 6, С. 3-11.
8. Аваков Е. Р. Теоремы об оценках в окрестности особой точки отображения.
Матем. заметки. 1990, Т. 47, вып. 5, С. 3-13.
9. Аваков Е. Р., А г р а ч е в А. А., Арутюнов А. В. Множество уровня гладкого
отображения в окрестности особой точки и нули квадратичного отображения. Матем. сб., 1991,
Т. 182, №8, С. 1091-1104.
10. Аввакумов С. Н., Киселев Ю. Н., Орлов М. В. Методы решения
задач оптимального управления на основе принципа максимума Понтрягина. Труды матем.
ин-та РАН, 1995, Т. 211, С. 3-31.
11. Авдонин С. А., Иванов С. А. Управляемость систем с распределенными
параметрами и семейства экспонент. Киев: Изд-во Минвуза Украинской ССР, 1989.
12. А граче в А. А. Топология квадратичных отображений и гессианы гладких
отображений. Итоги науки и техники. Сер. Алгебра, Геометрия, Топология. — М.: ВИНИТИ. 1988,
Т. 26, С. 85-124.
13. Акулич И. Л. Математическое программирование в примерах и задачах. — М.:
Высшая школа, 1993.
14. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное
управление. — М.: Наука, 1979.
15. Алексеев В. М., Гале ев Э. М., Тихомиров В. М. Сборник задач по
оптимизации. Теория. Примеры. Задачи. — М.: Наука. 1984.
16. Алексеев О. Г. Комплексное применение методов дискретной оптимизации.—
М.: Наука, 1987.
17. Алифанов О. М., Артюхин Е. А., Румянцев С. В. Экстремальные
методы решения некорректных задач. М.: Наука, 1988.
18. Андронов В. Г., Белоусов В. Г. О сходимости по функционалу метода
штрафных функций. Вестник Московск. ун-та. Серия 15. Вычисл. матем. и кибернетика, 1996,
№ 2, С. 59-61.
19. Андронов В. Г., Белоусов Е. Г. О слабой сходимости по аргументу метода
штрафных функций. // Ж. вычисл. матем. и матем. физики. —1997, Т. 37, № 4, С. 404-414.
20. Андронов В. Г., Белоусов Е. Г. О бержевой сходимости метода штрафных
функций. // Ж вычисл. матем. и матем. физики. —1998, Т. 38, № 4, С. 575-591.
21. Анрион Р. Теория второй вариации и ее приложения в оптимальном управлении. —
М.: Наука, 1979.
22. Антипин А. С. Об едином подходе к методам решения некорректных экстемальных
задач. Вестник Московск. ун-та, серия 1, Математика и механика, 1973, № 2, С. 60-67.
23. Антипин А. С. Метод регуляризации в задачах выпуклого программирования. —
Экономика и матем. методы, 1975, И, № 2, С. 336-342.
24. Антипин А. С. Методы нелинейного программирования, основанные на прямой
и двойственной модификации функции Лагранжа. — М.: изд-во ВНИИСИ, 1979.
25. Антипин А. С. Непрерывные и итерационные процессы с оператором
проектирования и типа проектирования. Сб. «Вопросы кибернетики. Вычислительные вопросы анализа
больших систем». —М.: Изд-во АН СССР, 1989, С. 5-43.
26. Антипин А. С. Управляемые проксимальные дифференциальные системы для
решения седловых задач. // Дифференц. уравнения, 1992, Т. 28, № 11, С. 1846-1861.
СПИСОК ЛИТЕРАТУРЫ
789
27. Антипин А. С, Недич А., Ячимович М. Трехшаговый метод линеаризации
для задач минимизации. Известия вузов, сер. матем., 1994, № 12, С. 3-7.
28. Антипин А. С, Васильев Ф. П. О непрерывном методе минимизации в
пространствах с переменной метрикой. Известия вузов, сер. матем., 1995, № 12, С. 3-9.
29. Антипин А. С, Недич А. Непрерывный метод линеаризации второго порядка
для задач выпуклого программирования. Вестник МГУ, сер. вычислит, матем. и кибернетики,
1996. № 2, С. 3-12.
30. Антипин А. С. Равновесное программирование: проксимальные методы. //
Ж вычисл. матем. и матем. физики, 1997, Т. 37, № 11, С. 1327-1339.
31. Антипин А. С. Методы решения вариационных неравенств со связанными
ограничениями. // Ж. вычисл. матем. и матем. физики, 2000, Т. 40, № 9, С. 1291-1307.
32. Анциферов Е. Г., Ащепков Л. Т., Булатов В. П. Методы оптимизации
и их приложения. Ч. 1. Математическое программирование. — Новосибирск: Наука, 1990.
33. А оки М. Введение в методы оптимизации.—М.: Наука, 1977.
34. Аркин В. И., Кречетов Л. И. Стохастические множители Лагранжа в
задачах управления и экономической динамики. В сборнике работ «Вероятностные проблемы
управления в экономике», М.: Наука, 1977, С. 5-32.
35. А р м а н Ж. - Л. П. Приложения теории оптимального управления системами с
распределенными параметрами к задачам оптимизации конструкций. — М.: Мир, 1977.
36. Арутюнов А. В., Тынянский Н. Т. К необходимым условиям локального
минимума в теории оптимального управления. Докл. АН СССР, 1984, Т. 275, № 2, С 268-272.
37. Арутюнов А. В., Тынянский Н. Т. О принципе максимума в задаче с
фазовыми ограничениями. Изв. АН СССР. Сер. технич. кибернетика, 1984, № 4, С. 60-68.
38. Арутюнов А. В. К необходимым условиям оптимальности в задаче с фазовыми
ограничениями. Докл. АН СССР, 1985, Т. 280, № 5, С. 1033-1037.
39. Арутюнов А. В. О необходимых условиях оптимальности в задаче с фазовыми
ограничениями // ДАН СССР. — 1985.—Т. 280, № 5. —С. 1033-1037.
40. Арутюнов А. В. Возмущения экстремальных задач с ограничениями и
необходимые условия оптимальности. Итоги науки и техники. ВИНИТИ. Сер. Математический
анализ. — 1989, Т. 27, С. 147-235.
41. Арутюнов А. В. К теории принципа максимума в задачах оптимального
управления с фазовыми ограничениями. Докл. АН СССР, 1989, Т. 304, № 1, С. 11 — 14.
42. Арутюнов А. В., Асеев С. М., Благ о датских В- И. Необходимые
условия первого порядка в задаче оптимального управления дифференциальным включением
с фазовыми ограничениями. Матем. сб., 1993, Т. 184, № 6, С. 3-32.
43. Арутюнов А. В. Условие второго порядка в экстремальных задачах с
конечномерным образом. 2-нормальные отображения. Изв. РАН, сер. матем., 1996, Т. 60, № 1, С. 37-62.
44. Арутюнов А. В. Условия экстремума. Анормальные и вырожденные задачи. —
М.: Факториал, 1997.
45. Арутюнов А. В. Расширения и возмущения задач оптимального управления.
Труды матем. ин-та РАН, 1998, Т. 220, С. 27-34.
46. Асеев С. М. Метод гладких аппроксимаций в теории необходимых условий
оптимальности для дифференциальных включений. Изв. РАН, сер. матем., 1997, Т. 61, № 2,
С. 3-26.
47. Асеев С. М. Задача оптимального управления для дифференциального
включения с фазовым ограничением. Гладкие аппроксимации и необходимые условия оптимальности.
Итоги науки и техники. Серия «Современная математика и ее приложения», Т. 64. М,: Изд-во
ВИНИТИ, 1999, С. 57-81.
48. Астафьев Н. Н. Линейные неравенства и выпуклость. — М.: Наука, 1982.
49. Астафьев Н. Н. Бесконечные системы линейных неравенств в математическом
программировании.—М.: Наука, 1991.
50. Афанасьев А. П., Дику с ар В. В., Милютин А. А., Чуканов С. А.
Необходимое условие в оптимальном управлении. — М.: Наука, 1990.
51. Ахмедов К. Т., Ахи ев С. С. Необходимое условие оптимальности для
некоторых задач теории оптимального управления. Докл. АН Азерб. ССР, 1972, Т. 28, № 5,
С. 12-15.
52. Ашманов С. А. Линейное программирование. — М.: Наука. 1981.
53. Ашманов С. А. Введение в математическую экономику. —М.: Наука. 1984.
54. Ашманов С. А., Т и м о х о в А. В. Теория оптимизации в задачах и
упражнениях.— М.: Наука, 1991.
55. Ащепков Л. Т. Оптимальное управление линейными системами. — Иркутск:
Изд-во ИГУ, 1982.
790
СПИСОК ЛИТЕРАТУРЫ
56. Ащепков Л. Т., Белов Б. И., Булатов В. П., Васильев О. В.,
Срочко В. А., Тарасёнко Н. В. Методы решения задач математического
программирования и оптимального управления. — Новосибирск: Наука, 1984.
57. Ащепков Л. Т. Оптимальное управление разрывными системами. — Новосибирск:
Наука, 1987.
58. Ащепков Л. Т., Величенко В. В. Оптимальное управление. — Владивосток:
Изд-во Дальневосточного ун-та, 1989.
59. Бабенко К. И. Основы численного анализа, — М.: Наука, 1986.
60. Баев А. В. О решении одной обратной задачи для волнового уравнения с помощью
регуляризирующего алгоритма. Ж. вычисл. матем. и матем. физики, 1985, Т. 25, № 1, С. 140—
146.
61. Базара М., Шетти К. Нелинейное программирование. Теория и алгоритмы/—
М.: Мир, 1982.
62. Бакушинский А. Б., Гончарский А. В. Итеративные методы решения
некорректных задач. — М.: Наука, 1989.
63. Бакушинский А. Б., Гончарский А. В. Некорректные задачи. Численные
методы и приложения. М.: Изд-во Московск. ун-та, 1989.
64. Бакушинский А. Б. Итерационные методы для решения нелинейных
операторных уравнений без свойства регулярности. Фундаментальная и прикладная матем., 1997, Т. 3,
№ 1. .',".''.'''
65. Балакришнан А. Введение в теорию оптимизации в гильбертовом
пространстве. — М.: Мир, 1974.
66. Банди Б. Методы оптимизации. Вводный курс.—М.: Радио и связь, 1988.
67. Баничук Н. В. Оптимизация форм упругих тел. — М.: Наука, 1980.
68. Баничук Н. В. Введение в оптимизацию конструкций. М.: Наука, 1986.
69. Баничук Н. В., Иванова С. Ю., Шаранюк А. В. Динамика конструкций.
Анализ и оптимизация. М.: Наука, 1989.
70. Банк Б., Белоусов Е. Г., Мандель Р., Черемных Ю. Н.,
Ш и р о н и н В. М. Математическая оптимизация: вопросы разрешимости и устойчивости. —
М.: Изд-во МГУ, 1986.
71. Батищев Д. И. Методы оптимального проектирования.—М.: Радио и связь,
1984. ;;
72. Батурин В. А., Урбанов ич Д. Е. Приближенные методы оптимального
управления, основанные на принципе расширения. — Новосибирск: Наука, 1997.
73. Батухтин'В. Д., Майборода Л. А. Оптимизация разрывных функций.—
М.: Наука, 1984.
74. Бахвалов Н. С, Жидков Н. П., Кобельков Г. М. Численные
методы. — М.: Наука. 1987.
75. Бахвалов Н. С, Лапин А. В., Чижонков Е. В. Численные методы в
задачах и упражнениях. М.: Высшая школа, 2000.
76; Бейко И. В., Бублик Б. Н., Зинько П. Н. Методы и алгоритмы решения
задач оптимизации. — Киев: Вища школа, 1983.
77. Беленький В. 3., Волконский В. А., Иванков С. А.,
П о м а н с к и й А. Б., Шапиро А. Д. Итеративные методы в теории игр и
программировании.— М.: Наука, 1974.
78. Беллман Р. Динамическое программирование.—М.: Изд-во иностр. литер., 1960.
79. Беллман Р. Процессы регулирования с адаптацией. — М.: Наука, 1964.
80. Беллман Р., Дрейфус С. Прикладные задачи динамического
программирования.— М.: Наука, 1965.
81. Беллман Р., Калаба Р. Динамическое программирование и современная
теория управления. — М.: Наука, 1969.
82. Б е л о л и п е ц к и й А. А., Рябов А. Ю. Асимптотические оценки решений
задачи оптимального быстродействия вблизи точек излома изохронной поверхности. // Ж.
вычисл. матем. и матем. физики, 1986, Т. 26, № 4, С. 521-535.
83. Белоусов Е. Г. Введение в выпуклый анализ и целочисленное
программирование.—М.: Изд-во МГУ, 1977.
84. Белоусов Е. Г., Андронов В. Г. Разрешимость и устойчивость задач
полиномиального программирования. — М.: Изд-во МГУ, 1993.
85. Белоусов Е. Г., Андронов В. Г. О сводимости общей задачи выпуклого
программирования к задаче на безусловный экстремум. // Известия вузов, сер. матем., 1995,
№ 12, С.21-29.
86. Б е н с у с а н А., Лионе Ж. — — Л. Импульсное управление и
квазивариационные неравенства. М.: Наука, 1987.
СПИСОК ЛИТЕРАТУРЫ
791
87. Б е р ды ш е в В. И. Устойчивость задачи минимизации при возмущении множества
допустимых элементов. —Матем. сб., 1977, 103 (145), № 4 (8), С. 467-479.
88. Бердыше в В. И. Непрерывность многозначного отображения, связанного с
задачей минимизации функционала. // Изв. АН СССР, сер. матем., 1980, Т. 44, № 3, С. 483-
509.
89. Березин И. С, Жидков Н. П. Методы вычислений. Т. 1.—М.: Наука,
1966. Т. 2. — Физматгиз, 1962.
90. Б е р е з н е в В. А. Математические методы планирования производственной
программы предприятий легкой промышленности.—М.: Легкая индустрия, 1980.
91. Березнев В. А., Карманов В. Г., Третьяков А. А. Устойчивые
методы решения экстремальных задач с приближенной информацией. — М.: Изд-во Научного
совета по комплексной проблеме «Кибернетика» АН СССР, 1987.
92. Бе ре сне в В. Л., Гимади Э. X., Дементьев В. Т. Экстремальные
задачи стандартизации. — Новосибирск: Наука, 1978.
93. Бертсекас Д., Шрив С. Стохастическое оптимальное управление: случай
дискретного времени.—М.: Наука, 1985.
94. Бертсекас Д. Условная оптимизация и методы множителей Лагранжа. — М.:
Радио и связь, 1987.
95. Бесов О. В., Ильин В. П., Никольский С. М. Интегральные
представления функций и теоремы вложения. — М.: Наука, 1975.
96. Благодатских В. И. Задача управляемости для линейных систем. — Труды
Матем. института АН СССР, 1977, 143, С. 57-67.
97. Благодатских В. И. Линейная теория оптимального управления. —М.: Изд-во
МГУ, 1978.
98. Благодатских В. И. Теория дифференциальных включений, ч. 1. — М.: Изд-во
Московск. ун-та, 1979.
99. Благодатских В. И., Филиппов А. Ф. Дифференциальные включения и
оптимальное управление. — Труды Матем. института АН СССР, 1985, Т. 169, С, 194-252.
100. Благодатских В. И., Григоренко Н. Л., Киселев Ю. Н. Практикум
по оптимальному управлению. — М.: Изд-во МГУ, 1986.
101. Блисс Г. А. Лекции по вариационному исчислению.—М.: Изд-во иностр.
литературы, 1950.
102. Бобылев Н. А., Климов В. С. Методы нелинейного анализа в негладкой
оптимизации. — М.: Наука, 1992.
103. Бобылев Н. А., Коровин С. К. Топологические методы в вариационных
задачах. М.: Изд-во РАЕН, 1997.
104. Бокмельдер Е. П., Дыхта В. А., Москаленко А. И., Овсянникова
Н. А. Условия экстремума и конструктивные методы решения в задачах оптимизации
гиперболических систем. Новосибирск: Наука, 1993.
105. Болтянский В. Г. Математические методы оптимального управления, ^М.:
Наука. 1969.
106. Болтянский В. Г. Оптимальное управление дискретными системами. — М.:
Наука, 1973.
107. Борисович Ю. Г., Обуховский В. В. О задаче оптимизации для
управляемых систем параболического типа. Труды Матем. института, РАН, 1995, Т. 211, С. 95-101.
108. Брайсон А., Хо Ю —Ши. Прикладная теория оптимального управления.—
М.:Мир, 1972. '>
109. Брежнева О. А., Третьяков А. А. Новые методы решения существенно
нелинейных проблем. М.: Вычислительный центр РАН, 2000.
ПО. Бублик Б. Н., Гаращенко Ф. Г., Кириченко Н. Ф. Структурно-
параметрическая оптимизация и устойчивость динамики пучков. — Киев; Наукова думка, 1985.
111. Будак Б. М., Беркович Е. М., Соловьева Е. Н. О сходимости
разностных аппроксимаций для задач оптимального управления. — Ж вычислит, матем. и
матем. физики, 1969, 9, № 3, С. 522-547.
112. Будак Б. М., Васильев Ф. П. Приближенные методы решения задач
оптимального управления (тезисы лекций), вып. 2. — М.: Изд-во Московск. ун-та, 1969.
113. Будак Б. М., Виньоли А., Гапоненко Ю. Л. Об одном способе
регуляризации для непрерывного выпуклого функционала. — Ж вычислит, матем. и матем.
физики. 1969, 9, № 5, С. 1046-1056.
114. Будак Б. М., Беркович Е. М. Об аппроксимации экстремальных задач, 1,
П. _ Ж вычислит, матем. и матем. физики, 1971, 11, № 3, С. 580-596; № 4, С. 870-884.
115. Будак Б. М., Васильев Ф. П. Некоторые вычислительные аспекты задач
оптимального управления. — М.: Изд-во МГУ, 1975.
792
СПИСОК ЛИТЕРАТУРЫ
116. Булавский В. А., Звягина Р. А., Яковлева М. А. Численные
методы линейного программирования.—М.: Наука, 1977.
117. Булатов В. П. Методы погружения в задачах оптимизации. — Новосибирск:
Наука. 1977.
118. Бурак Я. И., Зозуляк Ю. Д., Гера Б. В. Оптимизация переходных
процессов в термоупругих оболочках. Киев: Наукова Думка, 1984.
119. Бурдуковская А. В., Васильев О. В. Об алгоритмах оптимизации
в системах канонических гиперболических уравнений с частными производными. Иркутск:
Изд-во Иркутск, ун-та, серия «Оптимизация и управление», вып. 2, 1998.
120. Бурковская В. Л., Макаров В. Л. О применимости метода сеток й метода
прямых к решению одного класса задач теории оптимального управления. Ж. вычислит, матем.
и матем. физики, 1983, Т. 23, № 4, С. 798-805.
121. Буслаев В. С. Вариационное исчисление. — Л.: Изд-во ЛГУ, 1980. — 288 с.
122. Бутковский А. Г. Теория оптимального управления системами с
распределенными параметрами. — М.: Наука, 1965.
123. Бутковский А. Г. Методы управления системами с распределенными
параметрами.— М.; Наука, 1975.
124. Бутковский А. Г. Управление системами с распределенными параметрами.—
Автоматика и телемеханика, 1979, № 11, С. 16-65.
125. Бутковский А. Г., Пустыльников Л. М. Теория подвижного управления
системами с распределенными параметрами. М.: Наука, 1980.
126. Бутковский А. Г., Самойленко Ю. И. Управление квантовомеханиче-
скими процессами. М.: Наука, 1984.
127. Бухгейм А. Л. Введение в теорию обратных задач. Новосибирск: Наука, 1988.
128. Вазан М. Стохастическая аппроксимация. — М.: Мир, 1972.
129. Вайникко Г. М. Анализ дискретизационных методов. Тарту: Изд-во Тартусск.
ун-та, 1976.
130. Вайникко Г. М. Методы решения линейных некорректно поставленных задач
в гильбертовых пространствах. Тарту: Изд-во Тартусск. ун-та, 1982.
131. Вайникко Г. М., Веретенников А. Ю. Итерационные процедуры в
некорректных задачах. М.: Наука, 1986.
132. Варга Дж. Оптимальное управление дифференциальными и функциональными
уравнениями.—М.: Наука, 1977.
133. Васильев Н. С. О численном решении экстремальных задач построения
эллипсоидов и параллелепипедов. // Ж. вычислит, матем. и матем. физики, 1987, Т. 27, № 3,
С. 340-348.
134. Васильев О. В., Срочко В. А., Терлецкий В. А. Методы оптимизации
и их приложения. Часть 2. Оптимальное управление. Новосибирск: Наука, 1990.
135. Васильев О. В. Лекции по методам оптимизации. Иркутск: Изд-во Иркутск,
ун-та, 1994.
136. Васильев О. В., Аргучинцев А. В. Методы оптимизации в задачах и
упражнениях. М.: Физматлит, 1999.
137. Васильев Ф. П. Условия оптимальности для некоторых классов систем, не
разрешенных относительно производной.—ДАН СССР, 1969, 184, № 6, С. 1267-1270.
138. Васильев Ф. П. Об итерационных методах решения задач быстродействия,
связанных с параболическими уравнениями.—Ж. вычислит, матем. и матем. физики, 1970,
10, № 4, С. 942-957.
139. Васильев Ф. П., Иванов Р. П. Некоторые приближенные методы решения
задач быстродействия в банаховых пространствах при наличии фазовых ограничений. —ДАН
СССР, 1970, 195, № 3, С. 526-529.
140. Васильев Ф. П. Лекции по методам решения экстремальных задач. — М.:
Изд-во Московск. ун-та, 1974.
141. Васильев Ф. П. Численный метод решения задачи быстродействия при
приближенном задании исходных данных. — Вестник Московск. ун-та. Сер. вычислит, матем. и
киберн., 1977, № 3, С. 26-36.
142. Васильев Ф. П. О регуляризации некорректных экстремальных задач. — ДАН
СССР, 1978, 241, № 5, С. 1001-1004.
143. Васильев Ф. П. О методе нагруженных функционалов // Вестник МГУ.
Сер. вычисл. матем. и киберн., 1978. — № 3. — С. 24 — 32.
144. Васильев Ф. П., Воронцов М. А., Литвинова О. А. Об оптимальном
управлении процессом теплового самовоздействия.—Ж. вычислит, матем. и матем. физики,
1979, 19, № 4, С. 1053-1058.
СПИСОК ЛИТЕРАТУРЫ
793
145. Васильев Ф. П. О регуляризации некорректных задач минимизации на
множествах, заданных приближенно.—Ж. вычислит, матем. и матем. физики, 1980, 20, № 1,
С. 38-50.
146. Васильев Ф. П., Ковач М. О регуляризации некорректных экстремальных
задач с использованием штрафных и барьерных функций. — Вестник Московск. ун-та. Сер.
вычислит, матем. и киберн., 1980, № 2, 29-35.
147. Васильев Ф. П., Ячимович М. Д. Об итеративной регуляризации метода
условного градиента и метода Ньютона при неточно заданных исходных данных. —ДАН СССР,
1980, 250, № 2, С. 265-269.
148. Васильев Ф. П. Численные методы решения экстремальных задач. — М.: Наука,
1980 (1-е издание), 1988 (2-е издание).
149. Васильев Ф. П., Ячимович М. Д. Об итеративной регуляризации метода
Ньютона. —Ж. вычислит, матем. и матем. физики, 1981, 21, N° 3, С. 775-778.
150. Васильев Ф. П., Хромова Л. Н., Ячимович М. Д. Итеративная
регуляризация одного метода минимизации третьего порядка. — Вестник Московск. ун-та. Сер.
вычислит, матем. и киберн., 1981, № 1, С. 31-36.
151. Васильев Ф. П. Методы решения экстремальных задач. М.: Наука, 1981.
152. Васильев Ф. П. Итеративная регуляризация разностных аппроксимаций одной
задачи оптимального управления. Вестник Киевского ун-та, серия «Моделирование и
оптимизация сложных систем». 1982, № 1, С. 40-45.
153. Васильев Ф. П., Аваков Е. Р. Разностная аппроксимация одной максимин-
ной задачи оптимального управления с фазовыми ограничениями. Вестник Московск. ун-та,
серия 15, Вычисл. матем. и киберн., 1982, № 2, С. 11-17.
154. Васильев Ф. П., Константинова Т. В. Об одном обобщении метода
нагруженных функционалов // Вестник МГУ. Серия 15, Вычисл. матем. и киберн. — 1983,
№2.-С. 3-8.
155. Васильев Ф. П. Регуляризованный метод Стеффенсена с аппроксимацией
обратного оператора. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1984,
№ 4, С. 3-7.
156. Васильев Ф. П., Ковач М. О регуляризации некорректно поставленных
экстремальных задач при неточно заданных исходных данных. Computational mathematics, Ва-
nach Center Publication, Warszawa, 1984, V. 13, pp. 237-263.
157. Васильев Ф. П. Регуляризация некоторых методов минимизации высокого
порядка при неточных исходных данных. Ж. вычисл. матем. и матем. физики, 1985, Т. 25,
№ 4, С. 492-499.
158. Васильев Ф. П. О регуляризации метода Ньютона при неточном задании
исходных данных. Труды матем. ин-та АН СССР, 1985, Т. 167, С. 53-59.
159. Васильев Ф. П., Солодкая М. С, Ячимович М. Д. О регу-
ляризованном методе линеаризации при наличии погрешностей в исходных данных. Вестник
Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1985, № 4, С. 3-8.
160. Васильев Ф. П. О методе невязки для решения неустойчивых задач
минимизации. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1987, № 4, С. 6-10.
161. Васильев Ф. П. Применение негладких штрафных функций в методе
регуляризации неустойчивых задач минимизации // Ж вычислит, матем. и матем. физики. — 1987. —
Т. 27, № 10.—С. 1444-1450.
162. Васильев Ф. П. Оценка скорости сходимости метода регуляризации А. Н.
Тихонова для неустойчивых задач минимизации. Докл. АН СССР, 1988, Т. 299, N° 4, С. 792-796.
163. Васильев Ф. П. О регуляризации неустойчивых задач минимизации. Труды
матем. ин-та АН СССР, 1988, Т. 185, С. 60-65.
164. Васильев Ф. П., Ковач М., Фуллер Р. Об устойчивости нечеткого
решения систем линейных алгебраических уравнений с нечеткими коэффициентами. Вестник
Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1989, № 1, С. 5-9.
165. Васильев Ф. П., Куржанский М. А. О методе квазирешений для
неустойчивых задач минимизации с неточно заданными исходными данными. Вестник Московск.
ун-та, серия 15, Вычисл. матем. и киберн., 1989, № 4, С. 13-18.
166. Васильев Ф. П., Ишмухаметов А. 3., Потапов М. М. Обобщенный
метод моментов в задачах оптимального управления. М.: Изд-во Московск. ун-та, 1989.
167. Васильев Ф. П. Методы регуляризации для неустойчивых задач
минимизации, основанные на идее расширения множества. Вестник Московск. ун-та, серия 15, Вычисл.
матем. и киберн., 1990, № 1, С. 3-16.
168. Васильев Ф. П., Обрадович О. Регуляризованный проксимальный метод
для задач минимизации с неточными исходными данными. Ж вычисл. матем. и матем. физики,
1993, Т. 33, № 2, С. 179-188.
794
СПИСОК ЛИТЕРАТУРЫ
169. Васильев Ф. П., Ячимович М. Метод стабилизации для решения
лексикографических задач. Ж. вычисл. матем. и матем. физики, 1993, Т. 33, № 8, С. 1123-1134.
170. Васильев Ф. П., Куржанский М. А., Потапов М. М. Метод
прямых в задачах граничного управления и наблюдения для уравнения колебаний струны.
Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1993, № 3, С. 8-15.
171. Васильев Ф. П., Недич А. Регуляризованный непрерывный метод проекции
градиента третьего порядка. Дифференциальные уравнения, 1994, Т. 30, № 12, С. 2033-2042.
172. Васильев Ф. П., Недич А. Регуляризованный непрерывный метод проекции
градиента второго порядка. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн.,
1994, №2, С. 3-11.
173. Васильев Ф. П., Ковач М. Об оценке скорости сходимости методов
регуляризации для неустойчивых задач минимизации. Numerical analysis and mathematical modelling.
Banach Center Publication, Warszawa, 1994, V. 29, pp. 233-244.
174. Васильев Ф. П., Недич А., Ячимович M. Трехшаговый
регуляризованный метод линеаризации для решения задач минимизации. Известия вузов, Математика,
1994, № 12, С. 1-8. ~
175. Васильев Ф. П. О двойственности в линейных задачах управления и наблюдения.
Дифференциальные уравнения, 1995, Т. 31, № 11, С. 1893-1900.
176. Васильев Ф. П., Антипин А. С. О непрерывном методе минимизации с
переменной метрикой. Известия вузов, Математика, 1995, № 12, С. 3-9.
177. Васильев Ф. П., Недич А., Ячимович М. Двухшаговый
регуляризованный метод линеаризации для решения задач минимизации. Ж. вычисл. матем. и матем.
физики, 1996, Т. 36, № 5, С. 9-19.
178. Васильев Ф. П., Антипин А. С, Амочкина Т. В. Регуляризованный
непрерывный метод минимизации с переменной метрикой при неточно заданных исходных
данных. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1996, № 4, С, 5-11.
179. Васильев Ф. П., Иваницкий А. Ю. Линейное программирование. М.:
Факториал, 1998.
180. Васильев Ф. П. Критерии устойчивости общей задачи линейного
программирования. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1998, № 2, С. 17-20.
181. Васильев Ф. П. К вопросу устойчивости методов регуляризации в линейном
программировании. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1998, № 4,
С. 19-23.
182. Васильев Ф. П., Антипин А. С. Метод стабилизации для решения задач
равновесного программирования с неточно заданным множеством. Ж. вычисл. матем. и матем.
физики, 1999, Т. 39, № 11, С. 1779-1.786.
183. Васин А. А. Модели процессов с несколькими участниками.—М.: Изд-во МГУ,
1983.
184. Васин В. В., Агеев А. Л. Некорректные задачи с априорной информацией.—
Екатеринбург: Наука, 1993.
185. Васин В. В. Методы итеративной регуляризации для некорректных задач. Известия
вузов. Математика, 1995, N.11, С. 69-84.
186. Вахрамеев С. А. Замечание о выпуклости в гладких нелинейных системах.
Итоги науки и техники. Серия «Современная математика и ее приложения», Т. 60. М.: Изд-во
ВИНИТИ, 1999, С. 42-73.
187. В и га к В. М. Управление температурными напряжениями и перемещениями.
Киев: Наукова думка, 1988.
188. Винокуров В. А. О понятии регуляризуемости разрывных отображений. Ж
вычисл. матем. и матем. физики, 1971, Т. 11, № 5, С. 1097-1112.
189. Винокуров В. А. Приближенный метод невязки в нерефлексивных
пространствах. Ж. вычисл. матем. и матем. физики, 1972, Т. 12, № 1, С. 207-212.
190. Винокуров В. А. Два замечания о выборе пераметра регуляризации. Ж. вычисл.
матем. и матем. физики, 1972, Т. 12, № 2, С. 481-483.
191. Владимиров А. А., Нестеров Ю. Е., Чеканов Ю. Н. О равномерно
выпуклых функционалах // Вестник МГУ. Серия 15, Вычисл. матем. и киберн. — 1978. № 3. —
С. 12-23.
192. Воеводин В. В. Линейная алгебра. — М.: Наука, 1980.
193. Воробьев Н. Н. Числа Фибоначчи. —М.: Наука, 1978.
194. Воробьев Н. Н. Основы теории игр. Бескоалиционные игры.—М.: Наука, 1984.
195. Воронцов М. А., Корягин А. В., Шмальгаузен В. И. Управляемые
оптические системы. М.: Наука, 1989.
196. Воронцов М. А., Железных Н. И., Потапов М. М. О градиентной
процедуре внутрирезонаторного управления световыми пучками. Ж. вычислит, матем. и матем.
физики, 1990, Т. 30, № 3, С. 449-456.
СПИСОК ЛИТЕРАТУРЫ
795
197. By ко лов Э. А., Ефимов А. В., Земсков В. Н., Каракулин А. Ф.,
Лесин В. В., Поспелов А. С, Терещенко А. М. Сборник задач по математике
для втузов. Ч. 4. Методы оптимизации. Уравнения в частных производных. Интегральные
уравнения. — М.: Наука, 1990.
198. Габасов Р. Ф., Кириллова Ф. М. Качественная теория оптимальных
процессов. — М.: Наука, 1971.
199. Габасов Р. Ф., Кириллова Ф. М. Особые оптимальные управления. —
М.: Наука, 1973.
200. Габасов Р. Ф., Кириллова Ф. М. Оптимизация линейных систем. —
Минск: Изд-во БГУ, 1973.
201. Габасов Р. Ф., Кириллова Ф. М. Принцип максимума в теории
оптимального управления. —Минск: Наука и техника, 1974.
202. Габасов Р. Ф., Кириллова Ф. М. Основы динамического
программирования. — Минск: Изд-во БГУ, 1975.
203. Габасов Р. Ф., Кириллова Ф. М. Методы линейного программирования.—
Минск: Изд-во БГУ. Часть 1, 1977, часть 2, 1978, часть 3, 1980.
204. Габасов Р. Ф., Кириллова Ф. М. Методы оптимизации.—Минск: Изд-во
БГУ, 1981.
205. Габасов Р, Кириллова Ф. М., Тятюшкин А. И. Конструктивные
методы оптимизации. Ч. 1. Линейные задачи.—Минск: Изд-во Белорусск. ун-та, 1983.
206. Габасов Р, Кириллова Ф. М. Конструктивные методы оптимизации. Ч. 2.
Задачи управления. —Минск: Изд-во Белорусск. ун-та, 1984.
207. Габасов Р, Кириллова Ф. М., Костюкова О. И. Конструктивные
методы оптимизации. Ч. 3. Сетевые задачи, 1986, Ч. 4. Выпуклые задачи, 1987, Минск: Изд-во
Белорусск. ун-та.
208. Гаевский X., Грегер К., Захариас К. Нелинейные операторные
уравнения и операторные дифференциальные уравнения. —М.: Наука, 1978.
209. Галеев Э. М., Тихомиров В. М. Краткий курс теории экстремальных
задач. — М.: Изд-во МГУ, 1989.
210. Галеев Э. М., Тихомиров В. М. Оптимизация: теория, примеры, задачи.—
М.: Эдиториал УРСС, 2000.
211. Гамкрелидзе Р. В., X а р атишв и ли8 Г. А. Экстремальные задачи в
линейных топологических пространствах. Известия АН СССР, серия матем., 1969, Т. 33, № 4,
С. 781-839.
212. Гамкрелидзе Р. В. Основы оптимального управления. — Тбилиси: Изд-во
Тбилисского ун-та, 1977.
213. Гантмахер Ф. Р. Теории матриц. — М.: Наука, 1967.
214. Ганшин Г. С. Методы оптимизации и решение уравнений. — М.: Наука, 1987.
215. Гапоненко Ю. Л. Некорректные задачи на слабых компактах. М.: Изд-во
Московск. ун-та, 1989.
216. Га с с С. Линейное программирование (методы и приложения).—М.: Физматгиз,
1961.
217. Гельфанд И. М., Фомин С. В. Вариационное исчисление. — М.: Физматгиз,
1961. ,
218. Гермейер Ю. Б. Введение в теорию исследования операций. — М.: Наука, 1971.
219. Гермейер Ю. Б. Игры с непротивоположными интересами. — М.: Наука, 1976.
220. Гермейер 10. Б., Морозов В. В., Сухарев А. Г., Федоров В.
В. Задачи по исследованию операций. — М.: Изд-во Московск. ун-та, 1979.
221. Г е р н е т Н. Н. Об основной простейшей задаче вариационного исчисления. С. —
Петербург, 1913.
222. Гил л Ф., Мюррей У., Райт М. Практическая оптимизация. —М.: Мир,
1985.
223. Гилязов С. Ф. Методы решения линейных некорректных задач. М.: Изд-во
Московск. ун-та, 1987.
224. Гилязов С. Ф. Приближенное решение некорректных задач. М.: Изд-во Московск.
ун-та, 1995.
225. Гирсанов И. В. Лекции по математической теории экстремальных задач. —М.:
Изд-во МГУ, 1970.
226. Гладков Д. И. Оптимизация систем неградиентным случайным поиском. — М.:
Энергоатомиздат, 1984.
227. Гловински Р., Лионе Ж. —Л., Тремольер Р. Численное исследование
вариационных неравенств. — М.: Мир, 1979.
796
СПИСОК ЛИТЕРАТУРЫ
228. Голичев И. И. Метод функции от оператора и итерационные процессы в
некоторых задачах оптимального управления. Известия АН СССР, серия матем., 1991, Т. 55,
№ 4, С. 815-837.
229. Голичев И. И. Итерационный метод решения некорректных граничных задач.
Ж. вычисл. матем. и матем. физики, 1993, Т. 33, № 11, С. 1626-1637.
230. Гольдман Н. Л. Обратные задачи Стефана. Теория и методы решения, М.:
Изд-во Московск. ун-та, 1999.
231. Гольштейн Е. Г., Юдин Д. Б. Новые направления в линейном
программировании.— М.: Сов. радио 1966.
232. Гольштейн Е. Г., Юдин Д. Б. Задачи линейного программирования
транспортного типа.—М.: Наука, 1969.
233. Гольштейн Е. Г. Теория двойственности в математическом программировании
и ее приложения. — М.: Наука, 1971.
234. Гольштейн Е. Г., Третьяков Н. В. Модифицированные функции Лагранжа.
Теория и методы оптимизации.—М.: Наука, 1989.
235. Гончарский А. В., Черепа щук А. М., Я го л а А. Г. Численные
методы решения обратных задач астрофизики. — М.: Наука, 1978.
236. Гончарский А. В., Черепащук А. М., Ягола А. Г. Некорректные
задачи астрофизики. М.: Наука, 1985.
237. Горбунов В. К. Методы редукции неустойчивых вычислительных задач. Фрунзе:
Изд-во «Илим», 1984.
238. Горбунов В. К. Экстремальные задачи обработки результатов измерений.
Фрунзе: Изд-во «Илим», 1990.
239. Горбунов В. К. Введение в теорию экстремума. Ульяновск: Изд-во Ульяновского
гос. ун-та, 1999.
240. Горелик В. А., Кононенко А. Ф. Теоретико-игровые модели принятия
решений в эколого-экономических системах — М.: Радио и связь, 1982.
241. Горелик В. А., Горелов М. А., Кононенко А. Ф. Анализ конфликтных
ситуаций в системах управления. М.: Радио и связь, 1991.
242. Гребеников А. И. Метод сплайнов и решение некорректных задач теории
приближений. М.: Изд-во Московск. ун-та, 1983.
243. Грешилов А. А. Прикладные задачи математического программирования.—
М.: Изд-во Московск. технич. ун-та, 1990.
244. Григоренко Н. Л. Дифференциальные игры преследования несколькими
объектами.— М.: Изд-во МГУ, 1983.
245. Григоренко Н. Л. Математические методы управления несколькими
динамическими процессами.—М.: Изд-во МГУ, 1990.
246. Григорьев И. С, Григорьев К. Г., Петрикова Ю. Д. О
наискорейших маневрах космического аппарата с реактивным двигателем большой ограниченной тяги в
гравитационном поле в вакууме. Космические исследования, 2000, Т. 38, № 2, С. 171-192.
247. Григорьев К. Г., Григорьев И. С. Исследование оптимальных
пространственных траекторий перелетов космического аппарата с реактивным двигателем большой
ограниченной тяги между орбитами искусственных спутников Земли и Луны. Космические
исследования, 1995, Т. 33, № 1, С. 52-75.
248. Григорьев К. Г., Заплетин М. П. О вертикальном старте в
оптимизационных задачах ракетодинамики. Космические исследования, 1997, Т. 35, № 4, С. 363-377.
249. Гродзовский Г. Л., Иванов Ю. Н., Токарев В. В. Механика
космического полета с малой тягой. — М.: Наука, 1966.
250. Гроссман К., Каплан А. А. Нелинейное программирование на основе
безусловной оптимизации. — Новосибирск: Наука, 1981.
251. Гупал А. М. Стохастические методы решения негладких экстремальных задач.—
Киев: Наукова думка, 1979.
252. Гуревич Т. Ф., Л у щук В. О. Сборник задач по математическому
программированию.— М.: Колос, 1977.
253. Гурман В. И. Вырожденные задачи оптимального управления. — М.: Наука,
1977.
254. Гурман В. И. Принцип расширения в задачах управления. — М.: Физматлит,
1997.
255. Давыдов Э. Г. Исследование операций. — М.: Высшая школа, 1990.
256. Дамбраускас А. П. Симплексный поиск. — М.: Энергия, 1979.
257. Данилин Ю. М., П и я в с к и й С. А. Об одном алгоритме отыскания
абсолютного минимума. Сб. работ «Теория оптимальных решений». Вып. 2. — Киев: Институт
кибернетики, АН УССР, 1967, С. 25-37.
СПИСОК ЛИТЕРАТУРЫ
797
258. Данфорд Н., Шварц Дж. Т. Линейные операторы. Общая теория. — М.:
ИЛ, 1962.
259. Данциг Дж. Линейное программирование, его применения и обобщения.—М.:
Прогресс, 1966.
260. Даффин Р., Питерсон Э., Зенер К. Геометрическое программирование. —
М.: Мир, 1972.
261. Дементьев В. Т., Ерзин А. И., Ларин Р. М., Шамордин Ю. В.
Задачи оптимизации иерархических структур. Новосибирск: Изд-во Новосибирск, ун-та, 1996.
262. Демиденко Е. 3. Оптимизация и регрессия. — М.: Наука, 1989.
263. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. — М.: Наука,
1972.
264. Демьянов В. Ф., Васильев Л. В. Недифференцируемая оптимизация. —
М.: Наука, 1981.
265. Демьянов В. Ф., Рубинов А. М. Основы негладкого анализа и
квазидифференциальное исчисление. — М.: Наука, 1990.
266. Демьянов В. Ф. Точные штрафные функции в задачах негладкой
оптимизации. Вестник С. — Петербургск. ун-та. Серия 1, Матем., механика, астрономия, 1994, вып. 4
(№ 22), С. 21-27.
267. Демьянов В. Ф. Условия экстремума и вариационные задачи. Санкт-Петербург,
Изд-во С.-П. ун-та, 2000.
268. Денисов А. М., Л у к ш и н А. В. Математические модели однокомпонентной
динамики сорбции. М.: Изд-во Московск. ун-та, 1989.
269. Денисов А. М. Введение в теорию обратных задач. — М.: Изд-во МГУ, 1994.
270. Денисов А. М. Единственность определения нелинейного коэффициента системы
уравнений в частных производных в малом и в целом. Докл. АН РАН, 1994, Т. 338, № 4,
С. 444-447.
271. Денисов Д. В. Метод итеративной регуляризации в задачах условной
минимизации.— Ж. вычислит, матем. и матем. физики, 1978, 18, № 6, С. 1405-1415.
272. Деннис Дж., Шнабель Р. Численные методы безусловной оптимизации и
решения нелинейных уравнений. — М.: Мир, 1988.
273. Дикин И. И., Зоркальцев В. И. Итеративное решение задач
математического программирования.— Новосибирск: Наука, 1980.
274. Дикусар В. В., Милютин А. А. Качественные и численные методы в
принципе максимума.—М.: Наука, 1989.
275. Дикусар В. В. Регуляризация вырожденной задачи оптимального управления.
Дифференциальные уравнения, 1998, Т. 34, № 11, С. 1856-1865.
276. Дмитрук А. В. Принцип максимума для общей задачи оптимального управления
с фазовыми и регулярными смешанными ограничениями. Сб. «Оптимальность управляемых
динамических систем», вып. 14.—М.: ВНИИСИ, 1990. — С. 26-42.
277. Дончев А. Системы оптимального управления. Возмущения, приближения и
анализ чувствительности. — М.: Мир, 1987.
278. Дубовицкий А. Я., Милютин А. А. Задачи на экстремум при наличии
ограничений. // Ж. вычисл. матем. и матем. физики, 1965, Т. 5, № 3, С.395-453.
279. Дубовицкий А. Я., Милютин А. А. Теория принципа максимума. //
Методы теории экстремальных задач в экономике. — М.: Наука, 1981, С. 138-177.
280. Дубовицкий А. Я., Дубовицкий В. А. Необходимые условия сильного
минимума в задачах оптимального управления с вырождением концевых и фазовых ограничений.
Успехи матем. наук, 1985, Т. 40, № 2, С. 175-176.
281. Дудов С. И. Дифференцируемость по направлениям функции расстояния. Матем.
сб., 1995, Т. 186, № 3, С. 29-52.
282. Дыхта В. А. Вариационный принцип максимума и квадратичные условия
оптимальности импульсных и особых процессов. Сибирский матем. журн., 1994, Т. 35, № 1,
С. 70-82.
283. Дыхта В. А., С а м с о н ю к О. Н. Оптимальное импульсное управление с
приложениями. М.: Физматлит, 2000.
284. Дьяченко М. И., Ульянов П. Л. Мера и интеграл. М.. Факториал, 1998.
285. Дюво Г., Лионе Ж.-Л. Неравенства в механике и физике М.: Наука, 1980.
286. Евтушенко Ю. Г. Методы решения экстремальных задач и их применение в
системах оптимизации. — М.: Наука, 1982.
287. Егоров А. И. Оптимальное управление тепловыми и диффузионными
процессами.—М.: Наука, 1978.
288. Егоров А. И. Оптимальное управление линейными системами. Киев: Выща
школа, 1998.
798 СПИСОК ЛИТЕРАТУРЫ
289. Егоров Ю. В. Некоторые задачи теории оптимального управления.—Ж.
вычислит, матем. и матем. физики, 1963, 3, № 5, С. 887-904.
290. Егоров 10. В. Необходимые условия оптимальности в банаховых
пространствах.—Матем. сборник, 1964, 64 (106), № 1, С. 79-101.
291. Елкин В. И. Редукция нелинейных управляемых систем: дифференциально-
геометрический подход. М.: Физматлит, 1997.
292. Емеличев В. А., Комлик В. И. Метод построения последовательности
планов для решения задач дискретной оптимизации. — М.: Наука, 1981.
293. Емельянов С. В., Коровин С. К. Новые типы обратной связи. Управление
при неопределенности. — М.: Наука, Физматлит 1997.
294. Е р е м и н И. И. О методе штрафов в выпуклом программировании. Кибернетика,
1967, № 4, С. 63-67.
295. Еремин И. И., Астафьев Н. Н. Введение в теорию линейного и выпуклого
программирования. — М.: Наука, 19/6.
296. Еремин И. И., Мазуров В. Д. Нестационарные процессы математического
программирования. — М.: Наука, 1979.
297. Еремин И. И., Мазуров В. Д., Астафьев Н. Н. Несобственные
задачи линейного и выпуклого программирования. — М.: Наука, 1983.
298. Еремин И. И. Противоречивые модели оптимального планирования. — М.: Наука,
1988.
299. Еремин И. И. Теория линейной оптимизации. — Екатеринбург: Изд-во Уральского
отделения РАН, 1998.
300. Еремин Ю. А., Свешников А. Г. Задачи распознавания и синтеза в теории
дифракции. Ж вычислит, матем. и матем. физики, 1992, Т. 32, № 10, С. 1594-1607.
301. Ермаков С. М., Жиглявский А. А. Математическая теория оптимального
эксперимента.—М.: Наука, 1987.
302. Ермольев Ю. М. Методы стохастического программирования. — М.: Наука,
1976.
303. Ермольев Ю. М., Гуленко В. П., Царенко Т. И. Конечно-разностный
метод в задачах оптимального управления. — Киев: Наукова думка, 1978.
304. Ермольев Ю. М., Ляшко И. И., Михалевич В. С, Тюптя В. И.
Математические методы исследования операций. — Киев: Вища школа, 1979.
305. Ермольев Ю. М., Ястремский А. И. Стохастические модели и методы
в экономическом планировании.—М.: Наука, 1979.
306. Жадан В. Г. Об одном классе итеративных методов решения задач выпуклого
программирования // Ж. вычислит, матем. и матем. физики, 1984, Т. 24, № 5, С. 665-676.
307. Жданов В. А. О методе покоординатного спуска. // Матем. заметки, 1977, Т. 22,
вып. 1, С. 137-142.
308. Жиглявский А. А. Математическая теория глобального случайного поиска. —
Л.: Изд-во ЛГУ, 1985.
309. Жиглявский А. А., Жилинскас А. Г. Методы поиска глобального
экстремума.—М.: Наука, 1991.
310. Жуковский В. И., Чикрий А. А. Линейно-квадратичные дифференциальные
игры. — Киев: Наукова думка, 1994.
311. Жуковский В. И., Салуквадзе М. Е. Оптимизация гарантий в
многокритериальных задачах управления. — Тбилиси, Мецниереба, 1996.
312. Жуковский В. И. Введение в дифференциальные игры при неопределенности.
Ч. 1,2. — М.: Изд-во международного НИИ проблем управления, 1997.
313. Жуковский В. И. Кооперативные игры при неопределенности и их приложения.
М.: Эдиториал УРСС, 1999.
314. Заботин Я. И., Кораблев А. И., Хабибуллин Р. Ф. Условия
экстремума функционала при наличии ограничений. — Кибернетика, 1973, № 6, С. 65-70.
315. Заботин Я. И., Кораблев А. И. Псевдовыпуклые функционалы и их
экстремальные свойства. — Известия вузов. Сер. матем., 1974, № 4 (143), С. 27-31.
316. Заботин Я. И. Минимаксный метод решения задачи математического
программирования. — Известия вузов. Сер. матем., 1975, № 6 (157), С. 36-43.
317. Заботин Я. И. Лекции по линейному программированию. — Казань: Изд-во
Казанск. ун-та, 1985.
318. Завриев С. К. Стохастические градиентные методы решения минимаксных
задач. — М.: Изд-во МГУ, 1984.
319. Зангвилл У. И. Нелинейное программирование. — М.: Советское радио, 1973.
320. Заславский Ю. Л. Сборник задач по линейному программированию. — М.:
Наука, 1969.
СПИСОК ЛИТЕРАТУРЫ
799
321. Зеликин М. И. Оптимальное управление и вариационное исчисление. — М.:
Изд-во МГУ, 1985.
322. Зеликин М. И., Борисов В. Ф. Режимы учащающихся переключений
в задачах оптимального управления. Труды Матем. института им. В. А. Стеклова РАН, 1991,
Т. 197, С. 85-167.
323. Зеликин М. И. Нерегулярность оптимального управления в регулярных
экстремальных задачах. Фундаментальная и прикладная математика, 1995, Т. 1, № 2, С. 399-408.
324. Зеликин М. И. Однородные пространства и уравнение Риккати в вариационном
исчислении. М.: Факториал, 1998.
325. Зеликина Л. Ф. Многомерный синтез и теоремы о магистрали в задачах
оптимального управления. В сборнике работ «Вероятностные проблемы управления в экономике»,
М.: Наука, 1977, С. 33-114.
326. Зойтендейк Г. Методы возможных направлений. — М.: Изд-во иностран. литер.,
1963.
327. Зорич В. А. Математический анализ. — М.: Фазис, ч. I, 1997, ч. II, 1998.
328. Зубов В. И. Лекции по теории управления. — М.: Наука, 1975.
329. Зубов В. И. Динамика управляемых систем. — М.: Высшая школа, 1982.
330. Зуховицкий С. И., Авдеева Л. И. Линейное и выпуклое
программирование.— М.: Наука, 1967.
331. Иванов А. П., Кирин Н. Е. Сопряженные задачи теории управления. —.:
Изд-во Ленингр. ун-та, 1988.
332. Иванов В. А., Фалдин Н. В. Теория оптимальных систем автоматического
управления. — М.: Наука, 1981.
333. Иванов В. В., Березовский А. И., Задирака В. К., Здоренко Л.
Д., Лепеха Н. П. Методы алгоритмизации непрерывных производственных процессов. —
М.: Наука, 1975.
334. Иванов В. К., Васин В. В., Танана В. П. Теория линейных некорректных
задач и ее приложения.—М.: Наука, 1978.
335. Иванов В. К., Мельникова И. В., Филинков А. И. Дифференциально-
операторные уравнения и некорректные задачи. М.: Наука, Физматлит, 1995.
336. Иванов Г. Е., Половинкин Е. С. О сильно выпуклых линейных
дифференциальных играх. Дифференциальные уравнения, 1995, Т. 31, № 10, С. 1641-1648.
337. Иванов Р. П. Об одном критерии оптимальности и связанном с ним итерационном
методе решения задачи быстродействия.—Ж. вычислит, матем. и матем. физики, 1971,.11,
№ 3, С. 597-610.
338. Иванов Р. П. Об одном итерационном методе решения задачи быстродействия. —
Ж. вычислит, матем. и матем. физики, 1971, И, № 4, С. 1031-1037.
339. Иванович Л. Д. Разностная аппроксимация и регуляризация задачи об
оптимальном нагреве стержня. Вестник Московск. ун-та, Серия 15. Вычислит, матем. и кибернетика,
1982, №3, С. 10-15.
340. Иванович Л. Д. Разностная аппроксимация и регуляризация максиминной задачи
о нагреве стержня. Вестник Московск. ун-та, Серия 15. Вычислит, матем. и кибернетика, 1984,
№ 2, С. 20-23.
341. Ижуткин В. С, Кокурин М. Ю. О гибридном методе нелинейного
программирования, использующем криволинейный спуск // Известия вузов. Сер. матем.—
1986, №2. —С. 61-64.
342. Ижуткин В. С, Кокурин М. Ю. Методы приведенных направлений с
допустимыми точками для задачи нелинейного программирования. Ж. вычисл. матем. и
матем. физики, 1990, Т. 30, № 2, С. 217-230.
343. Ижуткин В. С, Петропавловский М. В. Методы приведенных
направлений на основе дифференцируемой штрафной функции для задачи нелинейного
программирования. Известия вузов. Математика, 1994, № 12, С. 50-59.
344. Ижуткин В. С, Петропавловский М. В. Методы приведенных
направлений на основе модифицированной функции Лагранжа для задачи нелинейного
программирования. Известия вузов. Математика, 1995, № 12, С. 33-42.
345. Ижуткин В. С, Петропавловский М. В., Блинов А. В.
Метод центров и барьерных функций с использованием приведенных направлений для задачи
нелинейного программирования. Известия вузов, математика, 1996, № 2, С. 30-41.
346. Измаилов А. Ф. Условия оптимальности для вырожденных экстремальных
задач с ограничениями типа неравенств. Ж. вычисл. матем. и матем. физики, 1994, Т. 34,
№ 6, С. 837-854.
347. Измаилов А. Ф., Третьяков А. А. Факторанализ нелинейных
отображений.— М.: Наука, 1994.
800
СПИСОК ЛИТЕРАТУРЫ
348. Измаилов А. Ф., Третьяков А. А. 2-регулярные решения нелинейных
задач. Теория и численные методы.—М.: Физматлит, 1999.
349. Икрамов X. Д. Задачник по линейной алгебре. М.: Наука, 1975.
350. Ильин В. А., Садовничий В. А., Сендов Б л. X. Математический
анализ. Начальный курс.—М.: Изд-во МГУ, 1985.
351. Ильин В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия. — М:
Изд-во Московск. ун-та, 1998.
352. Ильин В. А., Позняк Э. Г. Основы математического анализа. — М.:
Физматлит, ч. I, 1998, ч. II, 1998.
353. Ильин В. А., Позняк Э. Г. Линейная алгебра.—М.: Физматлит, 1999.
354. Ильин В. А. Волновое уравнение с граничным управлением на двух концах за
произвольный промежуток времени. Дифференциальные уравнения, 1999, Т. 35, № 11, С. 1517-
1534.
355. Ильин В. А. Волновое уравнение с граничным управлением на одном конце при
закрепленном втором конце. Дифференциальные уравнения, 1999, Т. 35, № 12, С. 1640-1659.
356. И нтрилигатор М. Математические методы оптимизации и экономическая
теория. — М.: Прогресс, 1975.
357. Иосида К. Функциональный анализ. М.: Мир, 1967.
358. Иоффе А. Д., Тихомиров В. М. Теория экстремальных задач. — М.:
Наука, 1974.
359. Ишмухаметов А. 3., Потапов М. М. О согласовании параметра
регуляризации с шагом разностной сетки. Вестник Московск. ун-та, Серия 15. Вычислит,
матем. и кибернетика, 1980, № 3, С. 66-68.
360. Ишмухаметов А. 3. Условия аппроксимации и устойчивости в задачах
оптимального управления гиперболическими системами. Ж. вычисл. матем. и матем. физики, 1994,
Т. 34, № 1, С. 12-28.
361. Ишмухаметов А. 3. Методы решения задач оптимизации. М.: Изд-во МЭИ,
1998.
362. Ишмухаметов А. 3., Юдина А. В. Аппроксимация квадратичной задачи
оптимального управления параболической системой. Вестник МЭИ, Математика, 1998, № 6,
С. 73-84.
363. Ишмухаметов А. 3. Вопросы устойчивости и аппроксимации задач
оптимального управления. М.: Изд-во ВЦ РАН, 2000.
364. Йованович М. В. Замечание о сильно выпуклых и квазивыпуклых функциях.
Матем. заметки, 1996, Т. 60, вып. 5, С. 778-779.
365. Кабанихин С. И. Проекционно-разностные методы определения коэффициентов
гиперболических уравнений. Новосибирск: Наука, 1988.
366. Казимиров В. И., Плотников В. И., Старобинец И. М. Абстрактная
схема метода вариаций и необходимые условия экстремума // Изв. АН СССР. Сер. матем. —
1985. —Т. 49, № 1.—С. 141-159.
367. Калашников А. Л. Порядковая регуляризация некорректной задачи
оптимального управления. — В сб.: Дифференциальные и интегральные уравнения, вып. 2. Горький:
Изд-во Горьковск. ун-та, 1978, С. 124-129.
368. Калихман И. Л. Сборник задач по математическому программированию. — М.:
Высшая школа, 1975.
369. Калихман И. Л., Войтенко М. А. Динамическое программирование в
примерах и задачах. — М.: Высшая школа, 1979.
370. Канторович Л. В. Экономический расчет наилучшего использования
ресурсов.— М.: Изд-во АН СССР, 1960.
371. Канторович Л. В., Акилов Г. П. Функциональный анализ.—М.: Наука,
1977.
372. Капустин В. Ф. Практические занятия по курсу математического
программирования.— Л.: Изд-во ЛГУ, 1976.
373. К а р л и н С. Математические методы в теории игр, программировании и
экономике.— М.: Мир, 1964.
374. Карманов В. Г. Математическое программирование. — М.: Физматлит, 2000.
375. Карманов В. Г., Федоров В. В. Моделирование в исследовании операций. —
М.: Твема, 1996.
376. Карташев А. П., Рождественский Б. Л. Обыкновенные
дифференциальные уравнения и основы вариационного исчисления,—М.: Наука, 1986.
377. Катковник В. Я. Линейные оценки и стохастические задачи оптимизации. —
М/. Наука, 1976.
378. Киндерлерер Д., Стампаккья Г. Введение в вариационные неравенства
и их приложения. М.: Мир, 1983.
СПИСОК ЛИТЕРАТУРЫ
801
379. Кирин Н. Е. Методы последовательных оценок в задачах оптимизации
управляемых систем. — Л.: Изд-во ЛГУ, 1975.
380. Кирин Н. Е., Морозкин Н. Д. Численные приближения экстремалей
управляемых динамических систем. — Уфа: Изд-во Башкирск. ун-та, 1989.
381. Кирин Н. Е. Методы оценивания и управления в динамических системах.—
Санкт-Петербург, Изд-во С.-Петербургск. ун-та, 1993.
382. Киселев Ю. Н. Линейная теория быстродействия с возмущениями.—М.: Изд-во
МГУ, 1986.
383. Киселев Ю. Н. Оптимальное управление.—М.: Изд-во Московск. ун-та, 1988.
384. Киселев Ю. Н. Быстросходящиеся алгоритмы решения линейной задачи
быстродействия. Кибернетика. Киев, 1990, № 6, С. 47-57, 62.
385. Киселев Ю. Н. Построение точных решений для нелинейной задачи
быстродействия специального вида. Фундаментальная и прикладная математика. 1997, Т. 3, № 3,
С. 847-868.
386. Кларк Ф. Оптимизация и негладкий анализ. — М.: Наука, 1988.
387. Коваленко А. Г. Элементы выпуклого векторного программирования. —
Куйбышев: Изд-во Куйбышевск. ун-та, 1990.
388. Ковалев М. М. Дискретная оптимизация.—Минск: Изд-во БГУ, 1977.
389. Ковач М. Непрерывный аналог итеративной регуляризации градиентного типа.—
Вестник Московск. ун-та. Серия 15, Вычислит, матем. и киберн., 1979, № 3, С. 36-42.
390. Ковач М. О сходимости метода обобщенных барьерных функций. Вестник
Московск. ун-та. Серия 15. Вычисл. матем. и кибернетика, 1981, № 1, С. 40-45.
391. Кокурин М. Ю. Операторная регуляризация и исследование нелинейных
монотонных задач. Йошкар-Ола, Изд-во Марийского ун-та, 1998.
392. Коллатц Л., Крабе В. Теория приближений. Чебышевские приближения и
их приложения. —М.: Наука, 1978.
393. Колмогоров А. Н., Фомин С. В. Элементы теории функций и
функционального анализа.—М.: Наука, 1976.
394. Колпакова Э. В., Колпаков В. И. Восстановление математических
объектов по неполно заданной информации. Саратов: Изд-во Саратовск. технич. ун-та, 1995.
395. Комков В. Теория оптимального управления демпфированием колебаний простых
упругих систем. — М.: Мир, 1975.
396. К о н н о в И. В. Методы недифференцируемой оптимизации. — Казань, Изд-во
Казанского ун-та, 1993.
397. К о н н о в И. В. Методы решения конечномерных вариационных неравенств. Казань:
Изд-во «ДАС», 1998.
398. Кор бут А. А,, Финкельштейн Ю. Ю. Дискретное программирование. —
М.: Наука, 1969.
399. Корнейчук Н. П. Экстремальные задачи теории приближения.—М.: Наука,
1976.
400. Коробов В. И., Скляр Г. М. Мин-проблема моментов Маркова и
быстродействие. Сибирский матем. журнал, 1991, Т. 32, № 1, С. 60-71.
401. Коростелев А. П. Стохастические рекуррентные процедуры (локальные
свойства).— М.: Наука, 1984.
402. Короткий А. И., Осипов Ю. С. Аппроксимация в задачах позиционного
управления параболическими системами. Прикладн. матем. и механика, 1978, 42, № 4, С. 599-
605.
403. Короткий А. И. Восстановление управлений и параметров динамических систем
при неполной информации. Известия вузов. Математика, 1998, N.11, С. 47-55.
404. Костоусова Е. К. О параллельном алгоритме решения задачи наблюдения для
одномерного волнового уравнения. Сб. работ «Алгоритмы и программные средства
параллельных вычислений». Екатеринбург, Изд-во УрО РАН, 1995, С. 101-114.
405. Кочиков И. В., Курамшина Г. М„ Пентин Ю. А., Ягола А. Г.
Обратные задачи колебательной спектроскопии. М.: Изд-во Московск. ун-та, 1993.
406. Коша А. Вариационное исчисление. — М.: Высшая школа, 1983.
407. Кравчук А. С. Вариационные и квазивариационные неравенства в механике.
М.: МГАПИ, 1997.
408. Край ко А. Н. Вариационные задачи газовой динамики. —М.: Наука, 1979.
409. Краснов М. Л., Макаренко Г. И., Киселев А. И. Вариационное
исчисление. Задачи и упражнения. — М.: Наука, 1973.
410. Краснощекое П. С, Петров А. А. Принципы построения моделей.—
М.: Фазис, ВЦ РАН, 2000.
411. Красовский Н. Н. Теория управления движением.—М.: Наука, 1968.
412. Красовский Н. Н. Игровые задачи о встрече движений. — М.: Наука, 1970.
802
СПИСОК ЛИТЕРАТУРЫ
413. Красовский Н. Н., Субботин А. И. Позиционные дифференциальные
игры. — М..: Наука, 1974.
414. Красовский Н. Н. Управление динамической системой. Задача о минимуме
гарантированного результата.—М.: Наука, 1985.
415. Крейн М. Г., Нудельман А. А. Проблема моментов Маркова и
экстремальные задачи. М.: Наука, 1973.
416. Крейн С. Г. Линейные уравнения в банаховом пространстве. М.: Наука, 1971.
417. Кротов В. Ф., Букреев В. 3., Гурман В. И. Новые методы
вариационного исчисления в динамике полета. — М.: Машиностроение, 1969.
418. Кротов В. Ф., Гурман В. И. Методы и задачи оптимального управления.—
М.: Наука, 1973.
419. Кружков С. Н. Нелинейные уравнения первого порядка и связанные с ними
дифференциальные игры. — Успехи матем. наук, 1969, 24, № 2, С. 227-228.
420. Крылов Н. В. Управляемые процессы диффузионного типа. — М.: Наука, 1977.
421. Кряжимский А. В., Осипов Ю. С. О моделировании управления в
динамической системе. Известия АН СССР, сер. техн. киберн., 1983, N° 2, С. 51—60.
422. Кузнецов Ю. Н., Кузубов В. И., Волощенко А. Б. Математическое
программирование. — М.: Высшая школа, 1980.
423. Кукушкин Н. С, Морозов В. В. Теория неантагонистических игр. — М.:
Изд-во МГУ, 1984.
424. Кулешов А. А. О задаче оптимального управления для одной смешанной
системы. Вестник Московск. ун-та, Серия 15. Вычислит, матем. и кибернетика, 1982, № 3,
С. 15-20.
425. Кулешов А, А. Разностная аппроксимация и регуляризация одной задачи
оптимального управления процессом, описываемым эллиптическим уравнением. Докл. АН СССР,
1983, Т. 269, № 4, С. 809-813.
426. Куликов А, Н., Фазы лов В. Р. Выпуклая оптимизация с заданной
точностью. Ж. вычислит, матем. и матем. физики, 1990, Т. 30, № 5, С. 663-671.
427. Куликовский Р. Оптимальные и адаптивные процессы в системах
автоматического регулирования.— М.: Наука, 1967.
428. Куратовский К- Топология, Т. 1, М.: Мир, 1966.
429. Куржанский А. Б., Осипов Ю. С. К задаче об управлении с ограниченными
фазовыми координатами. Прикладная матем. и механика, 1968, Т. 32, вып. 2, С. 194-202.
430. Куржанский А. Б., Осипов Ю. С. К задачам об управлении при стесненных
координатах. Прикладная матем. и механика, 1969, Т. 33, вып. 4, С. 705-719.
431. Куржанский А. Б. Управление и наблюдение в условиях неопределенности.—
М.: Наука, 1977.
432. Куржанский А. Б., Сивергина И. Ф. Метод гарантированных оценок и
задачи регуляризации для эволюционных систем. Ж. вычислит, матем. и матем. физики, 1992,
Т. 32, № 11, С. 1720-1733.
433. Куржанский М. А,, Потапов М. М., Разгулин А. В. Проекционная
схема метода прямых в задачах зонного управления и наблюдения для уравнения колебания
струны. Вестник Московск. ун-та, серия 15, Вычислит. Матем. и кибернетика, 1994, № 3,
С. 29-35. •
434. Кусраев А. Г., Кутателадзе С. С. Субдифференциальное исчисление.—
Новосибирск: Наука, 1987.
435. Кутателадзе С. С, Рубинов А. М. Двойственность Минковского и ее
приложения. — Новосибирск: Наука. Сибирское отделение, 1976.
436. Кухта К. Я., Кравченко В. П., Красно шапка В. А.
Качественная теория управляемых динамических систем с непрерывно-дискретными параметрами. Киев:
Наукова Думка, 1986.
437. Кюнци Г. П., Крелле В. Нелинейное программирование.—М.: Советское
радио, 1965.
438. Лаврентьев М. М. О некоторых некорректных задачах математической физики.
Новосибирск, изд-во СО АН СССР, 1962.
439. Лаврентьев М. М„ Романов В. Г.,' Шиш а теки й С. П. Некорректные
задачи математической физики и анализа. М.: Наука, 1980.
440. Лагунов В. Н. Введение в дифференциальные игры. — Вильнюс: Институт
матем. и кибернетики АН Литовской ССР, 1979.
441. Ладыженская О. А. Краевые задачи математической физики.—М.: Наука,
1973.
442. Ларичев О. И., Горвиц Г. Г. Методы поиска локального экстремума
овражных функций. М,: Наука, 1990.
СПИСОК ЛИТЕРАТУРЫ
803
443. Латтес Р., Лионе Ж. — Л. Метод квазиобращения и его приложения. М.:
Мир, 1970.
444. Лебедев В. И. Функциональный анализ и вычислительная математика. М.:
Изд-во Всероссийского ин-та научной и технической информации, 1994.
445. Левин А. М. О регуляризации вычисления нижних граней функционалов. Ж.
вычисл. матем. и матем. физики, 1984, Т. 24, № 8, С. 1123-1128.
446. Левин В. Л. Выпуклый анализ в пространствах измеримых функций и его
применение в математике и экономике. М.: Наука, 1985.
447. Левитин Е. С, Поляк Б. Т. Методы минимизации при наличии
ограничений.— Ж. вычислит, матем. и матем. физики, 1966, 6, № 5, С. 787-823.
448. Левитин Е. С. Теория возмущений в математическом программировании и ее
приложения. — М.: Наука, 1992.
449. Лейхтвейс К. Выпуклые множества. — М.; Наука, 1985.
450. Леонов А. С., Ягола А. Г. Можно ли решить некорректно поставленную
задачу без знания погрешностей данных? Вестник Московск. ун-та, серия 3, Физика, Астрономия,
1995, Т. 36, № 4, С. 28-33.
451. Леонов А. С. Функции нескольких переменных с ограниченной вариацией в
некорректных задачах. Ж. вычисл. матем. и матем. физики, 1996, Т. 36, № 9, С. 35-49.
452. Леонов А. С, Ягола А. Г. Метод L-кривой всегда дает неустранимую
систематическую ошибку. Вестник Московск. ун-та, серия 3, Физика, астрономия, 1997, № 6,
С. 17-19.
453. Леонов А. С. Замечания о полной вариации функций нескольких переменных и
многомерном аналоге принципа выбора Хелли. Математ. заметки, 1998, Т. 63, № 1, С. 69-80.
454. Леонов А. С, Ягола А. Г. Адаптивные регуляризующие алгоритмы для
решения некорректных задач. Вестник Московск. ун-та, серия 3, Физика, астрономия, 1998,
№ 2, С. 62-63.
455 Леонов А. С. О многомерных некорректных задачах с разрывными решениями.
Сибирск. матем. журн., 1998, Т. 39, № 1, С. 74-86.
456. Лесин В. В., Лисовец Ю. П. Основы методов оптимизации. М.: Изд-во
Московск. авиацион. института, 1998.
457. Ли Э. Б., Маркус Л. Основы теории оптимального управления. — М.: Наука,
1972.
458. Лионе Ж. — Л., Мадженес Э. Неоднородные граничные задачи и их
приложения. М.: Мир, 1971.
459. Лионе Ж—Л. Оптимальное управление системами, описываемыми уравнениями
с частными производными.—М.: Мир, 1972.
460. Лионе Ж — Л. Управление сингулярными распределенными системами. М.:
Наука,' 1987.
461 Лисковец О. А. Дискретные схемы в методе регуляризации для некорректных
экстремальных задач. -ДАН СССР, 1979, 248, № 6, С. 1299-1303.
462. Лисковец О. А. Вариационные методы решения неустойчивых задач. Минск:
Наука и техника, 1981.
463. Литвинов В. Г. Оптимизация в эллиптических граничных задачах с
приложениями к механике. М.: Наука, 1987.
464 Лопес Саура И. Разностная аппроксимация и регуляризация одной
параболической задачи оптимального управления. Вестник Московск. ун-та, Серия 15. Вычислит, матем.
и кибернетика, 1987, № 3, С. 35-42.
465. Лоран П. — Ж. Аппроксимация и оптимизация. — М.: Мир, 197b.
46б! Лотов А. В. Введение в экономико-математическое моделирование. —М.: Наука,
1984. '
467 Л у б ы ш е в Ф. В. Разностные аппроксимации задач оптимального управления
системами, .описываемыми уравнениями в частных производных. Уфа: Изд-во Башкирского
ун-та, 1999.
468. Лукьянов А. Т., Неронов В С Об оптимальном управлении одной
параболически-гиперболической системой. —Изв. АН Казахской ССР, 1976, № 6. С. ''-<*>•
469. Лурье К. А. Оптимальное управление в задачах математической физики. — М.:
Наука, 1975. ,, „ .__,
470 Лэсдон Л. С. Оптимизация больших систем. —М.: Наука, 1975
47L Ляшенко И. Н„ Карагодова Е. А., Черникова Н. В., Шор Н. J.
Линейное и нелинейное программирование —Киев: Вища школа, 1975
472. Магарил-Ильяев Г. Г., Тихомиров В. М. Выпуклый анализ и его
ппиложения М.: Изд-во Эдиториал УРСС, 2000.
473 Макаров В. Л., Рубинов А. М. Математическая теория экономической
динамики и равновесия. — М.: Наука, 1973.
804
СПИСОК ЛИТЕРАТУРЫ
474. Максимов В. И. Конечномерная аппроксимация входов в гиперболических
вариационных неравенствах. Ж. вычислит, матем. и матем. физики, 1995, Т. 35, № 11, С. 1615-
1629.
475. Малков В. П., Угодчиков А. Г. Оптимизация упругих систем. М.: Наука,
1981.
476. Мансимов К. Б. Особые управления в системах с запаздыванием. Баку, Изд-во
«ЭЛМ», 1999.
477. Марданов М. Д. Некоторые вопросы математической теории оптимальных
процессов в системах с запаздываниями. — Баку: Изд-во Азербайдж. ун-та, 1987.
478. Маркин Е. А., Стрекаловский А. С. О существовании, единственности
и устойчивости решения для одного класса динамических систем, описывающих химические
процессы. — Вестник Московск. ун-та. Серия 15, Вычислит, матем. и киберн., 1977, № 4,
С. 3-11.
479. Маркин Е. А. О задаче уклонения для одного класса динамических систем,
описываемых волновым уравнением. — Кибернетика, 1978, № 1, С. 132-133.
480. Map чу к Г. И., Шайдуров В. В. Повышение точности решений разностных
схем. — М.: Наука, 1979.
481. Марчук Г. И. Методы вычислительной математики.—М.: Наука, 1980.
482. Марчук Г. И. Математическое моделирование в проблеме окружающей среды.
М.: Наука, 1982.
483. Марчук Г. И. Сопряженные уравнения и анализ сложных систем. М.: Наука,
Физматлит, 1992.
484. Марчук Г. И., А го ш ко в В. И., Шутя ев В. П. Сопряженные уравнения
и методы возмущений в нелинейных задачах математической физики. М.: Наука, Физматлит,
1993.
485. Матвеев А. С. Вариационный анализ в задачах оптимизации систем с
распределенными параметрами и вектор-функции множества. Сибирск. матем. журнал, 1990, Т. 31,
№ 6, С. 127-141.
486. Матвеев А. С, Якубович В. А. Абстрактная теория оптимального
управления. — Санкт — Петербург: Изд-во С.-Петербургск. ун-та, 1994.
487. М е е р о в М. В. Исследование и оптимизация многосвязных систем управления. —
М.: Наука, 1986.
488. Мезенцев А. В. Сборник задач по теории оптимального управления. — М.:
Изд-во МГУ, 1980.
489. Меркулов В. И. Управление движением жидкости. Новосибирск: Наука, 1981.
490. Меченов А. С. Регуляризованный метод наименьших квадратов. М.: Изд-во
Московск. ун-та, 1988.
491. Мину М. Математическое программирование,—М.: Наука, 1990.
492. Михайлов В. П. Дифференциальные уравнения в частных производных. — М.:
Наука, 1983.
493. Михалевич В. С, Кукса А. И. Методы последовательной оптимизации в
дискретных сетевых задачах оптимального распределения ресурсов.—М.: Наука, 1983.
494. Михалевич В. С, Трубин В. А., Шор Н. 3. Оптимизационные
задачи производственно-транспортного планирования: модели, методы, алгоритмы.—М.: Наука,
1986.
495. Михалевич В. С, Тупал А. М„ Норкин В. И. Методы невыпуклои
оптимизации.—М.: Наука, 1987.
496. М и х л и н С. Г. Вариационные методы в математической физике. М.: ГИТТЛ, 1957.
497. Моисеев Н. Н. Численные методы в теории оптимальных систем. — М.: Наука,
1971.
498. Моисеев Н. Н. Элементы теории оптимальных систем. — М.: Наука. 1975.
499. Моисеев Н. Н„ Иванилов Ю. П., Столярова Е. М. Методы
оптимизации.— М.: Наука. 1978.
500. Моисеев Н. Н. Математические задачи системного анализа. — М.: Наука, 1981.
50L Молодцов Д. А. Устойчивость принципов оптимальности. М.: Наука, 1987.
502. Мордухович Б. Ш. Методы аппроксимаций в задачах оптимизации и
управления. — М.: Наука, 1988.
503. Мороз А. И. Курс теории систем, — М.: Высшая школа, 1987. _
504! Морозкин Н. Д. О сходимости конечномерных приближений в задаче
оптимального одномерного нагрева с учетом фазовых ограничений. Ж. вычисл. матем. и матем.
физики, 1996, Т. 36, № 10, С. 12-22.
505. Морозкин Н. Д. Оптимальное управление процессами нагрева с учетом фазовых
ограничений. Уфа: Изд-во Башкирск. ун-та, 1997.
СПИСОК ЛИТЕРАТУРЫ
805
506. Морозов В. А., Медведев Н, В., Иваницкий А, Ю. Регуляризация
задач алгебры и анализа. — М,: Изд-во МГУ, 1987.
507. Морозов В. А. Методы регуляризации неустойчивых задач. М.: Изд-во Московск.
ун-та, 1987.
508. Морозов В. А. Регулярные методы решения некорректно поставленных задач.—
М.: Наука, 1987.
509. Морозов В. А.,' Гребеников А. И. Методы решения некорректно
поставленных задач. Алгоритмический аспект. М.: Изд-во Московск. ун-та, 1992.
510. Морозов В. А. Регуляризация при больших помехах. Ж. вычисл. матем. и матем.
физики, 1996, Т. 36, № 9, С. 13-21.
511. Морозов В. В., Сухарев А. Г., Федоров В. В. Исследование операций
в задачах и упражнениях. — М.: Высшая школа, 1986.
512. Морозов С. Ф., Сумин В. И. Оптимизация нелинейных систем теории
переноса. Ж. вычисл. матем. и матем. физики, 1979, Т. 19, № 1, С. 99-111.
513. Москаленко А. И. Методы нелинейных отображений в оптимальном
управлении.— Новосибирск: Наука, 1983.
514. Мосолов П. П., Мясников В. П. Механика жесткопластических сред.
М.: Наука, 1981.
515. Муравей Л. А. Задача управления границей для эллиптических уравнений.
Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1998, № 3, С. 7-13.
516. Муртаф Б. Современное линейное программирование. — М.: Мир, 1984.
517. Мухачева Э. А., Рубинштейн Г. Ш. Математическое
программирование.— Новосибирск: Наука, 1987.
518. Назин А. В., Позняк А. С. Адаптивный выбор вариантов. Рекуррентные
алгоритмы.—М.; Наука, 1986.
519 Наттерер Ф. Математические аспекты компьютерной томографии. М.: Мир,
1990.
520. Недич А. Трехшаговый метод проекции градиента для задачи минимизации.
Известия вузов. Математика, 1993, № 10, С. 32-37.
521. Недич А. Непрерывный метод проекции градиента третьего порядка для задач
минимизации. Дифференц. уравнения, 1994, Т. 30, № 11, С. 1914-1922.
522. Н е'д и ч А. Регуляризованный непрерывный метод проекции градиента для задач
минимизации с неточными исходными данными. Вестник Московскю ун-та, Серия 15, Вычислит,
матем. и кибернетика, 1994, № 1, С. 3-10.
523. Немировский А. С, Юдин Д. Б. Сложность задач и эффективность
методов оптимизации, — М.: Наука, 1979.
524. Неронов В. С. Оптимальное управление системами с распределенными
параметрами. Алма-Ата, Изд-во Казахск. ун-та, 1989.
525. Нестеров Ю. Е. Эффективные методы в нелинейном программировании.—М.:
Радио и связь, 1989.
526. Нефедов В. Н. Методы регуляризации многокритериальных задач
оптимизации.— М.: Изд-во Московск. авиацион. ин-та, 1984.
527. Нефедов В. Н. Полиномиальные задачи оптимизации. Ж. вычисл. матем. и
матем. физики, 1987, Т. 27, № 5, С. 661-675.
528. Никольский М. С. Об одном способе убегания. —ДАН СССР, 1974, 214, № 2,
С. 287-290.
529. Никольский М. С. О квазилинейной задаче убегания.—ДАН СССР, 1975,
221, № 3, С. 539-542.
530 Никольский М. С. Первый прямой метод Л. С. Понтрягина в дифференциальных
играх, —М.: Изд-во МГУ, 1984.
531. Никольский М. С. О задаче управления линейной системой с нарушениями.
Докл. АН СССР, 1986, Т. 287, № 6, С. 1317-1320.
532 Никольский М. С. Об одной минимаксной задаче управления. Труды матем.
ин-та АН СССР, 1988, Т. 185, С. 187-191.
533. Никольский М. С, Силин Д. Б. О наилучшем приближении выпуклого
компакта элементами аддиала. Труды матем. ин-та АН СССР, 1995, Т. 211, С. 338-354.
534. Никольский С. М. Курс математического анализа. — М.: Наука, 1973, Т. 1,2.
535. Никольский С. М. Приближение функций многих переменных и теоремы
вложения. — М.: Наука, 1977.
536. Новикова Н. М. Стохастические методы численного решения выпуклых
вариационных неравенств. Ж вычисл. матем. и матем. физики, 1988, Т. 28, № 2, С. 186-197.
537. Новикова Н. М. Итеративная регуляризация метода штрафов для
бесконечномерной задачи поиска стохастической седловой точки. Ж. вычисл. матем. и матем. физики,
1991, Т. 31, №9, С. 1289-1304.
806
СПИСОК ЛИТЕРАТУРЫ
538. Новикова Н. М. Некоторые методы численного решения непрерывных выпуклых
стохастических задач оптимального управления. Ж. вычисл. матем. и матем. физики, 1991,
Т. 31, № 11, С. 1605-1618.
539. Новикова Н. М. Дискретные и непрерывные задачи оптимизации. — М.: Изд-во
вычисл. центра РАН, 1996.
540. Новоженов М. М., Сумин В. И., Сумин М. И. Методы оптимального
управления системами математической физики. Горький: Изд-во Горьковск. ун-та, 1986.
541. Ногин В. Д., Протодьяконов И. О., Евлампиев И. И. Основы
теории оптимизации.—М.: Высшая школа, 1986.
542. Нурминский Е. А. Численные методы решения детерминированных и
стохастических минимаксных задач. — Киев: Наукова думка, 1979.
543. О бен Ж. — П., Эк ланд И. Прикладной нелинейный анализ. М.: Мир, 1988.
544. Овсянников А. А. Моделирование и оптимизация динамики пучков заряженных
частиц. Ленинград, Изд-во Ленинградск. ун-та, 1990.
545. Олейников В. А„ Зотов Н. С., Пришвин А. М. Основы оптимального
и экстремального управления.—М.: Высшая школа, 1969.
546. Олейников В. А., Зотов Н. С, Пришвин А. М„ Соловьев Н. В.
Сборник задач и примеров по теории автоматического управления. — М.: Высшая школа, 1969.
547. Ольхофф Н. Оптимальное проектирование конструкций. М.: Мир, 1981.
548. Оревков Ю. П. Методы оптимальных решений; — М.: Изд-во МГУ, 1986.
549. Орловский С. А. Проблемы принятия решений при нечеткой исходной
информации. М.: Наука, 1981.
550. Ортега Д., Рейнболдт В. Итерационные методы решения нелинейных
систем уравнений со многими неизвестными. —М.: Мир, 1975.
551. Осипов Ю. С. К теории дифференциальных игр в системах с распределенными
параметрами. —ДАН СССР, 1975, 223, № 6, С. 1314-1317.
552. Осипов Ю. С, Охезин С. П. К теории дифференциальных игр в
параболических системах. — ДАН СССР, 1976, 226, № 6, С. 1267-1270.
553. Осипов Ю. С. Позиционное управление в параболических системах. —
Прикладная матем. и механика, 1977, 41, № 2, С. 195-201.
554. Осипов Ю. С, Охезин С. П. К теории позиционного управления в
гиперболических системах. — ДАН СССР, 1977, 233, № 4, С. 551-554.
555. Осипов Ю. С, Суетов А. П. Существование оптимальных форм
эллиптических систем. Случай краевых условий Дирихле. Свердловск: Изд-во УрО АН СССР,
1990.
556. Осипов Ю. С, Кряжимский А. В., Максимов В. И. Задачи
динамической регуляризации для систем с распределенными параметрами. Свердловск: Изд-
во ИММ УрО АН СССР, 1991.
557. Осипов Ю. С, Васильев Ф. П., Потапов М. М. Основы метода
динамической регуляризации. М.: Изд-во Московск. ун-та, 1999.
558. Островский Г. М., Волин Ю. М. Моделирование сложных химико-
технологических схем. — М.: Химия, 1975.
559. Охезин С. П. Дифференциальная игра сближения - уклонения для
параболической системы при интегральных ограничениях на управления игроков. — Прикладная матем.
и механика, 1977, 41, № 2, С. 202-209.
560. Охезин С. П. Об управлении гиперболической системой в условиях
неопределенности.— Прикладная матем. и механика, 1978, 42, № 4, С. 606-612.
561. Павловский Ю. Н„ Смирнова Т. Г. Проблема декомпозиции в
математическом моделировании. М.: Фазис, 1998.
562. Панин В. М. Методы конечных штрафов с линейной аппроксимацией ограничений.
Кибернетика, 1984, ч. 1, № 2, С. 44-50, ч. 2, № 4, С. 73-81.
563. Пахомов В. Ф. Нелинейное программирование. —М.: Изд-во МГУ, 1982.
564. Первозванский А. А„ Гайцгорн В. Г. Декомпозиция, агрегирование и
приближенная оптимизация.—М.: Наука, 1979.
565. Перевозчиков А. Г. О сложности вычисления глобального экстремума в
одном классе многоэкстремальных задач. // Ж вычисл. матем. и матем. физики, 1990, Т. 30,
№ 3, С. 379-387.
566. Петров А. А., Поспелов И. Г., Шананин А. А. Опыт математического
моделирования экономики.—М.: Энергоатомиздат, 1996.
567. Петров А. А., Поспелов И. Г., Шананин А. А. От Госплана
к неэффективному рынку: математический анализ российских экономических структур. The
Edwin Mellen Press, Lewiston, New York, 1999, 400 p.
568. Петров Ю. П. Вариационные методы теории оптимального управления. —
Ленинград Энергия, 1977.
СПИСОК ЛИТЕРАТУРЫ
807
569. Петросян Л. А. Дифференциальные игры преследования. — Л.: Изд-во Ленин-
градск. ун-та, 1977.
570. Петросян Л. А., Томский Г. В. Динамические игры и их приложения.—
Л.: Изд-во ЛГУ, 1982.
571. Петросян Л. А., Зенкевич Н. А., Семина Е. А. Теория игр. М.:
Высшая школа, 1998.
572. Пин яги на О. В., Фазы лов В. Р. Метод выпуклого программирования
с заданной абсолютно-относительной погрешностью. Ж. вычислит, матем. и матем. физики,
1998, Т. 38, № 8, С. 1247-1254.
573. Плотников В. И. Теоремы существования оптимизирующих функций для
оптимальных систем с распределенными параметрами. — Изв. АН СССР. Сер. матем., 1970,
34, №3, С. 689-711.
574. Плотников В. И. Необходимые и достаточные условия оптимальности и условия
единственности оптимизирующих функций для управляемых систем общего вида. — Изв. АН
СССР. Сер. матем., 1972, 36, № 3, С. 652-679.
575. Плотников В. И., Сумин В. И. Оптимизация объектов с
распределенными параметрами, описываемых системами Гурса — Дарбу.—Ж. вычислит, матем. и матем.
физики, 1972, 12, № 1, С. 61-77.
576. Плотников В. И., Сумин В. И. Оптимизация распределенных систем в
лебеговом пространстве. Сибирск. матем. журнал, 1981, Т. 22, № 6, С. 142-161.
577. Плотников В. И„ Сумин М, И. О построении минимизирующих
последовательностей в задачах управления системами с распределенными параметрами. Ж. вычисл.
матем. и матем. физики, 1982, Т. 22, № 1, С. 49-56.
578. Плотников В. И., Шашков В. М., Кузенков О. А. Оптимальное
управление линейными сосредоточенными системами. Нижний Новгород: Изд-во Нижегородск.
ун-та, 1993.
579. Погорелов А. Г. Обратные задачи нестационарной химической кинетики, М.:
Наука, 1988.
580. Подиновский В. В., Гаврилов В. М. Оптимизация по последовательно
применяемым критериям. — М.: Советское радио, 1975.
581. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения
многокритериальных задач.— М.: Наука, 1982.
582. Полак Э. Численные методы оптимизации. Единый подход.—М.: Мир, 1974.
583. Половинкин Е. С. Необходимые условия оптимальности с дифференциальными
включениями. Труды МИРАН, 1995, Т. 211, С. 387-400.
584. Половинкин Е. С. Сильно выпуклый анализ. Матем. сб., 1996, Т. 187, № 2,
С. 103-130.
585. Половинкин Е. С. О сильно выпуклых множествах и сильно выпуклых
функциях. Итоги науки и техники, Серия «Современная математика и ее применения». М.:
1999, Т. 61, С. 66-138.
586. Поляк Б. Т. Введение в оптимизацию.—М.: Наука, 1983.
587. Понтрягин Л. С, Болтянский В. Г., Гамкрелидзе Р. В.,
Мищенко Е. Ф. Математическая теория оптимальных процессов. — М.: Наука, 1976.
588. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. — М.: Наука,
1983.
589. Понтрягин Л. С. Избранные научные труды, Т. II, М.: Наука, 1988.
590. Попов Н. М. Приближенное решение многокритериальных задач с
функциональными ограничениями. // Ж. вычисл. матем. и матем. физики, 1986, Т. 26, № 10, С. 1468-1481.
591. Попов Н. М. К оцениванию информационной сложности глобальной оптимизации
и глобального решения уравнений. // Ж. вычисл. матем. и матем. физики, 1992, Т. 32, № 12,
С. 1853-1868.
592. Попов Н. М. О некоторых принципах оптимальности в многокритериальных
задачах. Проблемы математической физики. Сб. работ факультета ВМиК МГУ. М.: Изд-во
«Диалог МГУ», 1998, С. 217-224.
593. Потапов М. М. Разностная аппроксимация и регуляризация задач
оптимального управления системами Гурса — Дарбу. — Вестник Московск. ун-та. Серия 15, Вычислит,
матем. и киберн., 1978, № 2, С. 17-26.
594. Потапов М. М. Разностная аппроксимация максиминных задач для систем
Гурса — Дарбу при наличии фазовых ограничений. — Вестник Московск. ун-та. Сер. вычислит,
матем. и киберн., 1978, № 4, С. 28-36.
595. Потапов М. М. Об аппроксимации по функционалу максиминных задач со
связанными переменными.—Ж. вычислит, матем. и матем. физики, 1979, 19, № 3, С. 610-
621.
808
СПИСОК ЛИТЕРАТУРЫ
596. Потапов М. М. Аппроксимация экстремальных задач в математической физике
(гиперболические уравнения). М.: Изд — во Московск. ун-та, 1985.
597. Потапов М. М., Разгулин А. В., Шамеева Т. Ю. Аппроксимация
и регуляризация задачи оптимального управления для уравнения типа Шредингера. Вестник
Московск. ун-та, Серия 15. Вычислит, матем. и кибернетика, 1987, № 1, С. 8-13.
598. Потапов М. М. Метод прямых в задачах граничного управления и наблюдения
для гиперболического уравнения с краевыми условиями второго и третьего рода. Вестник
Московск. ун-та, серия 15, Вычислит, матем. и кибернетика, 1996, № 2, С. 35-41.
599. Потапов М. М. О сильной сходимости разностных аппроксимаций для задач
граничного управления и наблюдения для волнового уравнения. Ж. вычислит, матем. и матем.
физики, 1998, Т. 38, № 3, С. 387-397.
600. Потапов М. М. Устойчивый метод решения линейных уравнений с неравномерно
возмущенным оператором. Докл. РАН, 1999, Т. 365, № 5, С. 1-3.
601. Практикум по линейному программированию. Под ред. Черемных Ю. Н., Павловой
Л. С, Суторминой Е. И.—М.: Изд-во МГУ, 1984.
602. Пропой А. И. Элементы теории оптимальных дискретных процессов. — М.:
Наука, 1973.
603. Пшеничный Б. Н., Данилин Ю. М. Численные методы в экстремальных
задачах.—М.: Наука, 1975.
604. Пшеничный Б. Н. Выпуклый анализ и экстремальные задачи. — М.: Наука,
1980.
605. Пшеничный Б. Н. Необходимые условия экстремума.—М.: Наука, 1982.
606. Пшеничный Б. Н. Метод линеаризации.—М.: Наука, 1983.
607. Разгулин А. В. Применение проекционно-разностного метода в задачах
наблюдения и управления для уравнения типа Шредингера. Вестник Московск. ун-та, серия 15,
Вычислит, матем. и кибернетика, 1996, № 1, С. 42-52.
608. Разумихин Б. С. Физические модели и методы теории равновесия в
программировании и экономике.—М.: Наука, 1975.
609. Р а й т у м У. Е. Задачи оптимального управления для эллиптических уравнений.
Рига: Зинатне, 1989.
610. Растригин Л. А. Системы экстремального управления.—М.: Наука, 1974.
611. Раушенбах Б. В., Токарь Е. Н. Управление ориентацией космических
аппаратов. — М.: Наука, 1974.
612. Рейклейтис Г., Рейвиндран А., Рэгсдел К. Оптимизация в технике.
В двух книгах. — М.: Мир, 1986.
613. Ржевский С. В. Монотонные методы выпуклого программирования. — Киев:
Наукова думка, 1993.
614. Рихтер К. Динамические задачи дискретной оптимизации. — М.: Радио и связь,
1985.
615. Рождественский Б. Л., Яненко Н. Н. Системы квазилинейных уравнений
и их приложения к газовой динамике. — М.: Наука, 1978.
616. Ройтенберг Я- Н. Автоматическое управление. — М.: Наука, 1978.
617. Рокафеллар Р. Выпуклый анализ.—М.: Мир, 1973.
618. Романов В. Г. Обратные задачи математической физики. М.: Наука, 1984.
619. Романов В. Г., Кабанихин С. И. Обратные задачи геоэлектрики. М.:
Наука, 1991.
620. Романовский И. В. Алгоритмы решения экстремальных задач. — М.: Наука,
1977.
621. Русо в В. Д., Бибикова Ю. Ф., Я гол а А. Г. Восстановление изображений
в электронно-микроскопической авторадиографии поверхности. М.: Энергоатомиздат, 1991.
622. Рязанцева И. П. О выборе параметра регуляризации при решении выпуклых
экстремальных задач. Ж. вычисл. матем. и матем. физики, 1997, Т. 37, № 7, С. 895-896.
623. Рязанцева И. П., Дунцева Е. А. Об одном непрерывном методе решения
выпуклых экстремальных задач. Дифференциальные уравнения, 1998, Т. 34, № 4, С. 480-485.
624. С а а т и Т. Целочисленные методы оптимизации и связанные с ними экстремальные
проблемы.—М.: Мир, 1973.
625. Савелова Т. И. Об устойчивом суммировании рядов Фурье. Ж. вычисл. матем.
и матем. физики, 1979, Т. 19, № 4, С. 830-835.
626. Савелова Т. И. О связи метода регуляризации А. Н. Тихонова для некорректных
уравнений типа свертки с решением краевых задач. Ж. вычисл. матем. и матем. физики, 1982,
Т. 22, № 6, С. 1316-1322.
627. Савелова Т. И., Бухараева Т. И. Представления группы SU(2) и их
применения. М.: Изд-во МИФИ, 1996.
СПИСОК ЛИТЕРАТУРЫ
809
628. Савелова Т. И. Примеры решеня некорректно поставленных задач. М.: Изд-во
Московск. инженерно-физич. ин-та, 1999.
629. Садовничий В. А. Теория операторов. М.: Высшая школа, 1999.
630. Самарский А. А. Введение в теорию разностных схем. — М.: Наука, 1971.
631. Самарский А. А., Гулин А. В. Устойчивость разностных схем —М.:
Наука, 1973.
632. Самарский А. А., Попов Ю. П. Разностные схемы газовой динамики. —
М.: Наука, 1975.
633. Самарский А. А., Андреев В. Б. Разностные методы для эллиптических
уравнений. — М.: Наука, 1976.
634. Самарский А. А. Теория разностных схем. — М.: Наука, 1977.
635. Самарский А. А., Николаев Е. С. Методы решения сеточных уравнений. —
М.: Наука, 1978.
636. Самсонов С. П. Восстановление выпуклого множества по его опорной функции
с заданной точностью. // Вестник Московск. ун-та, серия 15, Вычислит, матем. и киберн.,
1983, № 1, С. 68-71.
637. Сатимов Н. Ю. Об одном способе убегания в дифференциальных играх —
Матем. сборник, 1976, 99 (141), № 3, С. 380-393.
638. Се а Ж. Оптимизация. Теория и алгоритмы. — М.: Мир, 1973.
639. Сергиенко И. В., Лебедева Т. Т., Рощин В. А. Приближенные
методы решения дискретных задач оптимизации. — Киев: Hay ко в а думка, 1980.
640. Серовайский С. Я. Вариационные неравенства в оптимизационных задачах.
Алма-Ата, Изд-во Казахск. ун-та, 1981.
641. Сиразетдинов Т. К. Оптимизация систем с распределенными параметрами.—
М.: Наука, 1977.
642. Сиразетдинов Т. К. Устойчивость систем с распределенными параметрами.
Новосибирск: Наука, 1987.
643. Сиразетдинов Т. К. Методы решения многокритериальных задач синтеза
технических систем. М.: Машиностроение, 1988.
644. С к а р и н В. Д. Об одном подходе к анализу несобственных задач линейного
программирования. Ж. вычислит, матем. и матем. физики, 1986, Т. 26, № 3, С. 439-448.-
645. Слугин С. Н., Шашков В. М., Миронов А. В. Топологический
достаточный признак существования оптимального управления динамической системой. —
Известия вузов. Математика, 1977, № 10 (185), С. 134-137.
646. Смирнов Е. Я. Стабилизация программных движений. С.-Петербург, Изд-во
С.-Петербургск. ун-та, 1997.
647. Смольяков Э. Р. Теория антагонизмов и дифференциальные игры. М.: Эдиториал
УРСС, 2000.
648. Соболев С. Л. Некоторые применения функционального анализа в
математической физике. Изд-во СО АН СССР, 1962.
649. Соболев С. Л. Введение в теорию кубатурпых формул.—М.: Наука, 1974.
650. Современное состояние теории исследования операций. Сб. работ / Под ред. Н. Н.
Моисеева.— М.: Наука, 1979.
651. Соловьева С. И. Итерационный метод решения обратной задачи для нелинейного
дифференциального уравнения. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн.,
1998, № 4, С. 14-16.
652. Солодовников А. С. Введение в линейную алгебру и линейное
программирование.— М.: Просвещение, 1966.
653. С р о ч к о В. А. Вычислительные методы оптимального управления. — Иркутск:
Изд-во Иркутск, ун-та, 1982.
654. Срочко В. А. Вариационный принцип максимума и методы линеаризации в
задачах оптимального управления.—Иркутск: Изд-во Иркутск, ун-та, 1989.
655. Срочко В. А. Методы линейно-квадратичных аппроксимаций для решения задач
оптимального управления. Оптимизация, управление, интеллект. Иркутск: Изд-во Иркутск,
ун-та, ВЦ СО РАН, 1995, № 1, С. 110-135.
656. Срочко В. А. Итерационные методы решения задач оптимального управления.
М.: Физмат лит, 2000.
657. Старосельский Л. А., Шелудько Г. А., Кантор Б. Я. Об одной
реализации метода оврагов с адаптацией величины овражного шага по экспоненциальному
закону. Ж. вычисл. матем. и матем. физики, 1968, Т. 8, № 5, С. 1161-1167.
658. Старостенко В. И. Устойчивые численные методы в задачах гравиметрии.
Киев: Наукова думка, 1978.
659. Страхов В. Н. О построении оптимальных по порядку приближенных решений
линейных условно-корректных задач. Дифференц. уравнения. 1973, Т. 9, № 10, С. 1862-1874.
810
СПИСОК ЛИТЕРАТУРЫ
660. Стрекаловский А. С. К проблеме глобального экстремума // ДАН СССР. —
1987. —Т. 292, № 5. —С. 1062-1066.
661. Стрекаловский А. С. Условие глобальной оптимальности в задачах D. С.
программирования. Иркутск: Изд-во Иркутск, ун-та, 1997. Серия «Оптимизация и управление»,
вып. 1.
662. Стронгин Р. Г. Численные методы в многоэкстремальных задачах управления. —
М.: Наука, 1978.
663. Субботин А. И., Ченцов А. Г. Оптимизация гарантии в задачах
управления.— М.: Наука, 1981.
664. Сумин В. И. Об обосновании градиентных методов для распределенных задач
оптимального управления. Ж. вычисл. матем. и матем. физики, 1990, Т. 30, № 1, С. 3-21.
665. Сумин В. И. О достаточных условиях устойчивости существования глобальных
решений управляемых краевых задач. Дифференц. уравнения, 1990, Т. 26, .№ 12, С. 2097-
2109.
666. Сумин В. И. Функциональные вольтерровы уравнения в теории оптимального
управления распределенными системами. Нижний Новгород: Изд-во Нижегородск. ун-та, 1992.
667. Сумин М. И. О первой вариации в теории оптимального управления системами
с распределенными параметрами. Дифференц. уравнения, 1991, Т. 27, № 12, С. 2179-2181.
668. Сумин М. И. Субоптимальное управление системами с распределенными
параметрами: минимизирующие последовательности, функция значений. Ж. вычисл. матем. и матем.
физики, 1997, Т. 37, № 1, С. 23-41.
669. Сумин М. И. Субоптимальное управление системами с распределенными
параметрами: свойства нормальности, субградиентный двойственный метод. Ж. вычисл. матем. и
матем. физики, 1997, Т. 37, № 2, С. 162-178.
670. Сухарев А. Г., Тимохов А. В., Федоров В. В. Курс методов
оптимизации.—М.: Наука, 1986.
671. Сухарев А. Г. Минимаксные алгоритмы в задачах численного анализа.-—М.:
Наука, 1989.
672. Сухинин М. Ф. Полутейлоровские снизу отображения и достаточные условия
экстремума. Матем. сборник, 1991, № 6, С. 877-891.
673. Сухинин М. Ф. Избранные главы нелинейного анализа. М.: Изд-во ун-та Дружбы
народов, 1992.
674. Сухинин М. Ф. К вопросу о беллмановском подходе в теории оптимального
управления. Матем. заметки, 1999, Т. 66, вып. 5, С. 770-776.
675. Сухинин М. Ф. Численное решение некоторых экстремальных задач. М.: Изд-во
ун-та дружбы народов, 2000.
676. Схрейвер А. Теория линейного и целочисленного программирования. В двух
томах. —М.: Мир, 1991.
677. Тадумадзе Т. А. Некоторые вопросы качественной теории оптимального
управления. — Тбилиси: Изд-во Тбилисского ун-та, 1983.
678. Та наев В. С, Шкурба В. В. Введение в теорию расписаний. — М.: Наука,
1975.
679. Танана В. П. Методы решения операторных уравнений. М.: Наука, 1981.
680. Танана В. П., Ре к ант М. А., Янченко С. И. Оптимизация методов
решения операторных уравнений. Екатеринбург, Изд-во Уральского ун-та, 1987.
681. Тарасова В. П. Метод стратегии противника в задачах оптимального поиска. —
М.: Изд-во Московск. ун-та, 1988.
682. Темам Р. Математические задачи теории пластичности. М.: Наука, 1991.
683. Тер-Крикоров А. М. Оптимальное управление и математическая экономика. —
М.: Наука, 1977.
684. Тетерев А. Г. Методы одномерной оптимизации. — Куйбышев: Изд-во Куйбы-
шевск. ун-та, 1983.
685. Тетерев А. Г. Линейные задачи оптимизации. — Куйбышев: Изд-во Куйбы-
шевск. ун-та, 1983.
686. Тимохов А. В. Математические модели экономического воспроизводства. — М.:
Изд-во МГУ, 1982.
687. Тихомиров В. М. Некоторые вопросы теории приближений. — М.: Изд-во МГУ,
1976.
688. Тихомиров В. М. Рассказы о максимумах и минимумах. —М.: Наука, 1986.
689. Тихомиров В. М. Выпуклый анализ. Теория приближений.Итоги науки и
техники. Серия Современные проблемы математики, фундаментальные направления, том 14,
М.: Изд-во ВИНИТИ, 1987.
СПИСОК ЛИТЕРАТУРЫ
811
690. Тихомиров В. М. Теория экстремума и экстремальные задачи классического
анализа. Итоги науки и техники. Серия «Современная математика и ее приложения», Т. 65.
М.: Изд-во ВИНИТИ, 1999, С. 188-258.
691. Тихонов А. Н., Васильев Ф. П., Потапов М. М., Юрий А.
Д. О регуляризации задач минимизации на множествах, заданных приближенно. — Вестник
Московск. ун-та. Серия 15, Вычислит, матем. и киберн., 1977, № 1, С. 4-19.
692. Тихонов А. Н., Васильев Ф. П. Методы решения некорректных
экстремальных задач. — В кн.: Banach Center Publications. V. 3. Mathematical models and numerical
methods. Warszawa, 1978, p. 297-342.
693. Тихонов A. H., Гончарский А. В., Степанов В. В., Ягола А.
Г. Регуляризующие алгоритмы и априорная информация. М.: Наука, 1983.
694. Тихонов А. Н., Васильева А. Б., Свешников А. Г. Дифференциальные
уравнения. — М.: Наука, 1985.
695. Тихонов А. Н., Арсенин В. Я. Методы решения некорректных задач.—
М.: Наука, 1986.
696. Тихонов А. Н., Гончарский А. В., Степанов В. В., Ягола А.
Г. Численные методы решения некорректных задач. М.: Наука, 1990.
697. Тихонов А. Н., Леонов А. С, Ягола А. Г. Нелинейные некорректные
задачи. М.: Наука, Физмат лит, 1995.
698. Тихонов А. Н., Самарский А. А. Уравнения математической физики. —
М.: Изд-во Московск. ун-та, 1999.
699. Толстоногов А. А. Дифференциальные включения в банаховом пространстве.
Новосибирск: Наука, 1986.
700. Толстошеий А. Ю. О задаче оптимального управления процессами,
описываемыми одной смешанной системой. Вестник Московск. ун-та, Серия 15. Вычислит, матем. и
кибернетика, 1986, № 4, С. 19-24.
701. Толстых В. К. Прямой экстремальный подход для оптимизации систем с
распределенными параметрами. Донецк: Изд-во «Юго — Восток», 1997.
702. Тонков Е. Л. О множестве управляемости линейного уравнения.
Дифференциальные уравнения, 1983, Т. 19, № 2, С. 269-278.
703. Тонков Е. Л. Задачи управления показателями Ляпунова. Дифференц. уравнения,
1995, Т. 31, № 10, С. 1682-1686.
704. Трауб Дж., Вожьняковский X. Общая теория оптимальных алгоритмов.—
М.: Мир, 1983.
705. Треногий В. А. Функциональный анализ. М.: Наука, 1980.
706. Троицкий В. А. Оптимальные процессы колебаний механических систем. — Л.:
Машиностроение, 1976.
707. Троицкий В. А., Петухов Л. В. Оптимизация упругих тел. М.: Наука,
1982.
708. Туйкина С. Р. Численные методы решения некоторых обратных задач динамики
сорбции. Вестник Московск. ун-та, серия 15, Вычисл. матем. и киберн., 1998, № 4, С. 16-19.
709. Уайлд Д. Дж. Методы поиска экстремума.—М.: Наука, 1967.
710. Уздемир А. П. Динамические целочисленные задачи оптимизации в
экономике.— М.: Наука, Физматлит, 1995.
711. Ульм С. Ю. Методы декомпозиции для решения задач оптимизации. — Таллин:
Изд-во Валгус, 1979.
712. Уонэм М. Линейные многомерные системы управления. — М.: Наука, 1980.
713. Урясьев С. П. Адаптивные алгоритмы стохастической оптимизации и теории
игр. М.: Наука, 1990.
714. Успенский А. Б., Федоров В. В. Вычислительные аспекты метода
наименьших квадратов при анализе и планировании регрессионных экспериментов. — М.: Изд-
во Московск. ун-та, 1975.
715. Усынин Г. Б., Карабасов А. С, Чирков В. А. Оптимизационные
модели реакторов на быстрых нейтронах. М.: Атомиздат, 1981.
716. Уткин В. И. Скользящие режимы в задачах оптимизации и управления. — М.:
Наука, 1981.
717. Уткин В. И., Орлов Ю. В. Теория бесконечномерных систем управления
на скользящих режимах. М.: Наука, 1990.
718 Фазы лов В. Р. Отыскание минимакса с заданной точностью. Ж. вычислит, матем.
и матем. физики, 1994, Т. 34, № 5, С. 793-799.
719. Федоренко Р. П. Приближенное решение задач оптимального управления. —
М.: Наука, 1978.
720. Федоров В. В. Численные методы максимина. — М.: Наука, 1979.
812
СПИСОК ЛИТЕРАТУРЫ
721. Фиакко А., Мак-Кормик Г. Нелинейное программирование. Методы
последовательной безусловной минимизации. — М.: Мир, 1972.
722. Филиппов А. Ф. О некоторых вопросах оптимального регулирования. //
Вестник МГУ, серия 1, Матем. и механика, 1959, № 2, С. 25-38.
723. Филиппов А. Ф. Дифференциальные уравнения с разрывной правой частью.
М.: Наука, 1985.
724. Флеминг У., Ришел Р. Оптимальное управление детерминированными и
стохастическими системами.—М.: Мир, 1978.
725. Форд Л., Фалкерсон Д. Потоки в сетях. — М.: Мир, 1966.
726. Формальский А. М. Управляемость и устойчивость систем с ограниченными
ресурсами. — М.: Наука, 1974.
727. Фурасов В. Д. Устойчивость движения, оценки и стабилизация.—М.: Наука,
1977.
728. Фурасов В. Д. Устойчивость и стабилизация дискретных процессов. М.: Наука,
1982.
729. Фурасов В. Д. Моделирование плохоформализуемых процессов. М.: Изд-во
«Academia», 1997.
730. Фурсиков А. В. Оптимальное управление распределенными системами. Теория
и приложения. Новосибирск: Научная книга, 1999.
731. Хай лов Е. Н. Об экстремальных управлениях однородной билинейной системы,
управляемой в положительном ортанте. Труды матем, ин-та РАН, 1998, Т. 220, С. 217-235.
732. X а п а е в М. М. Дифференциальные уравнения, содержащие сингулярные
многообразия в задачах управления и минимизации. Дифференц. уравнения, 1995, Т. 31, № 11,
С. 1886-1892.
733. Харатишвили Г. Л., Мачаидзе 3. А., Маркозашвили Н. И.,
Тадумадзе Т. А. Абстрактная вариационная теория и ее применения к оптимальным
задачам с запаздываниями. — Тбилиси: Мецниереба, 1973.
734. Харатишвили Г. Л., Тадумадзе Т. А. Нелинейные оптимальные системы
управления с переменными запаздываниями. Матем. сб., 1978, Т. 107, вып. 4, С. 613-633.
735. Харди Г. Г., Литтльвуд Дж. Е., Полна Г. Неравенства. — М.: Изд-во
иностран. лит-ры, 1948.
736. Хачиян Л. Г. Полиномиальные алгоритмы в линейном программировании. //
Ж. вычисл. матем. и матем. физики, 1980, Т. 20, № 1, С. 51-68.
737. Хедли Дж. Нелинейное и динамическое программирование. — М.: Мир, 1967.
738. Химмельблау Д. Прикладное нелинейное программирование.—М.: Мир, 1975.
739. Хоменюк В. В. Оптимальные системы управления.—М.: Наука, 1977.
740. Хромова Г. В. Об оценке погрешности метода регуляризации Тихонова для
интегральных уравнений с ядром Грина. Вестник Московск. ун-та, серия 15, Вычисл. матем.
и киберн., 1992, № 4, С. 22-27.
741. Хромова Г. В. Приближающие свойства резольвент дифференциальных
операторов в задаче приближения функций и их производных. Ж. вычисл. матем. и матем. физики,
1998, Т. 38, № 7, С. 1036-1043.
742. Хромова Л. Н. Об одном методе минимизации с кубической скоростью
сходимости.— Вестник Московск. ун-та. Серия 15, Вычислит, матем. и киберн., 1980, № 3, С. 52-56.
743. Ху Т. Целочисленное программирование и потоки в сетях.—М.: Мир, 1974.
744. Цирлин А. М., Балакирев В. С, Дудников Г. Е. Вариационные
методы оптимизации управляемых объектов.—М.: Энергия, 1976.
745. Цирлин А. М. Методы усредненной оптимизации и их приложения. М.:
Физмат лит, 1997.
746. Цурков В. И. Декомпозиция в задачах большой размерности. — М.: Наука, 1981.
747. Цурков В. И., Литвинчев И. С. Декомпозиция в динамических задачах
с перекрестными связями. — М.: Физмат лит, 1994.
748. Ч е н ц о в А. Г. Конечно-аддитивные меры и релаксации экстремальных задач.
Екатеринбург: Наука, 1993.
749. Ч е р е м н ы х Ю. Н. Качественное исследование оптимальных траекторий
динамических моделей экономики.—М.: Изд-во Московск. ун-та, 1975.
750. Ч е р е м н ы х Ю. Н. Анализ поведения траекторий динамики
народнохозяйственных моделей. — М.: Наука, 1982.
751. Черемных Ю. Н. Математические модели развития народного хозяйства.—
М.: Изд-во МГУ, 1986.
752. Черников С. Н. Линейные неравенства.—М.: Наука, 1968.
753. Черноусько Ф. Л., Баничук Н. В. Вариационные задачи механики и
управления. — М.: Наука, 1973.
СПИСОК ЛИТЕРАТУРЫ 813
754. Черноусько Ф. Л., Колмановский В. Б. Оптимальное управление при
случайных возмущениях. — М.: Наука, 1978.
755. Черноусько Ф. Л., Меликян А. А. Игровые задачи управления и
поиска. — М.: Наука, 1978.
756. Черноусько Ф. Л., Акуленко Л. Д., Соколов Б. Н. Управление
колебаниями. — М.: Наука, 1980.
757. Чечкин А. В. Математическая информатика. М.: Наука, 1991.
758. Ч и р и ч Н. Т. О регуляризованном методе линеаризации выпуклой функции на
многогранном множестве при наличии погрешностей в исходных данных. // Вестник Московск.
ун-та, серия 15, Вычислит, матем. и кибернетика, 1987, № 2, С. 20-25.
759. Численные методы условной оптимизации // Сб. работ под ред. Гилл Ф., Мюррэй У.—
М.: Мир, 1977.
760. Чичинадзе В. К. Решение невыпуклых нелинейных задач оптимизации. — М.:
Наука, 1983.
761. Шамеева Т. Ю. Об оптимизации в задаче о распространении светового пучка
в неоднородной среде. Вестник Московск. ун-та, Серия 15. Вычислит, матем. и кибернетика,
1985, № 1, С. 12-19.
762. III а н а н и н А. А. Об агрегации функций спроса. Экономика и матем методы.
1989, № 2.
763. Шананин А. А. Двойственность для задач обобщенного программирования
и вариационные принципы в моделях экономического равновесия. Докл. РАН, 1999, Т. 366,
№ 4, С. 462-464.
764. Шафиев Р. А. Псевдообращение операторов и некоторые применения. Баку:
Изд-во «ЭЛМ», 1989.
765. Шевченко В. Н. Качественные вопросы целочисленного программирования.
М.: Физмат лит, 1995.
766. Шепилов М. А. О методе обобщенного градиента для экстремальных задач. //
Ж- вычислит, матем. и матем. физики, 1976, Т. 16, № 1, С. 242-247.
767. Ш и к и н Е. В. Линейные пространства и отображения. — М: Изд-во Московск.
ун-та, 1987.
768. Шилов Г. Е. Математический анализ (функции нескольких вещественных
переменных). — М.: Наука, 1972.
769. Шор Н. 3. Методы минимизации недифференцируемых функций и их
приложения.— Киев: Наукова думка, 1979.
770. Шор Н. 3., С т е ц е н к о С. И. Квадратичные экстремальные задачи и
недифференцируемая оптимизация. Киев: Наукова думка, 1989.
771. Щеглов А. Ю. О равномерном приближении решения одной обратной задачи
методом типа квазиобращения. Матем. заметки, 1993, Т. 53, вып. 2, С. 168-174.
772. Эдварде Р. Функциональный анализ. М.: Мир, 1969.
773. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы.—М.:
Мир, 1979.
774. Эльстер К.-X., Рейнгардт Р., Шойбле М., Донат Г. Введение в
нелинейное программирование.—М.: Наука, 1985.
775. Юдин Д. Б., Г о л ь ш т е й н Е. Г. Линейное программирование. М.: Физматгиз,
1963.
776. Юдин Д. Б., Гольштейн Е. Г. Линейное программирование. Теория, методы
и приложения.—М.: Наука, 1969.
777. Юдин Д. Б. Задачи и методы стохастического программирования. — М.: Советское
радио, 1979.
778. Юнусов М. К. Оптимальное управление системами в некоторых процессах
тепло-массопереноса. Душанбе: Дониш, 1987.
779. Юрий А. Д. Об одной оптимальной задаче типа Стефана. Докл. АН СССР, 1980,
Т. 251, №6, С. 1317-1321.
780. Якубович В. А. К абстрактной теории оптимального управления. — Сибирск.
матем. журн., I, 1977, 18, № 3, С. 685-707; II, 1978, 19, № 2, С. 436-460; III, 1979, 20, № 4,
С. 385-410; IV, 1979, 20, № 5, С. 1131-1159.
781. Янг Л. Лекции по вариационному исчислению и теории оптимального
управления.— М.: Мир, 1974.
782. Я х н о В. Г. Обратные задачи для дифференциальных уравнений упругости.
Новосибирск: Наука, 1990.
783. Ячимович М. Итеративная регуляризация одного варианта метода условного
градиента. Вестник Московск. ун-та, Серия 15, Вычисл. матем. и кибернетика, 1980, №4,
С. 13-19.
814
СПИСОК ЛИТЕРАТУРЫ
784. Avdonin S. A., Ivanov S. A. Families of Exponentials. The Method of Moments
in Controllability Problems for Distributed Parameter Systems. Cambridge University Press. 1995.
785. Bertsekas D. P. Nonlinear Programming. Athena Scientific, 1999.
786. Boukari D., Fiacco A.V. Survey of penalty, exact-penalty and multiplier methods
from 1968 to 1993. Optimization, 1995, V. 32, pp. 301-334.
787. Bulirsch R., Montrone F., Pesch H. J. Abort landing in the presence of
windshear as a minimax optimal control problem. I Necessary conditions, II Multiple shooting and
homotopy. J. Optim. Theory Appl., 1991, V. 70, № 1, pp. 1-23, № 2, pp. 223-254.
788. D e n i s о v A. M., L a m о s H. An inverse problem for a nonlinear mathematical
model of sorption dynamics with mixed-diffusional kinetics. J. Inverse and Ill-posed Problems. 1996,
V. 4, № 3, pp. 191-202.
789. Dontchev A. L., Zolezzi T. Well-Posed Optimization Problems. Springer —
Verlag, Berlin —Heidelberg, 1993.
790. F a 11 о r i n i H. O. Optimal control of nonlinear systems: convergence of suboptimal
controls. I. Lecture Notes in Pure and Applied Mathematics, 108, Marsel Dekker, New York, 1987.
791. Fiacco A. V. Introduction to sensitivity and stability analysis in nonlinear
programming. New York, Academic Press, 1983.
792. Qrossmann C, Kaplan A. A. Strafmethoden und modifizierte Lagrangefunk-
tionen in der nichtlinearen Optimierung. Teubner, Leipzig, 1979.
793. Qrossmann C, Те mo J. Numerik der nichtlinearen Optimierung. Teubner,
Stuttgart, 1997.
794. Henkin G., Shananin A. Bernstein theorems and Radon transform. Application
to the theory of production functions. Translation of mathematical monographs, 1990,, V. 81.
795. Hiriart — Urruty J. В., Lemareshal С Convex Analysis and Minimization
Algorithms, V. I, II. Springer, 1993.
796. Hoffman A. J. On approximate solutions of systems of linear inequalities. Journ. of
Research of Nat. Bureau of Standarts, 1952, V. 49, pp. 263-265.
797. J a i A. El, P r i с h a r d A. J. Sensors and controls in the analysis of distributed
systems NY: J. Wiley and Sons, 1988.
798. Jankovic V., Jovanovic M. On contractibility of the operator I - iV/.
Matematicki Vesnik, 1997, V. 49, № 3-4, pp. 245-248.
799. Kaplan A., Tichatschke R. Stable Methods for Ill-Posed Variational Problems.
Berlin, Academie Verlag, 1994.
800. Kaplan A., Tichatschke R. Multi-step-prox-regularization method for solving
convex variational problems. Optimization, 1995, V. 33, pp. 287-319.
801. Krabs W. Optimization and Approximation. John Wiley & Sons, 1979.
802. Krabs W. On moment theory and controllability of one-dimensional vibrating systems
and heating processes. Springer — Verlag, Berlin, Heidelberg, 1992.
803. L e m a i r e B. The proximal algorithm. Intern. Series of Numer. Mathem., 1989, vol. 87,
Basel; Birkhauser Verlag, 1989, pp. 73-87.
804. Lions J. — L. Exact controllability, stabilization and perturbations for distributed
systems. SIAM Rev., 1988, V. 30, № 2, p. 1-68.
805. Malanowski K. Regularity of solutions in stability analysis of optimization and
optimal control problems. Control and Cybernetics, 1994, V. 23, № 1-2, pp. 61-86.
806. Mangasarian O. L. Nonlinear Programming, SIAM, Philadelphia, 1994.
807. Nesterov Y., Nemirovskii A. Interior-Point Polynomial Algorithms in Convex
Programming. Philadelphia, 1994.
808. Osipov Yu. S., Kryazhimskii A. V. Inverse problems for ordinary differential
equation: dynamical solutions. Gordon and Breach, London, 1995.
809. Petrosjan L. A. Differential Games of Pursuit. World Scientific, Singapore, London,
1993.
810. Petrov A. A., Shananin A. A. Intestability conditions, income distribution
and social structures. Lecture notes in economicsand mathematic systems, V. 453, 1998.
811. Polak E. Optimization: Algorithms and consistent approximations. Springer, New
York, 1997.
812. Prilepko A. I., Orlovsky D. G., Vasln I. A. Methods for solving inverse
problems in mathematical physics. Marsel Dekker, 2000.
813. Rockafellar R. T. Monotone Operators and the proximal point algorithm, SIAM
J. Control and Optimisation, 1976, p. 877-898.
814. Rockafellar R. Т., Wets R. J. B. Variational Analysis. Springer. 1998.
815. Silin D. B. On Discontinuous Strategies in Optimal Control Problems. Journ.'of
Mathematical Systems, Estimation and Control, 1994, V. 4, № 2, pp. 205-217.
816. Strekalovsky A. S. Global optimality conditions for nonconvex optimization. Journ.
of Global Opt., 1998, V. 12, pp. 415-434.
СПИСОК ЛИТЕРАТУРЫ
815
817. Tikhonov A. N., Leonov A. S., Yagola A. Q. Nonlinear ill-posed
problems. Chapman and Hall, London, 1998.
818. Vasiliev O. V. Optimization methods. World Federation Publishers Company, ICN,
Atlanta, USA, 1996.
819. Zelikin M. I., Borisov V. F. Theory of Chattering Control with applications
to Astronautics. Robotics, Economics and Engineering. Birkhauser, Boston, 1994.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Антициклин 123
Аппроксимация экстремальных задач 710
— задач быстродействия 386, 750
— максиминных задач 775
со связанными множествами 779
Базис угловой точки 104
Базисная матрица 106
Базисные координаты угловой точки 104
— переменные 104
Вектор опорный 192
— собственно опорный 192
Верхний предел последовательности 47
множеств 342
Верхняя грань функции 12, 501
Гильбертов кирпич 533
Гиперплоскость 44, 148, 495
— опорная 192
— отделяющая 188
— собственно опорная 192
Градиент 53
Двойственные переменные 140, 226
Допустимое множество 13
Задача быстродействия 386
— двойственная 140, 226
— классического вариационного
исчисления 459
— Коши 379
— линейного программирования
вырожденная 120
двойственная 140, 229
каноническая 97
невырожденная 120
общая 95
основная (стандартная) 99
разрешимая 134
— максимизации 12, 51
— минимизации 11,45
второго типа 11, 13, 617
первого типа 11, 13, 617
— многоэкстремальная 315
— наблюдения 601
— неустойчивая (некорректно
поставленная) по аргументу 620
по функции 620
— обратная 704
— оптимального управления 385
автономная 386
с закрепленным временем 384
с закрепленным концом 384
со свободным концом 384
с подвижным концом 384
с фазовыми ограничениями 384,
430, 726
— с сильно согласованной постановкой 330
— с согласованной постановкой 329
— управления 595
— устойчивая по аргументу 620
по функции 620
Задачи взаимодвойственные 140, 602
— на безусловный экстремум 53
условный экстремум 58
Замыкание множества 152, 515
Зацикливание 121
Золотое сечение отрезка 17
Индекс квадратичной формы 72
отрицательный 72
положительный 72
Квадратичная форма (матрица)
неотрицательная 54
отрицательно определенная 54
положительно определенная 54
Конус 45
— Арутюнова 70, 76
— выпуклый 195
— двойственный (сопряженный) 195
— замкнутый 195
— критических направлений 68, 76
— Лагранжа 61, 64, 212
— неострый 45
— острый 45
— открытый 195
Координата базисная 104
— фазовая 379
Коразмерность подпространства 44
Коэффициент барьерный 349
— штрафной 325
Краевая задача принципа максимума 391
Критерий выпуклости функции 32, 36, 37,
160, 162, 163, 523
— оптимальности 35, 161, 186, 279, 308,
524
— сильной выпуклости функции 178, 179,
523
Лексикографическая задача минимизации
646
Лексикографически положительная симплекс
таблица 125
— положительный вектор 124
Лексикографический минимум 124
Лексикографическое правило 126
— упорядочивание векторов 124
симплекс-таблиц 125
Локальные методы 315
Луч 44
— открытый 44
Максимум глобальный (абсолютный) 12
— локальный 13
Малый лагранжиан 388
Метод барьерных функций 349
— блуждающих трубок 477
— возможных направлений 269, 548
— градиентный 235, 540
непрерывный 247
— Давидона — Флетчера — Пауэлла 307
— декомпозиции 473
— деления отрезка пополам 16
— динамической регуляризации 703
— золотого сечения 17
— искуственного базиса 132
— касательных 38
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
817
— квазиньютоновский 307
— квазирешений 659, 667
— классический 14, 53
— линеаризации 284
— локальных вариаций 478
— ломаных 24
— модифицированных функций Лагранжа
320
— моментов 605
— нагруженных функций 357
— невязки 655, 666
— непрерывный 247, 256
с переменной метрикой 309
— Ньютона 301, 551, 690
непрерывный 309
— овражный 242
— оптимальный 20
— пассивный 21
оптимальный 22
— покоординатного спуска 310
— покрытий 28, 315
— последовательный 21
оптимальный 23
— проекции градиента 249, 543, 670
непрерывный 256, 697
субградиента 258
— проксимальный 281, 549, 685
— равномерного перебора 29
— регуляризации 625, 733
— симметричный 19
— скорейшего спуска 235
— случайного поиска 368
без обучения 369
с обучением 369
— сопряженных градиентов 299
направлений 293, 550
— стабилизации 639, 663
— стохастической аппроксимации 371
— тяжелого шарика 248
— условного градиента 264, 545, 678
— Фибоначчи 23
— штрафных функций 324, 551
Минимальный корень уравнения 359
Минимум глобальный (абсолютный) 12, 501
— лексикографический 124
— локальный 11
Множество аффинное 149
— выпуклое 148
— замкнутое 46, 152, 502, 515
— компактное 46, 502, 517
— Лебега 48
— многогранное (полиэдр) 151, 222
— ограниченное 46, 502
— открытое 152, 515
— относительно компактное 502
слабо компактное 504
— секвенциально компактное 517
— слабо компактное 504
— счетно-компактное 517
Множитель Лагранжа 59, 60, 64, 211
Модуль выпуклости 206
точный 207
— непрерывности множеств по Хаусдорфу
746
Момент времени конечный 384
закрепленный 384
начальный 384
закрепленный 384
Надграфик (эпиграф) функции 166
Наибольшее (максимальное) значение
функции 13
Наименьшее (минимальное) значение
функции 9
Направление возможное 167
убывания 269
— рецессивное 171
— сопряженное 296
Непрерывность семейства множеств по
Хаусдорфу 795
Неравенство вариационное 162
— Гронуолла 406, 407
— Йенсена 159
— Коши — Буняковского 44, 495
— треугольника 44
— Хоффмана 334
Нижний предел последовательности 47
Нижняя грань функции 10, 501
Норма вектора 44
— оператора 496
Нормальное решение 645, 706
Нормальный вектор гиперплоскости 149, 495
Оболочка аффинная 151
— выпуклая 155
Ограничения активные 64, 212
— интегральные 387
— корректные 333
— пассивные 64, 212
— поточечные 386
— типа неравенств 63
равенств 59
— фазовые 384
Окрестность множества 515
— точки 46, 501, 515
Оператор линейный 496
— ограниченный 496
— проектирования 184
— проксимальный 278
— регуляризирующий 631, 662, 677, 684,
690
— самосопряженный 496
— симметричный 520
— сопряженный 496
Ортант неотрицательный 151
Отделимость множеств 188, 533
сильная 188, 534
собственная 188
строгая 188
Отображение 494
— дифференцируемое 519
— многозначное 201
выпуклозначное 201
замкнутое (непрерывное сверху) 201
компактное 201
монотонное 201
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
Антициклин 123
Аппроксимация экстремальных задач 710
— задач быстродействия 386, 750
— максиминных задач 775
со связанными множествами 779
Базис угловой точки 104
Базисная матрица 106
Базисные координаты угловой точки 104
— переменные 104
Вектор опорный 192
— собственно опорный 192
Верхний предел последовательности 47
множеств 342
Верхняя грань функции 12, 501
Гильбертов кирпич 533
Гиперплоскость 44, 148, 495
— опорная 192
— отделяющая 188
— собственно опорная 192
Йадиент 53
юйственные переменные 140, 226
Допустимое множество 13
Задача быстродействия 386
— двойственная 140, 226
— классического вариационного
исчисления 459
— Коши 379
— линейного программирования
вырожденная 120
двойственная 140, 229
каноническая 97
невырожденная 120
общая 95
основная (стандартная) 99
разрешимая 134
— максимизации 12, 51
— минимизации 11, 45
второго типа 11, 13, 617
первого типа 11, 13,617
— многоэкстремальная 315
— наблюдения 601
— неустойчивая (некорректно
поставленная) по аргументу 620
по функции 620
— обратная 704
— оптимального управления 385
автономная 386
с закрепленным временем 384
с закрепленным концом 384
со свободным концом 384
с подвижным концом 384
с фазовыми ограничениями 384,
430, 726
— с сильно согласованной постановкой 330
— с согласованной постановкой 329
— управления 595
— устойчивая по аргументу 620
по функции 620
Задачи взаимодвойственные 140, 602
— на безусловный экстремум 53
условный экстремум 58
Замыкание множества 152, 515
Зацикливание 121
Золотое сечение отрезка 17
Индекс квадратичной формы 72
отрицательный 72
положительный 72
Квадратичная форма (матрица)
неотрицательная 54
отрицательно определенная 54
положительно определенная 54
Конус 45
— Арутюнова 70, 76
— выпуклый 195
— двойственный (сопряженный) 195
— замкнутый 195
— критических направлений 68, 76
— Лагранжа 61, 64, 212
— неострый 45
— острый 45
— открытый 195
Координата базисная 104
— фазовая 379
Коразмерность подпространства 44
Коэффициент барьерный 349
— штрафной 325
Краевая задача принципа максимума 391
Критерий выпуклости функции 32, 36, 37,
160, 162, 163, 523
— оптимальности 35, 161, 186, 279, 308,
524
— сильной выпуклости функции 178, 179,
523
Лексикографическая задача минимизации
646
Лексикографически положительная симплекс
таблица 125
— положительный вектор 124
Лексикографический минимум 124
Лексикографическое правило 126
— упорядочивание векторов 124
симплекс-таблиц 125
Локальные методы 315
Луч 44
— открытый 44
Максимум глобальный (абсолютный) 12
— локальный 13
Малый лагранжиан 388
Метод барьерных функций 349
— блуждающих трубок 477
— возможных направлений 269, 548
— градиентный 235, 540
непрерывный 247
— Давидона — Флетчера — Пауэлла 307
— декомпозиции 473
— деления отрезка пополам 16
— динамической регуляризации 703
— золотого сечения 17
— искуственного базиса 132
— касательных 38
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
817
— квазиньютоновский 307
— квазирешений 659, 667
— классический 14, 53
— линеаризации 284
— локальных вариаций 478
— ломаных 24
— модифицированных функций Лагранжа
320
— моментов 605
— нагруженных функций 357
— невязки 655, 666
— непрерывный 247, 256
с переменной метрикой 309
— Ньютона 301, 551, 690
непрерывный 309
— овражный 242
— оптимальный 20
— пассивный 21
оптимальный 22
— покоординатного спуска 310
— покрытий 28, 315
— последовательный 21
оптимальный 23
— проекции градиента 249, 543, 670
непрерывный 256, 697
субградиента 258
— проксимальный 281, 549, 685
— равномерного перебора 29
— регуляризации 625, 733
— симметричный 19
— скорейшего спуска 235
— случайного поиска 368
без обучения 369
с обучением 369
— сопряженных градиентов 299
направлений 293, 550
— стабилизации 639, 663
— стохастической аппроксимации 371
— тяжелого шарика 248
— условного градиента 264, 545, 678
— Фибоначчи 23
— штрафных функций 324, 551
Минимальный корень уравнения 359
Минимум глобальный (абсолютный) 12, 501
— лексикографический 124
— локальный 11
Множество аффинное 149
— выпуклое 148
— замкнутое 46, 152, 502, 515
— компактное 46, 502, 517
— Лебега 48
— многогранное (полиэдр) 151, 222
— ограниченное 46, 502
— открытое 152, 515
— относительно компактное 502
слабо компактное 504
— секвенциально компактное 517
— слабо компактное 504
— счетно-компактное 517
Множитель Лагранжа 59, 60, 64, 211
Модуль выпуклости 206
точный 207
— непрерывности множеств по Хаусдорфу
746
Момент времени конечный 384
закрепленный 384
начальный 384
закрепленный 384
Надграфик (эпиграф) функции 166
Наибольшее (максимальное) значение
функции 13
Наименьшее (минимальное) значение
функции 9
Направление возможное 167
убывания 269
— рецессивное 171
— сопряженное 296
Непрерывность семейства множеств по
Хаусдорфу 795
Неравенство вариационное 162
— Гронуолла 406, 407
— Йенсена 159
— Коши — Буняковского 44, 495
— треугольника 44
— Хоффмана 334
Нижний предел последовательности 47
Нижняя грань функции 10, 501
Норма вектора 44
— оператора 496
Нормальное решение 645, 706
Нормальный вектор гиперплоскости 149, 495
Оболочка аффинная 151
— выпуклая 155
Ограничения активные 64, 212
— интегральные 387
— корректные 333
— пассивные 64, 212
— поточечные 386
— типа неравенств 63
равенств 59
— фазовые 384
Окрестность множества 515
— точки 46, 501, 515
Оператор линейный 496
— ограниченный 496
— проектирования 184
— проксимальный 278
— регуляризирующий 631, 662, 677, 684,
690
— самосопряженный 496
— симметричный 520
— сопряженный 496
Ортант неотрицательный 151
Отделимость множеств 188, 533
сильная 188, 534
собственная 188
строгая 188
Отображение 494
— дифференцируемое 519
— многозначное 201
выпуклозначное 201
замкнутое (непрерывное сверху) 201
компактное 201
монотонное 201
818
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ
— проксимальное 278
— субдифференциальное 201
Отрезок локализации минимума 21
Параллелепипед 151
Погрешность метода 20
Подпространство 44
— несущее 151
— сопровождающее 71, 76
Позином 231
Полупространство замкнутое 149
— открытое 149
Поляра 197
Последовательность максимизирующая 12,
501
— минимизирующая 10, 501
— ограниченная 46
Постоянная Липшица 25
— сильной выпуклости 176
Правило множителей Лагранжа 59, 62, 212,
533
Приведенная система угловой точки 107
— форма канонической задачи 108
целевой функции 107
Принцип максимума Понтрягина 377, 389
Проблема синтеза 467, 479
— моментов 605, 608, 609
Программирование выпуклое 217
— геометрическое 231
— динамическое 462
— квадратичное 288
— линейное 94
— полиномиальное 292
— равновесное 787
— стохастическое 371
Проекция точки на множество 182
Произведение множества на число 152
Производная вторая 54, 520
— Гато (слабая) 536
— обобщенная 497
— отображения 520
— первая 53
— по направлению 167
— Фреше (сильная) 520
Пространство банахово 494
рефлексивное 496
сопряженное 494
— гильбертово 494
— линейное 494
— метрическое 494, 501
— топологическое 515
Прямая линия 44
Прямое произведение множеств 194, 495
Размерность множества 150, 151
— подпространства 44
Разность множеств 151
Разрешающий (ведущий) элемент симплекс-
таблицы ПО
Расстояние от точки до множества 10
— между множествами по Хаусдорфу 743
Симплекс 155
Симплекс-метод 106
Симплекс-процесс 119
Симплекс-таблица 108
— лексикографически положительная 125
Система вполне управляемая 597
наблюдаемая 602
— наблюдаемая 602
— сопряженная 388
— управляемая 527
Скользящий режим 488
Слабая сходимость последовательности 495
След функции 499
Сложность метода полиномиальная 135
экспоненциальная 135
Стабилизатор 632
— слабый 635
Субградиент 197
Субдифференциал 197
Сумма множеств 151
Сфера 44
— единичная 44
Схема Беллмана 462
— Моисеева 474
Сходимость последовательности к точке 501,
516
ко множеству 10, 502
Теорема Антипина 256, 283
— Арутюнова 71, 76, 342, 343
— Вейерштрасса 11, 46, 137, 177, 207, 501,
505, 509, 510, 516
— Дубовицкого — Милютина 193
— Калмана 600
— Каратеодора 155
— Каруша — Джона 63
— Красовского 599
— Куна —Таккера 220, 224
— Мазура 506
— Моцкина 147
— Фар каша 145
— Хоффмана 334
Теоремы двойственности 141
Топология банахова пространства 516
слабая 516
— метрического пространства 515
Точка глобального (абсолютного) максимума
12, 501
минимума 9, 12, 501
— локального максимума 13, 58
минимума 11, 58
— множества анормальная 69
внешняя 152
внутренняя 152
граничная 152
изолированная 83, 86, 152
нормальная 67, 78
относительно внутренняя 157
предельная 501, 516
прикосновения 515
угловая 102
вырожденная 104
невырожденная 104
— , подозрительная на экстремум 14, 55,
60
— седловая 143, 218
— стационарная 55
— строгого локального максимума 13
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ g 19
минимума 12 — непрерывно-дифференцируемая 54
— экстремума 13 — овражная 241
Точность метода гарантированная 21 — ограниченная 12
наилучшая 21 сверху 12, 500, 501
Траектории левый конец 384 снизу 10, 500, 501
закрепленный 384 — опорная 173, 193
подвижный 384 — полунепрерывная сверху 47, 502
свободный 384 снизу 47, 502, 517
— правый коней 384 — псевдовыпуклая 175
закрепленный 384 — равномерно выпуклая 206
подвижный 384 — сильно выпуклая 176
свободный 384 квазивыпуклая 182
Траектория (решение) задачи Коши 381 — синтезирующая 467, 479
— оптимальная 386 — слабо непрерывная 504
Управление 379 полунепрерывная сверху 504
— оптимальное 386 снизу 504
— особое 401 — строго вогнутая 159
Уравнение Беллмана 464, 480 выпуклая 159
— Эйлера 460 равномерно выпуклая 207
Условие Вейерштрасса 461 унимодальная 12
— дополняющей нежесткости 64, 212, 389 — , удовлетворяющая условию Гельдера
— достаточное оптимальности 83, 486, 533 335
максимума 56 —, Липшица 25, 87
минимума 56, 83 — унимодальная 12
экстремума 56 — целевая 13
— Лежандра 460 — штрафная 323
— Люстерника 68 точная 332
— Мангасариана — Фрамовица 79 Четтеринг-режим 406
— необходимое оптимальности первого по- Числа Фибоначчи 23
рядка 55, 161, 523 Шар 44, 148
максимума первого порядка 55 — единичный 44
минимума первого порядка 55, 60, — открытый 44
161, 168, 339 Шкала состояний 474
второго порядка 67, 76, 523 Элементарная операция 474
— Слейтера 216
— трансверсальности 389, 461
— Эрдмана — Вейерштрасса 461
Формула конечных приращений 87, 522
Функции класса С1'1(Х) 87, 523
Функционал 494
Функция барьерная 348
— Беллмана 464, 480
— Вейерштрасса 461
— вогнутая 32, 159
— выпуклая 32, 159
— Гамильтона — Понтрягина 388
— гладкая 54
— дважды гладкая 54
дифференцируемая 54, 521
непрерывно дифференцируемая 54
— дифференцируемая 53, 521
— квадратичная 288, 511
— квазивыпуклая 174
— Кротова 470, 487
— кусочно-гладкая 379
— кусочно-непрерывная 379
— Лагранжа 59, 63, 142, 211, 533
модифицированная 319
нормальная 218
— Ляпунова 248, 707
— Минковского 173
— непрерывная 47, 502
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ
-числовая ось
[а, Ь] — {х G R: а < х ^ 6} — отрезок
{а, Ь) = \х G R: а < х < 6} — интервал
{а, Ь] = {a; G R: а <х ^. Ь}, [а, Ь) — {х е R: а ^ х < 6} — полуинтервалы
1п — n-мерное линейное пространство векторов-столбцов х =
\х"
хг — г'-ая координата вектора х G Rn, i = 1,..., п
хт — {х ,..., хп) — вектор-строка, полученная транспонированием вектора-столбца х
1 " . \ 1/р
Ив — ( 1С \х%\р) •14р<°°,\х\ = max lai'l — нормы вектора х bR"
Еп — n-мерное евклидово пространство, представляющее собой пространство R", осна-
п
щенное скалярным произведением {х, у) = ]Г) х1 у1
( = 1
\х\ = \х\2 = \х\Е" = ( ]С Iх*I) —евклидова норма вектора
Ч = 1 у
ег = (0,..., О, 1,0,.,., 0)т — вектор-столбец, г-я координата которого равна 1, остальные
координаты равны нулю, г = 1,..., п
{е1> • • ■) еп) — ортонормированный базис пространства Еп
/ ап ... oln \ / а1 \
■А= J ={afj.* = 1 "bi = l "}= ( ... =(A,,...,Am) —матрица
\V ■•• "я/ \anJ
размера m x n с элементами аг-, где
°t = (апi ■ ■ ч ат) — г"я строка матрицы А,
Aj = (aXj,..., amj-)T — У-й столбец матрицы А
А —квадратная матрица n-го порядка, если тп — п
лТ (аП ■■■ «ml\ т т Ml\
А = I I = (а,,..., ап) — I . I — матрица размера n х тп, полученная
\а\п ■■■ amn/ \AlJ
транспонированием матрицы А размера т х п
А = А'—квадратная симметричная матрица
- квадратная симметричная матрица
1п = (е[,..., еп) — I I — единичная матрица n-го порядка со столбцами е{,..., еп
\enJ
det А — определитель квадратной матрицы А
1~' . ....
rang А — ранг матрицы А
Ах = {{Ах),..., (Ах)ту , где (Ах)г — ]Г) а^х3, i = \,...,m — произведение матрицы
3 = 1
размера тхпна вектор лбЕ"
\\А\\ = max |Аа;|вт —норма матрицы А размера т х п
АВ — произведение матрицы А = {щЛ размера тхпна матрицу В = {Ь{А размера п х
п
х д является матрицей С=:{с,Л размера т х q с элементами с-- = 52 "■ikhi1 г = '> ■ • •> т>
J fc = l
У = 1, ..., q
А ^ 0 — неотрицательно определенная симметричная матрица, если {Ах, х) ^ 0 Ух€ Еп
А > 0 — положительно определенная симметричная матрица, если {Ах, х) > 0 Ух£Еп,
хфО
А < 0 — неположительно определенная матрица, если —А > О
А < 0 — отрицательно определенная матрица, если —А > 0'
х = {х\...,хп)Т ^0, если х1^0 Уг = 1,...,п
х = {х\.,.,хп)т>0, если ж1' > 0 Vi = l,...,n
х = (я1,..., хп)т 2* г/ = О/1,..., г/")т. если * ~ У > °
я^я1,..., хп)т > у = {у1,..., уп)т, если х- у >0
Е£ = {х£Еп: х^О} — неотрицательный ортант пространства Е
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ
821
х+ = (xj.,..., х£)т, где xj = тах{0; х{}, г = 1,..., п
х = (х1,..., х")Т >-0— лексикографически положительный вектор, если i/Ои первая
ненулевая координата этого вектора положительна
х = (х1,..., хп)т Уу = (у1,..., уп)т, если х-ууО
х4 = lex minx.- — лексикографический минимум множества векторов {xi, г g М}, если для
i'eM
каждого номера г G Af либо ж,- >- х„, либо ж,- = х„
S = S{v, В)= ( д ) —симплекс-таблица угловой точки и с базисом В, где Г=(Г[,.. .,ГГ)Т,
гг = (%-0> 7,-i.- ■ -. 7iJ. »' = 1, ■ ■ ■> г; А = (А0, А,,..., Д„) (подробности см. в § 3 гл. 3)
S = ( д ) >- 0 — лексикографически положительная симплекс-таблица, если Г,- >- 0 Vi =
= 1,..., г
5, = ( .' ) >- S2 = ( д2 ) — симплекс-таблица S{ лексикографически больше симплекс-
таблицы 52, если А[ >- А2
X — замыкание множества X
Гр X — граничные точки множества X
int X — внутренние точки множества X
diam X = sup |х — у\ — диаметр множества X
х,уеХ
aff X — аффинная оболочка множества X
Lin X — несущее подпространство множества X
со X — выпуклая оболочка множества X
п X — относительная внутренность множества X
dim X — размерность множества X
mes X — лебегова мера множества X
\Х\ —количество элементов множества X
р(х,Х)= inf \х — у\—расстояние от точки х до множества X
уеХ
X U У — объединение двух множеств X и У
X П У — пересечение двух множеств X и У
X + У — сумма двух множеств X и У
X — У — разность двух множеств X и У
аХ — произведение числа а на множество X
X х У — прямое (декартово) произведение двух множеств X и У
0 — пустое множество
0(v, е) = {х G -Б": |ж — -и| < е} — е-окрестность точки v, или открытый шар радиуса е > О
с центром в точке v
S(v,R) = {x G-E": \x-v\ < Л} —замкнутый шар радиуса Л с центром в точке v
Г = Г(с, 7) = {я G Еп: (с, х) = 7} — гиперплоскость с нормальным вектором с ф 0, 7 —
заданное число
Г+ = {ж G Еп: (с, х) > 7} — открытое положительное полупространство гиперплоскости Г
Г~ = {ж G Еп: (с, х) < 7} — открытое отрицательное полупространство гиперплоскости Г
?+ = {х G Еп: (с, х) > 7} — замкнутое положительное полупространство гиперплоскости Г
Г" = {х G Еп: (с, х) < 7} — замкнутое отрицательное полупространство гиперплоскости Г
К — конус с вершиной в нуле
LL — ортогональное дополнение подпространства_Ь QEn
ГЦ А) — сопровождающее подпространство точки А
Vy(z) — проекция точки геЕ" на множество X
Vy(z) — проекция точки z G Еп на множество X в метрике G
/(х) -* inf, х G X —краткая символическая запись задачи минимизации функции /(х) на
множестве X
/„ = inf /(х) — нижняя грань функции /(х) на множестве X
X = {х G X: /(х) = /„ > -оо} — множество точек минимума функции /(х) на X
/(х) -* sup, х G X — краткая символическая запись задачи максимизации функции /(х) на
множестве X
/* = sup /(х) — верхняя грань функции /(х) на множестве X
X* = {х G X: /(х) = /* < +оо} — множество точек максимума функции /(х) на X
822
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ
-1АЩ1 =у .(ж) —частная производная функции f{x) = f(x ,..., хп) в точке х по
переменна;
ной хг, i = 1,.... п
f'{x) — |-7Г1 , ■ ■ -1 jSn } — градиент функции f(x) в точке х
—Г, =/^^(35) —частная производная функции f(x) = f(xl,..., х") в точке х по пере-
дх дх3.
менным хг, Ж'', г, У = 1,..., п
fix) = \ —; Д .', г, У = 1,..., п \ — вторая производная функции f{x) в точке х, она явля-
I дх дх; „ >
ется симметричной квадратной матрицей n-го порядка
д}(х) — субдифференциал функции /(ж) в точке х
3\х> = lim J\x+ e)~J\x) — производная функции f(x) в точке х по направлению е,
x(t)= xh■ '■ —первая производная функции x(t) по времени t
x(t) = —^2 — вторая производная функции x(t) по времени t
dt
pr (z) — значение проксимального оператора в точке z
lim хк — предел последовательности {хк} = (х1,х2,... <хк,...)
к—*оо
lim хк —верхний предел последовательности {хЛ
к-> оо
lim xlr —нижний предел последовательности {хк}
к—*оо
lim f(x) — предел функции f(x) при х -» а
lim f{x) — верхний предел функции f(x) при х —> а
х —* а
lim f(x) — нижний предел функции f{x) при х-* а
а:—* а
/(а+0)= lim /(i) — предел функции f(x) одной переменной i при стремлении t к
! ->а + 0
точке а справа
/(а —0) = lim /(t) — предел функции f(x) при стремлении i к точке а слева
( —* а-0
£s Пь —верхний предел последовательности множеств {Т1к}
к-юо
0(t) — величина, определенная в окрестности точки t =0 и такая, что —I—ч ^с, где с —
некоторая неотрицательная постоянная
o(t) — величина, определенная в окрестности точки t =0 и такая, что lim -¾^ =0
С(Х)— пространство непрерывных функций f(x) на замкнутом ограниченном множестве
X с нормой ||/||с = max |/(а;)|
ХЕ X
С'(Х) — пространство непрерывно дифференцируемых функций на множестве X
С2(Х) — пространство дважды непрерывно дифференцируемых функций на множестве X
С1,1(Х) — пространство непрерывно дифференцируемых функций на множестве X,
градиент f'{x) которых удовлетворяет условию Липшица на X (определение 1 § 6 гл. 2)
Q{L) — множество функций, удовлетворяющих условию Липшица на множестве X с
константой L
Ь^[а,Ь] — пространство функций / = /(t), интегрируемых по Лебегу на отрезке [а,Ь], с
нормой imibi(e,b]=imibi = ii/(t)i*
L2[a, b] — пространство функций f = f(t)^Ll[a,b], |/(i)|2 Gbja, b] со скалярным произ-
ь Г
ведением {/, g)Lj = $ f(t)g(t)dt и нормой ||/||Lj = уЧ/, f)Lj
L [a, b], 1 <p <oo — пространство функций / = /(t) el^a, 6], |/(t)lP G^iK b] c нормой
p
,b
,1/p
Hi —
bp = (SI/(*)Ri)
Loo[a> b] — пространство ограниченных измеримых функций / = /(<) с нормой ||/||L
(подробности см. в § 1 гл. 6)
УКАЗАТЕЛЬ ОБОЗНАЧЕНИЙ
823
L£ [а, Ъ] — пространство r-мерных вектор-функций / = /(*) = (/'(*),.. .,/*"(<)), /'(*)£
е 12[а, Ь], i = l,..., г, со скалярным произведением {/, g)L, — S{/(t), g(t))E,dt и нормой
LT[a, b], 1 <p<+oo —пространство r-мерных вектор-функций /=/(t) = (/'(t),..., /*"(*)),
/l'(i) G Lp[a, b], i = 1,..., г, с нормой ||/||L; = ($ |/(t)|£,ctt) ' ? при 1 < P < oo и ||/||LL =
= III/(*)U'IIl.
H = H(x, u, t, ф, (¾) — функция Гамильтона — Понтрягина
I = l(x, y,J, T,a) — малый Лагранжиан
£ = £(ж, А) — функция Лагранжа
L = L{x, А)— функция Лагранжа в нормальной форме
A(v) — конус Лагранжа точки v локального минимума
A~(v)— конус Лагранжа точки v локального максимума
Aa(v)— конус Арутюнова точки v локального минимума
A~~(v)— конус Арутюнова точки v локального максимума
K(v) — конус критических направлений в точке v
ker G'{v) = {h ей": (s;(u), fr) = 0, i GiW} — ядро отображения G'(v) = {g'{(v),i g M}, где
G(x) = {9i(x),izM)
V — квантор общности
3 — квантор существования
Издательство «ФАКТОРИАЛ Пресс»
117449, Москва, а/я 331 factorial @mail.compnet.ru www.compnet.ru/factorial
ИМЕЮТСЯ В ПРОДАЖЕ:
Мищенко А. С, Фоменко А. Т. Курс дифференциальной геометрии и топологии. 448 с, 2000
Винберг Э.Б. Курс алгебры. 530 с, 2001
Рыжков В. В. Лекции по аналитической геометрии. 208 е., 2000
Каток А. Б., Хасселблат Б. Введение в современную теорию динамических систем.
768 с, 1999.
Стоянов Й. Контрпримеры в теории вероятностей. 288 с, 1999.
Гильберт Д. Избранные труды. Т. 1, 2. 575 + 698 с, 1998.
Демидов Е. Е. Квантовые группы. 128 с, 1998.
Постников М. М. Лекции по геометрии. Риманова геометрия. 496 е., 1998.
Зеликин М. И. Однородные пространства и уравнения Риккати в вариационном исчислении.
351 с, 1998.
Дьяченко М. И., Ульянов П. Л. Мера и интеграл. 160 с, 1998.
Прасолов В. В., Соловьев Ю. П. Эллиптические функции и алгебраические уравнения.
288 с, 1998.
Сосинский А. Б. Как написать математическую статью по-английски? 112 с, 1998.
Топологические методы в теории гамильтоновых систем. (Сборник работ под ред. Бол-
синова А. В., Фоменко А. Т., Шафаревича А. И.) 320 с, 1999.
Виноградова И. А., Олехник С. Н., Садовничий В. А. Математический анализ в задачах
и упражнениях (несобственные интегралы и ряды Фурье). 488 с, 1998.
Виноградова И. А., Олехник С. Н., Садовничий В. А. Математический анализ в задачах
и упражнениях (числовые и функциональные ряды). 478 с, 1996.
Сэвидж Дж. Сложность вычислений. 368 с, 1998.
Мерфи Дж. С*-алгебры и теория операторов. 356 с, 1997.
Соловьев Ю. П., Троицкий Е. В. <7*-алгебры и эллиптические операторы в
дифференциальной топологии. 352 с, 1997.
Трофимов В. В., Фоменко А. Т. Алгебра и геометрия интегрируемых гамильтоновых
дифференциальных уравнений. 448 с, 1995.
Зайцев В. Ф., Полянин А. Д. Справочник по линейным обыкновенным дифференциальным
уравнениям. 304 с, 1997.
Зайцев В. Ф., Полянин А. Д. Справочник по нелинейным обыкновенным
дифференциальным уравнениям. 512 с, 1997.
Полянин А. Д., Манжиров А. В. Справочник по интегральным уравнениям. Точные
решения. 431 с, 1998.
Желобенко Д. П. Введение в теорию представлений. 136 с, 2002.
Мануйлов В. М., Троицкий Е. В. С*-гильбертовы модули. 224 с, 2002.
Тертычный-Даури В. Ю. Стохастическая механика. 464 с, 2002.
Смирнов В. А. Симплициальные и операдные методы в теории гомотопий. 272 с, 2002.
ГОТОВЯТСЯ К ПЕЧАТИ:
Кнепп А. Эллиптические кривые
Морган Дж. Инварианты Зайберга—Виттена и их применения к топологии гладких
четырехмерных многообразий.
Все книги можно приобрести в интернет-магазине: http://www.bolero.ru/
Аннотации, оглавления, введения к книгам можно найти на www-странице издательства:
http://www.compnet.ru/factorial.