Текст
                    В. Ф. Демьянов
А. М. Рубинов
ОПТИМИЗАЦИЯ
И ИССЛЕДОВАНИЕ
ОПЕРАЦИЙ
ОСНОВЫ
НЕГЛАДКОГО
AHAJ1ИЗА
И КВАЗИ-
ДИФФЕРЕНЦИАЛЬНОЕ
ИСЧИСЛЕНИЕ

ОПТИМИЗАЦИЯ И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ В. Ф. ДЕМЬЯНОВ А. М. РУБИНОВ ОСНОВЫ НЕГЛАДКОГО АНАЛИЗА И КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ МОСКВА «НАУКА» ГЛАВНАЯ РЕДАКЦИЯ ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ 1990
ББК 22.18 Д32 УДК 519.63 Демьянов В. Ф., Р у б и н о в А. М. Основы негладкого ана- лиза и квази дифференциальное исчисление.— М.: Наука. Гл. ред. физ.-мат. лит., 1990.—С. 432,— (Оптимизация и исследование one- раций/Ред. сер. Н. Н. Моисеев.)—ISBN 5-02-014241-7. Дается систематическое изложение основных понятий неглад- кого анализа — нового и быстро развивающегося раздела матема- тики, в котором изучаются свойства недифференцируемых функ- ций. Обсуждаются различные обобщения понятия градиента и про- изводной, устанавливаются связи между ними и области их при- менения. В частности, подробно изучаются такие объекты неглад- кого анализа, как субдифференциал Кларка, субдифференциалы Пено, Варги, понятия верхней выпуклой и нижней вогнутой ап- проксимаций Б. Н. Пшеничного, квазидифференциалы и кодидиф- ференциалы. Эти понятия применяются к решению ряда задач анализа и оптимизации, теории игр и оптимального управления. Для специалистов в области исследования операций, информа- тики, прикладной математики, а также студентов и аспирантов соответствующих специальностей. Ил. 53. Библиогр. 207 назв. ОПТИМИЗАЦИЯ И ИССЛЕДОВАНИЕ ОПЕРАЦИЙ ВЫПУСК 23 Редактор серии Н. Н. Моисеев Рецензент доктор физико-математических наук В. И. Благодатских д 1602110000-123 Д 053(02)-90 13-90 ©Издательствср^Наука». Главная редакция физико-математической литературы, 1990 ISBN 5-02-014241-7
ОГЛАВЛЕНИЕ Предисловие.......................................... Глава I. Однородные аппроксимации функций, множеств и отображений....................................... У § 1. Аппроксимация множеств с помощью конусов § 2. Производные Дини и Адамара........................™ § 3. Некоторые свойства производных Дини и Адамара 24 § 4. Аппроксимация множеств, заданных с помощью не- равенств и уравнений. Условия регулярности . . ^7 § 5. Аппроксимация многозначных отображений ... **4 § 6. Дифференцируемость функции максимума при свя- занных ограничениях..............................59 Глава II. Производные и субдифференциал Кларка . . 71 § 1. Субдифференциал Кларка.................- . 71 § 2. Касательный конус Кларка........................91 § 3. Непрерывные аппроксимации субдифференциального отображения Кларка..............................98 § 4. Обобщенные якобианы и вееры....................106 Глава III. Квазидифференцируемые функции .... ИЗ § 1. Разности выпуклых компактов.....................ИЗ § 2. Квазидифференциальное исчисление...............128 § 3. Условия регулярности для множеств, задаваемых с помощью квазидифференцируемых функций . .. 148 § 4. Связь квазидифференциала с субдифференциалами Пено и Кларка . . . . ?.................152 § 5. Верхние выпуклые аппроксимации.................166 § 6. е-квазидифферепциалы . . . •..................172 § 7. Звездные множества и квазидцфференцируемость 179 Глава IV. Кодифференцируемые функции...................186 § 1. Определение и примеры кодифференцируемых функ- ций ...............................................186 § 2. Основные формулы кодифференциального исчисле- ния .............................................t 192 § 3. Примеры....................................'! 197 § 4. Кодифференцируемость суперпозиции .... 204 § 5. Непрерывно кодифференцируемые множества . . 211 § 6. Дважды кодифференцируемые функции .... 214 Глава V. Экстремальные задачи..........................230 § 1. Необходимые и достаточные условия экстремума . 230 § 2. Условия минимума субдифференцируемой функции 238
ОГЛАВЛЕНИЕ § 3. Условия экстремума квазидифференцируемой функ- ции 247 § 4. Условия минимума гиподифференцируемой функции 270 § 5. Метод кодифференциального спуска..........274 § 6. Условия минимума второго порядка для дважды ко- дифференцируемой функции...........................280 § 7. Дифференцируемость по направлениям функции рас- стояния до гиподифференциала.......................285 § 8. Дифференцируемость функции экстремума по е-суб- дифференциальному отображению выпуклой функ- ции ...............................................289 § 9. Аппроксимация суб- и супердифференциальных ото- бражений выпукло-вогнутых функций и седловые точки..............................................296 Глава VI. Теорема о неявной функции...................308 § 1. Одномерный случай..............................308 § 2. Обобщение теоремы Какутани.....................319 § 3. Многомерный случай............................321 § 4. Примеры....................................... 330 § 5. Теоремы об обратной и неявной функциях для ло- кально липшицевых отображений......................337 § 6. Теоремы об обратной функции для многозначных отображений.....................................343 Глава VII. Некоторые применения методов негладкого анализа.............................................352 § 1. Негладкие задачи оптимального управления . . 352 § 2. Исследование одной модели обмена...............368 § 3. Анализ кооперативных игр..................... 382 Приложение I. Элементы выпуклого анализа . . . 395 Приложение II. Элементы топологической теории мно- гозначных отображений...............................399 Приложение III. Квазидифференциальное исчисление в банаховых /^-пространствах..........................400 Приложение IV. О системах дифференциальных урав- нений с квазидифференцируемыми правыми частями . 407 Библиографический комментарий.........................414 Список литературы.....................................417 Список основных обозначений и сокращений..............428 Предметный указатель..................................430
ПРЕДИСЛОВИЕ Введение Ньютоном и Лейбницем понятия производной и по- следовавшее развитие дифференциального и интегрального исчис- ления обеспечило математический аппарат для бурного взлета ес- тественных и точных наук на несколько столетий. Но в настоя- щее время классического «гладкого» математического анализа уже недостаточно для изучения возникающих в технике, экономике, в самой математике вопросов. Негладкие процессы все настойчи- вее «стучатся» в дверь. Первым серьезную атаку на негладкие функции предпринял более века назад П. Л. Чебышев. Сейчас можно говорить о негладком анализе как о складывающейся нау- ке. Некоторые разделы этой теории можно считать более или ме- нее законченными (например, суб дифференциальное исчисление выпуклых функций, теория минимакса), другие еще только оформ- ляются. Негладкий анализ занимается вопросами аппроксимации ото- бражений и множеств достаточно сложной природы. В дальнейшем определенности ради будем говорить о вещественнозначной функ- ции /, определенной на открытом множестве X с: Rn. Аппроксима- цию такой функции осуществляют, как правило, с помощью функ- ции двух переменных ср (я, g), определенной на X X Rn (при этом х называют точкой, a g — направлением). Говоря об аппроксима- ции, имеют в виду, что разность f(x -|- ag) —f(x) приближенно рав- няется величине a(p(z, g). Характер этого приближенного равен- ства и его точность зависят от способа применяемой аппроксима- ции и, разумеется, от сложности рассматриваемой функции. Далее в основном изучаются аппроксимации первого порядка. Типичным примером такой аппроксимации служит производная по направ- лениям Г (X, g) = lim £(/(* + ag) — f (x)) (1) a|o (предполагается, что соответствующий предел существует). Наиболее просто устроены непрывно дифференцируемые функ- ции (в дальнейшем они именуются гладкими). Исследование таких
6 ПРЕДИСЛОВИЕ функций основано на применении линейного анализа. Это вызвано следующим фундаментальным фактом: непрерывность производ- ной как функции точки влечет ее линейность как функции на- правления. Иными словами, если функция х^ f (х, g) непрерыв- на при всех g, то функция g^ /' (х, g) линейна при всех х. Эта линейная функция является дифференциалом — главной ли- нейной частью приращения функции / в точке х. В случае, когда производная (1) разрывна по х и, тем более, если она не существу- ет, любая разумная аппроксимация является, как правило, нели- нейной. Подход классического анализа, заключающийся в выделе- нии «главной линейной части», оказывается непригодным: «глав- ная часть», т. е. аппроксимирующая функция, не обязательно ли- нейна и самостоятельное значение приобретает вопрос о ее линеа- ризации (выражении через линейные функции). Более того, в данном случае саму аппроксимацию можно проводить различны- ми способами, не обязательно используя производную (1), даже если она существует. Одно из требований, часто предъявляемых к аппроксимации, заключается в положительной однородности первой степени по направлениям. Иными словами, аппроксимация <р(х, g) должна обладать свойством Ф (z, Ag) = Лф (х, g) VX > 0. Примерами подобных аппроксимаций являются производная по направлениям (1), а также верхняя и нижняя производные Клар- ка. В некоторых случаях, отказываясь от однородности аппрокси- мации как функции направления, удается добиться ее непрерыв- ности как функции точки. Непрерывность является весьма важ- ным свойством (например, с позиций численных методов) и ради нее можно отказаться от однородности. Один из подобных под- ходов, основанный на понятии кодифференциала, подробно обсуж- дается в гл. IV. Этот подход, конечно, не исключает использования производ- ной. Представляет интерес рассмотреть функции, для которых про- изводная обладает некоторыми топологическими свойствами, более слабыми, чем непрерывность. Для достаточно широкого класса функций производная (1) полунепрерывна сверху как функция точки. Оказывается (см. § ПЛ), что полунепрерывность сверху по х влечет выпуклость по g. Подобным же образом полунепрерыв- ность снизу по х влечет вогнутость по g. Это обстоятельство пока- зывает, что полунепрерывные сверху или снизу производные мож- но исследовать средствами выпуклого анализа. То же относится и к случаю, когда производная представима в виде суммы полуне- прерывных сверху и снизу функций. Отметим, что выпуклый ана-
ПРЕДИСЛОВИЕ 7 лиз представляет собой в настоящее время глубоко разработан- ный раздел математического анализа. Мы уже подчеркивали, что в негладком случае возможны раз- личные подходы к аппроксимации. По-видимому, это лежит в су- ществе дела: при исследовании одних задач удобнее использовать одни подходы, при исследовании других — другие. Некоторые из указанных подходов подробно исследуются в данной книге. При этом мы уделяем основное внимание случаям, когда аппроксими- рующие объекты выпуклы как функции направления или про- стым образом выражаются через выпуклые. Это позволяет исполь- зовать выпуклый анализ там, где в гладком случае применялся линейный. Непрерывная выпуклая функция представима как мак- симум аффинных (т. е. функций вида «линейная + константа»), если к тому же эта функция положительно однородна, то она представима как максимум линейных. Таким образом, выпуклость аппроксимации позволяет представить ее в линеаризованном виде, т. е. выразить через аффинные или даже линейные функции с помощью операции взятия максимума. Таким же образом вогну- тость аппроксимации позволяет линеаризовать ее с помощью опе- рации взятия минимума. Весьма эффективным оказался симмет- ричный подход, основанный на использовании суммы вида «мак- симум + минимум». Именно он лежит в основе квазидифферен- циального и кодифференциального исчислений, которым посвяще- на существенная часть книги. Отметим, что в настоящее время известно несколько весьма интересных подходов, не использующих аппарата выпуклого ана- лиза. Это относится прежде всего к контейнерам Дж. Варги и D-производным Б. Ш. Мордуховича, с которыми читатель может познакомиться по монографиям [13, 61]. В теоретических исследованиях, использующих методы не- гладкого анализа, удобно иметь дело с аппроксимациями, которые существуют «всегда», для всех функций из рассматриваемого про- странства. Практическое применение этих методов предполагает еще умение находить требуемые аппроксимации для достаточно широкого класса функций. Зачастую эти два пожелания противо- речат друг другу. Поясним это на примере двух однородных ап- проксимаций, рассматриваемых в данной книге — субдифферен- циале Кларка и квазидифференциале. Субдифференциал Кларка существует для всех липшицевых функций, однако отыскание его для сколько-нибудь сложно устроенной функции затруднитель- но. В то же время, хотя и не каждая липшицева функция квази- дифференцируема, класс квазидифференцируемых функций доста- точно широк и вычисление квазидифференциала можно проводить, используя методы квазидифференциального исчисления.
8 ПРЕДИСЛОВИЕ Все сказанное выше относительно аппроксимаций функций переносится на аппроксимацию множеств и отображений (одно- значных и многозначных). Связи между аппроксимациями всех этих объектов подробно обсуждаются в книге. Еще раз подчеркнем, что одна из основных целей данной ра- боты — представить аппарат, который можно использовать для со- здания программного обеспечения задач негладкого анализа и оп- тимизации, поэтому большее внимание уделяется тем вопросам, которые могут быть использованы на практике. Первое монографическое изложение квазидифференциального исчисления содержится в книге авторов [131], написанной по предложению проф. В. А. Балакришнана, которому авторы искрен- не признательны. Настоящая монография существенно отличается и по характеру изложения, и по рассматриваемым вопросам от [131]. Многие результаты, в частности теория кодифференциалов, излагаются впервые. Идея написания данной книги получила благословение Н. Н. Моисеева. При работе над книгой авторам существенно помогли встречи и беседы с В. И. Благодатских, Р. Ветсом, В. В. Гороховиком, Л. Грандинетти, Ж.-Б. Ирпа-Уррути, К. Лемарешалем, Б. Лудере- ром, В. Н. Малоземовым, М. С. Никольским, Ж.-П. Обеном, Д. Пал- лашке, П. Д. Панагиотопулосом, Л. Н. Поляковой, Б. Н. Пшенич- ным, Р. Т. Рокафелларом, 3. Сяо, Й. Цове, а также с Л. В. Ва- сильевым, А. М. Керимовым, К. К. Кивелем, С. Л. Печерским, Н. А. Печерской, Н. Э. Торгашовой, И. Р. Шаблинской, А. А. Ягу- бовым, М. Гаудиозо, Ф. Джианнесси, А. Б. Певным, М. А. Са- дыговым. Вопросы негладкого анализа, обсуждаемые здесь, были пред- метом постоянного внимания семинаров факультета прикладной математики — процессов управления Ленинградского госуниверси- тета, отдела математических методов Института социально-эконо- мических проблем АН СССР и Института Математики АН Азер- байджанской ССР, участникам которых авторы приносят сердеч- ную благодарность. Большую помощь в оформлении рукописи оказали Н. А. Джу- нусбеков, В. Н. Никулина, Э. К. Телихман, Н. Э. Торгашова, А. П. Ушакова. В книге используются стандартные обозначения, список неко- торых из них приведен в конце монографии. Внутри глав нуме- рация формул десятичная. Формула (5.3) означает формулу 3 § 5. При ссылке на формулу или параграф другой главы указывается (римскими цифрами) номер главы. Так, (П.4.5), означает фор- мулу (4.5) гл. II.
ГЛАВА I ОДНОРОДНЫЕ АППРОКСИМАЦИИ ФУНКЦИЙ, МНОЖЕСТВ И ОТОБРАЖЕНИЙ § 1. Аппроксимация множеств с помощью конусов 1. Локальная аппроксимация множеств может осу- ществляться многими способами. Наиболее простые и употребительные из них связаны с использованием в ка- честве аппроксимирующих объектов тех или иных кону- сов. Дадим описание некоторых из таких способов. Рассмотрим множество Q cz Rn, и пусть точка х со- держится в замыкании сШ этого множества. Вектор g называется допустимым направлением множества 12 в точке х, если найдется такое число > 0, что х + ag е Q Va е (О, аб). Совокупность всех допустимых в точке х направлений множества Q обозначим через Q). Вектор g называется касательным направлением в точке х к множеству Q, если найдутся а& > 0 и такая функция 'ipg(a): [0, a^]->[Rn, что (а) х + ag + ipg (а) е Q Vae [0, ag], —--------- 0. *) (1.1) « ОС 4 О Иногда вместо (1.1) используют запись х + ag + о(а)<= Q. Совокупность всех касательных в точке х к множеству Q векторов обозначим через К(х, Q). Вектор g называется возможным направлением мно- жества Q в точке х, если найдутся такие последователь- ности {gA} и {aj, что afeeR+, gk-+g, «л|0, x + afegftt=Q. (1.2) Направление g ¥= 0 является возможным в том и только том случае, когда найдется последовательность 1хк}, обладающая следующими свойствами: хк<=£1, хк^х, хк-+х, <1,3) *) Здесь и ниже иногда 0 = 0п, если это ясно из контекста.
10 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Если выполнено (1.2) и g =/= 0, то, полагая xh = х + ahgfL, убедимся в справедливости (1.3). Если же имеет место (1.3), то для последовательностей {aj, {gA}, где аА = = ИяА — adl/llgll, gA =(xh — я)/аА, выполняется (1.2). В терминах окрестностей определение возможного направления выглядит так: для любых чисел ао > 0, 8>0 найдутся элемент w^g + $jz и число а^(0, ао), при которых х + aw Й. Совокупность всех возможных направлений множества Й в точке х обозначим через Г (я, й). Непосредственно из определений следует, что множе- ства ч(х, Й), К(х, Й) и Г (я, й) представляют собой ко- нусы (т. е. содержат с каждым своим элементом g и весь луч {Xg |Х > 0}). Будем называть эти множества конусами, аппроксимирующими множество й вблизи точ- ки х. При этом К(х, й) часто называют касательным ко- нусом множества Й в точке х, а Г (я, й)—конусом Бу- лигана в этой точке. Конусы ^{х, Й), К(х, Й) и Г (я, Й) иногда записывают с помощью формул, в которых непо- средственно фигурируют Й и х. Для того чтобы выписать их, заметим, что при а 0 соотношение х + ag -е Й мо- жет быть переписано в Biqege — (й — х). Отсюда сразу вытекает равенство y(x,Q)= U fl ao>oo<a<ao Нетрудно показать, кроме того, что Г(х,й)= л Л и М-(й-х) + е<з\ (1.5) е>о ао>0 ае(о,ао) \ / где, как обычно, $ — единичный шар с центром в нуле. Чтобы записать подобным образом касательный конус К(х, й), введем в рассмотрение множество Ч\, состоя- щее из функций х|э, определенных на некотором отрезке [0, ао], действующих в и обладающих тем свойством, что а“1ф(а)-^0 при а I 0. В дальнейшем назовем множеством бесконечно малых первого порядка. Включе- ние g'^K(x, Й) равносильно тому, что я + ag + *ф(а)е е Й, где а"1г|)(а)-^0 при а I 0. Не умадяя общности, можно считать, что область определения функции хр сов- падает с некоторым отрезком [0, ао], не зависящим от g, поэтому Непосредственно из определения
§ 1. АППРОКСИМАЦИЯ МНОЖЕСТВ С ПОМОЩЬЮ КОНУСОВ 11 вытекает равенство tf(x,Q)= U П (1.6) t|)(=Tn о<а<ао а Понятно, ЧТО l(x, &)<=К(х, Й)с=Г(я, й). (1.7) Если х — внутренняя точка й, то все конусы, аппрокси- мирующие й вблизи х, совпадают с пространством Rn, если х — изолированная точка, то эти конусы состоят лишь из нуля. Все три указанных конуса осуществляют локальную аппроксимацию й; это означает, что при лю- бом е > 0 имеют место равенства 7 (х, й) = 7 (х, Й Л Ж (я)), К(х, Й) = К(х, й П «$е (х)), Г(я, Й)=Г(я, Й Л<(я)). Справедливость этих равенств вытекает непосредственно из определений. Конус Булигана Г (я, Й) всегда замкнут. Действитель- но, пусть g^cir(rr, й). Зафиксируем числа е>0 и ао>О и найдем такой элемент и еГ(я, Й), что llu — gll < < е/2. Так как и^Г(^, Й), то найдутся элемент ре е«^е/2(и) и число ае(0, ао), при которых выполняется включение х + av е Й. Поскольку Hu — gll < е, а е(0,ао), где е, ао — произвольные положительные числа, то Г(я, Й). Множество 7 (я, й) является наиболее простым из рассматриваемых трех конусов. Однако во многих слу- чаях оно осуществляет «неполную аппроксимацию» мно- жества Й, несет мало информации о том, как устроено й вблизи точки х. Для некоторых важных в приложени- ях множеств й конус 7 (я, Й) состоит лишь из нуля. Это относится, например, к поверхности Й = {у\f(y)= 0), где / — строго выпуклая функция. В связи со сказан- ным становится понятной необходимость использования конусов К(х, й) и Г (я, й), которые, однако, во многих случаях устроены гораздо сложнее, чем 7 (я, Й). Представляет интерес выявить те множества, для ко- торых «сложный» конус Г (я, Й) восстанавливается по более простому конусу 7 (я, Й). Иногда для достижения этой цели полезно использовать следующие включения: Ч(х, Й)<= сопе(й — х), Г (я, Й)<= cl сопе(Й — х). (1.8) Соотношения (1.8) вытекают непосредственно из опреде-
12 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ лений. Привлекая (1.7) и (1.8), легко убедиться в спра- ведливости следующего утверждения. Предложение 1.1. Если у(х, Q)= cone(Q — я), то Г (х, Q) = cl у (я, Q). 2. Наиболее просто устроенными подмножествами век- торных пространств являются выпуклые множества. Аппроксимацию выпуклого множества Q вблизи точки х е cl Q осуществляют, как правило, с помощью опорного конуса Кх(£1). По определению Кх (Q) = cone (Q — х) = J — х). х>о То обстоятельство, что ЛГЖ(£2)—конус, вытекает сразу из определения. Покажем, что этот конус является выпук- лым. Пусть u, p ^Ax(Q). Тогда при некоторых % > О, р > 0 выполняется и/К — х, v/p, ей- х. Так как (Q — х) — выпуклое множество, то и + ” = К и , Н р г- Q х А + Н А + Н» К А + Н Н» и потому и + + ц) (62 — х)^ Ха(£2). Предл ожение 1.2. Пусть Q— выпуклое множест- во, х е Q. Тогда у (я, Й)= АЖ(Й), Г (я, Q)=cl^(Q). Доказательство. 1) Как показывает формула (1.8), 7(я, Q)<= Aa(Q). Проверим противоположное вклю- чение. Пусть g^Kx(£i) и число %>0 таково, что g^ ^Z(Q--tf). Тогда х + g й. Пусть а < 1/Х. Тогда А / 1 \ х + ag = 4- (1 —Р)ж> где Р = а^- Так как £2 вы- пукло, x^Q, ₽ е(0, 1), то x + age£2. Таким образом, g е 7 (х, £2) и, следовательно, A«(£2)cz у(х, £2). 2) Равенство Г(х, £2)=с1^«(£2) вытекает из предло- жения 1.1. Замечание 1.1. Ниже (см. замечание 2.1) показы- вается, что в условиях предложения 1.2 К(х, £2) = = с1Я«(£2). В дальнейшем нам понадобится нормальный конус Nel®) к выпуклому множеству £2 в точке xs£2. На- помним, что Nx (£2) = [v е R" | (v, х) = max (v, у)1. I veQ I
§ 1. АППРОКСИМАЦИЯ МНОЖЕСТВ С ПОМОЩЬЮ КОНУСОВ 13 Другими словами, Nx (Q) = {v <= Rn | (у, х) = pQ (у)}, где *) pQ (у) = sup (у, у) — опорная функция выпуклого yeQ множества £2. Предложение 1.3. Пусть Q — выпуклое множе- ство, х £2. Тогда NX(Q) = -K*(Q). Здесь + обозначает переход к сопряженному конусу*). Доказательство. 1) Пусть —A’J(Q)). Так как ЛГХ(£2)=> £2 — х, то для всех у е Q выполняется нера- венство (v, у — x)<:Q, из которого вытекает, что р0(у) = (у, х). 2) Если ge^x(Q), то при достаточно малых а>0 выполняется включение х + ag е £2. Поэтому если v e7Vx(Q), то (v, я + а£)^(и, х), откуда следует неравен- ство (v, g) < 0. Таким образом, Nx (£2) cz — К* (£2). Следствие 1.1. Множество NX(Q) является выпук- лым замкнутым конусом. 3. Как уже отмечалось, аппроксимация множества £2 вблизи точки х осуществляется конусами 7 (х, £2), К(х, £2), Г (я, £2) локально. Допуская вольность речи, можно сказать, что на каждом из лучей, входящих в ко- нус, аппроксимация с заданной точностью осуществляет- ся лишь на некотором отрезке, длина которого зависит от этого луча. Например, если g — касательное направление, то справедливо соотношение х + ag + 'фя (а) е £2, где a-Ix|)g(a)->-0 при а ! 0, т. е. для любого б>0 найдется такое ag>0, что На-1фя(а)Н < 6 при а^(0, ag]. Понят- но, что ag зависит от g и может не найтись одного тако- го ао, что 11а_1ф^(а) II < б при всех g К(х, £2) и а^(0, ао]. Представляет интерес описать конусы, осуществляю- щие равномерную локальную аппроксимацию с точ- ностью до величин первого порядка малости. Введем со- ответствующее определение. Будем говорить, что замкну- тый конус Ж (х, £2) является равномерной аппроксима- цией первого порядка множества £2 вблизи точки х cl £2, если р(£2 Л ^.(х), (х + Ж(х, £2))Л^в(я))=о(б). (1.9) *) См. Приложение I.
14 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Здесь р —метрика Хаусдорфа, &ь(х) — шар радиуса 6 с центром в точке х, Заметим, что в отличие от конусов у(х, й), К(х, Й), Г (я, й), определяемых как объедине- ние лучей, обладающих некоторым свойством, равенство (1.9) определяет сразу весь конус Ж(х, й). Предложение 1.4. Пусть существует конус Ж {х, Й), являющийся равномерной аппроксимацией пер- вого порядка множества й вблизи точки х. Тогда: 1) Ж(х, &) = К(х, Й)=Г(я, Й); 2) для любого g^K(x, й) можно так найти функцию ^(а), пРи которой х + ag + -ф^(а)^ Й, что a-1if>g(a)-> О при а I 0 равномерно по g. Доказательство. Вначале покажем, что Г (х, й) <= Й). Предполагая противное, найдем элемент g е е Г (я, Й), который не входит в Ж(х, Й). Так как й), то найдутся последовательности gk^~ g, ak I 0, при которых справедливо включение х + ahgk -е Q. Поскольку g Ж (х, й) и конус Ж (х, Й) замкнут, то p(g, Ж(х, Й))=у>0. При достаточно больших к выпол- няется неравенство p(gA, Ж(х, Й))>у/2. Множество Ж (х, й) является конусом, поэтому Р («fegfe, Ж (я, Й)) > . Y а^и, следовательно, р (х + ahgh, х + уе (х, й)) > а*. (1.10) Так как х + ahgk е й Q ^ak\\gh^)^ то неравенство (1.10) означает, что Р (й П (#)> (# + Ж й)) П ^aA|l£k|] (#)) ”2" Это, однако, противоречит соотношению (1.9), опреде- ляющему конус Ж(х, й). Тем самым включение Г (я, £1)<=Ж(х, й) доказано. Покажем теперь, что Ж (х, й)<= К(х, й). Положим ф(6)=р(Й (х + Ж(х, Й))Л<&). Тогда б-1ср(б)—>- 0 при б 4 0. Пусть g^^= Ж(x, й), HgH = 1. Для любого б > 0 найдется такой элемент хб <= Й, что HxJI < б и Няб — (х + 6g) II = ср (б)* Положим г|^(б) = х^ — х — 6g. Тогда хъ = х + 6g + ^(б)е Й и ||%(6)||/б = Ф(6)/6^0. (1.11) Эти соотношения показывают, что g е К (х, Q). Таким образом, УС(х, Q)<=K(x, й). Так как, кроме того,
§ 2. ПРОИЗВОДНЫЕ ДИНИ И АДАМАРА 15 К(х, Й)<= Г(я, й), то Х(я, £}) = К(х, Й)=Г(я, Й) и первая часть предложения доказана. Вторая часть сра- зу следует из соотношения (1.11). Используя предложение 1.4, легко привести пример множества, для которого не существует конуса, являю- щегося равномерной аппроксимацией первого порядка. Пример 1.1. Пусть %А-> 0, причем lim =с<1; %о — 0. Положим Й = {%Agl к 0: <»}, где g — некоторый фиксированный элемент из Rn. Пусть х = 0. Найдем ко- нус К(х, й). Если ненулевой элемент h входит в этот конус, то ай + о(а)^Й. Обозначим через Lg луч с вер- шиной в нуле, проходящий через точку g. Предполагая, что h&Lg, получим р(ай, Й)>р(ай, Lg)=ap(h, обстоятельство показывает, что не найдется функций 'ф(а), удовлетворяющих соотношениям ah + г|?(а)^ й, гр (а)/а 0. Таким образом, конус К (ж, й) содержится в луче Lg. Покажем, что g & К(х, й). В самом деле, пусть число ah совпадает с серединой отрезка [Xfc-i, %fc], т. е. ah = (%а-1 + %а)/2. Предположим, что aAg +гр(аА)^ й. Тогда Игр(aA) II >(aA — lA-i) Hgll = fa — XA-i) Hgll/2. Имеем И fa) II Ч-Ч-1 ak 4 + 4-i * ~~ Ч-1/Ч 1 + ^k-l/'kk 1 — c Таким образом, g<£K(x, й). Отсюда следует, что и hg&K(x, Й) при к > 0. Из сказанного вытекает равен- ство К(х, Й)={0}. В то же время, как нетрудно прове- рить, Г(я, Й)=Д?. Мы показали, что К(х, Й)=/=Г(я, й) и потому, как следует из предложения 1.4, конуса, осу- ществляющего равномерную аппроксимацию первого по- рядка, не существует. § 2. Производные Дини и Адамара Здесь рассматривается вопрос об аппроксимации за- данной функции вблизи некоторой точки с помощью по- ложительно однородной функции направления. Проще всего подойти к изучению этого вопроса с помощью кону- сов, аппроксимирующих некоторые множества, связанные с функцией — ее надграфик и подграфик.
16 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ 1. Пусть / — функция, определенная на 0?п и прини- мающая значения в расширенной числовой прямой R = = RU{— °°> + °0}- Нам понадобятся следующие оп- ределения. Множество dom / = {# е Rn | | / (х) | С + оо} называется эффективным множеством функции /, а мно- жества gr/ = {[х, ц] €= Rn х RI Н = /(«)), epi/= {[х, р] sR" X 0?| р>/(х)}, Ьур/= {[ж, р,] gR" X 0?| ц</(х)}, соответственно, графиком, надграфиком и подграфиком этой функции. Понятно, что (epi/) Л (hyp/) = gr/. Если /(#)=+«>, то вертикальная прямая Пх={(я, р,)| не пересекается с надграфиком и целиком содержится в подграфике; если /(я)=—то эта прямая целиком со- держится в надграфике и не пересекается с подграфи- ком; если dom/, то прямая Пл представима как объе- динение двух лучей: П£ и П7, где nJ = {[ж, р] е Пх| р>/(х)}, П7 = {[^, р] е Щ | р < / (х)}; первый из них содержится в надграфике, второй — в под- графике. Множество й с Rn X Й назовем устойчивым вверх, ес- ли соотношения [я, р]^£2, р' > р влекут [х, p'J^Q. Понятно, что надграфик — устойчивое вверх множество. Пусть Q — произвольное устойчивое вверх множество, х е Rn. Рассмотрим прямую Пх = {[я, р] | ре R}. Воз- можны следующие случаи: 1) Пх Л « = 0; 2) Пх с= Q; 3) П* Л Q =# 0, Пх Ф Q. В третьем случае существует такое число %, что [х, р] е= Q при р >А и [х, р] Q при р < %. Определим функцию ср: положив ср(гс)=+°° в первом слу- чае, <р(я)= —00 — во втором и ф(х) = Х —в третьем. Во всех трех случаях можно воспользоваться формулой <р(я) = inf {р| [я, p] efi}. (2.1) Как обычно, считаем, что inf пустого множества совпада-
§ 2. ПРОИЗВОДНЫЕ ДИНИ И АДАМАРА 17 ет с+°°. Понятно, что надграфик epi ср так определенной функции ф может отличаться от Й лишь точками (х, ф(я)), лежащими на графике. (Эти точки могут и не входить в й). Про функцию ф, построенную по формуле (2.1), будем говорить, что она порождена устойчивым вверх множеством Й. Множество Q с F X К назовем устойчивым вниз, если с каждой своей точкой [я, р] оно содержит и точки [х, р'] при р' < р. Подграфик hyp / функции / устойчив вниз. Если Й — устойчивое вниз множество, то про функцию Ф(х) = sup { р| [я, |i]eQ} будем говорить, что она порождена множеством й. Пусть /: Rn->R — некоторая функция и rr^dom/. Положим /d (*. g) = iim i (/ (ж + ag) — / (я)). (2.2) ajo a Величина /р (x, g) называется верхней производной Дини функции / в точке х по направлению g. Заметим, что предел в (2.2) существует всегда, хотя и не обязательно он конечен. Предложение 2.1. Пусть zedom/, у = \х, — соответствующая точка графика gr / функции f. Тогда конус допустимых направлений ^(g, epi/) к надграфику epi / устойчив вверх и порождает функцию g *-> fv(x, g). Доказательство. Включение [g, р]е ^(g, epi/) имеет место в том и только том случае, когда при не- котором ао > 0 (выполняется соотношение [х, / (ж)] + + ос [g, р] е epi / Vа е (0, а0), или, что то же самое, f(x + ag)^f(x) + ар Vae (0, а0). Последнее неравенство можно переписать так: sup -^-(/(х +ag) —/(х))<ц. (2.3) 0<a<a0 Соотношение (2.3) показывает, что конус у (у, epi/) ус- тойчив вверх, поэтому имеет смысл говорить о порождае- мой им функции <p(g)= inf {р| [g, epi/)}- (2.4) Проверим равенство <p(g) =/l>(g). Пусть р > /в (х, g). Тог- да, как следует из определения верхнего предеягагд^ийм
18 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ дется такое ао > 0, что при этом ао выполняется пера венство (2.3). Поэтому [g, и]е Т(*Л epi/), т. е. p>cp(g) Таким образом, <p(g)^fb(g)- Проверим неравенство про- тивоположного знака. Пусть g>(p(g). Тогда [g, ц] — е epi/) и потому при некотором ао>О выполняется (2.3). Имеем А /Ь (*> g) < sup —(/(« + ag) — / (х)) < щ 0<а<а0 а откуда и следует требуемое. Наряду с верхней рассмотрим нижнюю производную Дини fb (xt g) функции / в точке х. По определению /i> {х, g) = lim 1- (/ (х + ag) — / (х)). а-»+о Аналогично предложению 2.1 доказывается следующее утверждение. Предложение 2.2. Пусть j^dom/, y = [x,f(x)]. Тогда конус у(г/, hyp/) устойчив вниз и порождает функ- цию /i(tf, g). Предел /' (*, g) = Ит 4 (/ + a?) ~ / (*))> ajo a если он существует, называется производной функции / в точке х по направлению g. Иногда этот предел называ- ют также производной Дини и обозначают через /d (я, g)> Производная по направлениям является одним из основ- ных инструментов для аппроксимации функций и под- робно изучается ниже (см. § 3). Понятно, что существо- вание производной Дини по направлению g равносильно совпадению чисел fb(z, g) и /d(^, g)- Геометрическая интерпретация этого факта в предположении конечности указанных чисел заключается в следующем: на ^прямой Щ = {[g, [1] | |1G ?} найдется такая точка [g, ц]Л что определяемые- ею открытые лучи {[g, ц] I ц > ц) и {[g, ц] I |х< ц) входят в конусы 7(1/, epi/) и 7 (г/, hyp/) соответственно. Существование производной функции / в точке х по всем направлениям равносильно тому, что все пространство Rn может быть представлено как объедине- ние трех частей: конуса 7 (г/, epi/), конуса 7 (г/, hyp/) и Лбгйжичивающей эти конусы поверхности. Последняя из
§ 2. ПРОИЗВОДНЫЕ ДИНИ И АДАМАРА 19 этих частей может пересекаться с каждой из преды- дущих. 2. Выясним, какую аппроксимацию функции /: (Rn~> (->0? порождает аппроксимация ее надграфика и под- графика с помощью конуса возможных направлений. Верхней (соответственно, нижней) производной Адамара функции f в точке х по направлению g называется ве- личина /н(*>?) = Нт + — a|o,e'-»g a соответственно /н (х, g) = Hm -1 (/ (х + ag') —/ (х))). a|o,g'-»g Предложение 2.3. Пусть х е dom /, у = [я, /(#)] — соответствующая точка графика gr / функции f. Тогда ко- нус Г (у, epi/) возможных направлений в точке у к над- графику epi/ является устойчивым вверх и порождает функцию g—/н(х, g). Доказательство. Включение [g, ц]е Г(г/, epi/) справедливо в том и только том случае, когда существу- ют последовательности {[gft, цЛ]}, [g, ц], и {aj, I 0, при которых выполняется включение \х, /(#)] + + «а [#а, На] е epi /. Это включение равносильно нера- венству -^- (/(* + aftgft) — / (х)) < р*. (2.5) afe Переходя в (2.5) к пределу, получим Hm -L (/ (х + aftgft) — / (х)) < р. (2.6) А~оо Из (2.6) непосредственно следует, что конус Г (у, epi/) устойчив вверх. Пусть <р — функция, порожденная этим конусом. Привлекая (2.6), получим /н(*. g) = Hm у(/(х+ag') —/(х)Х a|o,g'-»g < lim ~z~ (/ / И) и- £->4-00 ft Так как <p(g) = inf{p| [g, р] е Г {у, epi/)}, то /н^,
20 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Ф (g). Проверим противоположное неравенство. Пусть £)• Тогда найдутся такие последовательности {gft} и {аД, что gft-^g, ah\0,^—(f(x + akgk)—f(x))^L, т. е. [х, f(x)] + аА [gh, p]<^epi/. Отсюда следует соотно- шение [g, Г(г/, epi/), которое показывает, что ^T(g)- Тем самым неравенство /н(я, g)^ Ф^), а с ним и предложение доказаны. Замечание 2.1. Обратим внимание читателя на то, что конус допустимых направлений к надграфику порож- дает верхнюю производную Дини, а конус возможных на- правлений — нижнюю производную Адамара. Аналогично предложению 2.3 доказывается следую- щее утверждение. Предложение 2.4. Пусть ^dom/. у = \х, f(x)]. Тогда конус Г (у, hyp/) устойчив вниз и порождает функцию g^> /н {x, g). Производной Адамара функции / в точке х по на- правлению g называется предел lim + ag') — /(*))• (2.7) a!0,g'-»g “ Понятно, что из существования производной Адамара следует существование производной Дини, причем обе указанные производные совпадают. Поэтому, как прави- ло, для обозначения производной Адамара в точке х по направлению g будет использоваться тот же символ /'(я, g), что и для обозначения производной по направ- лениям (производной Дини). В некоторых случаях, ког- да потребуется подчеркнуть, что рассматриваемая про- изводная является именно производной Адамара, предел (2.7) будем обозначать символом /н(#, g)- Наличие про- изводной Адамара по направлению g равносильно сле- дующему: пересечение лучей {[g, ц] I ц > р} и {[g, Р-] 1 Ц р), входящих в конусы Г(у, epi/) и Г(i/, hyp/), состоит лишь из одной точки, а не из отрез- ка, т. е. р = р. То обстоятельство, что эти лучи пересека- ются, легко следует из предложений 2.3 и 2.4. 3. Рассмотрим аппроксимацию надграфика и подгра- фика с помощью конуса касательных направлений. Пусть /: Rn в? «— некоторая функция. Для х dom /и g е Rn
§ 2. ПРОИЗВОДНЫЕ ДИНИ И АДАМАРА 21 рассмотрим следующие величины: /* (*> g) = inf Ит (/ (х + ag + я|> (а)) — / (х)), f* (х, g) = sup lim -1 (/ (х + ag + tp (а)) — / (x)), M’e'Fn аТо1“ где Tn — множество бесконечно малых первого порядка (см. п. 1 § 1). Предложение 2.5. Пусть у = [х, f(x)]. Тогда конус К (у, epi/) касательных направлений в точ- ке у к надграфику epi/ является устойчивым вверх и порождает функцию g^f*(x,g). Доказательство. Пусть [g, ц]^ЛГ(у, epi/). Тог- да найдутся функции ip е Yn и со е при которых вы- полняется соотношение [х, /(x)] + a[g, p] + [ip(a), ®(a)]eepi/; (2.8) это соотношение может быть переписано в виде (f (х + ag + (а)) — / (х)) < р + ® (а)/а. (2.9) Из (2.9) непосредственно вытекает, что конус К(у^ epi/) устойчив вверх. Кроме того, из (2.9) следует неравенство /*(*.?)= inf lim(/(х + ag 4- -ф (ос)) — /(х))<р, а|о а которое показывает, что f*(x, g)^^(g). С другой сторо- ны, если ц >/*(#, g), то найдется такая функция -ф е 4% что Йт-^-(/(х + as + t(a))-/(«))<M- (2.10) афО La Пусть G>(a)=0. Неравенство (2.10) влечет при достаточ- но малых а неравенство (2.9) и, следовательно, включе- ние (2.8). Справедливость этого включения показывает, что [g, К(у, epi/), т. е. jx ><p(g). Предложение 2.6. Пусть х<= dom/, у = [я, /(я)]. Тогда конус К (у, hyp/) устойчив вниз и порождает функцию g^ /* (я, g). Доказательство проводится с помощью тех же соображений, что и доказательство предложения 2.5. 4. Верхние и нижние производные, осуществляющие аппроксимацию функций, выше были определены с по-
22 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ мощью конусов, аппроксимирующих множества. Возмо- жен и другой подход: вначале определить производные, а затем с их помощью ввести в рассмотрение аппрокси- мирующие конусы. При этом используется функция р0, указывающая расстояние до множества Q. По опре- делению ра(у) = inf ||z — g||; zeQ понятно, что ро(*/) = 0 в том и только том случае, когда у е cl Q. Это обстоятельство позволяет сразу описать ко- нус допустимых направлений у(х, Q) в терминах функ- ции р0: а именно £еч(.£, Q) в том и только том случае, когда р0(я + ag) = 0 при всех достаточно малых а > 0. Описание конусов касательных и возможных направ- лений проводится с помощью верхней и нижней произ- водной Дини функции р0. Прежде чем сформулировать соответствующее утверждение, сделаем ряд замечаний. Пусть х е cl Q, g — некоторое направление. Так как р0 (х) = 0, то (Pq)d(^, ^“lim-ipaCr + ag), (2.11) a|o а (pa)i> {х, g) = lim pQ (х 4- ag), (2.12) афо Ра (*. g) = Ит pQ (х + ag). (2.13) афо а Так как, кроме того, pQ(^ + ag)>0, то (рд)п(я, g)^® при всех g. Поэтому соотношение (Pq)d (#> g) = 0 влечет су- ществование производной рй(#? g) и равенство ее нулю. Предложение 2.7. Пусть х -е cl Q. Тогда К (ж, Q) = {g I (pq)£> (х, g) = 0) = {g I (pn)' (ж, g) = 0}, (2.14) Г(х, Q) = {g| (pq)d(x, g) = 0}. (2.15) Доказательство. Установим вначале равенство (2.14). Учитывая определение функции р0, для любого a > 0 можно найти такой элемент Q, что Ь + ag — yall р0(я + ag)+ a2. (2.16) Положим ф(а) = х + ag — Если (ро)'^, #)=0, то, как следует из (2.13) и (2.16), ip(a) является беско- нечно малой первого порядка. Поскольку а: + ag + + ф(а)=1?аей, то g^K(x, £2). С другой стороны, если
§ 2. ПРОИЗВОДНЫЕ ДИНИ И АДАМАРА 23 g^K(x, й), то найдется такая функция *ф(а), что х + + ag + г|)(а)е Q и а-11|)(а)-^ 0. Имеем 1 1 — ра(х + ag) <— ||(х + ag) — (х + ag + ф (а))|| = = а-1||А|)(а)||->0. Тем самым равенство (2.14) доказано. Перейдем к доказательству формулы (2.15). Восполь- зуемся равенством (2.12). Пусть нижний предел в фор- муле (2.12) равен нулю и последовательность {aft} тако- ва, чтоаДОи —Рй(^ + а^)->0. Найдем элементы иЛ^Й, ak обладающие тем свойством, что II# + ahg — vhW < afe/A, и wk положим wk = х + akg — vk, g — — = gk. Тогда x + = “л = vk <= Й, gh — g -> 0, откуда следует включение ^еГ(х, й). Предположим теперь, что g — возможное направление в точке х относительно множества Й. Тогда найдутся та- кие последовательности {aj, {gj, что ак 4 0, gk -* g, х + akgk <= й. Последнее включение можно переписать в виде х + akg + ak(gk — g)e й. Имеем po(z + asg)s£ II(х + akg) — (x + akg + ak(gk— g))H «S «л — Д I Таким образом, —ря (x + akg) -> 0 ak lim pQ (a: + ag) = 0. Mo и, следовательно, Замечание 2.1. Используя предложение 2.7, пока- жем, что конус касательных направлений К(х, й) к вы- пуклому множеству Й в точке х е cl Й в точности совпа- дает с замыканием с!Ях(Й) опорного конуса ЛГХ(Й). Для этого воспользуемся следующими утверждениями (см. приложение I): 1) если й выпукло, то функция pQ выпукла; 2) выпуклая функция в каждой точке имеет произ- водную по направлениям. Из этих утверждений вытекает, что{^| ря(#> g) = 0} = = 1g| Рй(х, g)=0). Тем самым, в силу предложения 2.7, К(х, й)=Г(я, Й). В то же время (см. предложение 1.2) Г(лт, Й) = с1Ях(Й).
24 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ § 3. Некоторые свойства производных Дини и Адамара 1. В § 2 были определены производные по направле- ниям для функций, заданных на всем пространстве и действующих в расширенную числовую прямую. Ниже, как правило, будут рассматриваться функции, принимаю- щие лишь вещественные значения и определенные на некотором открытом множестве. Понятно, что, доопреде- лив их в случае необходимости каким-то образом на. все пространство, мы придем к уже рассмотренной ситуации. Пусть функция / определена на некотором открытом множестве Q cz Rn и принимает там лишь конечные зна- чения. Напомним, что верхняя и нижняя производные Дини этой функции в точке х Я по направлению g е е Rn, обозначаемые через /1 (х, g) и /£> (х, g) соответст- венно, определяются так: /о (*, g) = Km (/ (х + ag) — / (x))t оцо а fi>(х, g) = Km^-(/(a; + ag) —/ (ж)). Производной по направлению (или производной Дини) называется предел /' (*, g) = Km (f (х + ag) — / {х)). (3.1) а|о a В случае если эта производная существует и конечна, будем также говорить, что функция / дифференцируема (по Дини) в точке х по направлению g. Говорят, что функция / дифференцируема по направлениям (или диф- ференцируема по Дини), если предел (3.1) существует и конечен при всех g. Иногда наряду с символом f (х, g) будем использовать для производной по направлению df (х) t . следующие обозначения: , /«(g). Непосредственно из определений следует, что произ- водная Дини является положительно однородной первой степени функцией направления: /«(M = Vx(g) VX>0. То же относится, разумеется, и к верхней и нижней про- изводным.
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 25 Зафиксируем точку х Q, направление g е Rn и рас- смотрим функцию вещественной переменной ф(а) =/(я + ag), определенную при a > 0. Понятно, что /d (я, g) совпада- ет с верхней правой производной ф+ (0) функции ф в точ- ке a = 0, /г> (я» g) — с нижней правой производной Ф^. (0) этой функции, а производная f (х, g) — с правой произ- водной ф^ (0). Напомним, что по определению Ф+ (0) = Пт -1g (ср (а) — <р (₽)), а“Р Ф+ (0) = lim (ср (а) — ср (0)), а!Р н Ф+ (0) = lim (<р (а) — <р (0)). (U0 а~Р Таким образом, производная Дини (соответственно, верх- няя и нижняя производные Дини) является просто одно- сторонней производной (соответственно, верхней и ниж- ней односторонней производной) обычной числовой функции и при их изучении можно использовать методы анализа функции одной переменной. Это обстоятельство позволяет, в частности, говорить о дифференциальном ис- числении по отношению к производным по направлению. Точнее говоря, справедливо следующее утверждение. Предложение 3.1. Пусть функции /1 и /2 диффе- ренцируемы по направлениям в точке х. Тогда их сумма и произведение, а также частное (если /2(2)^ 0) также дифференцируемы по направлениям в этой точке. При этом (fl + g) = fl(x’ g) + /2 (я, g)> (fl — fzY (X’ g) = fl (x> g) — fz (x> g\ a if 2)' (x< g) = fi (x) fz (x> g) + fz (x) A (x> g)> ( y-) (X, g) = г (A (X) 1* (X' ~ g^' Для доказательства следует рассмотреть функции Ф1(а) = /1(я + а£) и ф2(а) = /2(2 + ag) и применить к ним классические теоремы дифференциального ис- числения.
26 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ . Замечание 3.1. Из предложения 3.1 следует, что дифференцируемость по направлениям функции / влечет дифференцируемость по направлениям функции при любом вещественном % и равенство (kf)'(x> Kf' (х, S) • Ниже будут приведены теоремы о дифференцируемо- сти по направлениям максимума и минимума конечного числа дифференцируемых по направлениям функций, а также теорема о дифференцируемости сложной функ- ции (композиции). Сейчас обратимся к аналогу теоремы о среднем. Теорема 3.1. Пусть функция / определена и непре- рывна на некотором открытом множестве Q с 0?п и отре- зок {у\ у = х + ag, aG[0, ао]} целиком содержится в Q. Положим m= inf + ag, g), М= sup fB(x+.ag, g). as(0,a0] »e[o.“o] Тогда тпао < f(x + aog) — f(x) C >a0. Доказательство теоремы опирается на следующую лемму. Лемма 3.1. Пусть функция h(a) определена и не- прерывна на отрезке [а, Ь]. Тогда-. 1) если h+(a) 0 при всех а^(а, Ь), то h(b)> h(a); 2) если h+(a)^0 при всех а^(а, Ь), то h(b)^h(a). Доказательство. Ограничимся доказательством лишь первой части леммы. Зафиксируем 8 > 0 и рас- смотрим подмножество А отрезка [а, &], состоящее из чисел а, обладающих следующим свойством: если а а, то A(P)-ft(a)>-e(p-a). (3.2) Из определения следует, что множество А с каждой сво- ей точкой содержит отрезок [0, а]. Кроме того, а^А. Таким образом, А является непустым промежутком. Пусть 7 — правый конец этого промежутка. Так как функция h непрерывна, то, переходя в неравенстве (3.2) к пределу при £ t 7, получим Л(7)— h(a)> —8(7 — a), (3.3) откуда следует, что 7 е Л. Таким образом, А = [а, 7]. Покажем, что 7 = 6. Предполагая противное, для каждого
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 27 6>0 яайдем такое число аее(0, 6), что Л(7 + ав)—/г(а)<—8(7+ ав— а). (3.4) Из (3.3) и (3.4) следует равенство—[Л(?+аб)——е, ад которое показывает, что Л+(т) = lim-i- [Л(у + а) —&(?)]< —е<0. ~оа Это противоречит условию леммы. Таким образом, = Ъ и, следовательно, h(b)—h(a)'>—е(& — а). Устремляя е к нулю, убедимся в справедливости леммы. Доказательство теоремы 3.1. Положим h(a) = = f(x + ag), а^[0, ао]. Тогда h'+ (а) = /£)(я + g) и по- тому А+(а)^Мпри всех а^(0, ао). Положим /и(а) = = Ma — h (а). Так как (а) = М — h'+ (а) 0, то, в силу леммы 3.1, получим Л1(ао)> Л1(0) или, что то же самое, Afao—Л(ао)^—Л(0). Последнее неравенство мо- жет быть переписано в виде /(х + ао£)—f(x)^ Мао. Подобным же образом с помощью функции /^(a) = = h (а) — та доказывается неравенство /(х + aog) — — /(х)>тпао. Следствие 3.1. Пусть функция / определена на от- крытом выпуклом множестве Й, ее верхняя производная Дини ограничена на этом множестве сверху, а нижняя производная Дини — снизу, иными словами, существует такое число L > 0, что sup inf /i(x, g)> — L. xeQ,!lgll=i xeQ,llgll=i Тогда функция f удовлетворяет на множестве й условию Липшица, причем липшицева константа совпадает с числом L. Действительно, пусть х, у и х = у + ag, где Hgll = 1, а = Их—у\\. Тогда, как непосредственно следу- ет из теоремы 3.1, — L Их — z/ll f(y)— /(х)^ L Их — у\\. 2. Функция /, определенная на открытом множестве Й, называется равномерно дифференцируемой по направ- лениям (или по Дини) в точке х £ й, если она имеет в этой точке конечную производную по всем направлениям
28 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ и существует такое число ао > 0, что ^|/(® + ag) — /(я) — а/'(я, g)| <е Vae=(0, а0), Vgf=S, (3.5) где S = {g| Ilgll =4} — единичная сфера. Полагая ag = у, неравенство (3.5) можно переписать так: |/(ж + V) — f(x) — Л(р)|<||И Vv: ||у||<а0. (3.6) Таким образом, равномерная дифференцируемость по на- правлениям означает, что + о.?) В дальнейшем, как правило, рассматриваются лишь функции, у которых производная по направлениям fx в точке х является непрерывной как функция направле- ния. Следующий пример показывает, что равномерная дифференцируемость не обеспечивает этого свойства. Пример 3.1. Пусть {^ — последовательность раз- личных точек на единичной окружности пространства R2. Положим {АХ, если х = Kxh при некоторых А и Х> О, О в противном случае. Нетрудно проверить, что функция / равномерно диффе- ренцируема по направлениям в точке х = 0; в то же вре- мя производная /х разрывна. Оказывается, что равномерная дифференцируемость по направлениям вместе с непрерывностью производной эквивалентны дифференцируемости по Адамару (т. е. су- ществованию и конечности производной Адамара по всем направлениям; определение производной Адамара см. в § 2). Точнее говоря, справедливо следующее утверж- дение. Теорема 3.2. Функция f дифференцируема по Ада- мару в точке х тогда и только тогда, когда она равно- мерно дифференцируема по Дини и ее производная fx' непрерывна как функция направления. Доказательство. 1) Пусть / дифференцируема по Адамару. Тогда она дифференцируема и по Дини. Непре- рывность jx по g доказывается от противного. Покажем
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 29 равномерную дифференцируемость. Для любого е > 0 и любого направления g из единичной сферы S найдутся такие числа > 0 и а5>0, что \f(x + <*g')— f(x)~ — а/н(я, g)| <а*е/2 при любых а®(0, ag) и g' е <^V(g, 'Пя) = ^1 Ilg — gH <цД. Так как функция g ~ f'(x, g) непрерывна, то найдется такое > 0» что g)—f(x> g')l<e/2 при g'^V(g, lg). Положим 6g = min (%g). Семейство окрестностей {V (g, 6g)} яв- ляется открытым покрытием сферы S. Воспользовавшись компактностью сферы, выберем из этого покрытия конеч- ное подпокрытие, определяемое тачками gi, g2, ..gm. Положим a0=min(agi,..., agm). Если g e 8, то найдется такое к, что g е V(gkt 6gft). При a < a0 agk выполня- ются неравенства (см. (3.8)) |/(x + ag) — f(x) — a/н (x, g) | < <|/(* + ag) —/(*) —а/н(ж,£л)| + + а|/н(«, gk) — /н(я, g)|<ae. Таким образом, f равномерно дифференцируема по на- правлениям в точке х. 2) Пусть функция / равномерно дифференцируема по направлениям и производная fx непрерывна. Имеем |4 (/ +а^)—/ <*))_ /' <х» £) | < <[-£-/(*+ ag') —/(*)-/'(*, g')| + + \f(xt g’) — f(x, g)\. (3.9) Зафиксируем e > 0. Используя равномерную дифферен- цируемость, найдем £о > 0, обладающее тем свойст- вом, что + — /<*))“/'(а:>1,)1<8 VPe(O,po) VyeS. (3.10) Пусть g' ¥=0 и v = g'/\\g'W. Тогда, используя положитель- ную однородность производной, имеем ^- (/ (« + ag') — / (х) — /' (х, g')) = =И*•»[mW (/(ж + ai|g'Hp) (ЗЛ1>
30 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Полагая a Ill'll = 0, ао = ₽о/М> получим, исполь- зуя (3.10): |4-(/<ж+ £')|<ek'll Va<=(0, а0). Это же соотношение верно и при g' = 0. Таким образом, первое слагаемое в правой части (3.9) может быть сде- лано сколь угодно малым сразу при всех g' из некоторо- го шара с центром в точке g. Второе слагаемое будет ма- ло при g', близких к g, в силу непрерывности функции g^f (ж, g). Таким образом, / диф- м . ференцируема в точке х по Ада- мару. Если функция / дифференци- руема по Адамару в некоторой точке х, то она непрерывна в этой точке. Это следует, например, из (3.7). Таким образом, равномер- ная дифференцируемость по Ди- ни и непрерывность производной как функции направления влекут непрерывность самой функции. Если дифференцируемость функ- ции / в точке х не равномерна, то функция в этой точке может терпеть разрыв, даже если производная непрерывна как функция направления. Приведем соответствующий пример. Пример 3.2. Рассмотрим на плоскости с координа- тами (u, v) множество Q, изображенное на рис. 1: Q = = Qi U Q2 U Q3, где Qi — выпуклое множество, ограничен- ное параболой и = гг2, Q2 — выпуклое множество, ограни- ченное параболой и = —u2, Q3 — общая касательная к этим параболам в точке хо =(0, 0). Пусть /м’|о’ если если zeQ, x^Q. Тогда, как нетрудно проверить, / дифференцируема по направлениям в точке xq (и притом не равномерно), /' (хо, g)=0 при всех g. В то же время функция / раз- рывна в нуле. Напомним, что вектор v называется производной Гато в точке х, если для любого g е Rn выполняется f(x + ag)= f(x)+ a(g, и)+ов(а),
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 31 где —Og (а) ^^0. Иными словами, производная Гато — это линейная производная Дини. Ясно, что производная Га- го функции / в точке х совпадает с градиентом V/(#). Говорят, что / дифференцируема по Фреше в точке х, если справедливо представление /(* + y)=/(*) + (W)> у)+о(у), (3.12) где -в -^ > 0. В силу (3.7) это означает, что / равномер- но дифференцируема по направлениям, причем произ- водная /х линейна и, стало быть, непрерывна. Теорема 3.2 показывает, что дифференцируемость по Фреше рав- носильна «линейной дифференцируемости» по Адамару. При некоторых предположениях на функцию диффе- ренцируемость по Дини влечет дифференцируемость по Адамару. Приведем один результат такого рода. Предложение 3.2. Пусть функция / дифференци- руема по направлениям в точке х и удовлетворяет усло- вию Липшица с константой L в некоторой окрестности этой точки. Положим jx(g) = /'(я, g)- Тогда*. 1) производная fx удовлетворяет на всем Rn усло- вию Липшица с той же константой L; 2) функция / дифференцируема по Адамару. Доказательство. При достаточно малых а имеем \f(x + ag) — f(x + ag') I aL llg — g'll. Поэтому IA (/ (ж + ag) — / (x)) — A (/ (x + ag') _ f (x)) I < Z, |g— g'||. I (A I (3.13) Переходя к пределу при a I 0, получим из (3.13) Ite) — 4 (я') I < £ к — Л • Проверим, что / дифференцируема по Адамару. Имеем lim А (/ (х + ag') — / (х)) = g'^g а = lim A(f(x +ag') — /Cr + ag)) + alo.g'-bg + Ит A (/ (x + ag) — f (x)). alo a
32 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Так как / удовлетворяет условию Липшица, то первый из написанных оправа пределов существует и равен нулю, второй предел, равный f (х, g), также существует. Тем самым дифференцируемость по Адамару доказана. 3. Класс функций, дифференцируемых по направле- ниям, достаточно широк. Он содержит все гладкие (диф- ференцируемые по Гато) функции, выпуклые и вогнутые функции (см. Приложение I), а также функции макси- мума (см. следующий пункт). Предложение 3.1 и замечание 3.1 показывают, что совокупность дифференцируемых по направлениям функ- ций является линейным пространством, содержащим с каждыми двумя своими элементами их произведение и частное (если делитель отличен от нуля). Более того, существование производной Дини у функций f\ и /г вле- чет существование этой производной и функций / и /, где /(«) = min {/i (х), /2 (я)}, 7(®) = max {/i (х), /2 (х)1. (Этот вопрос детально обсуждается в п. 4.) Приведем теорему о производной композиции. Пусть задано отображение Н\ где Q — открытое мно- жество в Rn. Координатные функции этого отображения обозначим через ..., Лт, так что Нх — (h\ (х), ... ..., hm(x)). Производная И'(х, g) отображения Н в точ- ке х по направлению g определяется как предел lim (Я (х + ag) — Нх). а|0 “ Как и в случае вещественной функции, используется так- же термин «производная Дини». Предел lim А (Я (х + ag') — Нх), a!o,g'-*g a который мы обозначим тем же символом Н' (х, g), назы- вается производной Адамара отображения Н в точке х по направлению g. Понятно, что производная Дини или Адамара существует тогда и только тогда, когда коорди- натные функции hi имеют соответствующие производные. При этом Н’ (х, g) = (hT(x9 g), ..hm(x, g)). Теорема 3.3. Пусть Qi — открытое множество в пространстве [Rn, Q2 — открытое множество в 0?w, отобра- жение Н: Qi Q2 дифференцируемо по направлениям в точке х ^ Qi, функция / определена на £22 и дифферен-
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 33 цируема по Адамару в точке Н(х). Тогда функция ф(з) = = f(Hz) дифференцируема в точке х по направлениям, причем ф'Сг, g) = f(Hx, Н'(х, g)). (3.14) Если, кроме того, отображение Н дифференцируемо по Адамару, то и (р дифференцируемо по Адамару. Доказательство. Положим ш£) = 4 — Нх — аН'(х, g)], (Л + — i(Hx) — t'(Нх> “)Х Vu=#o, и (a, g) = Н' (х, g) + со (а, g). Пусть отображение Н дифференцируемо по направлени- ям. Тогда (о (ос, g)—► 0 и, тем самым, и (a, g)-+ Н' (х, g). Qt 1 О Имеем q(x + ag) = f(H(x + ag)) = f(Hx + аН'(х, g) + aco(a, g)) — = f(Hx)+af'(Нх, u(a, g))+г|)(аи(а, g))-Hau(a, g)H. (3.15) Так как дифференцируемость по Адамару функции / вле- чет ее равномерную дифференцируемость и непрерыв- ность производной f (Нх, и) как функции направления и, то из (3.15) вытекает существование производной Дини ф'(я, g) функции ф и равенство (3.14). Предположим теперь, что отображение Н дифферен- цируемо по Адамару. Тогда если g' g и a I 0, то со (a, g')-+0, Н'(х, g')-+H'(x, g) и, следовательно, u(a, g')~*H'(x, g). Привлекая (3.15), убедимся в су- ществовании производной Адамара <р'(х, g). 4. Здесь изучаются дифференциальные свойства так называемой функции максимума, т. е. функции вида Ф (х) = max / (х, у) \fx е X. (3.16) 1/еУ Заметим, что оборот «функция максимума», так же, на- пример, как «сложная функция» в классическом анализе, относится не к виду функциональной зависимости, а к способу ее задания. В дальнейшем предполагаем, что / — непрерывная по совокупности переменных функция, оп- ределенная на X X Y, где X — открытое множество в Rn, Y — компактное множество в Отметим, прежде все-
34 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ го, что <р непрерывна. Действительно, пусть х е X и V — компактная окрестность точки х. Функция / равномерно непрерывна на компактном множестве V ХУ, откуда следует, в частности, что для любого е > О найдется та- кое 6 > О, что /(Л у) — y)<f(x', у) + е УуеУ, х'<=$6(х). Переходя в этих неравенствах к максимуму по У, убе- димся в требуемой непрерывности. Для х е X обозначим через R(x) множество точек у « У, на которых в (3.16) достигается максимум: R(x)={y^Y\ <р(*) = Ж у)}. (3.17) Из непрерывности функций <р и / легко следует, что мно- жество R(x) замкнуто и, следовательно, компактно. Бо- лее того, справедливо следующее утверждение. Предложение 3.3. Многозначное отображение ь-> R (х) замкнуто *). Доказательство. Пусть xh х, yk-+ у, yk -е R . Тогда q(xk)= f(xk, yh). Так как функции / и ср непре- рывны, то <р (#) = /(#, у), 'откуда и следует требуемое. При исследовании дифференциальных свойств функ- ции максимума важную роль играет дифференцируемость по направлениям, равномерная относительно параметра. Пусть f(x, у) — непрерывная функция двух переменных, определенная на X X У, где X — открытое множество, У — компакт. Предположим, что для каждого у функция я'•->/(#', у) дифференцируема по некоторому направлен нию g в точке х (в смысле Дини или Адамара). Обозна- чим ее производную по этому направлению через f(x, У, ё)* Положим (Пх.Да, y) = f(x + vg, y)-f(x, y)-af'(x, у, g). (ЗЛ8) По определению для любого 8 > 0 и для любого у е У существует такое число 6(s, g), что 1(0ж,Да, у) \ < еапри 0<а<6(е, у). Говорят, что функция f дифференцируе- ма по направлению g в точке х равномерно относительно параметра у, если величину 6(8, у) можно выбрать не- зависимо от у, т. е. по любому е > 0 найдется такое 6(е)>0, что 1й)а^(<х, у) I < еа при всех у и всех ае=(0, 6(e)). *) По поводу замкнутых многозначных отображений см. При- ложение II.
§ 3. СВОЙСТВА ПРОИЗВОДНЫХ ДИНИ И АДАМАРА 35 Заметим, что дифференцируемость функции /(л, у) по направлению g в точке х равномерно относительно у вле- чет непрерывность функции у f'(x, у, g). Действитель- но, эта функция является равномерным пределом при а I 0 семейства непрерывных функций ha(y) = + + ag, — У))- Теорема 3.4. Пусть Ф (х) = max / (х, у) Vx е X, V^Y где X — открытое, a Y — компактное множества, функ- ция / непрерывна по совокупности переменных и диф- ференцируема по направлению g в точке х равномерно относительно параметра у. Тогда функция ф дифференци- руема по направлению g, причем ф'(*, g) = max У, g)> y^R(x) где множество R(x) определено формулой (3.17). Доказательство. Если у *= R(x), то 4 (ф (х + ag) — Ф (х)) >-£-(/(* + ~ f (х’ Переходя в этом неравенстве к пределу при а ! О, полу- чим фр (я, откуда, ввиду произвольности y^R(x), следует неравенство <Р^ (х, g) > max f (х, у, g) (3.19) уек(х) (максимум в правой части (3.19) достигается ввиду ком- пактности множества R(x) и непрерывности функции у, g)). Рассмотрим теперь элемент у а из множества Л (я + ag) (а > 0). Имеем f(x + ag, уа) — f(x, ya) = af(x, уа, g) — <ом(а, уа), где сох,£ — функция, определенная формулой (3.18). Учи- тывая определение множества R(x + ag), имеем 4 (ф (* + ag) — ф (*)) < (/(* + ag, уа) — f(x, Уа)) = = f(x,ya,g) — -^®x,g(y№,a). (3.20) Так как Y — компактное множество, то, не умаляя общ- ности, можно считать, что существует предел Иш уа = у'. а|о
36 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Поскольку отображение R замкнуто (см. предложе- ние 3.3), то y^R(x). Из непрерывности функции у>~* f (х, у, g) следует, что /' Уа, g) f (*, у', g) < max f (х, у, g). Используя равномерную дифференцируе«мо1сть функции /, получим, что для любого е > 0 при достаточно малых а > 0 выполняется неравенство cox>g (а, у^ < е; поэтому уа) = 0. Учитывая сказанное и переходя в а|о (3.20) к верхнему пределу, получим ФМ*’ S)< max f'(x, у, g). W=R(x) (3.21) Доказательство теоремы следует из неравенств (3.19) и (3.21). Замечание 3.2. Если функция / удовлетворяет ус- ловию Липшица с константой L по совокупности пере- менных, то и функция <р удовлетворяет этому условию с той же константой. Если в данном случае условия тео- ремы выполнены для всех направлений g, то функция ср дифференцируема по Адамару. Это следует из предло- жения 3.2. Замечание 3.3. Если дифференцируемость функции / не является равномерной по параметру, то теорема 3.4 перестает быть справедливой. Соответствующий пример приведен в § 6 (см. пример 6.1). Там же указан один случай, когда дифференцируемость ф можно гарантиро- вать без равномерной дифференцируемости /. При этом получается формула для производной, которая в некото- рых случаях дает ответ, отличный от предлагаемого тео- ремой 3.4. Приведем еще два следствия из теоремы 3.4. Следствие 3.2. Пусть ф(<г) = max /i(rr), iei:m где fi — непрерывная и дифференцируемая в точке х по направлению g функция, определенная на открытом мно- жестве X. Тогда производная ф' (х, g) существует и вы- числяется по формуле ц)'(х, g) = max fi(x, g). ieB(x)
§ 4. АППРОКСИМАЦИЯ МНОЖЕСТВ. УСЛОВИЯ РЕГУЛЯРНОСТИ 37 Это утверждение сразу вытекает из теоремы 3.4, если положить Y = {1, ..., т} и /(я', ?) = /i(z') Vz' е X, VZe еУ. Следствие 3.3. Пусть Ф (х) = max f(x,y) V# е X, i/eY где f — непрерывная функция, определенная на X X У, имеющая на этом множестве непрерывную же частную производную (Здесь, как обычно, X — открытое, а У—компактное множества.) Тогда функция ф диффе- ренцируема по любому направлению g, причем g) = max (х, у), g\. (3.22) уен(х) \ох J Понятно, что при сделанных предположениях для каждого у е У существует производная /' (х, у, g), при- чем эта производная совпадает с 0^ Поэтому формула (3.22) следует из теоремы 3.4. Чтобы ее при- менить, следует лишь воспользоваться легко проверяе- мым утверждением о том, что в рассматриваемом случае дифференцируемость равномерна по параметру у. Функция £^-*ф'(я» g), где ф'(я, g) определена форму- лой (3.22), представима как максимум некоторого мно- жества линейных функций. Отсюда сразу следует, что она субаддитивна: ф' (х, £i + £2)^ ф'(я, £1)+ф'(я, £2) при всех gi, £2. Поскольку, кроме того, эта функция, как всякая производная, положительно однородна, то она и сублинейна. (По поводу сублинейных функций см. При- ложение I.) § 4. Аппроксимация множеств, заданных с помощью неравенств и уравнений. Условия регулярности Аппроксимирующие конусы часто приходится нахо- дить для множеств, которые задаются как совокупность решений неравенства h(x)^0 или уравнения h(x) — 0, где h — некоторая непрерывная функция. В теории эк- стремальных задач ограничения, задающие множества подобным образом, иногда называют «ограничениями ти- па неравенства» или «ограничениями типа равенства» соответственно. В некоторых случаях описание конусов,
38 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ аппроксимирующих указанные множества, удается дать с помощью производной по направлению. Рассмотрим сначала множества, которые могут быть описаны с по- мощью «ограничений типа неравенства». 1. Пусть Q = {a;eX| h(x)^ 0), где h — непрерывная функция, определенная на открытом множестве X в Rn Если h (х) <0, то х е int й и потому у (х, й) = К (ж, й) = = Г (х, й) = КЛ. Поэтому интерес представляет лишь точка я, для которой h(x)=Q. Предположим, что h диф- ференцируема по Адамару в точке х и введем в рас- смотрение множества = tel h'(x, g)< 0}, Г1(х)= {gl h'(x, g)^z 0). (4.1) Так как производная h' (x, g) является непрерывной функцией направления, то множество 71 (х) открыто, а множество Г1(я) замкнуто. Так как функция h'(х, g) положительно однородна по g, то эти множества явля- ются конусами. Укажем на связи конусов Ч\(х) и Г1(я) с конусом допустимых направлений ^(х, й) и конусом Булигана Г (я, й). Предложение 4.1. Справедливы включения 71 (я) с 7 (я, Й), Г (х, й) <= Г1 (х). Доказательство. Пусть ge 71 (ж). Тогда h (х + ag) = h(x)+ ah' (х, g)+ о (а) 0 при достаточно малых а > 0, и потому х + ag е Й при указанных а. Это и означает, что gG7(^, й). Рассмот- рим теперь элемент g конуса Г (.г, Й). Найдутся такие последовательности gh-+ g и ak I 0, что h (х + ahgh) 0. Так как h(x + ahgh) = h (х) + akh' (х, gh) + о (a*gA), где h(x) = 0, o(p)/llpll-> 0, производная h'(х, g) непре- рывна по направлению, то h'(х, g)^0, т. е. g <= Г1(ж).Я Будем говорить, что в точке х ей, для которой h(x) = = 0, выполнено условие регулярности, если с! 71 (я)= Г1 (я). (4.2) Предложение 4.2. Если в точке х выполнено ус- ловие регулярности, то Г (х, й) = с! 7 (х, Й) = Г1 (х).
§ 4. АППРОКСИМАЦИЯ МНОЖЕСТВ. УСЛОВИЯ РЕГУЛЯРНОСТИ 39 Доказательство следует из предложения 4.1. Ситуация, в которой условие регулярности не вы- полнено, возникает, например, в случае, когда функ- ция h достигает в точке х глобального минимума на всем множестве X, т. е. неравенство Л(у)^О влечет ра- венство /г(*/)=0 (напомним, что Л(я)=0). Действи- тельно, в этом случае 71 (я) пусто, множество же Г1 (х) всегда не пусто, оно содержит нуль. Укажем один простой случай, когда можно гаранти- ровать выполнение условия регулярности. Существенно более общая ситуация разбирается в § III.3. Предложение 4.3. Пусть производная h'(х, g) сублинейна по g и при некотором v выполняется нера- венство h'(х, у)<0. Тогда справедливо условие регуляр- ности (4.2). Доказательство. Пусть ^еГ1(т:) и h'(х, g) = = 0. Имеем h'(х, g + av)^h'(x, g)+ah'(x, и)<0, сле- довательно, g + av •<= Yi(x) при всех а>0. В то же вре- мя g + ар -> g при а I 0. Заметим, что предложения 4.1—4.3 справедливы и при отсутствии непрерывности h. Рассмотрим теперь функцию G(x, у), определенную на X X У, где X — открытое, а У — компактное множе- ства. Положим О={я|С(м)<0 Vi/еУ}. (4.3) Понятно, что й= Q Qy, где Йу = {#1 G(x, у)^0}, т. е. y^Y Й представляет собой пересечение «ограничений типа неравенств». В то же время й можно представить как одно «ограничение типа неравенства», а именно й = = {х| h(x)^ 01, где h (х) = max G (х, у). (4.4) y=Y Данный прием позволяет сводить описание множе- ства с помощью системы неравенств вида G(x, у)^0 к его описанию с помощью одного неравенства h(x)^0. При этом, однако, некоторые свойства функции G, зада- ющей указанную систему, могут теряться. Так, если G непрерывно дифференцирумая по х, то функция h этим свойством уже не обязана обладать, можно говорить лишь о дифференцируемости h по направлению. Ниже нам понадобится следующее утверждение. Предложение 4.4. Пусть множество й определе- но соотношением (4.3), где G — непрерывная вместе со
40 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ своей частной производной функция, причем функ- ция ограничена в области определения XX У функции G (напомним, что X — открытое, а У — ком- пактное множества). Пусть, далее, x^Q и G(x, у) = 0 при всех у ^R (х), то справедливы равенства R(x) = {yt=Y\ G(x,y)^G(x,y') \fy'e=Y}. Тогда, если существует такая точка v, что^^(х, y)f при всех y^R(x), то справедливы равенства с1у(я,й) = Г(х, Q) = g[ [^(х,у), g <0 Vye=R(x) Доказательство. Пусть функция h задана фор- мулой (4.4). Следствие 3.2 показывает, что h’ (х, g) = max ((х, у), Д (4.5) уав(х)\°^ / тх м && Из ограниченности частной производной легко сле- дует, что функция h удовлетворяет условию Липшица и потому производная h' (х, g) является производной Адамара. Формула (4.5) показывает, что эта производ- ная сублинейна по g, кроме того, выполняется неравен- ство h'(х, v)<0. Поэтому применимо предложение 4.3, в силу которого выполнено условие регулярности. При- меняя предложение 4.2 и используя формулу (4.5), убе- димся в справедливости доказываемого предложения. 2. Покажем, что при выполнении условия регуляр- ности конус Булигана осуществляет равномерную ап- проксимацию первого порядка множества Q« = Ul h(x)^ 0). Теорема 4.1. Пусть точка x^Q такова, что h(x)=* = 0, функция h дифференцируема по Адамару в этой точке и выполнены условия регулярности (4.2). Тогда конус Г (я, Q) является равномерной аппроксимацией первого порядка множества Q вблизи точки х. Доказательство. Для б > 0 положим £2б(я)= Q П«$б(я), Ге(^) — (х + Г(х, Q))A $)6(х).
§ 4. АППРОКСИМАЦИЯ МНОЖЕСТВ. УСЛОВИЯ РЕГУЛЯРНОСТИ 41 Требуется показать, что р(£2б (л),.Гб(х)) = = шах ( max min || z — у ||, (zer6(x) 1/=йб(х) max min ией6(х) zer6(x) к—у = 0(6). (4.6) Предположим, что соотношение (4.6) не выполняется. Тогда возможны два случая: 1) существуют такие числа а>0и последовательно- сти {6ft}, {zh}t что 10, zh s 1\(я), min || y — zft||>a6ft; (4.7) veQ6fc(x) 2) существуют такие число а > 0 и последовательно- сти {6А}, {zj, что 6Й! О, Уь е Qgft(x), min || z — yft||>a6ft. zereft(x) (4.8) Рассмотрим первый случай. Так как ^еГб^(х), то zk представимо в виде zh = х + 8кик, где H-rJI 1, vk^ Q). Не умаляя общности, считаем, что vk -> и. Так как конус Г (я, £}) замкнут, то Q). Поэто- му (см. предложение 4.2) h'(х, г)^0. Используя ус- ловие регулярности (4.2), найдем такой элемент v', что Hr — v'H.< aJ2 и h'(х, г')<0. Имеем h(x + 6ftr') = h(x) + + 8kh'(x, r')+o(6ft), поэтому при достаточно больших к выполняется неравенство h(x + 6ftr')=^ 0, показывающее, что х + 8kv' е Q. Так как, с другой стороны, х + 6&rft е e^6ft(x), то х + 6fer'eQdft. Привлекая (4.7), получим Их + 6ftr' — ZftH > a6ft. (4.9) Поскольку zh = х + 6ftrft, то неравенство (4.9) может быть переписано так: Hr' — rfcll > а. (4.10) Из (4.10) следует, что Пр' — pH > а, а это противоречит выбору элемента и'. Иткк, случай 1) невозможен. Перейдем ко второму случаю. Так как г/^ейбл(х), то Нг/ь — яН и потому найдутся такие векторы ик^$, что Уа = х + 8huh. В то же время yk -е Q и потому h(z + 8кик)^ 0. Функция h дифференцируема в точке х
42 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ по Адамару, поэтому h(x + 6huk) = h(x) + 6kh'(x, uh) + o(6huh), (4.11) где о(u)/IW -> 0 при v -> 0. Так как h(x) = 0, то из (4.11) следует, что (4.12) Без ограничения общности считаем, что существует предел limuA = u. Переходя в (4.12) к пределу, полу- чим, что h' (х, и)^0. Это неравенство показывает, что иеГ(л:, S2). Так как llull,^ 1, то х + bhu е Г^. Поэто- му, как следует из {(4.8), 1 Их + 6Au — yk\\ = Их + 6hu — (х + 6AuA) II. > бАа. (4.13) Неравенство (4.13) показывает, что Hu — иЛИ>а, а это противоречит определению и. Итак, случай 2) также не- возможен. Следствие 4.1. В условиях теоремы конус каса- тельных направлений К(х, Q) совпадает с конусом Бу- лигана Г(х, Q). При этом для любого £еГ(х, Q) мож- но найти такую функцию “фДа), что х + ag + г|)^(а)е й и а“Ч|^(а)-> 0 при а I 0 равномерно по g. Это вытекает из предложения 1.4. 3. Перейдем к «ограничениям типа равенства». Пусть множество й имеет вид Й = {уеХ| h(y)=O}. Здесь X — открытое множество в Rn, h — непрерывная на X функция, дифференцируемая по Адамару в точке х *е X. Рассмотрим, как и выше, конусы 'Г1(^)= tel h'(x, g)<0}, Г1(ж)= tel h'(x, g)<0), а также конусы Y2te) = tel h'(x, g)>0), r2(x)= {gl k'(x, g)>0). Установим связь конуса Булигана Г (a:, Q) с конусами с! у, и Г, (i = 1, 2). Пр едложение 4.5. Справедливы следующие вклю- чения: (cl у 1 (х)) П (cl у2 (х)) cz Г (х, Й) <= Г1 (х) П Г2 (х). (4.14) Доказательство. Второе включение в (4.14) очевидно, поэтому проверим лишь первое. Пусть g е
§ 4. АППРОКСИМАЦИЯ МНОЖЕСТВ. УСЛОВИЯ РЕГУЛЯРНОСТИ 43 (i=l, 2). Тогда найдутся такие последова- тельности И что А'(^^)<0, h'(x,£)>0 V*. (4.15) Неравенства (4.15) показывают, что для каждого к при достаточно малых а > 0 выполняются соотношения h (х + agj) <0, h (х + agl) > 0. Пусть ah — одно из этих чисел. Рассмотрим отрезок [х + х + aftg£]. Так как функция h принимает на его концах значения разных знаков, то найдется такая точка у на этом отрезке, что h(y)~O. Понятно, что у представима в виде у = х + akgh, где gh — выпуклая ком- бинация векторов gl и g%. Так как gk -> g, I 0, то g^ Г (я, Й). Будем говорить, что в точке х й выполнено усло- вие регулярности (относительно ограничения типа ра- венства), если si Y1 (х) = Г1 (х), с! у2(х) = Г2 (х). (4.16) Предложение 4.6. Если в точке х выполнено ус- ловие регулярности (4.16), то Г (я, fi)={gl h'(x, g)=0}. Доказательство следует непосредственно из предложения 4.5. , Замечание 4.1. Если множество Й представимо в виде й = {х | hi (x)^S) Vtel : к}, то, как отмечалось в п. 1, его можно записать в виде одного ограничения ти- па неравенства Й = {я| h(x)^Q}, где h(x) = maxhi(x). i Если для функций hi выполнены условия регулярности (4.2), то при естественных предположениях эти условия выполняются и для функции h. Если множество Й имеет вид {.г |(X) =0 \fi el : к}, то его можно задать одним ограничением, типа равен- ства Й = Lr| Л(я)=0}, где h(x) = max | ЛДх)|. При i этом, однако, для функции h условие регулярности (4.16) не выполняется. Поэтому случай нескольких ог- раничений типа равенств надо рассматривать особо. При его исследовании используют, как правило, ту или иную теорему о неявной функции.
44 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Замечание 4.2. Условие регулярности можно на- писать и в случае липшицевых, но не дифференцируе- мых по направлениям функций. Ограничимся лишь ог- раничением типа равенства Й = Lrl h(x) = 0). Положим Тю(я) = {g I (®. g) < 0}, ?2D (х) = {g I ho (x, g) > 0), Гщ(х) = {gI ДА(x, g)<0}, r2D(x) = {g I /Id (x, g)>0}. Будем говорить, что в точке х е Й выполнено условие регулярности, если cl Yid(*)== ГпДя), cl Y2d(*) = Г2]>(я). Можно показать, что при выполнении условий регуляр- ности справедливы равенства Г (ж, й)= Гю(лг) П Г2в(я) = cl Yid(z) A cl Y2d(*). § 5. Аппроксимация многозначных отображении В предыдущих параграфах изучалась однородная ап- проксимация множеств и функций. Перейдем к исследо- ванию однородной аппроксимации многозначных отобра- жений. 1. Пусть а: X -> 2 —многозначное отображение, оп- ределенное на открытом множестве X cz Rn и принима- 2®т всех подмножеств пространства Рассмотрим график gr а = {[х, у] I у е ^а(х)} этого отображения и аппроксимируем его вблизи некоторой точки z = [я, у], ему принадлежащей, с по- мощью конусов y(z, gra), K(z, gra) и Г (и, gra) всех допустимых, касательных и возможных направлений со- ответственно. Эти конусы лежат в пространстве КпхКт, и поэтому их можно рассматривать как графики неко- торых многозначных отображений, действующих из Rn в Rm. Обозначим эти отображения через у(х, у\ •), К(х, у; •) и Г (я, у; •) соответственно. Непосредственно из определений вытекают равенства ?(*>*/;£) = {и>| Ba0>0: y + aw<=a(x + ag) Уае=(Олао)},.
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 45 К (х, у\ g) = = {w I Зг|\ (= Tm, а|)2 е Тл: у + aw + (а) е е а(х + ag + гр2(а)) Va>0}, *) Г (х, у; g) = = {w\ 3gft->g, wh-+w, ak|0: у + ahwh e= a(x + akgh)}. Отображения ч(я, у; •), K(x, у\ •), Г(.г, у* •) одно- родны (если w^^{x, у; g), то у\ Ag) при %>0); то же можно сказать и о К(х, у\ •), Г (я, у\ •). Они выступают как объекты, осуществляющие аппрок- симацию исходного отображения а вблизи точки [х, у]^ е gr а. Их использование позволяет свести вопрос об аппроксимации отображений к вопросу об аппроксима- ции множеств. Наряду с у(х, у\ •) и К(х, у\ •) ниже будет использоваться отображение К(х, у, ♦) в каком- то смысле промежуточное между ними. По определению К(х,у, g) = = {w | Bip у + aw + ip (a) e a (x + ag) Va > 0}. (5Л) Ниже понадобится следующий простой факт, являющий- ся по сути дела переформулировкой определения. Предложение 5.1. Справедливо равенство K(x,y,g) = [w|pfiz?, -±-(а(х + ag) — у)—О}. Здесь р (п>, |) = inf || ip — z || — расстояние от элемента w до множества £. Доказательство. Если w^R(x, у\ g), то най- дется функция ip Тт, при которой у + aw + ф (а) а(х + ag). Поскольку w +е-— (а(ж + ag) — у), то р 4" — а-1 II1!’(а) II-’'0, Пусть w,—(a(# + ag) — у)1->0. Тогда найдется такой эле- мент za множества — (а(х + ag) — у), что w — za0. *) Напомним (см. п. 1 § 1), что Ч'п — множество бесконечно малых первого порядка, определенных при a > 0 и действую- щих в Rn.
46 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Полагая a(z<x — м?)= \|)(а), получим а-11|э(а)->0 и у + + aw + г|) (а) а (х + ag). Отметим, что множество Г(х, у; g) замкнуто при всех g. Это следует из замкнутости конуса возможных направлений Г ((я, у); gra). Предложение 5.2. Если отображение а имеет вы- пуклые образы, то множества у(х, у\ g) и R(x, у; g) выпуклы при всех g. Доказательство. Рассмотрим только множество R(x, У> g)- Пусть IP1, W2 ^R (х, у; g), ц е[0, 1]. Тогда при некоторых е Т'™ имеем у + aw\ + 4>i (a)e а(х + ag); у + aw2 + ф2(а)е а(х + ag), и потому у + a(|xiPi +(1 - и) w2)+ Hi(a) + (1 - |x)i|)2(a)e ^а(х + ag). Так как рд|)1 +(1 — jx) г|?2 *= Ч7™, то |Wi +(1 — p)w2 е у, g). Замечание 5.1. Пусть отображение а однозначно, т. е. a(x)={F(x)} при всех х, где F — отображение, дифференцируемое по Адамару в некоторой точке х. По- ложим Fx = y. Тогда множество R(x, у- g) при любом g непусто и содержит элемент w = F' (х, g). В самом деле, непосредственно из определения производной вытекает, что найдется функция i|)(a), обладающая теми свойства- ми, что а”1ф(а)->0 и у + aw + гр(а) = F(x + ag)^ ^a(x + ag). С другой стороны, если w^Y(x, у; g), то w — F' (х, g). Действительно, найдутся такие последо- вательности {gj, {wh}, {aj, что gft“> g, wh-+w, aft4 0, F (x) + akwh = F (x + akgk) = F(x) + ahF' (x, gh) + о (aA), откуда следуют соотношения wk-=F'(x, gA) + о (aft)/aA-> -+F'(x, g). Так как R (x, y; g)<=K(x, y; g)c=r(x, y; g), to R(x, y; g\=K(x, y; g)=r(x, y, g)={F,(^, g)}. Это обстоятельство дает повод рассматривать каждое из ото- бражений R(x, у; •), К(х, у; •), Г (я, у; •) как одно из возможных обобщений понятия производной на много- значные отображения. 2. В этом пункте будут рассматриваться замкнутые отображения а, имеющие выпуклые компактные образы. Предполагается, что doma = {rr| а(х)¥:0} совпадает с некоторым открытым множеством X.
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 47 На множестве XxRm определим функцию а(х, I), положив а (х, I) = max (Z, у). (5.2) При фиксированном х^Х равенство (5.2) приводит к опорной функции множества &(#).*) В связи с этим бу- дем называть функцию а(х, Z), х е X, ZelRw, опорной функцией отображения а. Иногда будет удобно рассмат- ривать эту функцию лишь на множестве X X где = = {Z| IlZH 1J — единичный шар в Из свойств опор- ной функции сразу следует, что соотношения у^а(х) и О ПРИ всех равносильны. Это об- стоятельство неоднократно будет использоваться в даль- нейшем. Если опорная функция отображения а равномерно дифференцируема по параметру Z, то аппроксимирующие а отображения К, К, Г, у обладают рядом хороших свойств. Приведем соответствующие результаты. Предва- рительно условимся о следующем. Опорный конус ЛГу(а(л:)) к выпуклому множеству а(х) в точке у а(х) обозначим через Кху. Нормальный конус Ny(a(x)) обо- значим через NXtV. **) Нам понадобится также следую- щее утверждение. Лемма 5.1. Справедливо равенство Р G/, а(*)) = max {(Z, у) — а (х, Z)}. 1^38 Доказательство. Используя теорему о минимак- се, имеем р (у, а (х)) = min || у — 21| — min max (Z, у — z) = zea(x) zea(x) 1^38 = max min (Z, у — z) = max ((Z, y) — max (Z, z)l = Ze^ zea(x) Ze^ I zea(x) J = max{(Z, y) — a(x,l)}. ze^ Предложение 5.3. Пусть x<^ X, g e и опор- ная функция отображения а дифференцируема в точке х по направлению g равномерно относительно параметра *) Определение опорной функции выпуклого множества и ее свойства см. в Приложении I. **) Определение указанных конусов см. в п. 2 § 1.
48 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Пусть, далее, у^а(х). Тогда множество К(х, у; g) с каждой своей точкой w содержит конус w + Кху с вер- шиной в этой точке. Доказательство. Из равномерной дифференци- руемости опорной функции относительно параметра I & следует, что a(x + ag, l)=a(x, l)+aa'(x, I, g)+<o(a, I), где a-1(o(a, I)—>0 равномерно по Пусть alo ^R{x, у, g). Тогда найдется такая функция ф(а), что 0 и (I, у + aw + ф (а)) < а (х + ag, I) = = а(х, l) + aa'(x, I, g)+co(a, Z) (5.3) при всех I е Пусть v Кху. Тогда у + av е а (х) при достаточно малых а и потому (Z, y + av)<a(x, I) 41^ %. (5.4) Из (5.3) и (5.4) следует, что [l,y + -j-a(w 4- и) + -i-ip(a))<a(.r, I) + -у а'(х, l,g) + + -y(o(a, I) = a(x + -у g, + (|<o(a, I) — zjj, (5.5) 1 1 Положим ya = у +-y a (w + у) + "2*'Ф (a) и найдем такой элемент zae а + jrg^, что ||ya — za|] = р (уа, а [х + + Привлекая (5.5) и лемму 5.1, получим II ka — Za|| = p(z/a, + = = max((Z, ya\ — a(x +% g, maxf4-®(a,Z) — a(4-, /11 \ z J) iegs\z z // .Так как а -1со(а, I)—>0 равномерно по то al о а-1 {уa — 2a) —> 0. Положим (a) = -j- -ф (a) — (ya — za). alo Из сказанного следует, что a-1^ (a) —> 0, т. e. ф1 Yw. al о
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 49 В то же время и + -y(w + v) + ^(а) = za<= а[х + y-gji т. е. w + v^R(x, у, g). Пусть опорная функция отображения а дифференци- руема в точке х X по направлению g равномерно от- носительно Z. Рассмотрим точку у '<= а (х) и нормальный конус NXtV. Определим функцию р следующим образом: р (/) = а' (х.1, g) VZ g= NXtV. (5.6) Покажем, что р субаддитивна. Действительно, если 1ц I2 ZVX|y, ТО а(х, li) + a(x, Z2) = (Zb y) + (l2, y) = (Zi + Z2, у) = s а(х, 1{ + Z2). Поэтому а'(х, l± + l2,g) = ]im4-(a(x + ag, + Z2) — a(x, Zi+Z2)X ajo “ < lira A (a (x + ag, h) + a (x + ag, l2) — aio a — a (я, ZJ — a(x, Z2)) = a'(x, lvg) + a'(x, l2, g). Нетрудно проверить, что p — положительно однородная функция. Далее, так как дифференцируемость опорной функции равномерна относительно параметра Z, то функ- ция р непрерывна. Таким образом, р — сублинейная не- прерывная функция, определенная на замкнутом кону- се Nx>y. Отсюда следует (см. Приложение I), что спра- ведливо равенство p(l) = max (и?, Z), wGdp где др = {w | (ip, Z) р (Z) VZ е Nx,y} — суб дифференциал функции р. Дадим описание субдифференциала др. Предложение 5.4. Пусть опорная функция ото- бражения а дифференцируема в точке х X по направ- лению g равномерно относительно параметра 1^^ и функция р определена равенством (5.6). Тогда др = = ^(x, у, g). Доказательство. 1) Проверим сначала, что др с ^К(х, у, g). Для этого воспользуемся предложением 5.1,
50 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ (fl \ в силу которого К(х, у. g) = hv | р I iv, —(a (x + ag) — y))-+- ->oj. Положим co (a, l)= a(x + ag, l) — a(x, l)—aa'(x, I, g). Используя лемму 5.1, имеем p (w, — (a (x + ag) —y)\ = I W / = max ((Z, w) — (a (x + ag, I) — (I, y))] = legg I a J (1 'I (l,iv)---(a(x, I) + aa'(x, I, #) + <o(a, Z) — (Z, y)) a j max HZ, w) — a' (x, I, g)-(a(x, Z) — (Z, j/))| + max®(a,Z). legs I a ) legs (5-7) Положим t(Z) = (Z, w) — a'(x, I, g), Q(l)=a(x, I)—(I, y). Понятно, что 0(Z)>0 и 0(Z)=O в том и только том слу- чае, когда Z е Nxy. Положим также — max ©(a, Z) = © (а). а legs В новых обозначениях соотношение (5.7) запишется так: р (», ~ (а(х + ag) — y)j< max (т (Z) — 0 (Z)j + со (a)j. (5-8) Пусть Z« = {Ze^| 0(Z)<6). Множества Lt компакт- ны и L& о Lq при б' > б. Из определения сразу следу- ет, что П Li = Nx>y П Отсюда следует (см. Прило- в>0 жение II), что Lt,^>- NXiVft $ в метрике Хаусдорфа, т. е. для любого е > 0 при достаточно малых б выполняется соотношение Ze<=2Vxv+e^. (5.9) Если Z е NXiV, то 0 (Z) = 0 и потому max ft (Z)-— 0(Z)^^ max x(Z). ieL6 \ 06 1 u=NXtVf\gg Зафиксируем б>0. Если I Lt, to 0(Z)> б и потому т (Z)--77 0 (Z) •< т (Z) — б/а т — б/a, где т = max т (I). a legs
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 51 Так как функция I •-> a' (я, Z, g) непрерывна, то и функ- ция t(Z) непрерывна, поэтому т <+°°. Проведенные рассуждения показывают, что для любого 6 > 0 найдет- ся такое ао, что при а (О, ао) max^x(Z)---— 0 (Z)) = max ^t(Z)- Поскольку 0(Z)>O, то max (x (I)—0(z/)^maxr(Z). а J ’ zeL6 Из соотношения L& -> NXtV и непрерывности функции x имеем maxr(Z)-> max x(Z). Из сказанного следует, zeL6 что limmaxfx(Z)-----0(Z)^^ max r(Z). a J - KzNXtVn£ Вспомним теперь, что r(Z) = (Z, ip)— a (x, Z, g). Если w dp, to r(Z)^O. Вернувшись к формуле (5.8) и учи- тывая соотношение (о(а)-> 0, получим lim р(ш, 4- (а(х 4- ag) — у)]< 0. а!о \ а 1 ' Так как функция р неотрицательна, то отсюда lim р (ю, (х 4-ag) — Z/Й в 0- Тем самым показано, что alo \ а / w<^R(x, у; g). 2) Пусть w^R(x, у; g). Тогда найдется такая функ- ция 4>(а), что а“1‘ф(а)-^0 и у + аю + *ф(а)е а(х + ag). Для I Nx>y имеем (Z, y)+a(l, w) + (l, *ф(а))^ а(я + ag, Z), (Z, у) = а(х, I). Поэтому (Z, ю) lim — (а (х + ag, 1) — а (х, I)) + lim (Z, ip (а)) —, а;о а ajo а откуда следует включение w др. Покажем, что в случае равномерной дифференци- руемости аппроксимирующие множества R(x, у; g), R(^ g) Г (я, у; g) совпадают между собой. Теорема 5.1. Пусть опорная функция отображения а дифференцируема в точке х^. X по Адамару равл номерно относительно параметра I е Тогда для
52 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ у* е а (х*) и всех g^Rn справедливо равенство К (я*, У*, g) = K У*> £) = г (**> У*'> ё)- Доказательство. Для z = [х, у] &XxRm и Ze е <% положим /(2, Z)i=(Z, у}-а(х, Z). Из условия теоремы легко вытекает, что функция / дифференцируема в точке z* *=(х*,у*) по направлени- ям равномерно относительно параметра I е При этом для направления v = (g, w) G Rnx F2 выполняется /' (z*, Z, v) = (Z, w) — a' (x*, I. g). Пусть cp(z) = max{/(z, I) I Ze5}, где S = {1\ ИЛ1 = 1} — единичная сфера в Теорема 3.4 показывает, что функция <р дифференцируема в точке z* по направле- нию v, причем <p'(z*,p) = max (5.10) zeH(z*> где R(z) = {I е Si (p(z)=/(z, Z)}. Из свойств опарной функции следует, что включение у^а(х) равносильно неравенству / (х, у, Z) 0 VZ е 5, поэтому график gr а отображения а может быть записан в виде gra = {z<= XxRm| <p(z)<:0}. Представляет интерес лишь случай, когда <р (z*) = 0. Рассмотрим конус ^(z*), построенный по функции <р и точке z* (этот конус изучался в п. 1 § 4): ri(z*) = {H (5.11) и опишем его в терминах опорной функции а(х, Z). От- метим сначала, что R(z*) = Р е S | <р (z*, Г) = 0} = = {Z е S | (I, у^) = a (x*, I)} = NП 5. Поэтому из (5.10) и (5.11) получим rjz*) ={г = [g,w]| (I, Vlt= Nx*,Vllt}. (5.12) Для g s Rn положим Ps (0 ?= a' (x*>
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 53 Формула (5.12) показывает, что Г1 (z*) = = [g>I ^dpg}, где 9pg — субдифференциал сублинейной функции pg. Привлекая предложение 5.4, имеем ri(z*)’={[g>u?]| К g}}. (5.13) С другой стороны, как показывает предложение 4.1, I\ (z#) id Г (z*, Q), где Q = {zl <p(z)^O} = gra. Это обстоя- тельство вместе с формулой (5.13) приводит к вклю- чению Г(я*, у*; g) cz К(я*, у**, g). В то же время, как следует непосредственно из определения, К (я#, у*; g) о К (я*, у*; g) cz Г (х*, g). Предл о ж е н и е 5.5. Пусть выполнены условия тео- ремы 5.1 и множество а(х*) телесно. Тогда Г (х*, у*, g) = = cl y(z*,y*;g). Доказательство. Наряду с конусом Г х (х*), участвующим в доказательстве теоремы 5.1, рассмотрим конус Yi(z*) = {p| q/(z*, у)<0}. Те же рассуждения, которые привели к формуле (5.12), показывают, что Yi(**) = {y = [£>w]| (Z,zp)<a'(£*,Z,g) VZe2Vx*,^\{0}}. Покажем, что в условиях предложения выполнено усло- вие регулярности (4.2), т. е. ^(z*) = cly^z*). Так как множество а(х*) телесно, то опорный конус Кх*,у* так- же телесен. Если Wq — внутренняя точка этого конуса, то, посколькуNx*,у* =— Kt*,у*, для всех Ze Nx*ty*\{0} выполняется неравенство (Z, wo) < 0. Пусть [g, ir] е e=I\(z*), т. е. (7^)<а'(^,и) VI е Nx*,y*. Для любо- го е > 0 имеем (Z, w + eir0) < а' (х#, I, g) VZ <= ЛГх„у»\{0}, и потому [g, w + eiz;0] е ух (z*). Устремляя е к нулю, придем к включению [g, w]e cl y1(zHs), откуда и сле- дует требуемое равенство Г х (z*) = cl ух (z#). Доказа- тельство завершается ссылкой на предложение 4.2. Замечание 5.2. Если отображение а(х) однознач- но, т. е. а(х)= {F(x)}, то а(х, Z) = (Z, Fx) при всех Z. В этом случае равномерная дифференцируемость отобра- жения а по направлению g равносильна дифференцируе- мости отображения F по этому направлению. Таким об- разом, равномерную дифференцируемость опорной функ-
54 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ ции можно рассматривать как одно из возможных обоб- щений понятия дифференцируемости по направлению на случай многозначных отображений с выпуклыми ком- пактными образами. Более далеко идущие обобщения основаны на понятии пространства выпуклых множеств (см. § III.1). 3. В этом пункте рассматриваются многозначные ото- бражения, допускающие аппроксимацию первого поряд- ка. Пусть a: Rn->2Rm—замкнутое многозначное отобра- жение, причем множество dom а = X открыто. Рассмот- рим точку х е X, направление g и многозначное отобра- жение Аё'. а (я)-> 2R7\ (В дальнейшем под ЛДу), где понимается одно из следующих множеств: с1у(а:, у; g), R(x, у, g), К(х, у, g), Г(х, у; g).) Будем говорить, что отображение а допускает аппрок- симацию первого порядка в точках х, у^а(х) по направ- лению g относительно множества Ag(y), если для любых последовательностей чисел {aj и векторов {yj, обладаю- щих свойствами aftIO, yk<=a(x + akg), Ук-^У, будет pftr2’ *0. (5.14) Соотношение (5.14) эквивалентно следующему: существу- ет такая последовательность {рЛ}, что е Ag (у), yh = y + ahvh’+ о (aft), (5.15) Действительно, если (5.15) справедливо, то Ag(y)) = \ А \ ak inf weAg(i/) vb-°-^p-w < 4г11 °(<Xft) 8 °' Пусть выполняется (5.14). В множестве Ag(y) выбе- рем элемент для которого ||yft —у II (Uk — v а , Л 1 |-^—Ч=р(~’ и положим wh = -1- (yk — у) — vh. Тогда yk = у + a*v* + + akwk и, в то же время, wk -> 0.
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 55 Аппроксимация первого порядка используется при изучении дифференциальных свойств так называемой функции максимума при связанных ограничениях, т. е. функции вида ср (х) = max / (х, у). У^а(х) Этот вопрос рассматривается в следующем параграфе. Здесь же мы опишем некоторые классы отображений, допускающих аппроксимацию первого порядка. Прежде всего обратимся к отображениям, задавае- мым «ограничениями типа неравенств». Рассмотрим не- прерывную функцию G (х, у, z), определенную на X X X Y X Z, где X, Y — открытые множества в Rn и Rw соответственно, Z — компактное множество. Считаем, что при любом (х, у, z)^ XXYXZ существуют и непрерыв- ны частные производные z/, и)и — (z, ограни- ченные на X X Y X Z. Для х X положим а(х) = {у | G(х, у, z)< О V2E Z}. (5.16) Введем также в рассмотрение множество R (х, у) = {z е Z | G (х, у, z) = 0} Vye а (х). (5.17) Зафиксируем точки х и у ^а(х), для которых R(x, у) непусто. Предположим, что функция G удовлетворяет следующим двум условиям: 1) для любых z^R(x, у) и у' из некоторой окрестности точки у выполняется не- равенство G (х, у', z) — G (х, у, z) > (х, y,z),y' — y ); (5.18) 2) существует такая точка у'^а(х), что выполнено не- равенство (5.18) и G(x, у', z)<0 при всех z^R(x, у). Замечание 5.3. Если функция G(x, у, z) выпукла по у при всех и, то неравенство (5.18) выполнено для любого у'. В этом случае множество а(х) (выпукло. Предложение 5.6. Пусть отображение а опреде- лено формулой (5.16), у^а(х) и выполнены сделан- ные выше предложения. Тогда отображение а допускает аппроксимацию первого порядка в точках х, у относи- тельно отображения Ag: у' •-> с1у(я, у', g)=Y(x, у', g). Доказательство. Пусть yh е а\х + ahg), yk-+y. Положим -(yh — у). Пусть z^R(x, у).
ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Применяя при достаточно больших к неравенство (5.18), получим G (х, у + ahwk, z) = G(x,y -f- ahwk, z) — G (x, y, z) [dG . . 1 >aft —(x,y,z),wk\. Поэтому при некоторых 0Ae(O, aft) выполняется нера- венство 0>G(a: + ahg,y + z)> > 137(* + 9hg, У + “h^h, z), g 1 4-aJ (x, y, z), wk . Отсюда легко следует, что тах g)+ (£(a^’z)’H’'H<6'» (5Л9) zGR(x,y) (Д ox / \°У ]) где ek I 0. Положим iv = у — у', где у' — точка, о кото- рой идет речь в предположении 2). Тогда 0>G(z, i/,z) — G(z,/,z)> [ -т-(я, (5.20) Неравенство (5.20) показывает, что в данном случае вы- полнены условия предложения 4.4. (Та переменная, ко- торая в предложении 4.4 обозначается через х (соответ- ственно I/), сейчас обозначается через [я, у] (соответ- ственно z); вектор и, рассматриваемый в предложении 4.4, совпадает с вектором [0, w]. Множество Q совпа- дает с gra = {[#, у] |G(rr, у, z)^0 при всех z^Z}.) Ис- пользуя предложение 4.4, получим, что г ([х, у], й) = с! у ([х, у], й) = {. [dG (х, у, z) \ , [dG (х,у, z) \ А w , ul ( ’ g) + ( ду ’ VzeT?^,^ (5.21) Отсюда следует, что Г (ж, у; g) совпадает с множеством, стоящим в правой части (5.21). Нетрудно проверить, что в условиях предложения Г (я, у'\ £) = с1у(я, у'\ g). Положим vh= wh—’—Lu?, где г = max z-(^, #, и), u; . г / Соотношения (5.19), (5.20) и (5.21) показывают, что vh Г(я, у; g). В то же время yk = у + ahwh = у + ahwk + + о (аА).
§ 5. АППРОКСИМАЦИЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 57 Замечание 5.4. Отображения, задаваемые нели- нейными «ограничениями типа равенства», как правило, не допускают аппроксимацию первого порядка относи- тельно К(х, у; g) или Г (я, у; g). Это касается, напри- мер, отображения а(х) = {у\ (Ах, х) + (Ву, у)=с}, где А, В — ненулевые симметрические матрицы. Опишем еще один класс отображений, допускающих аппроксимацию первого порядка. Теорема 5.2. Пусть отображение а имеет выпуклые компактные образы и его опорная функция дифференци- руема в точке х по направлению g равномерно относи- тельно параметра I из Тогда отображение а допуска- ет аппроксимацию первого порядка в точках х, у ^а(х) по направлению g относительно отображения R(x, у\ g). Доказательство. Пусть ah I 0, yh^a(x + akg) , yk У- Для I е Na у А имеем (Z’ = — (а:+а^> Q—Ф» 0) = \ ak / ak ak = а' (х, I, g) + со (aft, Z), (5.22) где о (а, Z) —> 0 равномерно по Z. Положим срь = ajo = sup{co(aft, I) I I e NXtV, IIZH 1). Из сказанного следует, что -> 0. В то же время из (5.22) вытекает неравен- ство I, У±^<а'(х,1,ё) + ^\\Ц VleNx,y. (5.23) Рассмотрим на конусе Nx>y следующие сублинейные функции: p1(Z) = a'(x, l,g), Р2(0 = Ф*Р1Ь 4h(l) = Pi(l) +РЬ2(1). Формула (5.23) показывает, что У-^ е dqh = дР1 4- dpi (5.24) В силу предложения 5.4 dpi~R(x, у\ g). Чтобы найти др£, воспользуемся результатами Приложения I. Так как р2 есть сужение сублинейной функции sh(v) = <pftllt?ll на копус NXtV, то др2 = dsk — Понятно, что dsh «= в то же время (см. предложение 1.3) N^.y = — К*у*у =
58 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ = — cl Кх,у. Таким образом, dpi = + cl KXtV и dqh = R(x, у\ g)+qh& + c\KXty. (5.25) Из предложения 5.4 заключаем, что множество R (х, у; g) замкнуто. Поэтому, привлекая предложение 5.3, по- лучим, что оно с каждой своей точкой w содержит и ко- нус 1^+с1Кх>|/, иными словами, К(х, у\ g) + c\KXty^ <^R(x, у; g). Поскольку, кроме того, O^clA^, то R (я, У, g) + Kx.v R («г, у*, g). Таким образом, R (х, у\ g) + + cl KXty = R (я, у, g) и потому, как следует из (5.25), d_qh = R(x, у\ g) + <pk$. (5.26) Из (5.24) и (5.26) следует, что ——- К (х, у; g) + cpk$. ak Так как <рА -+ 0, то р I Ук- У, К (х, у; g) | -> 0. \ ak / Опишем постоянные отображения, допускающие ап- проксимацию первого порядка. При этом ограничимся отображениями 4* для которых множество Ag(y) явля- ется конусом. Если отображение а постоянно, то, как нетрудно проверить, множества у(х, у\ g), R(x, у\ g)=* = К\х, у; g), Г (я, у; g)— конусы. Предложение 5.7. Пусть Q — замкнутое множе- ство в Rw, множества Ag(y) являются замкнутыми ко- нусами при всех у е Q. Тогда постоянное отображение a(#)=Q допускает аппроксимацию первого порядка по направлению g относительно отображения Ag в точке у е Q тогда и только тогда, когда существует такое е > > 0, что у + А^(у)^^2П^е(у) (где, как обычно, Ж (у) = у + — е-окрестность точки у). Доказательство. Пусть отображение а допуска- ет аппроксимацию первого порядка. Если yh Q, yh -> 1/, то для любой последовательности {<хА} такой, что ah I 0, будет у л /
§ 6. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 59 Так как Ag(y) — конус, то р Ав(УИ =-^f>(yk — y,Ag(y))‘ 1 Соотношение — р (ук — У» Ag (у)) 0 для любой по- ah следовательности {<xj такой, что ah 10, выполняется лишь в случае, когда yk^ у + Ag(y) при всех достаточ- но больших к. Отсюда следует, что у + Ag(y)^ Й П Ж(г/) при некотором 8>0. С другой стороны, если у + Ag(y)=> Й П (у) при некотором е > О и yh^ у, то р(—____У~, Л^г/)] = О для любой последовательности aft \ ak / и, тем самым, отображение а допускает аппроксимацию первого порядка. Замечание 5.5. Пусть множество Й локально вы- пукло в точке у, т. е. при некотором е > О пересечение ЙП«$е(#) выпукло. Тогда при любом g множество с1у(;г, г/, £)=Г(;г, г/; g) совпадает с замыканием опорного ко- нуса К множества ЙПЖ(г/) в точке у. Используя пред- ложение 5.7, легко проверить, что в данном случае по- стоянное отображение а(я)=Й допускает в точке у ап- проксимацию первого порядка относительно отображе- ния Ag(y) = Г(я, у, g)=cl у (я, у\ g). § 6. Дифференцируемость функции максимума при связанных ограничениях 1. В § 3 был описан достаточно широкий класс функ- ций, дифференцируемых по направлению. К ним относятся, в частности, функции максимума вида ф(я) = тах/(я, у), yeQ где Й — компакт. Представляет интерес выяснить, когда дифференцируемы по направлениям функции вида ф(я)= max f(x,y), (6.1) уеа(х) где а — многозначное отображение с компактными об- разами. Функцию (6.1) часто называют функцией мак- симума при связанных ограничениях или маргинальной функцией. В дальнейшем предполагается, что функция / в (6.1) определена на X X У, где X, Y — открытые множества
60 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ в Rn и Rm соответственно, в каждой точке [я, у] X X У эта функция дифференцируема по Адамару (как функ- ция двух переменных), т. е. существует предел /' ([ж, у], [g, V]) = lim -i- (/(x+ag', y+ap')—/(x, y)). a;o Пусть Ю (a, g, ») = (f(x + ag, у + av)—f(x,y)—af([x, y], [g, p]). (6-2) Из теоремы 3.2 следует, что <o(a, g, v)->0 равномерно по y] ; кроме того, производная непрерывна как функ- ция направления [g, v]. Напомним, что дифференцируе- мость по Адамару влечет непрерывность функции /. Положим 7?(x) = {ysa(x)| <р(х) = /(х,у)}, ' (6 U(x,g) = sup sup f'([x,y], [g, P]), y^R(x) v^K(x,y’tg) где R{x, y; g) определено формулой (5.1). При сделан- ных предположениях нижняя производная Дини /d(#, g) функции ср оценивается снизу величиной U (х, g). Предложение 6.1. Справедливо неравенство фо(х, y)^U(x,g). Доказательство. Если при всех y^R(x) мно- жество R(x, у\ g) пусто, то правая часть в (6.3) совпа- дает с — оо. *) Пусть при некотором y^R(x) множество R(x, У\ S) непусто. Если v^R(x, у, g), то существует такая функция ф, что у + av + 'ф(а) а (х + ag) и 0. Так как f(x, у) = ср(х), то ф(я + ag)> f(x + ag, у + av + -ф(а)) = = ф(я)+а/'([я, г/], [g, v + a-Ii|)(a)] ) + +со(а, g, v + а-1г|)(а)).. Из непрерывности производной как функции направле- ния и равномерного стремления со к нулю следует, что <Pd(^, g) = lim4~(<P (^+ ag)— Ч> f'([х, у], [g, р]). а; о ♦) Напомним, что супремум пустого множества по определе- нию равен —оо.
§ 6. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 61 Так как у — произвольный элемент множества R(x) и v — произвольный элемент множества К(х, у; g), то <₽Ь(Я, g)>U(x, g). В связи с доказанным предложением возникает воп- рос: когда справедливо неравенство Фп(я, g)^U (х, g),га- рантирующее существование производной по направле- ниям <р'(я, g) и дающее формулу для ее вычисления? Это неравенство удается доказать лишь при некоторых дополнительных предположениях. Основное из них за- ключается в том, что отображение а допускает аппрок- симацию первого порядка. Кроме того, предполагается, что оно замкнуто и ограничено (последнее означает, что образ а( ) = (J а (у) каждого ограниченного множест- ве £ ва £ ограничен). Что касается функции /, то относитель- но нее предполагается, что она обладает некоторым свой- ством типа локальной вогнутости по у. Теорема 6.1. Пусть х^Х и выполнены следую- щие условия: 1) отображение а замкнуто и ограничено в некоторой окрестности точки х; 2) отображение а допускает аппроксимацию первого порядка в точках х, y^R(x) по направлению g относи- тельно множества Ag(y) = R(x, у\ g)\ 3) функция f непрерывно дифференцируема в точках (х, у'), где у' входит в некоторую окрестность множе- ства R(x), при этом для у е R(x) выполняется неравен- ство /(«. У') — 7 (*, у)< (х> у)’у’ —у)- (6.4) Тогда функция <р, определенная формулой (6.1), имеет в точке х производную <р'(я, g) по направлению g и <p'(x,g)= sup sup Яg) + (6-5) veB(x) veK^.v.g) U дх 1 \ ду 1) Доказательство. Следует лишь проверить, что Фб (я, у) U (х, g), где величина U(х, g) определена фор- мулой (6.3). (В условиях теоремы &(х, g) совпадает с выражением, стоящим в правой части формулы (6.3).) Прежде всего отметим, что, поскольку отображение а до- пускает аппроксимацию первого порядка, множество У\ g) непусто. Поэтому, как показывает предложе-
62 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ ние 6.1, найдется такое число с, что lim-J- (q> (х + ag) — <р (х))> с. «И Из этого неравенства вытекает соотношение lim ср (я + ag) ср (я), ajo Пусть последовательность ак ! О такова, что (Ф(я + akg) — ф(«))->Hm X(ф (х + ag) _ ф (ж)) = ak а । о a = фт> (я. ?)• Пусть, далее, ук е R (х + aftg). Так как отображение а ограничено и R (х + akg)<^ а(х + aftg), то последователь- ность ук ограничена. Не умаляя общности, считаем, что существует предел lim ук = у. При этом из замкнутости отображения а следует, что у а (х). Используя непре- рывность функции /, имеем <p(^ + afeg)=/(^ + aAg, ук)-+ f(x, у). Поэтому ф (х) < lim ф (х + ag) < lim ф (х + aAg) = / (х, у), aj о А->оо С другой стороны, включение у^а(х) показывает, что q(x)>f(x, у). Таким образом, ф(я)=/(я, у) (это рав- носильно соотношению у R(x)). По условию 2) теоремы существуют такие элемен- ты vh, что У К = У + ФА + д (а„), vk^R(x, у, g). (6.6) Используя условие 3) теоремы, при некотором 9Л s е [0, as] получим ф(* + aftg) —ф(ж) = /(х+ akg,yk) — f(x,y) = = f(x + ahg,yk) — f(x,yk) + f(x,yk) — f(x,y)^ < “A (* + Qkg, Ук), g) + ak (x, y), vk + = =“* {(£(*’g))+Pft)}+
§ б. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 63 Выражение, стоящее во вторых фигурных скобках, стремится к нулю при к -> + «>. Так как vh е R(x, у; g), то Фо Ju₽ (lite + (77 v=K(x,y,g) ' \ ' ' Ввиду произвольности у R (x) приходим к требуемой формуле <Pd (я, g)< U (х, g). Замечание 6.1. Неравенство (6.4) заведомо вы- полнено, если функция f(x, у) вогнута по у в окрестно- сти множества {(#, у) I y^R(x)}. Если / вогнута по совокупности переменных, то мож- но не предполагать ее гладкости. Напомним, что вогнутая ограниченная функция дифференцируема по Адамару в каждой внутренней точке множества своего определения. Теорема 6.2. Пусть выполнены условия 1) и 2) теоремы 6.1, а условие 3) заменено следующим: 3') функция f(x, у) вогнута по совокупности перемен- ных в некоторой выпуклой окрестности множества Ч*, J/] I y^R(x)}. Тогда функция ср, определенная формулой (6.1), име- ет в точке х производную <р'(я, g), и эта производная сов- падает с числом U(x, g), определенным формулой (6.3). Доказательство. Рассмотрим те же последова- тельности {aj и {yh}, что и в доказательстве теоремы 6.1. Пусть yh -> у и элементы vk удовлетворяют соотношениям (6.6). Из вогнутости / следует, что функция со (a, g, и), определенная формулой (6.2), неположительна. Поэтому ф (* + а^) — ф(*) = /(*+ У + ад+ о (aft)) — f(x, у) С (Г [*,*/]. £, vk + ). (6.7) I & / Так как производная вогнутой функции /'(z, w) удов- летворяет условию Липшица по w, то где P(aft)-* 0 при ah ! 0. Из (6.7) следует, что (ф (х + aftg) — <р (х)) < jsup f ([X, г/], [g, v]) + P (aft). V&K(X,y',g)
64 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Переходя к пределу при к оо, получим неравенство фв(м)< sup /'([ж, у], [g, р])< U(x,g)- veK(x,y;g) Для завершения доказательства осталось сослаться на предложение 6.1. Если в условиях теоремы 6.2 отображение а выпукло- значно, то производную функции ф можно выразить че- рез производную опорной функции отображения, не ис- пользуя множество R(x, у; g). Теорема 6.3. Пусть отображение а имеет выпук- лые компактные образы, замкнуто, ограничено и его опорная функция а(х, I) равномерно дифференцируема по параметру I. Пусть, далее, х е X и функция / вогнута в некоторой выпуклой окрестности множества {\х, у] I y^R(x)}. Тогда производная функции ф в точке х по направлению g существует и вычисляется по формуле = SUP min + а'(ж, Z2,g)), veB(x)[Zrz2]eV(x,i/) где V(х, у)={1 = [h, h] df(x, у) | 12 <= ад, у) — супердифференциал функции / в точке (х, у), NXtV—нормальный конус к множеству а(х) в точке у. Доказательство. В силу теоремы 5.2 отображе- ние а допускает аппроксимацию первого порядка относи- тельно множества Ag(y) = R(x, у; g). Поэтому применима теорема 6.2, в силу которой производная ф'(я, g) суще- ствует и совпадает с U(х, g). Вычислим величину #(*/) = sup f'([x,y], [g,v]). v^K(x,y',g) Используя теорему о минимаксе (см. Приложение I), имеем D(y) = jsup inf [g, d) = rei(x,ii;«) [ivi2]edf(x,y) = inf jsup ([Zx, Z2], [g, p]) = prZ2]ed/(x,j/) v^K(x,y‘tg) = inf g) + sup (Z2, p)\. [ lv l2]^df(x,y)\ v(=K(x,y',g) ) Предложение 5.4 показывает, что sup {(l2, v)\ e R(x, y; g)} = a' (x, l2, g) при l2 e NXtV. Если же l2 Ф Nx>y,
§ 6. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 65 то (см. Приложение I) sup{(Z2, у)1 v^R(x, у; g)}= = + 00. Поэтому D (у) = inf ((Zi g) + а’ (х, l2, g)). [l^l^edfix.y^l^Nxy Для завершения доказательства осталось заметить, что U (х, g) = sup D (у). уев(х) 2. Теорема 6.3 представляет интерес даже в случае, когда отображение а постоянно, т. е. рассматривается функция максимума вида Ф (х) = max f (х, у), (6.8) где Q — компактное множество. Теорема 3.4 утверждает, что в случае, когда производная f (х, у\ g) равномерна по у, производная ф'(я, g) существует и вычисляется по формуле <р'(х, g) = max f(x, у; g), (6.9) veR(x) где T?(x)={z/eQ| Дх, у)=ф(я)}. Теорема 6.3 позволя- ет в некоторых случаях отказаться от предположения о равномерной дифференцируемости. Теорема 6.4. Пусть f(x, у)— функцця, определен- ная на XX У, где X, У — открытые множества в конеч- номерных пространствах, Q — компактное множество в У и функция ф определена по формуле (6.1). Пусть, далее, х X, множество Q локально выпукло во всех точках y^R(x) (т. е. пересечение Q и некоторой окрестности точки у выпукло), функция f вогнута по совокупности переменных в некоторой выпуклой окрестности множест- ва {[я, у] | у^П(х)}. Тогда для любого направления g существует производная ф'(я, g) функции ф в точке х по направлению g, вычисляемая по формуле ф'(*> g) = sup sup f{[x, g], [g, p]), (6.10) уев(х) vey(y,Q) где ^{y, Q)— конус допустимых направлений к множест- ву Q в точке у, {Конус у(х, Q) совпадает с опорным ко- нусом Kx(Q(\$r(z)) к выпуклому при достаточно ма- лых г множеству &г (х) A Q.) Доказательство. Из замечания 5.5 следует, что постоянное отображение а(х*) = Q У/х' е X допускает аппроксимацию первого порядка. Тем самым выполнены условия теоремы 6.3. В силу этой теоремы производная
66 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ ф'(х, g) существует и совпадает с числом U(x9 g), опре- деленным формулой (6.3). Из локальной выпуклости мно- жества Q в точке у легко следует, что множество А* (я, у*, g) совпадает с конусом у (у, Q). Приведем пример, в котором формула (6.10) дает от- вет, отличный от (6.9). Пример 6.1. Пусть n = т = 1, Х = (—2,2), У = R1, Q = [—2,2], f(x4y)=x—2\y — x\. Тогда ф(я) = = max(2 — 2\у — #1). Прямой подсчет показывает, что при 11/1^2 Ы < 2 выполняются соотношения /(я) = я, /?(#) = {я), у(я, й) = R1. Вычислим производные функции f по направлению [g, р]. Так как на прямой имеет смысл рассматривать лишь два направления, то g принимает значения +1 или — 1. Запишем / в виде /(х, у) = х — 2 шах {х — у, у — х} = — шах {х — 2у, 2у — Ъх} и применим теорему о производной функции максимума. Имеем 3g — 2р, х > у, f'(lx,y],[g,v])= -g + 2v, у<х, (6.11) min (3g — 2v, — g + 2v), x = y. Функция / вогнута, поэтому можно применить теоре- му 6.4. Согласно этой теореме ф' (х, g) = sup min {3g — 2v. — g + 2v}. veR1 Следовательно, 1) = 1, ф'(я, —1)= — 1. (6.12) (Конечно, зная равенство ф(я)=я, мы можем получить формулы (6.12) непосредственно.) Предполагая, что функция / равномерно дифференци- руема относительно параметра у и применяя формулу (6.9), получим ф'(х, g)= max /'(я,у, g) =/'(z,£,g), yeR(x) где f (х, х, g)—частная производная в точке х по на- правлению g в случае, когда у = х, иными словами, /'(я, х, g) = f'([x1 х], [g, 0]). Применяя формулу (6.11),
§ 6. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 67 получим /'(я, х, g) = min{3g, —g}. Таким образом, pnin{3, — 1} = — 1, g = 1, ,X>/'(l'S'g)-U(-3,l)--3, е--1. В данном случае формула (6.9) не дает правильного от- вета ни для одного направления. Отсюда следует, в част- ности, что функция / дифференцируема неравномерно. 3. Выше рассматривался вопрос о дифференцируемо- сти по направлениям функции максимума при связанных ограничениях (6.1) для случая, когда / обладает теми или иными свойствами типа вогнутости. Обратимся те- перь к выпуклому случаю. Прежде всего рассмотрим функцию вида <р(ж)= max /(у), (6.13) уеа(х) где а — многозначное отображение, определенное на от- крытом множестве X cz R71, имеющее образами выпуклые компактные множества. Предполагается, что это отобра- жение непрерывно по Хаусдорфу и его опорная функция а (х, I) дифференцируема в некоторой точке хо е X по на- правлениям равномерно относительно параметра I. Пусть V—такой компакт в что а(хь)<=> int V. Считаем ниже, что / — выпуклая функция, определенная на открытом выпуклом множестве У, содержащем множе- ство V. Как обычно, полагаем Н(х)= {у а(х)\ ср(я) = = /(У)>- Предложение 6.2. При сделанных выше предпо- ложениях функция /, определенная формулой (6.13), дифференцируема по направлениям в точке хо и ф'(*о,£) = тах таха'(ж0,1, g), (6.14) 2/ева(х0) ze^ где Ra (я0) = [У <= Y | ф (*о) = тах тах (G> z — у) + / (У))), ( Zed/(v) zea(x0) J (6.15) |(у) = (lt= df(y)\ cp(x0)= max ((/, z — y) + I zea(xe) J (6.16) £/(У)—субдифференциал функции f в точке у.
68 гл. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ Если функция / не совпадает с аффинной ни на каком отрезке O(z, у), где z^Ra(x0), у&На(хо), то множество Ra(xQ) в формуле (6.15) можно заменить на R(xq). Доказательство. Положим w = {w = [Z, с] I ЭуеУ: Ze df(y), с = / (у) - (Z, у)}. Множество W компактно и, как следует из свойств вы- пуклых функций (см. Приложение I), справедливо ра- венство f(z)= max ((Z, z) + c) z^Y. [Z,c]evr Имеем ф(я) = max f(z) = max max ((Z, z) + c) = zea(x) zea(x) [Z,c]cVF = max max ((Z,z) + c) = max/Ця, w), (6.17) [z,c]eir zea(x) wew где для w = [Z, с] положено h (x, w) = max ((Z, z) + c). zGa(x) Зафиксируем w = [Z, с]. Функция x »-* h (x, to) отличается от функции x а (х, Z) только константой. Отсюда следу- ет, что функция h дифференцируема в точке xq по на^ правлениям равномерно относительно параметра w е Ж, причем Л'(<г0, w, g)=a'(xQ, Pw, g), где положено Pw = I, если w = [Z, с]. Равномерная диф- ференцируемость позволяет применить в данной ситуации, теорему 3.4, согласно которой функция ф дифференци- руема по направлениям и ф'(я0, g) = max h'(x0,w,g) = max a'(x0, Pw, g), weRo(xo) weRo(xo) где Rq(x)= {w e W\ cp(x)=h(x, w)}. Пусть w=[l, e W. Тогда при некотором у <= Y выполняются соотно- шения l^df(y), с = /(у) — (Z, у). При этом h(x, w) = — max ((Z, z — у) + f(y))- Отсюда следует, что w Rq(xq) zea(x) в том и только том случае, когда найдется такое у е У, что I = Pw s df(y) и <р (х) = max ((Z, z — у) + / (у)). zea(x)
§ 6. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ МАКСИМУМА 69 Последнее равенство при х = xq равносильно тому, что I входит в множество В(*/), определенное формулой (6.16). Таким образом, (p'(^0,g) = max (xQ,l,g) = тахтах af (x0,l, g). (6.18) /е U ty y^Y i&iy y^Y v y Так как непустота множества эквивалентна включению y^Ra(x), то формула (6.18) может быть переписана в виде (6.14). Покажем теперь, что для х е X выполняется вклю- чение R(x)^Ra(x). (6.19) Пусть у е R(x), т. е. функция / достигает в точке у мак- симума на множестве а(х). Применяя необходимые усло- вия максимума на выпуклом множестве (см. гл. V), получим max /' (у, z — у) = 0. В свою очередь (см. zea(x) Приложение I) /' (у, z — у) = max (Z, z — у). Поэтому /еа/(у) max max (Z, z — у) = 0 и, следовательно, :еа(х) l^df(y) 4>(я) = /(*/)= max max (/(«/) +(Z, z— г/)). zea(x) Тем самым включение (6.19) доказано. Предположим теперь, что / не является аффинной ни на каком отрезке O(z, у), где z^Ra(x), y&R(x). Пусть y = Ra(x). Тогда при некотором l^df(y) вы- полняется ф (х) = max ((Z, V —у) + f(y)). иеа(х) Пусть последний максимум достигается в точке z^a(x). Так как / — выпуклая функция, то T(^)>/(h)>(Z,z —I/) + /(i/)= max vea(x) Эти соотношения показывают, что z^7?a(x) и f(z) — — z — y). Поскольку l^df(y), то последнее ра- венство возможно лишь в случае, когда / аффинна на отрезке O(z, i/), таким образом, у R(x). Вернемся теперь к общей ситуации и рассмотрим функцию <р(я) = max / (х, у), (6.20) уеа(х)
70 ГЛ. I. ОДНОРОДНЫЕ АППРОКСИМАЦИИ где отображение а обладает всеми указанными в начале этого пункта свойствами, а / — выпуклая по совокупно- сти переменных функция, определенная на достаточно широком открытом выпуклом множестве. Построим многозначное отображение Ь, положив b(x) = {х} X а(х). Найдем его опорную функцию. Если Z = [Z1,Z2]eRnxiR7n, то Ь(я, Z) = (Zb х)+а(х, 12). (6.21) Учитывая, что опорная функция отображения а диффе- ренцируема по направлениям равномерно относительно параметра Z, получим, что опорная функция отображе- ния b также равномерно (относительно Z) дифференци- руема и b' (х, I, g) = (Zb g) + а' (х, l2, g). Функция ф, определенная равенством (6.20), представи- ма в виде ф{х) = max f(t). teb(x) Применяя к этой функции предложение 6.2, убедимся в справедливости следующего утверждения. Теорема 6.5. Пусть отображение а непрерывно по Хаусдорфу, а его опорная функция а(х, I) дифференци- руема по направлениям в точке х$ равномерно относи- тельно параметра I; пусть, далее, f — выпуклая по сово- купности переменных функция. Тогда функция (6.20) дифференцируема по направлениям в точке х^, при этом Ф'(^о^)= max max (Uv #) + #'(*, Z2, g)). (6.22) Ve^a(xo) Pl’ Здесь Ra (г) = /у I ф(х) = max max ((Z2, z — у) + /(x, у))], J Pi J2]e ЭД*»*/) zGa<x) J ly = /Z = [ZnZ2] e=df(x,y)\ ф(я)= max((Z2, 2—y) + f(x,y))\, I ““ zea(x) J df(x, у) — субдифференциал функции f в точке [ж, у]. Если / не совпадает с аффинной функцией ни на ка- ком промежутке, имеющем концами точки [я, z] и [я, у], где z^R^Xq), у&Щхо), то множество Ra(x^) в формуле (6.22) можно заменить на R(xq).*) *) Как обычно, R(x) = {у|ф(х) = f(x, у)}.
ГЛАВА II ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА § 1. Субдифференцйал Кларка 1. В гл. I производная /' (я, g) =/x(g) функции / в точ- ке х по направлению g рассматривалась в основном как функция направления при фиксированной точке х, В классическом анализе, как правило, рассматривают не- прерывно дифференцируемые функции, т. е. функции, для которых отображение х »-* fx является непрерыв- ным. С точки зрения негладкого анализа непрерывность производной, а иногда даже ее полунепрерывность пред- ставляется весьма жестким условием. Оказывается, что топологические свойства отображения /' в некоторой точ- ке хо тесно связаны с алгебраическими свойствами про- изводной /х0 как функции направления. Так, полуне- прерывность сверху (соответственно, снизу) отображения /' влечет сублинейность (соответственно, суперлиней- ность) производной /х0- Отсюда следует, что непрерыв- ность /' влечет линейность /х0 и, тем самым, существо- вание дифференциала. Рассмотрим более подробно вопросы, относящиеся К полунепрерывности производной. Прежде всего заме- тим, что в случае, когда производная не полунепрерыв- на сверху (соответственно снизу), представляет интерес рассмотреть ее верхнюю (соответственно нижнюю) регу- ляризацию. Ниже приводятся определения регуляриза- ций и указываются их простейшие свойства. Пусть X — некоторое подмножество пространства 1РП» / — произвольная вещественная функция, определенная на X, и х е cl X. Положим /(<r) = inf sup /(#'), 6> О || X' — х||<6, х' е X /(.r) = sup inf /(#'). 6>о ||Х'-Х||<с,х'ех
72 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Функции J и / называются соответственно верхней и ниж- ней регуляризациями функции f на множестве X. Понят- но, что справедливы равенства = sup /(#'), 610 ||х'-х||<6, х'ех /(#) = lim inf /(я'). 610 ||х'—х||<6, X'Gl Напомним, что верхний и нижний пределы функции /, определенной на X, в точке х cl X представимы в виде lim / (х) = lim sup / (ж'), х'->х бю ||х'—х||<6, х'еХ.хух inf /(ж'). ||х'-х||< 6, x'el.xyx lim /(ж') — lim х'-»х ^-10 Отсюда легко следует, что ](х) = max f(x) = min Понятно, что f(x)^f(x)^f(x). Если функция / по- лунепрерывна сверху в точке х, то f(x) = f(x). Действи- тельно, предположим, что f (х)> f(x). Тогда в силуполу- непрерывности сверху найдется такое 6 > 0, что /(#)> > f(x') Для всех х ХПЗД, а это противоречит опре- делению функции /. Таким же образом проверяется, что для полунепрерывной снизу функции / выполняется ра- венство /(#) = /(#). Предложение 1.1. Для любой функции f ее верх- няя регуляризация f полунепрерывна сверху, а нижняя регуляризация / полунепрерывна снизу. Доказательство. Ограничимся случаем функ- ции J. Рассмотрим точку х е X и зафиксируем е > 0. По определению верхней регуляризации найдется такое S > 0, что sup /(я')<7(я) + 8. ||х'—х||<6,х'ех Пусть y^^6/z(x) и х' е &ь/2(у) П X. Тогда x'^$t(x) и потому sup /(х') </(ж) + е.. Отсюда следует ||х'-»||<6/8,х'ё-Х
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 73 соотношение 1(у)<7(х) + 8 Vye^6/2(^)nx. которое показывает, что / полунепрерывна сверху. Оказывается, что верхняя регуляризация / является наименьшей полунепрерывной сверху функцией, мажо- рирующей /, а нижняя регуляризация / — наибольшей полунепрерывной снизу функцией, минорирующей /. Иными словами, справедливо следующее утверждение. Предложение 1.2. Если f\(x) — полунепрерыв- ная сверху функция и f\(x)^ f(x) при всех х, то /1(я)> >/(я). Если /2 (я)—полунепрерывная снизу функция и /2(я)^/(я) при всех х, то f2(x)^f\x). Доказательство. Ограничимся функцией /. Ес- ли /i(x)> f(x) при всех х, то, как сразу следует из оп- ределения, f\(x)^f(x). Так как функция f\(x) полуне- прерывна сверху, то /i (^)=следовательно, fi(x)^ 2. Пусть функция / определена на открытом множест- ве X в пространстве (Rn. Рассмотрим ее верхнюю и ниж- нюю производные Дини по некоторому фиксированному направлению g при всех х из X, т. е. функции я»-* fv(x, g) и х^ /о (х, g), цде х X, Далее будем рассматривать верхнюю регуляризацию 7d (*, g) = max ( /d (х, g)> Ию /{> (х', g)'} ( х'->х У верхней производной Дини /Ь (х, g) и нижнюю регуля- ризацию g) = min/yi) (х, g), lim fl, (x', g)^ \ x'->x / нижней производной Дини /d (x, g). Всюду в дальнейшем считаем, что функция f локаль- но липшицева на множестве X. Последнее означает, что для каждой точки х X существует окрестность V этой точки, в которой / удовлетворяет условию Липшица с не- которой константой (быть может, зависящей от этой ок- рестности). Из локальной липшицевости следует, что верхняя и нижняя производные Дини /Ь (х, g) и (ж, g) при любом g ограничены в некоторой окрестности точ- ки х и, следовательно, числа /d(#, g) и fb(x, g) конечны. За-
И ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЁРЕНЦИАЛ КЛАРКА метим еще, что в рассматриваемом случае производная по направлениям {если она существует) совпадает с произ- водной Адамара. Предложение 1.3. Справедливы равенства /d (я, g) = Пт -X (/ {х' + ag) — / (а/)), х'-*х,а|о u /d {X, g) = lim -X (/ (х' + ag) — f (х')). х'-»х,а;о Доказательство. Ограничимся проверкой лишь первого из указанных равенств. Положим А= Hm -Х(/(а;' + ag) — f(x')), х'-»х,а|,о a А = 7d (х, g) = inf sup /J, (x', g). d|O||x'—x||<6 Зафиксируем e > 0 и найдем такую последовательность {xk}, что xh -> х, /d (a*, g) = iim’-X (/ (xk + ag) — f (xk)) > A2 — s. aio a Для каждого к найдется такое число aft, Дто Х(Ж +a»g) —/(**))> А —е> O<aft<l/A:. (1.1) ak Неравенство (1.1) показывает, что — в; посколь- ку е — произвольное положительное число, то Ai>A2. Ив определения числа Аг вытекает, что для произволь- ного е > 0 найдется 6 > 0, обладающее следующим свой- ством: если у содержится в шаре &ь(х) радиуса б с цент- ром в точке х, то /п(У> g)< А2 + е. Если Их — х'И < 6/2 и 0 <a <Z9|Д-п", то точки х' и х' + ag входят в(х). По- II # II t этому, привлекая теорему 1.3.1, получим, что /(х + ag) — — /(х')< а(Аг + е). Отсюда вытекает неравенство А\ < Аг + е, из которого, ввиду произвольности е, следует А\ Аг» ® ___ Заметим, что величина lim /d (х', g) представляет co- x'-»х бой повторный верхний предел Йт Пт -X (/ (х' + ag) — f (х')). x'-»xa|o
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 75 Поскольку /d(x, g) = max (х, g), liin Д (х', то пред- ложение 1.3 показывает, что в случае, когда /d(^? ^lim /d(^\ g)t двойной верхний предел х'-»х Йт -±-(f (х'+ ag) — f (х')) x'-^x.ajo' a совпадает с указанным повторным верхним пределом. Числа /ci (х, g) = lim (х' + ag) — f (х'}>, /ci (*>£) = lim -L(f(x'+ ag) — f(x')) x'-»x,a | о называются соответственно верхней и нижней производ- ными Кларка, Таким образом, предложение 1.3 показыва- ет, что при фиксированном направлении g верхняя про- изводная Кларка является верхней регуляризацией верх- ней производной Дини, а нижняя производная Кларка — нижней регуляризацией нижней производной Дини. Предложение 1.4. При каждом g функция Xi^ fci(x^ g) полунепрерывна сверху, а функция *-* /ci(#, g) полунепрерывна снизу. Доказательство следует из предложений 1.1 и 1.3. Сформулируем одно' из основных свойств производных Кларка. Предложение 1.5. При каждом х функция g /ci (х, g) сублинейна, а функция g »-► /ci (я, g) су- перлинейна. Доказательство. Рассмотрим лишь функцию g /ci (х> g)- Из равенства /ci (х, kg) = lim (/ (х' + akg) — / (х').) = x'-»x,alo “ lim lakV(x' + aM — f(x'))=kfcl(x,g) x'->x,a|o следует, что эта функция положительно однородна. По- кажем, что она субаддитивна. Используя субаддитивность
76 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА верхнего предела, имеем /ci (я, £1 + g2) = iiin -^-[f(x'+ agt +ag2) — f(x')]^ x'-»x,ajo a < iim JL (/ (У + ag! + ag2) - / (x' + agj) + x'-»x,a|o a + -^-(f(x:, + ag1) — f(x')) = fl1(x,g1) + x'-»x,aio + /ci (x, g2). Так как функция g >-+ fci (x, g) сублинейна, то спра- ведливо представление fci(x,g) = тах (h g), (1.2) led/^x) где 9/ci (x) — субдифференциал этой функции. Подобным же образом /ci(^g)= min (Z,g), (1.3) Jed/^x) где d/ci (x) — супердифференциал суперлинейной функ- ции g •-* /ci (#, g). Покажем, что множества d/ci (х) и д/с1(я) совпадают. С этой целью проверим справедли- вость следующих утверждений. Предложение 1.6. Имеет место равенство 7с1(*> —g) = (-/)ci (*, g)- Доказательство. По определению fciU, — g)= lim -L[/(x' —ag) —/(x')J. x'-»x,a|o Положим x' — ag = z. Тогда x = z + ag и, следовательно, fciU, — g)= ii“ — /(z + ag)) = z-»x,a|o = lim + — z->x,aj,o Предл о же ни e 1.7. Справедливо равенство fci(x, g) = —fti(x, — g).
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 77 Доказательство следует из предыдущего пред- ложения и равенства Л1 (*,£) = -^-(/(x' + ag)-/(x')) = х'->х,а|о = — lim -i- (— f(x' + ag) — (— /)(*'))= — (— /)^(х, g). х'-»х,а|о Используя предложение 1.7 и формулы (1.2) и (1.3), имеем при всех g s Rn max (Z, g) = fci (*, g) = ~ /ci (*. — g) = zea/^(x) = — min (Z, — g) = max (Z, g). Zed/^(x) Ze57ci(x) Эти равенства показывают, что опорные функции ком- пактов 5/ci (я) и d/ci (х) совпадают, откуда (см. Прило- жение I) следует, что и сами эти компакты совпадают. Выпуклый компакт, являющийся одновременно суб- дифференциалом верхней производной Кларка в точке х и супердифференциалом нижней производной Кларка в этой точке, называется субдифференциалом Кларка функ- ции f в точке х и обозначается символом ды]{х). Таким образом, по определению /ci (*,g)= max (Z,g), ^i(a:,g)= min (Z,g) Vg <=(₽”. zeacl/(x) zeacl/(x) Элементы субдифференциала Кларка называются обоб- щенными градиентами функции f в точке х. Предложение 1.8. Многозначное отображение х ^ci/ (х) полунепрерывно сверху. Доказательство следует из предложения 1.4 и результатов приложения 2. 2. Вернемся к рассмотрению производных Дини. Предложение 1.9. Пусть локально липшицевая функция f определена на открытом множестве X и ее верхняя производная Дини /Ь (х, g) является полунепре- рывной сверху функцией точки х для любого фиксиро- ванного направления g. Тогда/в (хл g) = /ci(^» ё) при всех х и g. . ___ • .
78 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Действительно, так как функция g) полуне- прерывна сверху, то она совпадает со своей верхней ре- гуляризацией х~ /ci g)~ Подобным же образом проверяется следующее ут- верждение. Предложение 1.10. Пусть нижняя производная Дини /d (я, g) локально липшицевой функции f, опреде- ленной на открытом множестве X, полунепрерывна сни- зу как функция точки х при любом фиксированном на- правлении g. Тогда эта производная при всех х и g сов- падает с нижней производной Кларка /с1(я, g)* Из предложений 1.5 и 1.9 вытекает, что если верхняя производная Дини полунепрерывна сверху как функция точки х, то она сублинейна как функция направления g. Таким же образом полунепрерывность снизу функции х* fv(x,g) при всех g влечет суперлинейность функции g-+ /d («г, g) при всех х. Если же функция / дифферен- цируема по направлениям и производная /' (х, g) при всех g непрерывна по х, то она линейна по g при всех х и тем самым функция f непрерывно дифференцируема в классическом смысле. Приведенные выше утверждения позволяют предста- вить соотношения между верхней и нижней произ- водными Кларка, с одной стороны, и производной по направлениям — с другой, в случае, если она суще- ствует. Пусть производная по направлениям /'(х, g) по- лунепрерывна сверху при каждом g. Тогда справедливы равенства f'(x,g) = fa(x,g)= max (I, g), iedaf(x) /ci (*-£)= min (l,g). Zedcl/(x) Таким образом, в данном случае верхняя производная Кларка совпадает с f'(х, g). В то же время нижняя про- изводная Кларка отличается от производной по направ- лениям во всех тех точках х, где функция не дифферен- цируема по Гато. Важны не только численные различия между этими производными, но, что весьма существенно, принципиальные различия в их свойствах: производная /' (х, g) субаддитивна, она выражается через линейные функции с помощью операции максимума; производная
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 79 же /ci (#» g) супераддитивна и выражается через линей- ные с помощью операции взятия минимума. Если производная /'(я, g) полунепрерывна снизу при всех g, то /'(*>£) = fci(*,g) = min ZGdC1/(x) /ci(*, g) = max (Z,g). j€=dG1y(x) В данном случае производная Дини в каждой точке не- дифференцируемости по Гато отличается от верхней про- изводной Кларка. В случае если производная f (х, g) не является полу- непрерывной ни снизу, ни сверху, можно лишь утвер- ждать, что /с! (*. g) < /' (*» g) < /ci (*, g). Таким образом, верхняя и нижняя производные Клар- ка являются соответственно сублинейной мажорантой и суперлинейной минорантой производной f'(x, g). Производная по направлениям (совпадающая для ло- кально липшицевых функций с производной Адамара) осуществляет точную аппроксимацию первого порядка функции / в точке х в том смысле, что -j[4jj-(/(®+ h) — f(x) — f(x,h))^O при A->0. Из сказанного выше следует, что в любой точке х, где / не дифференцируема по Гато, по крайней мере одна из производных /ci (я, g) и (х, g) не осуществляет аппрок- симацию первого порядка. Можно лишь утверждать, что указанные производные представляют собой верхнюю и нижнюю границы аппроксимации. 3. Приведем несколько примеров. Пример 1.1. Пусть / — выпуклая функция. Тогда, как хорошо известно из выпуклого анализа, / дифферен- цируема по направлениям и функция х^ /' (ж, g) полу- непрерывна сверху для любого g. Таким образом, для выпуклых функций производная по направлениям совпадает с верхней производной Кларка. Отсюда следует (см. Приложение 1), что субдифференциал Кларка дС1/(я) совпадает с субдифференциалом функции / в точке х в смысле выпуклого анализа.
80 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Пример 1.2. Пусть / — вогнутая функция. Тогда функция х*+ f (х, g) полунепрерывна снизу для любо- го g и потому производная по направлениям совпадает с нижней производной Кларка, а субдифференциал Клар- ка dc\f(x) совпадает с супердифференциалом df(x) функ- ции / в точке х. Пример 1.3. Пусть / = /1 + /г, где /1— выпуклая, а /2 — вогнутая функция. В этом случае производная по направлениям f (х, g) существует, но не обязательно по- лунепрерывна сверху или снизу (как функция точки х). Относительно этой производной можно лишь утверждать, что /ci (я» g) < Г (*> g) < /ci (*, £), при этом «зазор»/с1(я, g) — g) может быть весьма велик. Оценка субдифференциала Кларка dC\f(x) _через субдифференциал Ofi (х) и супердифференциал д/г (х) приводится в § II 1.4. Пример 1.4. Пусть /(х) = maxф(я,у) Ух^Х, l/ей где X — открытое множество, Q — компакт, ф — непре- рывная вместе с частной производной (х, у) функция, определенная на XX Y. Тогда (ом. следствие 1.3.3) /' («, g) = max (ж, у), Л (1.4) yGR(x) \ ОХ ) где R(x)={y\ f(x) = q>(x, g)}. Напомним (см. предло- жение 1.3.3), что отображение Н(х) полунепрерывно сверху. Нетрудно проверить, используя непрерывность функции (х, у) и полунепрерывность отображения Я (ж), что производная f (х, g) полунепрерывна сверху. Поэтому f'(x, g) совпадает с верхней производной Клар- ка. Обозначим через df (x) выпуклую оболочку множест- ва векторов #)| У е/?(я)|. Из (1.4) следует, что /' (я, g) = max(Z, g) при всех g. Это равенство показывает, ied/ (х) что дС1/(я)= df(x). Пример 1.5. Пусть/(х) = minф(х, у), где X, Q, ф те же, что и в предыдущем примере. Тогда, используя равенство min ф(я, у) = — max (— ф (х, у)), нетрудно про- 1/eQ y^Q
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 81 верить, что функция / дифференцируема по направлени- ям, причем при всех g функция x^f(x,g) полунепре- рывна снизу и справедливо представление f(x,g)= min = min (l,g), yeQ(x) \ ° / zed/(x) где Q{x)= {y e Q|/(x)= у)}, df (x) = co(x, y)| y^Q (#)j. Отсюда следует, что субдифференциал Кларка совпадает с множеством а нижняя производная Кларка — с производной по направлениям. В заключение этого пункта приведем следующее ут- верждение. Предл ожение 1.11. Если функция f дифферен- цируема по Гато в точке х, то V/(s)e 3ci/(x). Доказательство. Так как верхняя производная Кларка мажорирует производную по направлениям, то (\/(х), g) ^/ci (#> g) при всех g. Это означает, что вектор V/(x) входит в суб дифференциал сублинейной функции g /ci g)> совпадающий с dCif(x). Говорят, что функция / строго дифференцируема в точ- ке х, если она имеет градиент в этой точке и (V/ (*), g) = lim (/ («' + ag) — f (ж')). х'->х,а|о Нетрудно проверить, что непрерывная дифференцируе- мость в точке х влечет строгую дифференцируемость в этой точке. Непосредственно из определения следует, что верхняя производная Кларка строго дифференцируемой функции / в точке х совпадает с линейной функцией £ (V/(я), g) и потому в этом случае субдифференциал Кларка dc\f(x) состоит из одного элемента Vf(x). При от- сутствии строгой дифференцируемости равенство дс1/(я)= {Vf(x)} уже не обязано выполняться. Соответ- ствующий пример приведен ниже (см. пример 1.7). 4. Хорошо известно (см., например, [86]), что если функция /, определенная на открытом множестве X cz Rn, удовлетворяет условию Липшица, то она поч- ти всюду на X дифференцируема, т. е. во всех точках х <= X, за исключением, быть может, множества нулевой лебеговой меры, существует дифференциал функции / в точке х. (В дальнейшем обозначаем этот дифференциал
82 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА либо символом df(x), либо символом Используя это обстоятельство, дадим описание верхней производной Кларка в терминах дифференциального отображения x^df(x). В дальнейшем n-мерную меру Лебега обозна- чаем символом Цп. Нам понадобятся следующие простые результаты из теории меры. Лемма 1.1. Пусть Z cz Rn, }in(Z) = 0 и H^ = {ag| a e О?1} — прямая, проходящая через нуль и точку ge!Sn(g^On). Тогда для почти всех у^^п множест- во (у + П^) П Z имеет нулевую меру. Доказательство. Пусть Xz — характеристическая функция множества Z: Xz(z)=0, если z^Z; %z(z)=l, если z^Z. Через Р обозначим гиперплоскость, ортого- нальную вектору g. Отождествим точку z е Rn с парой (у, а), где у — проекция z на Р, а —проекция на пря- мую П^. Используя теорему Фубини (см., например, [86]) о сведении двойного интеграла к повторному, имеем О = (Z) = j Xz (2) dz = f J Xz (y, a) dy da = Rn P R1 = J dy J xz (У, a) da = [ ((y + IIg) f| Z) dy. (1.5) P R1 P Положим & = {y^P\ p,i((g + ng)nZ)>0}. Из (1.5) сле- дует, что pn-i(^)=0. Отсюда и вытекает справедливость леммы. Лемма 1.2. Пусть h(a)—функция, определенная на отрезке [а, Ь] и удовлетворяющая там условию Лип- шица. Тогда ъ У h' (a) da = h (Ь) — h (a), a Доказательство вытекает из абсолютной непре- рывности функции, удовлетворяющей условию Липшица (см., например, [86]). Напомним, что абсолютно непре* рывная функция почти всюду дифференцируема и пред- ставима как первообразная от своей производной. Теорема 1.1. Пусть функция j определена на откры- том множестве X cz Rn и удовлетворяет условию Лип- шица в некоторой окрестности точки х^Х. Пусть, да- лее, Q — подмножество полной меры в этой окрестности.
§ 1. СУБ ДИФФЕРЕНЦИАЛ КЛАРКА 83 Тогда для выполняется равенство /ci (*, g) = Ит /Ь (аД g). x'->x,x'eQ Доказательство. Используя предложение 1.3, имеем /ci (ж, g) = lim /d (а/, g) lim /Ь (х', g). х'->х х'->х, х'еф Предположим, что /ci (a;, g) > lim /d (х', g). Тогда пай- х'->х, x'eQ дутся такие числа 6 > 0 и с, что fci(x,g)>c>fb(x',g) (1.6) при х' $&(х) П Q. Для у е ^6/2(^) положим Му = ^б(ж) Г) П(^ + Щ), гдеП^={а^| а е R1}.Понятно, что множество Му является непустым интервалом, лежащим на прямой у + ng. Из леммы 1.1 следует, что для почти всех у е еЖ/2(^) пересечение интервала Му с множеством нуле- вой меры $6(x)\Q имеет нулевую меру. Рассмотрим лишь точки из указанного пересечения. Функция hv(a) = = f(y + ag) удовлетворяет условию Липшица и потому почти всюду дифференцируема. Если в точке а существу- ет производная hy (а), то h'y (а) = lim (Л (а + £) — h (а)) = 01,0 Р = Ит -i- (/ (у + ag + pg) — f (у + ag)) = f(y + ag, g). eio p Используя лемму 1.2 и неравенство (1.6), получим для почти всех у^$ь/2(%) иае^О, (считаем g=/=0) а f (у + ag) — / (у) = hy (а) — hv (0) = J h'v (Р) dp = о а а = J /'(У + Pg. gHP< fcdp = <?•«. о а Так как функция / непрерывна, то неравенство f(y + ag) — f(y)^ с • а выполняется при всех у^&ъ/2(х} и ае (О, Отсюда следует неравенство/ci (я, g)^£> противоречащее соотношению (1.6).
84 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Следствие 1.1. Пусть Q — множество полной ме- ры, в точках х' которого существует дифференциал V/(z'). Тогда fci(x,g)= lim (V/(Z), g). x'-»x,x'eQ Пусть функция / удовлетворяет условию Липшица в некоторой окрестности точки х и Q — некоторое множе- ство полной меры, в точках которого / имеет дифферен- циал. Положим А = {Z| 3 Uih I = limVf(x'i), x'i^x, x\^ ()}. i->oo Так как /—липшицева функция, то градиенты Vf(y) (у Q) ограничены в совокупности и, следовательно, множество А ограничено. Нетрудно проверить, что А замкнуто и, следовательно, компактно. Выпуклую оболоч- ку со Л множества А обозначим символом D. Так как А — компактное множество, то и D компактно. Теорема 1.2. Справедливо равенство dCif(x) = D. Доказательство. Непосредственно из определе- ния множества А вытекает, что для любого g е Rn вы- полняется равенство max(Z, g) = lim (V/(z'), g). IgA x'^>x,x'gQ Из теоремы 1.1 следует, что max (Z, g) = /cj (x, g). Так как IGA субдифференциал сублинейной функции g /сд(я, g) сов- падает с множеством ды}(х), то, используя двойствен- ность Минковского (см. Приложение I), придем к равен- ству dc\f(x) = coA = D. Теорема 1.2 иногда оказывается полезной при вы- числении субдифференциала Кларка. Приведем соответ- ствующие примеры. Пример 1.6. Рассмотрим функцию /, определенную на плоскости R2 равенством / (2) = 11 х | — | у 11 Vz = (х, у) е= R2. Пусть Q состоит из точек z=(x, у), лежащих на прямых х = уи.х = — у. Ясно, что Н(^2\(?) = 0- В точках мно- жества Q функция f имеет дифференциал. Если (х, у)^ е Q, то число /(ж, у) совпадает с одним из чисел х + у,
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 85 —я — £/, — + У. х — у. В пересечении любой окрестности точки zo=(O, 0) и множества Q функция / имеет гради- ентами векторы ai=(l, 1), Л2 = (1, —1), аз = (—1, —1), й4 = (—1, 1), и только эти векторы. Поэтому, как следу- ет из теоремы 1.2, субдифференциал Кларка dC\f(zo) функции / в точке zo совпадает с квадратом, имеющим своими вершинами указанные четыре точки. Пример 1.7. (И. С. Забродин.) Для z = (x, ^)sR2 положим f(x, «/) = 1пах(г/ — ж2, 0) + пнп(# + я2, 0). Пусть Qx = {(ж, у) е R21 у> х2} — внутренность параболы у = ж2, й2 = {(я, у) е R21 у — я2} — внутренность пара- болы у = —х2, Q3 = R2 \ (Qx J Q2) (см. рис. 2). Тогда У— х2 У + х2 0 /(*, У) = V (х, у) е Qx, V (х, у)(=й2, V (х, у) е Q3. Пусть Q состоит из точек плоскости, не лежащих на па- раболах у = х2 и у = — х2. Понятно, что мера множества R2\@ равна нулю и в точках мно- а жества Q функция / непрерывно дифференцируема. При этом У) = (—2я, 1) V(z, */)<=Qx, (2х, 1) V(z, i/)g=Q2, (0, 0) V(x, y)<=Q3HQ- Пусть zh = (xh, i/fc)->(0, 0), zk^Q. Тогда последовательность Vf(zh) мо- жет иметь предельными точками Рис. 2 лишь ортв2 = (0, 1) и начало коорди- нат ио = (0, 0). Отсюда следует, что субдифференциал Кларка dGi/(#o) совпадает с отрезком, имеющим концами точки 62 и Xq. Нетрудно проверить, что функция / имеет в нуле про- изводную по любому направлению g = (g\ g2) и f (zo, g) = = g2 = (e2, g). Таким образом, функция f имеет в точке z0 градиент, совпадающий с ортом вг. Отметим, что субдиф- ференциал dcif(zo) содержит, помимо градиента v/(#o) = в в2, и другие точки. 5. Приведем некоторые свойства субдифференциала Кларка.
86 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Предл ожение 1.12. Пусть / = /1 + /г. Тогда dGi/i(*) + dclf2(х). Доказательство. Субаддитивность верхнего пре- дела показывает, что при всех g выполняется неравен- ство Йт У+ aS)~f (*'))<Йт =£-(/х(z + ag) — ft(х')) + а|о а|о + Йт (ft (х' 4- ag) — /2 (х')), х'-»х a a|o или, ЧТО ТО же самое, /ciU> g)<(/i)ci (^> g) + (fzicitx, g). Используя двойственность Минковского (см. Прило- жение I), получим dC\f(x)^ dcifi (#) + dC}f2(x). Локально лишпицева функция / называется регуляр- ной в точке х, еслй она дифференцируема по направлени- ям в этой точке и ее производная по направлениям /'(х, g) совпадает с производной Кларка /ci(x, g)- Если функции /1, /2, рассмотренные в предложении 1.12, регулярны, то dcif(x) — dCif\(x)+dC}f2(x), (1.7) В самом деле, используя регулярность, имеем /ci (ж, g) > /' (*, g) = f'l (х, g) + /2 (х, g) = ==(/l)ci(*, g) + (/2)ci (*. g)> откуда следует включение dC}f(x)^dC}fi(x)+dCif2(x). Из этого включения и предложения 1.12 и вытекает равен- ство (1.7). Без дополнительных предположений гаранти- ровать это равенство нельзя. Приведем соответствующий пример. Пример 1.8. Пусть / — четная функция (т. е. /(х)*= /(“#))> определенная на Rn. Покажем, что верх- няя производная Кларка этой функции в нуле является четной функцией направления. Действительно, /ci (о, g)= йт (/ (х' + ag) — f (х')) = х'->о,аю = Ит х’ + а(— g^~ = — g)- x'->o»a|O a
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 87 В силу предложения 1.6 выполняется равенство /с1(0» — g) = (— /)ci (0, g)- Учитывая четность производ- ной /ci (0, g), придем к равенству /ci (0, g) = (— /)ci (°, g)- Из сказанного следует, что dci/(O)+ М-/) (0)= 25с1/(0).- (1.8) В то же время 3d (/ + (—/)) (0)== {0}. Если, например, /(я)= llrrll, то в правой части формулы (1.8) стоит множе- ство 2^, где & — единичный шар. Понятно, что в этом случае 3Ci/(0) + 3С1 (-/) (0) = 2^ {0} = 3С1 (/ + (-/)) (0). Здесь 0 = 0п. Предложение 1.12 дает типичный пример формулы, связывающей субдифференциал Кларка результата неко- торой алгебраической операции с субдифференциалом Кларка функций, над которыми эта операция производит- ся. Мы не приводим дальнейшие результаты в этом на- правлении, отсылая интересующихся к монографии Клар- ка [120]. Остановимся лишь на одном утверждении о субдиффе- ренциале Кларка сложной функции. Оно понадобится нам в § 4. Предложение 1.13. Пусть отображение Н: Rn-> непрерывно дифференцируемо в некоторой окрест- ности точки х и обладает тем свойством, что образ каждой окрестности этой точки содержит некоторую ок- рестность точки у = Нх. Предположим, далее, что лип- шицева функция / определена на некотором открытом множестве Y, содержащем точку у. Тогда функция <р (#') = / (Яя') V.r' е (х) удовлетворяет условию Липшица в окрестности &ъ(х) и йс1ф(л:) = (Ях)*(дС1/И). Иными словами, 5С1Ч> (х) = {I | I = (Ях)* l’> I' 5ci/ (*)}• (Здесь, как обычно, через (Яя)* обозначена матрица, транспонированная матрице частных производных Нх — дифференциалу отображения Я в точке х.) Доказательство. Так как отображение Я непре- рывно дифференцируемо, то оно удовлетворяет условию
88 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДЙФФЁРЕНЦЙАЛ КЛАРКА Липшица, а потому и функция <р удовлетворяет условию Липшица. Зафиксируем направление g и положим © (У, а) = -±- (Н (х + ag) — Н (х')) — Нх (g). Поскольку отображение Н непрерывно дифференци- руемо, то со (я', у поэтому, учитывая липшице- вость функции /, имеем lim [/ (н (И + аН'х (g)) — f(H (х' + ag))] = 0. x'->x,ajo (1-9) Используя (1.9) и то обстоятельство, что образ каждой окрестности при отображении Н содержит окрестность, найдем верхнюю производную Кларка функции <р: <Pci {X, g)= Йт (Я (х' + ag)) — f(H («'))) = x'->x,ajo a = Ita 4(/(Я(х') + аЯ;(^)-/(Я(У)) = = Пт + aHx (g)) — / (у')) = (y, Hx (g)). (1.10) Из (1.10) следует, что производная Фс1(^> S) при всех- g совпадает с функцией q(g) = р (Ag), где р (р) = /ci (У* *>), А = Нх. Функция q сублинейна. Покажем, что ее суб- дифференциал dq совпадает с множеством А*(др)={1'\ 1' = А*1, 1 = др}. Действительно, множество А* (др) выпукло и компактно. Кроме того, max (Z', g) = шах (Л*/, g) = шах (Z, Ag) = р (Л#). /*еА*(зр) zedp i^dp Поэтому равенство dq = А* (др) справедливо в силу двой- ственности Минковского (см. Приложение I). Для за- вершения доказательства осталось заметить, что dp = dCif(y), dq = dC\(p(x)t Замечание 1.1. Из доказательства предложе- ния 1.13 следует, что, каково бы ни было непрерывно
§ 1. СУБДИФФЕРЕНЦИАЛ КЛАРКА 89 дифференцируемое отображение Я, справедливо вклю- чение дС1<р (х) <= (Я*)* (5С1/ (х)). Равенство дс1ф(х) = (Я*)* (5Ci/(x))выполняется не только в условиях этого предложения, но и в случае, когда функ- ция / регулярна, т. е. /с1(я, g) = f (#> S’) при всех g. Чтобы установить это, следует воспользоваться соотношением ф'(*. £)=/'(Я(х), H'x(g)), которое справедливо в силу тео- ремы 1.3.3. 6, Приведем теорему о среднем для производных Клар- ка. Нам понадобятся следующие необходимые условия экстремума. Предложение 1.14. Если локально липшицева функция f, определенная на открытом множестве X, до- стигает локального экстремума в точке х е X, то 0п е dci/(z). Доказательство. Пусть х — точка локального минимума, т. е. f(x')&* f(x) для всех х', достаточно близ- ких к х. Тогда при любом g и достаточно малых а > О выполняется неравенство f(x + ag) — f(x)>0, а потому /ci (*, g) = Йт (х' + ag) — / (х')) > >Йт-^-(/(х + ag) — /(х))>0. аЮ а Так как сублинейная функция g** /ci (я, g) неотрицатель- на, то нуль входит в ее субдифференциал dCif(x). Если х — точка локального максимума, то таким же образом проверяется, что /ci (#, g) 0 при всех g, откуда также следует, что 0n е dCif(x). Пусть, как и выше, X — открытое множество и точки х1, х2 вместе с отрезком, их соединяющим, содержатся в X. Положим Xt = Xх + t(x2 — Xх). Теорема 1.3. Пусть f — локально липшицева функ- ция, определенная на X. Тогда найдется такое 0^(0, 1), что /ci (*0, f №) — / (х1) < fcl (хе, X2 — X1). Доказательство. Положим g (t) = /(х(), h (f) = g (t) + t [/(x>) - /(X2) ] .
90 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Так как Л(0)=й(1), то в некоторой точке 0 интервала (0, 1) функция h достигает локального экстремума на этом интервале. Из предложения 1.13 следует, что On dclh(Q), т. е. (1.11) при всех v е IR1. Оценим производные Кларка функ- ции h. С этой целью оценим сначала производные Кларка функции g. Имеем gci(0.y)= iiin + av)-g(t)) = = lim — (/ (x1 + (t + av) (x2 — x1)) — /(хг + 1 (rr2—rr1)))^ t->0,a|o a < lim ~ (j («' + ay (x2 — x1)) — / (x')) = x'-»XQ,a| o a = /ci(*(b v(x2 — x1)). Подобным же образом gel (0> у) > /ci (*e. У (^ — я1)). Отсюда следует, что hci (9, у) = gh (0, у) + v [f(xx) — / (я2)] < v(x2-xx)) + у [/(ж1) —/(ж2)], (1.12) Лс1(9. у)>/с1(^0, у(х2 — х1)) + yj/t®1) —/(х2)]. (1.13) Полагая в (1.12) и (1.13) v=l и используя формулу (1.11), убедимся в справедливости теоремы. Замечание 1.2. В условиях теоремы найдется та- кое 0 е(0, 1) и такой элемент w dcif(#e), что f(x2) — f{x[) = {w1 х2 — я1). Действительно, в качестве w выступает точка azp1 + + (1 —a)w2, где z^1 и w2— элементы субдифференциала Кларка 3Ci/(rr0), удовлетворяющие условиям /ci (^0, х2 — я1) = (^х, %2 — х1), %2 — я1) = (^2, х2 — х1), а число а находится из равенства / (х2) — f (х1) = а/ll (XQ, хг — Xх) + (1 — a) (хе, х2 — х1).
§ 2. КАСАТЕЛЬНЫЙ КОНУС КЛАРКА 91 § 2. Касательный конус Кларка 1. Как отмечалось в § 1.1, 1.2, аппроксимации мно* жеств и функций тесно связаны друг с другом: аппарат для аппроксимации множеств позволяет определить ап- проксимацию функций, в свою очередь аппарат для аппроксимации функций позволяет строить объекты, ап- проксимирующие множества. В § 1.2 отмечалось, что ко- нусы К(х, й) и Г (я, Й), аппроксимирующие множество й вблизи точки х е cl Й, могут быть описаны с помощью производных Дини функции pQ, где ра(я)— расстояние от точки х до множества Й. В частности, как следует из предложения 1.2.7, К(х, Q) = {g| ро(ж, g) = О) = (я| (рй)£>(х, g) = 0}. По аналогии с конусом касательных направлений К(х,&) представляет интерес рассмотреть множество T(x,Q) = (g| (pQ)^(x,g) = 0}. (2.1) Здесь, как и выше, я^с1Й. Прежде всего покажем, что функция ро удовлетворяет условию Липшица и потому говорить о ее производной Кларка корректно. Предл ожение 2.1. Для х, у е Вп выполняется неравенство 1ро(я) — pQ(i/) I Ня — у\\. Доказательство. Зафиксируем произвольное чис- ло е > 0. Пусть элемент г^й таков, что ро(*/)> > \\у — z\\ — 8. Имеем р0(я)Ня — zW Ня — у\\ + \\у — zll С Ня — 1/11 + pfl(i/) + е; отсюда, в силу произвольности 8, получаем ро(я) — — ро(Ю Ня—1/Н. Аналогично доказывается неравенство ра(#)— ро(я)^ Ня — у\\. Так как (рй)с1(я, Kg) = Црй)с1(я, g) при К > 0 (это сразу следует из определения производной Кларка), то множество Т(я, Й), определенное равенством (2.1), яв- ляется конусом. Оно называется касательным конусом Кларка или просто конусом Кларка. Предложение 2.2. Следующие условия эквива- лентны: (а) элемент g входит в конус Т(х, й); (б) для любого 8 > 0 существует такое 6 > 0, что при всех х'$ь(х) и а^(0, S) существует элемент g' g=
92 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА e^e(g), и/?и котором выполняется включение х' + + ag' е Q; (в) для любых последовательностей {а*} таких, что xk-+x, aft I О, существует последовательность {gft}, для которой gh -> g, xk + ahgh e Q. Доказательство. Утверждения (б) и (в) пред- ставляют собой переформулировку на языке «е — 6» и на языке последовательностей равенства lim inf 4-1| i/ — (а/ + ag) || = 0; (2.2) х'->х,а 1 о j/ей ** это равенство является расшифровкой соотношения (Pq)ci (я, g) = 0, определяющего конус Кларка. Проверим, например, импликацию (а)=>(б). Пусть g^ Т(а:, Q), т. е. выполнено (2.1). Так как под знаком lim в (2.2) стоит неотрицательная функция, то по любому 8 > 0 найдется такое б > 0, что inf —\\у— (#'+ag)||<;e, если х' veQ a ^$б(х) и а^(0, б); иными словами, для любых х е ^$ъ(х) и а^(0, б) найдется элемент у' при кото- ром выполняется неравенство || (у‘ — х') — g | <8. Пола- гая g' = — (у'— х'), получим, с одной стороны, неравен- ство 11g' — gH < 8, а с другой стороны — включение х' + ag' = / е Q, Так как х е cl Q, то (pa)ci (*,g)= Hm -i- pQ (ж' + ag) > 0. х'-»х,а{0 Это означает, что соотношения (Pq)ci g) = 0 и (pn)ci(^,g)<0 эквивалентны. Тем самым конус Т(х, Q) можно представить в виде T(z,Q)={g| (pfi)^(a:,g)<0). (2.3) Предложение 2.3. Конус Кларка Т(х, S2) явля- ется выпуклым и замкнутым. Доказательство. Так как функция g-*(Pq)ci(х, g) сублинейна, то множество {g| (Pq)ci (#, #) ^ 0} выпукло и замкнуто. Для завершения доказательства следует вос- пользоваться формулой (2.3). В отличие от касательного конуса Кларка Т(х, Q), конус касательных направлений К(х, Q) и конус Були-
§ 2. КАСАТЕЛЬНЫЙ КОНУС КЛАРКА 93 гана Г (я, Q) не всегда выпуклы; однако, К(х, Q) и Г (я, Q) осуществляют локальную аппроксимацию мно- жества Й вблизи точки х, в то время как конус Кларка может и не иметь никакого отношения к устройству множества й вблизи этой точки. Приведем соответствую- щий пример, принадлежащий Ж.-П. Обену [108, 200]. Пример 2.1. Пусть множество Й в пространстве R2 представляет собой объединение отрицательной части оси абсцисс и биссектрисы первого координатного угла. Не- трудно проверить, что в точке х = 0г выполняются равенства К(х, Й)=Г(я, Й)=Й, Т(х, Й)={021. Как отмечает Ж.-П. Обен [108, 200], этот пример по- казывает, что цена, которую надо платить за выпуклость, иногда чрезмерно высока. .2. Дальнейшее исследовнание конуса Кларка основано на понятии нижнего предела многозначного отображения. Пусть X — некоторое подмножество конечномерного про- странства, а — отображение X в 2У, где Y — конечномер- ное пространство. Под нижним пределом отображения а в точке х е cl X понимают множество lim inf а (х') = х'-»х = lim а (ж')*), состоящее из ®сех элементов g, обладающих х'->х следующим свойством: для любого е > 0 существует та- кое 6 > 0, что р (g, a (xf)) 8, если х' е (х) П X. Пре дложение 2.4. Пусть Q — некоторое множест- во в R”. Для а > 0, х s R” положим 4 «(*, а) = — *)• Тогда Т (х, Q) = lim inf а (х', а). х'->х,а| о Доказательство. Включение ge lim inf а(х', а) х'->х,а|о эквивалентно следующему: для любого 8 > 0 существует такое 6>0, что при всех х'^$6(х) и аЕ(0, 6) вы- (1 t \ g, — (й — х') I 8. Последнее ОС / *) Ниже сохраняется обозначение lim inf вместо lim, чтобы от- личить отображение от числовой функции.
ы ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА неравенство означает, что найдется элемент £'€=±(£2-^'), (2.4) для которого 11g — g'll g. Переписывая соотношение (2.4) в виде x'+ag'^£l и используя предложение 2.2, убедимся в справедливости доказываемого утверж- дения. Оказывается, что касательный конус Кларка Т(х, Q) может быть представлен как нижний предел конусов Бу- лигана Г (я, Й). При этом предполагается, что множест- во Й замкнуто, а многозначное отображение х Г (х, Й) определено на й. Дадим точную формулировку соответствующего ут- верждения. Теорема 2.1. Пусть й — замкнутое множество в Rn, х Й. Тогда Т (rr, й) = lim inf Г (х’, й). х'->х Доказательство этой теоремы опирается на ряд лемм. Лемма 2.1. Справедливо включение Т (х, й) ci lim inf Г (#', й). x'->x Доказательство. Пусть g^T(x, й). Тогда для каждого g > О найдется 6 > 0, обладающее следующим свойством: для любых х'$ь(х) и а^(0, б) найдется такой элемент g'(x', а), что 11g'(я', а) — gH < е, х' + + ag' (#', а)е й. Зафиксируем х' П Q и выберем не- которую последовательность I 0. Пoлoжимg/l =g'(x', a*). Не умаляя общности, считаем, что существует limgft = g'. Так как х’ + то g' Г (я/, Й). В то же время ||g' _ g|| < 8t Таким образом, p(g, Г (я', Q))<e. Это по- казывает, что g е lim inf Г (х‘, й). х'-»х Для v Ф Й положим л(у)= {w е Q| \\w — vll = pQ(v)}. Через А (де, Й) обозначим замкнутую выпуклую оболоч- ку конуса Б|улигана Г (де, й). Лемма 2.2. Если gsA(iP, Й), то (v — w, g)^ 0. Доказательство. Элемент де является решением следующей экстремальной задачи: найти минимум функ-
§ 2. КАСАТЕЛЬНЫЙ КОНУС КЛАРКА 95 ции /г,(^)=Пр — на множестве Q. Согласно необходи- мым условиям экстремума (см. лемму V.1.1), в точке w должны выполняться соотношения (A)'(w, g)^=0 для всех g е Г (ip, Q). Поскольку (Л)g)=2(w — v, g), то (w — v, g)> О для всех g Г (де, Q). Отсюда и следу- ет заключение леммы. Зафиксируем х е Q и g е Rn. Рассмотрим функцию ф(а) =-|-ра(х + ag) Va>0. (2.5) Так как функция р0 липшицева, то и функция ф липши- цева, поэтому она почти всюду дифференцируема. Лемма 2.3. Если в точке а>0 функция ф(а), опре- деленная формулой (2.5), дифференцируема, то ф'(а)^ ро+ ag) • p(g, A(z, Q)), где z— произвольный элемент множества л(я + а£). Доказательство. Положим х + ag = у. Имеем <p'(a)= lim 4-(ф(а + 0) — ф(а)) = 0->О Р =lim i (ре —ро ₽->0 Пусть z^n(y). Тогда р0(у)= Ну — all, po(y + 0g)^ Ну + ?g — 211. Поэтому Ф' (а) < lim -!г(|| у 4- 0g — z||2 — ||у — z||2) = р->о = ё) = (У — z, g). Здесь, как и в лемме 2.2, /z(y)= Hz — yll2. Пусть g' е A(z, Q). Тогда, как следует из леммы 2.2, (у — z, g')^ С 0 и поэтому ф' (а) С (у — z, g — g'). Поскольку (у ~ Z, g — g')^\\y — zll • llg — g' II = p0 (y) llg — g'll, TO cp' (a) < Pq (y) inf II g — g' II = pQ (y) p (g, A (z, Q)). g'GA(z,fi) Лемма 2.4. Справедливо включение lim inf A (x', Q) с T (x, Q). эс'-»х
96 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Доказательство. Пусть g е lim inf Д (х\ Q). Тог- х'->х да для любого е > 0 найдется такое б > О, что для х' е Q выполняется неравенство p(g, Д(х', £2))^е. (2.6) Пусть числа т) > 0, ао > О таковы, что 2(т] + аоМ)<б. (2.7) Тодда для х' ^^(х), а^(0, ао) выполняется вклю- чение n(xf + ag)<= ^б(х). (2.8) Действительно, возьмем х'^&^х), а^(0, ао). Имеем р0 (х' + ag) Их' + ag — xll Их' — xll + allgll < т) + aolIgH. Поэтому для zaen(x'+ag) выполняются неравенства llza — = Hza — (х' + ag) + (х' — х) + agH Hza — (х' + ag) Н + Их' — xll + a Ugll •= = pQ(#' + ag) + И#' — xll + a HgH 2(i] + ao UgH), откуда и следует (2.8). Пусть для чисел д и ао выпол- нено неравенство (2.7), х' ^n(x) A Q. Рассмотрим при а^(0, ао) функпиюф (а)=-^-р£ (#'+ag). Пусть, как и вы- ше, zaen(x' + ag). Из леммы 2.3 заключаем, что в тех точках а, где существует производная <р'(а), выполняет- ся неравенство ф,(а)^ро(#/ + ag)p(g, A(za, Q)). В силу (2.8) za е ^б(х), поэтому из неравенства (2.6) следует, что p(g, Д(га, Q))^e. В то же время, посколь- ку х Q, то pQ(x'+ ag) II (х'+ ag) — х'Н < allgll. Итак, <p'(a)^ eallgll. Поскольку <р(0) = 0, то а <р(а) = <р(а) — <р(0) = J<p'(a)da<6||^||-^-. О Мы показали, что при х' a^(0, ао) выполняется неравенство Pq(z' + ag)Ce||g||a2. Отсюда р0(л/ + ag)— ра(х')^р0(х'+ ag)CaVe Igl. (2.9)
§ 2. КАСАТЕЛЬНЫЙ КОНУС КЛАРКА 97 Таким образом, (pa)ci (*>g) = Ит 4-(ра(х'+ ag) — рй(*')Х/МЛ- х'-»х,a Jo В силу произвольности 8 (Pq)ci (я. g) = о. По определению конуса Кларка это означает, что g^T(x, Й). Замечание 2.1. Пусть () —множество полной ме- ры, лежащее в некоторой окрестности точки х. Тогда lim inf Д (х, Й) cz Т (х, й). (2.10) х'->х, x'eQ Действительно, возьмем 8 > 0 и найдем по нему число б > 0 так, чтобы для х' е $6(х)П й выполнялось нера- венство (2.6), а затем по 6 найдем числа т] > 0 и ао > 0, при которых справедливо (2.7). Следуя доказательству леммы 2.4, получим, что для х е <%п(х) Г) Q выполняется неравенство (2.9). Из этого неравенства ввиду произ- вольности 8 следует, что (Pq)d(z', g) = 0. Так как в силу теоремы 1.1 (ря)с1 {х, g) = lim (pq)d (х', g), x'->x,x'eQ то и (рй)с1 (#, g) = 0. Отсюда и вытекает включение (2.10). Доказательство теоремы 2.1 непосредственно вытекает из лемм 2.1 и 2.4, если учесть включение Д (я, й)=> Г (я, й). Замечание 2.2. Пусть, как и в замечании 2.1, Q — множество полной меры, лежащее в некоторой окрестно- сти точки х. Тогда lim inf Г (ж, й) = lim inf Д (х, й) = lim inf Д (ж, й). х'->х х'->х х' ->x,x'eQ Это вытекает из леммы 2.4 и замечания 2.1. Многозначное отображение а, определенное на мно- жестве X, называется полунепрерывным снизу, если lim inf а(х') = а(х). Из теоремы 2.1 вытекает х'->х Следствие 2.1. Равенство Т(х, й)=Г(я, й) спра- ведливо в том и только том случае, когда многозначное отображение х' (xf, Й) полунепрерывно снизу в точке х.
98 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА § 3. Непрерывные аппроксимации субдифференциального отображения Кларка 1. Пусть / — липшицева функция, определенная на некотором открытом множестве, и X — компакт, содер- жащийся в этом множестве. Отображение, сопоставляю- щее точке х множество дС1/(я), называется субдифферен- циальным отображением Кларка. Оно полунепрерывно сверху. Если функция / негладка, в том смысле, что хоть для одного х множество dGi/(#) состоит не из одной точ- ки, то это отображение не является непрерывным. Пред- ставляет интерес аппроксимировать это отображение не- прерывным по Хаусдорфу многозначным отображением. Под аппроксимацией субдифференциалъного отобра- жения х >-> 5С1/ (я) будем понимать многозначное отобра- жение Ь, удовлетворяющее при некоторых числах б > О и ц > 0 соотношениям 5С1/ (ж) с: Ъ (х) cz 5СЛ/ (х + ^$) + Vxs I. (3.1) (Напомним, что — шар радиуса е с центром в нуле.) Замечание 3.1. Положим а(х)= dcif(x). В терми- нах графиков отображений соотношения (3.1) при б = ц можно записать так: gra <= gr Ъ <= 76(gr а), где Fo(gra)—замкнутая б-окрестность множества gra: F6(gr a) = {z = [я, у] I p(z, gra)^6>. Непрерывное отображение b, для которого выполнено соотношение (3.1), назовем непрерывной (б, р,)-аппро- ксимацией субдифференциала. Так как отображение х ^ddf(x) полунепрерывно сверху, то (см. Приложе- ние II) при любых б > 0, ц > О непрерывная (б, ^-ап- проксимация субдифференциала существует. Пусть зада- ны числа б > 0, ц > 0 и выпуклая функция /. Покажем, что ее 8-субдифференциал х*-»дг/(х) при достаточно ма- лых е является (б, ц)-непрерывной аппроксимацией суб- дифференциала df(x), совпадающего с субдифференциа- лом Кларка dQ\f{x). Предварительно напомним (см. Приложение I), что 8-субдифференциал def(x) функции / в точке х X опре- деляется равенством 5e/(x) = {Z| /(z) —/(x)>(Z, z —х) —е Vz<=Rn}-
§ 3. НЕПРЕРЫВНЫЕ АППРОКСИМАЦИИ 99 Множество Oef(x) является выпуклым компактом, а ото- бражение х *-+д^ (х) непрерывно по Хаусдорфу при лю- бом 8 > 0. Справедливо равенство df(x) = П def(x). (3.2) е>0 ~ Предложение 3.1. Для любых ц > 0, б>0 най- дется такое е > 0, что ь-субдифференциалъное отображе- ние х •-> де f (х) является непрерывной (6, ц)-аппроксима- цией субдифференцйала функции f на компакте X. Доказательство. Из (3.2) следует, что def(x)^ df(x) при любых е > 0. Зафиксируем ц > 0, б > 0 и покажем, что при достаточно малых е > 0 для всех х X выполняется включение де/(х)^д/(х + ^6) + ^9^ Предпо- лагая противное, для любого е > 0 найдем такие элемен- ты хй X и Ze dRf (х6), что Ze & df (х + ^б)+ Не ума- ляя общности, считаем, что существуют пределы lim#e = = х и lim Ze = Z. (Здесь используется компактность мно- жества dzf(X).) Из определения 8-субдифференциала сле- дует, что / (и) — / (гге) > (Z, Z — Хе) — 8 VzeRn. Переходя в этом неравенстве к пределу, получим соотно- шение /(и)—/(#)>(Z, z— х), которое показывает, что 1<=д/(х). При достаточно малых 8 справедливо включе- ние х е Таким образом, Z д/(яе + ^б). С другой стороны при достаточно малых 8 выполняется неравенст- во II 1е — ZH < ц, из которого следует соотношение Ze £^/(^ + Д)+Я- Это соотношение противоречит, одна- ко, выбору элемента Ze. Полученное противоречие и дока- зывает предложение. 2. Построение непрерывной (б, ц)-аппроксимации суб- дифференциала некоторой функции / является, вообще говоря, достаточно сложной задачей. Иногда ее можно упростить, воспользовавшись приведенной ниже теоремой о непрерывной (б, ц)-аппроксимации композиции. Теорема 3.1. Пусть функция f удовлетворяет усло- вию Липшица на открытом множестве Х\ в пространстве Rn, функции fei, ..., hm определены и непрерывно диф- ференцируемы на открытом множестве X2cRm, где тп&* > п, причем отображение Н(х) = (к\(х), ..., hm(x)) обла- дает следующими свойствами:
100 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА а) Я(Х2)с=Х1; б) матрица Якоби (д\ dhr к ^(1) ’ * ’ \ .............. dhn dhn ] дх™ ’ * ’ дх^> / имеет минор п-го порядка, который отличен от нуля на некотором компактном подмножестве X множества Х2. Положим ф(я)=/(Я(я)) Тогда для любых 6 > 0, ц > 0. найдутся числа у > 0, v > 0, обладающие следующим свойством: если d1>vf — непрерывная (7, ^-аппроксимация субдифференциала функции f, то отображение X ~ (н'х)* dytVf (Н (х)) является непрерывной (6, р.)-аппроксимацией субдиффе- ренциала функции ф. (Здесь * означает транспониро- вание.) Доказательство теоремы опирается на следующую лемму. Лемма 3.1. Пусть выполнены предположения теоре- мы 3.1. Тогда для любого £ > 0 существует такое у > 0, что Н (х) + cz Н (х + У/х <= X, Доказательство. Сначала покажем, что для каждой точки х е X найдется такая ее окрестность Vx, что образ H(VX) содержит некоторый шар с центром в точке Н(х). Определенности ради считаем, что минор, о котором идет речь в условии б) теоремы, соответствует первым п индексам. Зафиксируем точку х=(х(1), ..., я(п), ..., х(т)) из X и рассмотрим множество ^2 = {у = (j/(1), • • •. У<П>) е €=Rn| (1/(1)..!/<">, ?и+1), . . *(m)) S Х2}. Для x = (yw, у(п}, х<п+1), х!"')еХ положим В(у) = Н(х). Из условия б) теоремы следует, что якоби- ан этого отображения в точке у=(«<п, х{п)) отличен
§ 3. НЕПРЕРЫВНЫЕ АППРОКСИМАЦИИ 101 от нуля; поэтому, как вытекает из классической теоремы об обратной функции (см., например, [43]), в некоторой окрестности точки Й(у) = Н(х) существует непрерывное отображение Я-1, обратное к Н. Непрерывность Я-1 по- казывает, что образ каждой достаточно малой окрестно- сти точки у в множестве Хъ при отображении Й содер- жит шар с центром в точке Н(х). Более того, образ каж- дой окрестности точки х в множестве Х% (при отображе- нии Н) содержит шар с центром в точке Н(х). Зафиксируем 0 > 0. Пусть у(х) совпадает с супрему- мом чисел у > 0, обладающих тем свойством, что Н (х) + ст Н (х + Vx е X. Здесь Ж — открытый шар радиуса е с центром в нуле. Из сказанного выше вытекает, что т (х) > 0 при всех х. Покажем, что функция у(х) полунепрерывна снизу. Предполагая противное, найдем последовательность {хк} и такие числа 7', ч", что xh~+x, xh^X, у(^)>y">y'>yG*a) VA = 1,2, ... Неравенство Y'>Y(xft) показывает, что существуют эле- менты ук, для которых — Ук^Н(хк + ^р) Vfc = l,2,... (3.3) Так как последовательность {Н(хк)} сходится, то после- довательность {ук} ограничена. Не умаляя общности, счи- таем, что существует lim ук = у. Так как \\Н(х) — у\\ « lim \\Н(хк) — ук\\ у' < у" < Y (х), то у е Н (х) + cz Н (х + ^р), т. е. у = й(х') при не- котором х' х + Пусть Их' — xll = v < 0 и число v' удовлетворяет неравенствам 0 < 2v' < 0 — v. Поскольку ук-+ Н(х') и образ окрестности содержит окрестность, то для достаточно больших к справедливо включение Ук (= Н(х' + Ж,,). (3.4) Пусть zex' + Тогда для достаточно больших к вы- полняются неравенства Ilz — xjl Ilz — х'И + Их' — xll + Их — xftH v' + v + v' < 0, т. e. xf + xk + ^p. Поэтому, учитывая (3.4), получим
102 гл. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА при достаточно больших к yh^H (х' + Д/) GZ Н (хк + Д). Последнее включение противоречит соотношению (3.3). Полученное противоречие показывает, что функция 7 (я) полунепрерывна снизу. Так как X—компактное множество, то 7 (х) достига- ет минимума на X в некоторой точке х^ при этом Y (#о) > 0, так что ч(д)>0 при (всех х^Х. Доказательство теоремы 3.1. Рассмотрим функцию <р(х) = f(H(x)). Так как функция / удовлетво- ряет условию Липшица, а отображение Н непрерывно дифференцируемо, то (см. предложение 1.13 и лемму 3.1) справедливо равенство дс1(р(я)= {НхУдС}/(Н(х)). Положим А* = (Н'х)*- Тогда Зс1<р(х) = 4хдС1/(Я(х)). (3.5) Так как отображение х Ах непрерывно, то оно и рав- номерно непрерывно, поэтому по данному р, найдется такое £ > 0, что неравенство Hz — xll < £ влечет || Ах— где с = max {ll/ll I Ze3Ci/(X)} (из ком- пактности множества 5Ci/(X) следует, что с’<+<». Под нормой матрицы А здесь понимается норма линейного оператора, порождаемого этой матрицей, т. е. НАН = = max {НА (g) II I llgll С 11.) Пусть 0 = min (6, £). По числу [} найдем число Y > 0, существование которого гарантирует лемма 3.1. По чис- лу р, найдем число v так, чтобы выполнялось неравенство V НАЛ и/2. (3.6) Пусть cZT>v/—произвольная непрерывная (7, v)-an- проксимация субдифференциала функции /. Тогда dcif(Н(х)) <= dTtV/(Я(х)) cz 5С1/(Н(х) + ^т) + Ж. Поэтому Axdclf(H(x))<^Aad1>vf(H(x))^ с=Азс(5С1/(Я(^)+^т))+Аа(Ж). (3.7) Положим b (х) = AxdytVf (Я (х)) Мх е X. Отображение b непрерывно. Кроме того, как следует из
§ 3. НЕПРЕРЫВНЫЕ АППРОКСИМАЦИИ ЮЗ (3.5) и (3.7), Зс1ф(«)сЬ(ж)‘ Проверим включение ’ Ъ (х) <= дС1ф (х + ^р) + (3.8) Из леммы 3.1 следует, что Н(х)+ <= Н(х + 3^), а по- тому и АМ(Н(х) + ^)^Axdclf(H(x + <0Э)). Непосредственно из определения нормы линейного опе- ратора вытекает включение (.$)<= IL4JI а потому, используя (3.6) и равенство с$ = $с (с>0), получим Ах (&v) = vAx (Я) с v || Ах || <8 <= Привлекая правое включение в (3.7), имеем теперь b (х) CZ Л5С1/ (Я (х + # ₽)) + £ 3S. (3.9) С другой стороны, как следует из (3.5), аС1Ч> (* + #₽)= и Д<Ы(Я(г)). (3.10) Hz-xKP Так какр<£, то||Ах — Аг||<, где с > max {|| 11| | I е 5С1/ (Н (z))} Vzez + ^p. Поэтому 1 (Д - Д) (5С1/(Я (z))) с (Д - Д) (сЯ) <= <0, откуда имеем Д (<W (Н (z))) с Аг (5С1/ (Я (Z))) + £ < (3.11) Воспользовавшись формулами (3.9), (3.10) и (3.11), получим ъ (х) с и Ах (5С1/ (Я (z))) + <=. Ilz-XHP <= и Гд (dm/ (я (z))) + 4 + 4 с Ik- мкр L z J л <= и Д (5С1/ (я (z))) + = 0С1Ф (х + ^р) + Ilz-x||^p Тем самым включение (3.8) проверено. Так как (J 6, то из этого включения вытекает b (х) cz дС1ф (х + ^б) +
104 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА 3. Теорема 3.1 позволяет в некоторых случаях опи- сать непрерывную (6, |1)-аппроксимацию субдифферен- циала функции максимума. При этом используется сле- дующее утверждение. Лемма 3.2. Пусть р — сублинейная функция, опре- деленная на Rn. Тогда ъ-субдифференциал дер(х) функ- ции р в точке х имеет вид _дер(х)=И др\ (Z, х)>(р, х)— е). (3.12) Доказательство. Пусть I е д^р (х), Тогда р (х) — (Z, х) — е р (z) — (Z, z) Vz е Rn. (3.13) В частности, при z = 0 из (3.12) следует, что (Z, х\> р(х)— е. Пусть z'e Rn, z — \z , где % > 0. Воспользо- вавшись положительной однородностью функции р, полу- чим из (3.12): Д)-8 р откуда следует (при %->+«>), что (Z, z')^p(z'). Это и означает, что Z <= др. Предположим теперь, что I входит в множество, стоя- щее в левой части равенства (3.13). Тогда р (я) — (Z, х) — е 0 р (z) — (Z, z), т. е. Zg дър(х). Теорема 3.2. Пусть функции hi, ..., hn определены и непрерывно дифференцируемы на открытом множестве X cz Rm, где ш> п, Ф (х) = max hi (х) \fx еХ. iei:n ( Предположим, что матрица Якоби J—г имеет ми- ienn jei:m нор п-го. порядка, который отличен от нуля на замыка- нии cl X некоторого ограниченного открытого подмноже- ства X множества X. Тогда для любых б > 0, р, > 0 най- дется такое е > 0, что отображение dR, определенное ни- же, является непрерывной (б, ц)-аппроксимацией суб- дифференциала функции ф на множестве X.
§ 3. НЕПРЕРЫВНЫЕ АППРОКСИМАЦИИ 105 Отображение х dz{x) имеет следующий вид: , / ч L гот| 7 IV dhi^ V dhi(x}\ de(x)-|ZsR I •••’ 2 « = («!, ...,an)eVe(x)}, (3.14) где {n «=(«!, ...,an)| 2ai = l> a»>0 i=l Vi = 1: n, n 1 2 «Л* (#) ф (я) — e i=l J Доказательство. Положим p (у) = max yW Yy^iRn. iei:n Понятно, что p — сублинейная функция, имеющая суб- дифференциалом множество 5р= « = (04, . ..,ссп)| п ] 2 cq = 1, О Vie 1 : nL i=l J (3.15) Функция ф представима в виде ф(я) = р(Н(х)), поэтому по теореме 3.1 для данных б > О, ц > 0 найдутся такие Y>0, v>0, что непрерывная (7, v)-аппроксимация dT>vp субдифференциала функции р порождает непрерывную (б, ц)-аппроксимацию d6,n<P суб дифференциала функции Ф, имеющую вид Согласно предложению 3.1, по данным у > 0, v > 0 най- дется такое е > О, что е-субдифференциал дгр(х) являет- ся непрерывной (7, v)-аппроксимацией суб дифференциа- ла функции р. Таким образом, если 8 достаточно мало, то отображение х »-► (Я^)* (дер) (Я (х)) является непре- рывной (б, ц)-аппроксимацией функции ф. Для заверше- ния доказательства осталось воспользоваться леммой 3.2, из которой, с учетом (3.15), следует, что (д^р)(Н(х)) совпадает с множеством Ve(x). Замечание 3.2. Из (3.14) заключаем, что множест- во dz(x) представляет собой часть выпуклой оболочки
106 гл. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА / dh- векторов Zj = I -Д-, . дх{т) J 1: п. Множество Ve(^) состоит из наборов коэффициентов, которые опре- деляют выпуклые комбинации, входящие в de(x). § 4. Обобщенные якобианы и вееры 1. Естественным обобщением субдифференциала Клар- ка на случай отображений является так называемый обобщенный якобиан. Пусть отображение Н: X->RW определено на откры- том множестве X cz Rn и имеет координатные функции Л1(я), ...» hm(x). Предположим, что Н локально липши- цево на X, тогда и все функции hi обладают этим свойст- вом. Отсюда следует, что функции hi почти всюду диффе- ренцируемы на X; а потому множество Q тех точек х £Х, в которых существуют дифференциалы Vhi(x), ... ..., Vhm(x), имеет полную меру. Понятно, что в точках х е Q отображение Н дифференцируемо. Обозначим его дифференциал в точке х через Н' (х). В естественных ба- зисах пространств Rn и Rm дифференциал Н' (х) пред- ставляет собой матрицу частных производных отображе- ния Н в точке х. В дальнейшем мы не различаем линей- ный оператор Rn-> Rm и матрицу этого оператора в есте- ственном базисе. Поэтому в зависимости от контекста на- зываем Н' (х) либо оператором, либо матрицей. Пусть х е X. Рассмотрим множество D линейных опе- раторов (матриц), представимых в виде предела последо- вательностей Н' (хк), где хк х, xh^ Q. Выпуклую обо- лочку множества D назовем обобщенным якобианом ото- бражения Н в точке х. Обозначим обобщенный якобиан символом дыН{х). Из теоремы 1.2 следует, что при тп = 1 обобщенный якобиан совпадает с субдифференциалом Кларка. Укажем некоторые свойства обобщенного якобиана. Предложение 4. £ Справедливы следующие ут- верждения: 1) многозначное отображение х^дс\Н(х) замкнуто; 2) множество dQiH(x) при всех х непусто выпукло и компактно; 3) i-й столбец каждой матрицы из множества dciH(x) содержится в субдифференциале Кларка dclhi(x) i-й ко- ординатной функции отображения Н (i = 1, 2, ..., m).
§ 4. ОБОБЩЕННЫЕ ЯКОБИАНЫ И БЕЕРЫ 107 Доказательство. 1) Проверка замкнутости ото- бражения х ^д^Н (х) распадается на две части. Прежде всего покажем, что замкнуто отображение я Z) (#). Пусть хк х, Ak е D(xk), Ак А. Проверим, что А ^D(x). Так как Ak<= D(xk), то найдется элементу, об- ладающий следующими свойствами: (а) в точке xk суще- ствует дифференциал Я'(^); (б) ||^ — xh || <1/Л; (в) ||Я'(#ь) —Ak || <1/й. Понятно, что хь~+х, И' (х'к) А. Тем самым A^D(x), и замкнутость отображения D про- верена. Перейдем теперь непосредственно к отображению х^дС1Н(х). Пустъхк-+ х, Ah^dciH^Xk), Ah-+A. Пока- жем, что A^dciH(x). Так как дС1Н(х) = соЬ(х), то ис- пользуя теорему Каратеодори (см. Приложение I), найдем такие элементы А£ множества D(xk) Vi е е1:(тпп + 1)и числа а^О Vie 1: (mn + 1), = 1» что . 4 Л = 2 Из локальной липшицевости отображения Н I Н следует, что последовательности А^, Аг2, ..., Ак, ... при всех i ограничены. Поэтому, не умаляя общности, можно считать, что эти последовательности, равно как и после- довательности коэффициентов а}, ..., а&, ..., сходятся. Переходя к пределу и используя замкнутость отображе- ния Z), убедимся в том, что оператор А представим в ви- де выпуклой комбинации элементов из Щх), т. е. входит в dQVH(x). 2) Непустота и выпуклость множества дс\Н(х) следу- ет непосредственно из определения, ограниченность — из локальной липшицевости отображения Я, замкну- тость — из замкнутости отображения х дС1Я (х). 3) Утверждение 3) вытекает из теоремы 1.2. Используя обобщенный якобиан, можно оценить суб- дифференциал Кларка композиции. Сформулируем соот- ветствующий результат. Теорема 4.1. Пусть q(x') = f(H(x')), где отобра- жение Н: Rn —> удовлетворяет условию Липшица в окрестности точки х, а функция / удовлетворяет условию Липшица в окрестности точки у = Н(х). Тогда д^{х)(=- со {Zl I = А*1', А -е= dQXH(x), V dQXf(y)}. Здесь, как обычно, * обозначает переход к сопряженному оператору (транспонированной матрице). Доказательство этой теоремы можно найти, на- пример, в книге Ф. Кларка [120].
108 ГЛ. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА 2. Дальнейшее изучение обобщенного якобиана дС\Н(х) удобно проводить в терминах так называемых вееров. Прежде чем перейти к ним, рассмотрим некото- рое многозначное отображение, которое порождается мно- жеством линейных операторов (матриц). Пусть й— множество линейных операторов A: Rn—> ->Rm. Это множество порождает многозначное отображе- ние ар: определенное равенством v = Ag, Лей). (4.1) Множество <aQ(g) называется сечением множества опера- торов Й элементом g. Многозначное отображение а0, как нетрудно проверить, сублинейно, т. е. обладает свой- ствами = VgG=Rn, VX>0, (4.2) + + aa(g2) Vg1( g2<=Rn. (4.3) Справедливы следующие простые утверждения. 1) Если множество Й выпукло, то сечения aQ(g) вы- пуклы при всех ge R71. 2) Если множество Й компактно, то сечения da(g) компактны при всех g е Rn. 3) Если множество й ограничено, то sup sup || v || = sup || А || < + оо. IteHi v(=a(g) лей 4) Если пг = п и множество й состоит из обратимых операторов, то сечения aQ(g) не содержат нуля ни при каком g =# 0. Поясним лишь последнее утверждение. Если0^ао(^) при g =/= 0, то найдется такой оператор А •е й, что Ag = 0. Это, однако, противоречит обратимости оператора А. Определение обобщенного якобиана dCiH(x) липши- цего отображения Н существенно опиралось на конечно- мерность пространств, в которых действует отображение Я. Удачное расширение понятия обобщенного якобиана на бесконечномерный случай — понятие веера — было предложено А. Д. Иоффе [148]. В основе этого обобще- ния лежат свойства (4.2) и (4.3) сечений множества ли- нейных операторов. Мы изложим понятие веера, остава- ясь, однако, в рамках конечномерных пространств. 3. Многозначное отображение a: Rn->R7n называется веером, если:
§ 4. ОБОБЩЕННЫЕ ЯКОБИАНЫ И ВЕЕРЫ 109 1) вое множества a(g) непусты, выпуклы и компакты; 2) a(gi + £2)<=a(gi) +a(g2) Vgv g2<=Rn; 3) a (Xg) = Xa (g) для всех g e (Rw, X > 0; 4) величина Hall, определенная равенством || a ||= sup sup || p||, (4.4) ||g||<l W=a(g) конечна. Beep называется нечетным, если a(—g) =—a(g} для всех g. Примером нечетного веера может служить ото- бражение aQ, где Q — выпуклое компактное множество линейных операторов. Отметим, что не каждый нечет- ный веер представим в виде аа. Пусть а — веер. Положим p(l, g)= шах {(Z, р)| v^a(g)}. При фиксированном g функция I р (Z, g) представляет собой опорную функцию выпуклого компакта a (g). Функ- ция двух переменных (Z, g) р (Z, g) называется опорной функцией веера а. Так как p(l, g)— опорная функ- ция компакта a(g), то p(l, g) сублинейна по пере- менной I: р (h + I» sXp (ii, g} + р (Ц, g), p(XZ,g) = Xp(Z,g) VX>0. В то же время из свойств 2) и 3) в определении вее- ра вытекает, что p(l, g) сублинейна по переменной g: Р(I, gi + gi)<P(I, gi) + P(I, gz), (4.5) p (Z, Xg) = Xp (Z, g) VX>0. (4.6) Кроме того, max p (Z, g) = max max (Z, v) llell<i IWI<1 »Ga(g) < || Z ||«max max Ц v|| = || 11|-Ц a ||. (4.7) IlgUi Bea(g) Свойства (4.5) —(4.7) показывают, что функция Р (Z, g) является опорной функцией некоторого ком- пакта. Обозначим его через a*(Z). Используя двойствен- ность Минковского, нетрудно проверить, что многознач- ное отображение Z »-► a* (Z) является веером. Этот веер называется сопряженным к вееру а. Рассмотрим теперь функциюр^, g) V (Z, g) е Rn X которая сублинейна, по каждой переменной и, кроме
110 гл. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА того, обладает тем свойством, что max max р (I, g) < + оо. I11IK1 Зафиксируем Так как функция I »-► р (I, g) суб- линейна, то она является опорной функцией некоторого компакта a(g). В то же время при фиксированном сублинейная функция g>-+ р(Ц g) представляет собой опорную функцию некоторого компакта Используя двойственность Минковского, из свойств функции р по- лучаем, что каждое из отображений а и а* является вее- ром, при этом а* — веер, сопряженный к а, в свою оче- редь а — веер, сопряженный к а*. 4. Пусть дано отображение F: X->RW, где X — от- крытое множество в Rn. Веер а называется предпроиз- водной отображения F в точке х, если F(x + h)^F(x)+a(h)+r(h) II АП где г(А)->- 0 при h -> 0, & — единичный шар пространст- ва Rm. Этот веер называется строгой предпроизводной в точке х, если F(x' + А)е= F(x') + a(h) + r(x'9 h)W Я, где r(x', A)-> 0 при а/ я, A 0. Для локально липшицевых отображений F понятие строгой предпроизводной тесно связано с понятием обоб- щенного якобиана. Чтобы указать эту связь, опишем опорную функцию веера a* порожденного множе- ством линейных операторов ^1Г(я) = {Л*| 4e=5clF(a;)} (здесь * означает переход к сопряженному линейному оператору; если отождествить оператор с его матрицей в естественных базисах, то * означает переход к транспо- нированной матрице). Для положим fi(x) = (l, Fx). Понятно, что fi — локально липшицева функция. Пр едложение 4.2. Справедливо равенство a* m х (0 = ^Ci/г (*)• Это предложение непосредственно вытекает из сле- дующего более общего утверждения.
§ 4. ОБОБЩЕННЫЕ ЯКОБИАНЫ И БЕЕРЫ 111 Предложение 4.3. Пусть функция f непрерывно дифференцируема в окрестности точки y=F(x) и <р(х') = f(Fx') для х’ е X, где X — область определения отображения F. Тогда функция <р локально липшицева и 5Ci<p(z) = а » „..(?/(!/))• OciF(x) Доказательство. Пусть Q — множество точек х', в которых существует дифференциал F'(x'). Ясно, что в точках х' Q функция <р дифференцируема, причем V<P (*') = )°F'(x') = (F' (х')) * (V/ (F (х'У). (4.8) По теореме 1.2 дС1(р(я) = со Л, где А состоит из элемен- тов v вида р= lim V(p(zft). В силу равенства (4.8) xft->x,xfteQ v= [lim (F'(xft))*(V/(F(xft))). (4.9) xft->x,xfteQ Пусть v^A. Без ограничения общности можно считать, что последовательность LrJ, фигурирующая в (4.9), вы- брана так, что последовательность F'(xk) сходится к не- которому оператору Е7. При этом F(xh)-+ F(x)= у и, по- скольку функция / непрерывно дифференцируема, из (4.9) следует, что Так как U^dciF(x), то рея» (V/(y)). Мы показа- ли, что А с. a* (УШ). Так как множество dciF(x) ac]F(x) выпукло, то и dci<P(^)cz а ♦ (V/(y)). 0ClF(x) Проверим обратное включение. Пусть Al — множество операторов, элементы U которого представимы в виде U =. lim F' (хь). Если V — указанный оператор, то x*->x,xftGQ U* (V/ (у)) = [lim (F' (xft)) (V/ (у)) = = lim (F' (xh)) (Vf (F (xh))) = lim V<p (xh) xk~*x и потому Cr*(v/(y))c= A <= dci<p(z). Отсюда легко сле- дует, что « * I U е 5с1/? С 5с1<₽ (*)• OCiMX)
112 гл. II. ПРОИЗВОДНЫЕ И СУБДИФФЕРЕНЦИАЛ КЛАРКА Из предложения 4.2 сразу вытекает Следствие 4.1. Опорная функция p(l, g) веера а • z имеет вид «ClF(x) Р g) = (/z)ci (*> g) = lim (l, (F (x' +ag) — F («'))! х'-»х,а|о \ w / Через F'(x) обозначим веер, сопряженный вееру Нетрудно видеть, что любая строгая предпроиз- а * flGlF(x) водная а содержит веер F'(x). Действительно, по опреде- лению строгой предпроизводной выполняется включение F(x' + h)— F(x'\^ a(h)+ r(x'9 h)WhW^. (4.10) где r(x , &)-> 0 при х х^ h -> 0. Если IIZII = 1, llgll = 1, то, как следует из (4.10) при h = ag, fi (*' + h) — fi (xf) = (Z, F (x' + h) — F (x’)) < < max (Z, y) + r (xf, h) || h ||-|| 11| = p (Z, h) + r (xf, h) || h || = y^a(h) = ap(Z, g) + ar(z', ag). (4.11) Здесь p(Z, g)—опорная функция веера а. Соотношение (4.11) влечет неравенство (fz)ci (#> g) p(Z> #), из ко- торого в силу двойственности Минковского вытекает включение F' (х) (g) <= a (g). Можно проверить (см. [148]), что веер F'(х) сам яв- ляется строгой предпроизводной. Таким образом, F'(х) — наименьшая строгая предпроизводная отображения F в точке х. В рассматриваемой нами конечномерной ситуации строгие предпроизводные полностью описываются веером F'(x), определяемым по обобщенному якобиану ^gi^(^). Действительно, веер а является строгой предпроизводной в том и только том случае, когда a(g)^> F' (х) (g) для всех g. При определении обобщенного якобиана сущест- венно использовалась конечномерность пространства (из нее вытекает существование множества полной меры (>, в точках х которого существует дифференциал F(#')). В бесконечномерном случае это определение теряет свою силу. В то же время предпроизводная и строгая пред- производная могут быть определены и в бесконечномер- ном случае. При этом, однако, наименьшая строгая пред- производная существует не всегда.
ГЛАВА III КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ § 1. Разности выпуклых компактов 1. При изучении сублинейных функций и выпуклых компактов удобно использовать двойственность Минков- ского, т. е. отображение ф, сопоставляющее каждой суб- линейной функции ее субдифференциал. Напомним ос- новные свойства этого отображения, указанные в При- ложении I. Отображение ф осуществляет взаимно однозначное соответствие между совокупностью Р всех сублинейных функций, определенных на Rn, и совокуп- ностью N всех непустых выпуклых компактных подмно- жеств Rn, при этом сумме функций отвечает сумма (по Минковскому) множеств, произведению функции на не- отрицательное число — произведение множества на то же число, максимуму сублинейных функций — выпуклая оболочка объединения множеств. Обратное к ф отобра- жение восстанавливает сублинейную функцию pv по вы- пуклому компакту V с помощью операции взятия мак- симума: Pv(g) =max (I, g). zev Двойственность Минковского можно рассматривать и на совокупности суперлинейных функций. Здесь она об- ладает теми же свойствами, что и в сублинейном случае, за. тем исключением, что выпуклая оболочка объедине- ния компактов отвечает минимуму, а не максимуму соот- ветствующих функций, а обратное отображение восста- навливает суперлинейную функцию qv по выпуклому компакту V с помощью операции взятия минимума. Отображение ф играет основную роль при геометри- ческой интерпретации производной. Так, верхняя произ- водная Кларка всегда является сублинейной функцией, поэтому в силу двойственности Минковского ей соответ- ствует выпуклый компакт, являющийся субдифферен- циалрм Кларка. В частности, если производная по на-
114 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ правлениям f (х, g) полунепрерывна сверху как функ- ция точки х, то она сублинейна как функция направ- ления g, поэтому ей соответствует выпуклый компакт — ее субдифференциал, по которому она восстанавливается с помощью взятия максимума. Если же производная f (х, g) полунепрерывна снизу (по х), то она суперли- нейна как функция направления, поэтому ей соответству- ет супердифференциал, по которому она восстанавливает- ся с помощью взятия минимума. Однако предположение о сублинейности или суперлинейности производной как функции направления, в частно1сти, о полунепрерывности сверху или снизу этой производной как функции точки, часто оказывается весьма жестким. Так функция, пред- ставимая в виде разности выпуклых, уже не всегда обла- дает нужными свойствами, и вопрос о геометрической ин- терпретации ее производной по направлениям не решает- ся классическими методами. Чтобы преодолеть соответствующее затруднение, надо прежде всего попытаться распространить двойственность Минковского на более широкий класс, чем множество сублинейных или суперлинейных функций. Основное препятствие здесь заключается в том, что множество суб- линейных функций Р не является линейным пространст- вом: разность сублинейных функций не всегда сублинейна. В множеству непустых выпуклых компактов N можно определить вычитание по Минковскому: если U, V то U — V = {у — z I у е U, z е 7}. Однако эта операция не согласована с уже имеющимися в N операциями, точнее говоря, вычитание по Минков- скому не является операцией, обратной к сложению. В самом деле, если множество U содержит более одной точки, то U — U ¥= {0} (множество U — U содержит эле- менты вида у — х и х — I/, где ж, y^U, х^= у). С точки зрения двойственности Минковского вычитание по Мин- ковскому особого интереса не представляет. Опорная функция pu-v разности U — 7=С7 + (—7) совпадает с суммой (а не разностью) опорных функций ри и p_v компактов U и —V, Если множество V симметрично, на- пример, V = & — единичный шар, то V = —V и pu-v = — Ри + Pv- В связи со сказанным предпринимались различные попытки определить разность в совокупности выпуклых
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 115 компактов так, чтобы она в каком-то смысле была бы бо- лее близка к операции, обратной сложению, чем разность по Минковскому (например, обладала бы тем свойством, что U — U = {0} для любого U <^N). К сожалению, если оставаться в рамках пространства 7V, то говорить об об- ратной к сложению операции нельзя. Однако, используя общепринятые в алгебре подходы, можно поступить сле- дующим образом: расширить пространство N до некото- рого линейного пространства М. В этом пространстве в силу его линейности операция, обратная сложению, суще- ствует, тем самым она определена и для элементов 7V; однако результат ее уже не обязательно лежит в исход- ной совокупности АГ, он может находиться среди вновь добавленных элементов. Мы рассмотрим указанную кон- струкцию сначала для сублинейных функций, а затем, используя двойственность Минковского, применим ее к изучению выпуклых компактов. 2. Рассмотрим множество L всех функций, определен- ных на Rn и представимых в виде суммы сублинейной и суперлинейной или, что то же самое, в виде разности двух сублинейных функций. Иными славами, L = Р + (), где Р — совокупность всех сублинейных, a Q — совокуп- ность всех суперлинейных функций. Так как сублинейная функция, определенная на всем пространстве, непрерывна, то элементы множества L яв- ляются непрерывными функциями, т. е. L cz С (Rn), где C(Rn) — пространство непрерывных на Rn функций. Нетрудно проверить, что L представляет собой линей- ное подпространство в пространстве С (Rn) и, тем са- мым, само является линейным пространством: если Zi, I2 то и X1Z1 + W2 е L при любых вещественных %i, %2. Действительно, пусть Zf = Pi + qh где Pi^P, qt^Q (i = 1, 2). Имеем %iZi + W2 = Mpi + Xigi +tap2 + tag2. (1.1) Предположим, например, что M >0, %2 < 0. Тогда функ- ция + %2?2 сублинейна, а функция + W2 супер- линейна и потому, как следует из (1.1), Zi + Хг^2 = (Л4Р1 + ^2^2) + (М{71 + ^2Рг)'е Ь. Подобным же образом рассматриваются три остальных возможных случая 1) %i >0, Х2 > 0; 2) М <0, Х2 > 0; 3) М ;< 0, А* < 0.
lie гл. Ш. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Введем в L естественное отношение порядка: если Zi, L, то соотношение Zi > Д означает, что 1\(х)> > h{x) для всех Существенные для нас свойст- ва пространства L описываются в терминах этого отно- шения порядка. Прежде чем перейти к ним, дадим ряд определений. Пусть Д, ..., Д— числовые функции, опре- деленные на некотором множестве X. Функцию макси- мума х •-* max (Д (ж), ..., Д (х)) называют поточечным супремумом функций /], ..., Д. Подобным же образом функцию минимума х min (Д (я), ..., Д (х)) называют поточечным инфимумом этих функций. Одно из важнейших свойств пространства L заключа- ется в том, что с любыми своими элементами /1, ..., Д оно содержит их поточечный супремум и поточечный ин- фимум. Чтобы показать это, воспользуемся следующей леммой. Лемма 1.1. Пусть /1, ..., Д — функции, определен- ные на некотором множестве X, причем fi = <рг + V i е 1 : к. Тогда max Д (х) = max (ср, (х) — 2 Фг (х)) + 2 Фг (я), (1 -2) iGEUfc / i=l min fi (x) = S <p» (x) + min (% (x) — S <P« (*)\ (1-3) ieirfc i=l 3<=i:k \ J Доказательство. Ограничимся проверкой форму- лы (1.2). Рассмотрим вначале случай к = 2. Тогда фор- мула (1.2) выглядит так: тах(Д(ж), /2(я))== = max (<р 1 (х) — г|)2 (х), ф2 (#) — Ф1 (*)) + (Ф1 (*) + ф2 (х)). (1.4) Если Д(я)>Д(я), то правая и левая части формулы (1.4) совпадают с fi(x), если же Д(я)^/1(я), то эти части совпадают с Д(я). Таким образом, равенство (1.4) истинно. Воспользуемся теперь индукцией по к. Предположим, что для множеств из к — 1 функции лемма справедлива и рассмотрим набор из к функций: /1, ..., Д-i, Д. Поло- жим /* (*)= тах Д(^). Тогда, по индукционному предпо- 1)
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 117 ложению, /# = Ф* + где {Л-1 <Pj — S Ф< (я) <=хл^ л-1 Ф* (х) = 2 Ф1 (х). 1=1 Так как max fi (х) = max f max /{(x), /ft’(x)) = max {/* (x), fh (x)}, то, используя (1.4), имеем л-i max fi (x) = max {a (x), ₽ (x)} + 2 Ф. (я) + Фл (я), (1.5) 1е1:Л i=l где a(x)= max (<рДя)— S Ф1 (я))- Фл (*), jei:(fc-l) г(=1:(Л-1), Л-1 ₽(®) = Фл(®)— 2ф>(4 i=l Рассмотрим величину у (х) = max (ф3- (х) — 3 Ф1(я)\ (1.6) /61:Л \ <ех:ЛЛ9^ / Если точка х такова, что максимум в (1.6) достигается Л-1 на индексе к, то у (х) =<рл (х) — У (х) = р (х). В то же 2=1 время у (я)^ 4Pj (х) — 2 'фг(я) при всех / к и тем г£1.*Л,г^} самым ч(х)>а(х). Таким образом, в данном случае 7 (х) = max {а (х), £ (х)}. Пусть максимум в (1.6) достигается на индексе f < к. Тогда у(х) = ф;(х)— 2 Ф1(#) и, в то же время, 1е1:Л,<^5 у (я) фт (х) — У тр$ (х) {т =Н= /); отсюда следует, что <б1:Л,Мт 7(я)= а(я), у(я)^р(х), т. е. и в данном случае 7(#) = = max {а(я), Р(я)}. Учитывая это обстоятельство и привлекая формулу (1.5), убедимся в справедливости леммы. Предложение 1.1. Пусть функции Zi, ..1к вхо- дят в пространство L, причем li^Pt + q^ еде pt^P,
118 ГЛ., III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ е Q. Тогда поточечный супремум шах Ц(х) и поточечный инфимум wn.li(x) этих функций также входят в L, причем . k max li (х) = max [pj (x) — 2 3 <7г(я), (1-7) i j&l'h ( iei:ft,i^J J i«=l min li (x) = 2 Pi (x) + min [li i.x) — 2 Pi(x)l. (1.8) i i=l I J Доказательство формул (1.7) и (1.8) следует из леммы 1.1. Положим fe Р (х) = max (Pj (х) — 2 qi («)]> q (х) = 2 q* (•*)• 3 I ) i—1 Функция p сублинейна, a q — суперлинейна, поэтому max Ц (x) входит в L. Таким же образом проверяется, что min Ц (х) является элементом L. i 3. Пусть L и I = р + q, где р — сублинейная, a q — суперлинейная функции. В силу двойственности Минковского функции р соответствует ее субдифферен- циал др = U, а функции q — ее супердифференциал dq = V. При этом р восстанавливается по множеству U с помощью операции взятия максимума, a q восстанавли- вается по множеству V с помощью операции взятия ми- нимума: р (х) = max (fe, х), q(x) = min (fe, x). (1.9) Леи ЛеУ Таким образом, каждой функции I е L отвечает упорядо- ченная пара выпуклых компактов (Z7, У), причем I вос- станавливается по этой паре с помощью операций взятия максимума по первой компоненте и минимума по второй: I (х) = max (А, х) + min (fe, х) Vze[Rn. (1.10) Леи ЛеУ Представление функции I в виде суммы элементов из Р и Q, конечно, не единственно. Так, если I = р + д, где р Р, q е Q, то I можно представить и в виде i=(р + p’)+(q — р'У где р' — любой элемент из Р. При этом р + р' е Р, q-p'^Q.
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 119 Пусть I = Pl + I == р2 + $2, __где Pi -е=Р, q^Q (i = 1, 2). Положим Ut = dph V{ = dq{ Vi^ 1:2. Так как pi + qi = P2 +q2, to pi +(—?2) = P2 + (—qi). Функция —qi сублинейна и ее субдифференциал совпадает с мно- жеством —dqi = — Vi Vi el :2. Это следует из равенства — qi (х) = — min (ft, х) = max (— h, x) = max (fe, x). леУ^ леу$ h(=—Vi Привлекая двойственность Минковского, получим, что Z7i — V2 = U2-VX. (1.11) Таким образом, если две пары выпуклых компактов [C7i, Vi] и [С/2, V2] таковы, что по ним восстанавливает- ся с помощью формулы (1.10) одна и та же функция Z, то выполняется равенство (1.11). Рассуждая подобным образом, легко проверить и обратное: если выполнено равенство (1.11), то max (h, х) + min (ft, х) = max (fe, x) + min (A, x) Vx e Rn, te=ut ЛеУх леи, ЛеУ, т. е. li = 12. Упорядоченные пары выпуклых компактов будем называть эквивалентными (обозначение: [Z7j, Vi]» « \U2, V2]), если Z7r~ V2 == U2 — Vi. Приведенные выше рассуждения показывают, как можно распространить двойственность Минковского на функции из пространства L; при этом из-за наличия эквивалентных и не совпадаю- щих между собой пар это распространение проводится технически достаточно сложно. Рассмотрим множество N2 — декартов квадрат мно- жества непустых выпуклых компактов N; элементами N2 являются упорядоченные пары [Z7, V], где Z7, V N. В множестве N2 естественным образом вводятся операции сложения и умножения на положительное число: [?7i, Pi]+i[Z72, V2]=i[Ui + U2, 7i +V2], X [U, V] = [XZ7, XV] VX>0. Каждой паре [Z7, V]^N2 сопоставим функцию kutvi, определенную формулой (1.10): ки У1 (х) = max х) + min (&> х)- (1.12) ’ леи Ле у
120 ГЛ, III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Нетрудно проверить, что Z[UrVll + ^2-^] = Z[Ul^l]+lU2>r2]’ (1ЛЗ) = ^[p.v] VX>0. (1.14) Проверим, например, формулу (1.13). Имеем Zru,,v,] (х) + к и,, v»l (*) = max + min (h, х) + 1 1 1J i 2 2j fteU^ h^vi + max (h, x) + min (h, x) = max (h, x) + min (7г, x) = Леи2 леУ2 леп1+и2 ftsv1+v2 - fo+l^Vx+У,) = Z[U1.V1]+[V2.V21- Найдем теперь пару множеств, которая соответствует функции при % < 0. Сначала считаем, что % = —1. Имеем — ku,vy (я) = — (тах (^, х) + т*п (й, = min (— h, х) + \Леи ЛеУ J heu + max (— А, х) = max (fe, х) + min (Д, x) = l[_v>,-и}. (1.15) Леу Ле—У Ле-и Пусть теперь % — произвольное отрицательное число. Тогда, привлекая (1.14) и (1.15), имеем MtU’.V’] = 1Х| (_“4и’Л])= Ixl Z[-yt-17] = IlKV'KUy (1.16) Основываясь на формуле (1.16), естественно ввести сле- дующее определение: если [27, V] е №, X < 0, то пола- гают Х[27, К] — [ХИ, ХС7]. Тем самым в N2 определено умножение па все вещест- венные числа, однако это умножение не согласовано с операцией сложения и потому N2 не является линейным пространством. Так, например, Р, И-P, V]=p, Г]+[-Г, -^=[^.-7, V—U]. Таким образом, разность [J7, И] — [17, V] не обязательно совпадает с нулем. Для того чтобы обратить N2 в линейное пространство, следует отождествить эквивалентные между собой пары, рассматривая их как один элемент. Это следует из того, что совокупность эквивалентных пар описывается одной функцией из А, причем алгебраические операции над функциями соответствуют алгебраическим операциям над парами.
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 121 Формализуем высказанное утверждение. Рассмотрим множество М, элементами которого являются классы а эквивалентных пар. (Иными словами, М является фактор- множеством множества N2 по отношению эквивалентно- сти «.) Элемент a^Af, содержащий пару [U, 7], будем обозначать через [Z7, 7]. Таким образом, [Z7i, 7i] = = [С72, 72] в том и только том случае, когда U\ — V2 = = 72 — Ui. Класс а, содержащий пару [{0}, {0}], назовем нулем и обозначим, как обычно, символом 0. Понятно, что [4, В]=0 тогда и только тогда, когда А = —В. Пусть l^L. Через i|?(Z) обозначим класс -а е А/, со- стоящий из всех пар [U, 7]еДГ2? при которых справед- ливо равенство I = l[u,vi (гДе ku.vi определено формулой (1.12)). Из сказанного следует, что отображение г|? осу- ществляет взаимно однозначное соответствие между L и М. Под суммой ai + a2 элементов он = [Z7i, 7J и а2 = = [С72, 72] пространства М будем понимать класс а = = [ £71 + U2, 71 + 7г]. Произведение элемента а =[С7, 7] на вещественное число % определяется так: Ха = ин. Можно показать, что эти определения кор- ректны в том смысле, что сумма ai + a2 не зависит от выбора конкретных пар из классов ai, аг, а произведение Ха не зависит от выбора пары [Z7, 7] из класса а. Это утверждение легко проверяется непосредственно. Его можно проверить и используя отображение ф. Действи- тельно, если функции Zb 12 таковы, что ai = i|?(Zi), аг = = гр (7г), то ai + а2 = i|)(Zi + Z2). (1.17) Если а = i|)(Z), X — вещественное число, то Xa = ip(XZ). (1.18) Равенства (1.17) и (1.18) дают (выражение классов ai + + a2 и Ха, не основанное на использовании конкретных пар, содержащихся в этих классах. Эти равенства пока- зывают также, что взаимно однозначное отображение L -+ М линейно. Отсюда и из линейности пространства L следует линейность пространства М. Класс а, содержащий пару вида [Z7, 0], где U <^N, 0 = {0}, обозначим через а^. Заметим, что если [Z7, 0]е a и [7, 0]^а, то [U, 0]~[7, 0], т. е. U = 7. Таким обра- зом, равенства a^ = av и U = 7 равносильны. Понятно, что функция /[и,©] совпадает с опорной функцией ком- пакта U. Поэтому, отождествляя компакт U и класс а^,
122 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ можно сказать, что отображение гр совпадает на конусе Р сублинейных функций с двойственностью Минковского ср: если р е= Р, то <р (р) = др, а|) (р) = адр. С помощью пространства М можно определить раз- ность выпуклых компактов. Пусть U, V е N, Рассмотрим классы at;, av- Разность этих классов (в пространстве М) аи — аг вычисляется так: air-ar=|C7, 01 —[К, 0] = [С7, 0] + [0, -V] = [t7, -7]. Если отождествить компакты U и V с классами ау, то можно сказать, что разность U и V есть класс эквива- лентных пар, содержащий пару [U, — V]. Заметим^ что каждый элемент а пространства М выражается через па- ры вида аи и, тем самым, через элементы пространства N. Действительно, если а = [С7, 7], то а=[С7, 0] + [0, V] = R01-(-l)[0, 7] = = [С7, 0]-[-7, 0]=at7-a_y. В связи с этим М часто называют пространством выпук- лых множеств или, точнее, пространством выпуклых ком- пактов. 4. Введем в пространстве М отношение порядка. Пусть ai, «2 е М, причем ai = ip(Zi), a2 = 'ф(Ь). Счита- ем, что ai > аг в том и только том случае, когда 1\ > /г. Предположим, что ai = [СЛ, 7J, аг = [Г7г, 7г]; обозначим pv. (х) = max (fe, х), q?. (х) = min (/г, х), i =1, 2. Тогда = put + qy^ Ч = Ри2 + qv2- Неравенство l\ > h равносильно неравенству Ри± — qv2>Pu2 — Qv^ (1.19) Сублинейная функция (—qy^ имеет субдифференциалом множество —Vf (1 = 1, 2), поэтому в силу двойственно- сти Минковского субдифференциалы сублинейных функ- ций — qv2 и Ри2 — qvi совпадают соответственно с компактами U\ — V2 и U2 — Vi, а неравенство (1.19) равносильно включению их - V2 => и2 - 71. (1.20) Таким образом, неравенство ai > a2, где 7г], эквивалентно соотношению (1.20).
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 123 Непосредственно из определения следует, что отобра- жение гр сохраняет порядок: неравенства l\ > I2 и г|?(/1)> >^(/2) равносильны. Приведем два утверждения, которые будут использо- ваться ниже. Предложение 1.2. Пусть Zb ..., lh^L, причем 'ф(/г) = [^г, Vi]. Пусть, далее, Z (я) == m ах Z* (я), I (х) = _ __ _ г=1:Ь = min Ц(х). Тогда ip(Z) = [tf, У], ^(Z) = [C7, У], где i^i:k — — — 6 - k [7 = СО и (Ui- 2 уД F=sn, \ jei:fcJ¥=i / i=l Л U=^Ui, 7 = 0011(4- S Uj i=l i=l \ Доказательство. Так как ip(Z<) = [Z7i, У<], то Z, = = где pi (х) = max(fe, х), qi(x)—min(h, х) Vfel:A. hf=Ui hf=Vi Воспользовавшись формулами (1.7) и (1.8), которые да- ют выражение 1(х) и 1(х) через ph Viel:fc и при- меняя двойственность Минковского, убедимся в справед- ливости предложения. Предложение 1.3. Пусть U, У, W^N и U+V=> =>W+V. Тогда U=>W. Доказательство. Пусть Ри, Pv, Pw — опорные функции компактов U, У, W соответственно. Используя двойственность Минковского, имеем Ри + Pv = Pu+v > > pw+v = pw + Pv, откуда следует неравенство ри > pw, равносильное требуемому включению. Следствие 1.1. Если U, У, W^N и U + У = = 17 + У, то U = W. 5. Вернемся к вопросу об определении разности в со- вокупности N выпуклых компактов, лежащих в простран- стве Rn. Один из способов определения разности, осно- ванный на использовании операции вычитания в линей- ном пространстве выпуклых множеств, указан в преды- дущем пункте. При этом вычитание является операцией, обратной к сложению по Минковскому, однако результат ее уже не обязательно лежит в исходной совокупности N, он принадлежит более широкому пространству М. По са- мому определению вычитания в линейном пространстве для любых U, V е N справедливо равенство (С7-У)+У=С7. (1.21)
124 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ Здесь U—V — элемент [Z7, — У] пространства выпуклых множеств, являющийся разностью элементов [С7, 0] и [У, 0], относящихся к множествам Е7 и У соответствен- но. Равенство (1.21) есть символическая запись ра- венства [U, -У] + [У, 0] = р, 0], То обстоятельство, что разность, определяемая в про- странстве выпуклых множеств, может выходить за пре- делы совокупности N, представляется иногда неудобным. Поэтому наряду с указанным выше рассматриваются и другие способы определения разности. При этом под раз- ностью понимается операция, определенная для любых U, У е ДГ; ее результат есть элемент совокупности N или пустое множество; она обратна к сложению по Минков- скому в следующем смысле: если U = У + ТУ, то раз- ность множеств U и У должна совпадать с ТУ. Если же множество U не представимо в виде У + ТУ, то разность компактов U и У может зависеть от способа определения. (Разные определения приводят к разным результатам.) Иными словами, выполнение равенства вида (1.21) тре- буется лишь в случае, когда U = У + ТУ. Мы рассмотрим лишь два способа определения раз- ности. 1. Операция +. Пусть Z7, У^ДГ. Положим U+V = {x\x+V<=U}. Результат операции 4- может быть и пустым множеством, тем самым она может выводить за пределы N. Отметим, что операцию -4- рассматривал Л. С. Понтрягин (см. [76]). Нетрудно показать, что множество U + У выпукло и компактно. Проверим, например, выпуклость. Предполо- жим, что U 4- У непусто и пусть х, у U 4- У. Тогда при любых z У имеем х + z^-U, у + z U, а потому при 0 а 1 выполняется соотношение а(х + z) + (l — а) (у + z) = ах + (1 — а)у + z U, которое показывает, что ах + (1 — а) г/ е U У. Операцию 4- можно рассматривать как вычитание. Точнее говоря, справедливо следующее утверждение. Предложение 1.4. Если U=V'+W, то U 4- 4-У = Ж Доказательство. Пусть х U 4- У, т. е. х + У сг <= U = У + W. Привлекая предложение 1.3, получим, что
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 125 х е W. Если же х W, то х + V <= W + V = U, т. е. х^ ^U+V. Приведем два примера. 1. Пусть V => U. Тогда множество U 4- V пусто. В то же время 0 е V + U. 2. Пусть U — шар, V — диаметр этого шара. Тогда U 4- V = {0}. Если Vi — произвольное подмножество ша- ра, содержащее диаметр, то и U 4- V\ = {0}. Покажем, как операция 4- связана с отношением эк- вивалентности. Предложение 1.5. Пусть пары [U, —У] и [W, —Z] эквивалентны. Тогда U 4- V = W + Z. Доказательство. Соотношение [С7, —У]« « [Ж, — Z] означает, что U + Z = V + W. Поэтому спра- ведливы следующие импликации: x^U+V=>x+V^U=> x + V + Z<=U + Z=> =>x+V + Z<= V+W. Предложение 1.3 означает, что включение я+У + + Z cz V + W равносильно включению х + Z <= W, кото- рое показывает, что х <= W ч- Z. Итак U -5- V <= W + Z. Подобным же образом доказывается обратное вклю- чение. Замечание 1.1. Выразим эквивалентность пар [С7, —V] и [Ж, — Z] на языке пространства L. Пусть элемент l^L таков, что 4>(Z) = [C7, — У]. Тогда I (х) = max (fe, х) + min (fe, х) = max (ft, x) — max (h, x). ht=U hf=-V ht=U h~V Подобным же образом, если ‘ф(Г) = [Ж, —Z], то I (x) = max (Л, x) — max (fe, x). hEW hf=Z Будем сопоставлять паре компактов (Л1, Лг) функцию I L по такому правилу: I (х) = max (ft, х) — max (ft, х). Из сказанного выше следует, что эквивалентность пар [Z7, —У] и [Ж, — Z] равносильна тому, что пары [U, У] и [Ж, Z] порождают по указанному выше правилу одну и ту же функцию I L. 2. Операция —. Прежде чем ввести эту операцию, приведем ряд предварительных сведений.
126 ГЛ. III. КВАЗИ ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Пусть U — выпуклый компакт и ри — его опорная функция. Для х е Rn положим б?х (U) = fh^ U | (А, х) = max (х, g)L I g^Uj J Множество GX(U) назовем max-гранью компакта С7, поро- жденной элементом х. Пусть ри — опорная функция ком- пакта U. Эта функция сублинейна и потому ее субдиф- ференциал дри(х) в точке х вычисляется по формуле дРц(я) = {h е дри | (А, х)=рп(х)}(см. Приложение I). Ины- ми словами, max-грань GX(U) совпадает с субдифферен- циалом дри(х). Если GX(U) состоит из одной точки, то Ри дифференцируема в точке х и GX(U)=^ {^ри(х)}. Как отмечено в Приложении I, выпуклая функция почти всю- ду дифференцируема. Поэтому множество тех х, для ко- торых max-грань GX(U) состоит более чем из одной точ- ки, имеем меру нуль. Отметим, что сублинейная функция р или, что то же самое, ее субдифференциал полностью восстанавливают- ся по значениям градиента ^р(х) на некотором множе- стве полной меры Т, где этот градиент существует. Дей- ствительно, множество др совпадает с субдифференциа- лом Кларка функции р в нуле, а потому, как следует из теоремы II.1.2, др совпадает с выпуклым замыканием множества {V/(x3 I х Т). Рассмотрим выпуклые компакты U, V и пусть Т — некоторое множество полной меры, в точках х которого существуют градиенты Чри(х) и ^pv(x). Рассмотрим множество разностей {Vpu(x)— Vpv(x)}; его выпуклую замкнутую оболочку обозначим символом U — V. Та- ким образом, по определению, U — V = cl со{Vpu (х) — Vpy (х) | хе Т}. Допуская вольность речи, можно сказать, что разность U — V определяется разностями точек из выпуклых компактов U и У, в которых гиперплоскость, ортогональ- ная одному и тому же вектору х е Т, «касается» этих компактов.. Прежде всего следует проверить, что данное определе- ние корректно, т. е. U ч- и не зависит от выбора мно- жества Т, обладающего указанными выше свойствами. Пусть Tu,v — совокупность всех векторов х, в которых существуют градиенты ^ри(х) и Vpv(x) и множество
§ 1. РАЗНОСТИ ВЫПУКЛЫХ КОМПАКТОВ 127 Т cz TUtv таково, что его замыкание содержит Tu,v Пусть Wi =с1со — Vpv (х) I x<^TUtv}t JV2 = C1CO {Ури(х)— ^р?(х) I Понятно, ЧТО W1 => W2» С другой стороны, пусть X Tutv и xh Т, хк х. Поскольку в точке х существует гради- ент ри (х), то Vpu(xh)-*- Vpu(x). Это легко следует, на- пример, из полунепрерывности сверху субдифференциаль- ного отображения У^дри(у) и того факта, что дри(х) = = №ри(х)}. Подобным же образом Vpv(xh)-+Vpv(x). От- сюда следует, что ^Ри(х)—pv(x)^ W2, а это влечет справедливость включения W\ <= W2. Из сказанного выте- кает, что если Ti, Т2 <= TUtV и Ti, Т2 — множества пол- ной меры, то clco{vpir(a?)— Vpv(x) I х^Т\} = = clco{Vpl7(^) — Vpv(x) I x^T2}. Тем самым множество U -1- V определено корректно. По самому определению множество U — V выпукло и замкнуто. Понятно, что это множество содержится в разности Минковского U — V и потому ограничено. Та- ким образом, U “ V — выпуклый компакт. Это показыва- ет, что в . отличие от операции 4- операция — всегда вы- полнима в совокупности N. Покажем, что так же, как и ч-, операция — является вычитанием в том смысле, что (F + РИ) — W = V. Точнее говоря, справедливо следую- щее утверждение. Предложение 1.6. Если U=V+W, то U — Доказательство. Пусть множество Т состоит из всех точек я, в которых существуют градиенты опорных функций pv и pw компактов V и W соответственно. В каждой точке х^Т существует и градиент функции pv + Pw, совпадающей с опорной функцией ри компакта и = V + W. Имеем U — V = cl со {V/ty (х) — Vpy (х) | х е Т} = = cl со {Vру (х) + Vpw (х) — Vpv (х) | х <= Т} = = clco{Vpw(^)| х^Т}. Но, как уже отмечалось выше, выпуклое замыкание мно- жества {V^w(.r)| х е Т} совпадает с субдифференциалом dpw функции pw, т. е. с компактом W.
128 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Приведем простой пример. Рассмотрим плоскость R* с единичными ортами ei, в2. Пусть U — единичный круг с центром в нуле, V = = {Лег I Л [—1, 1]} — его диаметр. Положим Т = = {х = (x{i),x{2)) I я(2)¥=0}. Для всех х^Т тах-грань GX(U) состоит из точки х. Если ж(2)>0, то СЛ(У) = {е2}? если я(2)<0, то GX(V) = {—ег). Отсюда легко следует, что множество С7— V совпадает с описанным вокруг круга квадратом [—1, 1] X [—*1, 1]. (Напомним, что, как отмеча- лось выше, U У = {0}.) Предложение 1.7. Если пары [С7, — У] и [ТУ, —Z] эквивалентны, то U — V = W — Z. Доказательство. Пусть множество Т состоит из всех элементов х, в которых опорные функции ри, Pv, pw, pz компактов U, У, W, Z имеют градиенты. По определе- нию операции — получим, что компакты U — У и W — Z совпадают с замкнутой выпуклой оболочкой мно- жеств {Vpu(x)- Vpv(x) I х^Т} и {Vp vr (x)-Vpz(z)\ x^ e T} соответственно. Эквивалентность nap [U, —У] и [W, —Z] влечет равенство U + Z = У + W. Используя двойственность Минковского, получим Ри + pz = Pv + Pw или, что то же самое, ри — Pv = Pw — pz. Из сказанного вытекает равенство Vpu(x)— Vpv(x)= Vpw(x)— Vpz(x) \fx^ T, которое и показывает, что G — У = 1У — Z. § 2. Квазидифференциальное исчисление 1. Пусть функция / определена на открытом мно- жестве X в пространстве Rn и имеет производную по на- правлениям fx (g) e f'(z, g) в точке х е X, Напомним, что / называется субдифференцируемой в точке х, если /х является сублинейной функцией или, что то же са- мое, если найдется такой выпуклый компакт U, что fx (g) = max (h, g) Vg(=Rn. (2.1) h(=U Представление (2.1) весьма удобно для изучения произ- водной. Его можно рассматривать как своего рода линеа- ризацию производной, ее выражение через линейные функции. Веллман и Калаба [195] использовали в по- добной ситуации термин квазилинеаризация. Наряду с субдифференцируемыми можно рассматривать супердиф-
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬПОЕ ИСЧИСЛЕНИЕ 129 ференцируемые функции, т. е. функции, для производ- ных fx которых справедливо представление fx (g) = min (Ji, g) Vg e Rn, ЛеУ где V — выпуклый компакт. Понятно, что функция / супердифференцируема в том и только том случае, когда функция /1 = субдифференцируема. Класс субдифференцируемых функций достаточно ши- рок, в частности, как отмечалось в § II.1, если производ- ная f (х, g) = fx (g) полунепрерывна сверху по х при каждом g, то функция f суб дифференцируема. Легко про- верить, что сумма и максимум (поточечный супремум) конечного числа субдифференцируемых функций также являются субдифференцируемыми функциями. В то же время совокупность субдифференцируемых функций не является линейным пространством. Это обстоятельство наводит на мысль рассмотреть совокупность функции, у которых производная представима в виде разности двух сублинейных или, что то же самое, суммы сублинейной и суперлинейной. Иными словами, речь идет о функциях, у которых производная входит в пространство L, изучен- ное в § 1. Совокупность таких функций уже является ли- нейным пространством. Введем следующее определение. Функция /, опреде- ленная на открытом множестве X в пространстве Йп, называется квазидифференцируемой в точке х X, если она дифференцируема по направлениям в этой точке и ее производная fx(g) может быть представлена в виде fx (g) = max (fe, g) + min (h, g), (2.2) hf=U hEV где U, V — выпуклые компактные множества в Rn. Поло- жим fx (g) = max (h, g), fx(g) = min(fe, g), Леи ЛеУ ^(g) = /x(g) + 7x(g). Понятно, что fx — сублинейная, a f x — суперлинейная функции, поэтому fx (g) = I (g) является элементом про- странства L функций, представимых в виде суммы субли- нейной и суперлинейной. Пара выпуклых компактов [U, 7], участвующая в представлении производной (2.2),
130 гл. Ill, КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ определена не единственным образом. Эта неединствен- ность совершенно естественна с точки зрения простран- ства выпуклых множеств М, введенного в § 1. Так как производная /х является элементом пространства L, то ей отвечает элемент пространства выпуклых множеств, т. е. класс эквивалентных пар выпуклых компактов. На- помним, что пары [J71, KJ и [СЛг, 72], где ЕЛ, 7< (i = 1, 2)— выпуклые компакты, называются эквивалент- ными, если U\ — Vz = U2 — V\. Пусть функция / квазидифференцируема в точке х. Класс эквивалентных пар выпуклых компактов [С7, 7], обладающих тем свойством, что /х (g) = max (h, g) + min (A, g) Vg g= Rn, ЛеС7 hEV называется квазидифференциалом функции f в точке х и обозначается символом Каждую пару множеств, принадлежащую этому классу, также будем называть квазидифференциалом и обозначать тем же символом <£)/(#). Это нигде не приведет к недоразумению. Если ®f (x) = \U, 7], то множество U назовем субдифферен- циалом функции f в точке х и обозначим символом df(x), а множество 7 назовем супердифференциалом функции в точке х и обозначим через df(x). Таким образом, ®f(x)=[df(x), df(x)]. Подчеркнем, что множества df(x) и df(x) нельзя рассматривать изолированно, сами по се- бе. Смысл имеет лишь пара 0f(x) = [df(x), df(x)] как представитель класса эквивалентных пар (элемента про- странства выпуклых множеств). Квази дифференцируемость функции / в точке х озна- чает, что функция / имеет производную по направлениям (производную Дини) в этой точке и указанная производ- ная может быть выражена через линейные функции (квазилинеаризована) с помощью квазидифференциала 3)f(x) = [df(x)> df(x)] посредством формулы /'(*>£)= max (й>?)+ m_in (Й»Я)- лед/(х) ЛедДх) В случае, если функция f дифференцируема в точке х по Адамару и квазидифференцируема, будем говорить, что / квазидифференцируема по Адамару. Заметим, что, .как следует из результатов § 1.3, всякая квазидифференцируе-
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 131 мая локально липшицевая функция квазидифференцируе- ма по Адамару. Пусть функция / дифференцируема по направлениям на открытом множестве X. Если / представима в виде суммы двух функций, причем производная одной из них полунепрерывна снизу, а другой —- полунепрерывна свер- ху при каждом g, то функция / квавидифференцируема на X (т. е. в каждой точке х^Х). Предположим, что ква- зидифференциал функции / в точке х е X не вырожден в том смысле, что не существует квазидифференциала ви- да [д/(я), {0}] или [{0}, df(x)], т. е. функция / не явля- ется субдифференцируемой или супердифференцируемой. Тогда f (х, g) не является полунепрерывной сверху или снизу. Точнее говоря, хотя бы при одном g eRn функ- ция У f'(y, g) не является полунепрерывной сверху или снизу в точке х. Это следует из результатов § II.1. Понятно, что субдифференцируемость (соответствен- но, супердифференцируемость) квазидифференцируемой функции / равносильна тому, что эта функция имеет квазидифференциал вида &>f(x) = [df(x), {0}] (соответ- ственно, вида 3)f(x) = [{0}, df(x)]). Класс квазидифференцируемых функций достаточно богат. Приведем несколько примеров таких функций. 1. Если функция / имеет градиент в точке х, то она квазидифференцируема в этой точке. Ее квазидифферен- циалами являются, например, пары [v/(^r), (О)] или [{0}, Vf(x)]. Таким образом, / является одновременно и субдифференцируемой и супердифференцируемой. 2. Пусть f — выпуклая функция, определенная на от- крытом множестве X cz Rn. Тогда, как отмечено в При- ложении I, функция / дифференцируема по направлени- ям в точке х е X, причем f(x,g)= max (v, g), где df (х) = {v(= Rn| f (z) — /(x)>(p, z — я) Vze X} - субдифференциал функции / в точке х. Отсюда следует, что / — квазидифференцируема в точке я и в качестве ее квазидифференциала в этой точке можно взять пару 3)f(x) = [df(x), {0}]. Это означает субдифференцируемость выпуклой функции. Подобным же образом показывается, что вогнутая функция /, определенная на открытом множестве X cz (Rn,
132 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ является квазидифференцируемой (и даже супердиффе- ренцируемой) в точках х е X. В качестве ее_квазидиф- ференциала можно взять пару 3)f(x) = [{0}, df(x)], где df(x) = Rn|/(z) — f(x)^(w, z — х) Vzelj —супер- .дифференциал функции /. 3. Пусть X — открытое множество в Rn, Y — ком- пакт в Rm, функция ср (я, у) определена на XX Y и не- прерывна там вместе со своей частной производной ду/дх. Положим /1 (х) = max (р (х, у), /2 (х) = min (р (х, у). yf=Y ' yf=Y Поскольку (см. § 1.3) g) = max (*’ y), Д f'2(x, g) = min y), g\ yf=R(x)\ ox ) yeQ(x)\ Ox J где R(x)={y^G\ <p(rr, y)=fi(x)}, Q(x)=={y^G\ q>(x,y) = = /г(^)), то функции /i и /г квазидифференцируемы в точке х X, причем в качестве их квазидифференциалов выступают соответственно пары 0/1 (*) = Р/i (х), {0}], 0f2 (х) = [{0}, df2 (х) ], где дДСг) = со [ve Rn| У = срх(я, */), y<=R(x)}, df2 (х) = со [и> (= Rn | w = (р'х (х, у), yt=Q (я)). Отсюда следует, что функция максимума Д субдифферен- цируема, а функция минимума /2 супердифференцируе- ма на X. 2. Укажем свойства квазидифференцируемых функ- ций, которые можно трактовать как квазидифференциаль- ное исчисление. При этом алгебраические операции над парами выпуклых компактов (в том числе и над квази- дифференциалами) будем понимать так, как они опреде- лены в § 1 при изучении пространства выпуклых множеств. Напомним, что [Uh У1] + [^2, V2] = [Ui + U2, V1 + V2], Mt/, J - (РУ, XL7] VX>0, VX<0. Теорема 2.1. 1) Пусть функции /1 и f2 квазидиф- ференцируемы в точке х. Тогда сумма и произведение этих функций квазидифференцируемы в этой точке, при
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 133 ^>(/1 + /2)(х) = ^/1(х)+^/2(х), (2.3) 0(/i (2.4) Иными словами, если [dfa(x), dfa(x)], [dfafx), dfa(x)] — квазидифференциалы функций fa и fa в _точке х, то квазидифференциалы [d (/i + fa) (х), д (f\ + fa) (х) ], (/i • fa) (xfa d(/i • fa) (я)] функций /i + fa и /1 • fa вычис- ляются по формулам _ d{fa + fa){x)^dfa{x)+dfa{x), d(fa + fa)(x) = = dfa (х)+ dfa(x), d(fa-f2)(z) = 1 fi (x)df2(x) + /2(х)5А (х), если /1(^)^ 5 0, fitx)^ 5 0, fi(^df2(x) + fi(x)df1(x), если fl № « S0, 5 0, fi (*) df2 (x) + /2 (x) df± (x), если fl (*)« so, f2 (*) < SO, fi + fi(x) df1(x), если /i № 5 5 0, fiix)^ SO, d(f i’/a) (x) = /1 (*) df2 (x) + f2 (x) (x), если fi (^)S 5 0, fi (*)5 5 0, Ji (x)df2(x) 4- f2(x)df!(x), если /1 (.х) SO, fi (x) 5 0, — fi (x)df2 (x) + /2 (x) д/г (x), если /1(^)< SO, fi (x) S ^0. fi (x)df2 (x) + /2 (x^f^x), если /1 (®) S >0, fi(x)z >0, 2) Пусть функция f квазидифференцируема в точке х. Тогда при" любом вещественном X функция также ква- зидифференцируема в этой точке, причем 0(Х/)(я) = Х0/(я). (2.5) Иными словами, если [df(x), df(x)] — квазидифференци- ал функции f в точке х, то для квазидифференциала [д(Х/)(я), 9(Kf)(x)] функции kf в этой точке справед- ливо равенство ('kdf(x), если £(М)(^) = 1 I kdf (x), если X 0, J(X/)(x) = ^df(x)^ если X^0, Xdf(x), если X<10.
134 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 3) Пусть функция f квазидифференцируема в точ- (1 \ । —j(x') = у- , где х — точка из области определения f, в которой f(x')¥=O. Тог- да функция квазидифференцируема в точке х и (т) f (я) (2.6) Иными словами, если [df(x), df(x)]— квазидиф- ференциал функции f в точке х, то для квазидифферен- циала (у)(я), функции у в этой точке вы- полняется равенство -(т)w ~ s - - Ж У(х}- Доказательство. Прежде всего отметим (см. предложение 1.3.1 и замечание 1.3.1), что функции /1+ + /2, /1 • fa (пункт 1 теоремы), X/ (пункт 2 теоремы) и — (пункт 3 теоремы) дифференцируемы в точке х по на- правлениям, причем для всех g Кп выполняются ра- венства (/1 + /г)' (*> g) = f'l (*» g) + /2 (*> g)> (fl ‘fj (^ g) = fl (*) /2 (x, g) + /2 (*) fl & g)> g) = V'(*> ?)> (j)\x,g) = -^f'(r,g). Далее, определенности ради, рассмотрим функцию /1 • /2. Ее производная представима в виде Ц1/г(?) + + (?), где числа щ, Ц2 совпадают с f\(x), /2(2) соот- ветственно, а функции Zi(g), lz(g)—с производными /1 (х> g)i /2 (я, g) соответственно. При этом по определе- нию квазидифференцируемости функция Z<(g), i = 1, 2, является элементом пространства L, т. е. представима в виде суммы сублинейной и суперлинейной. Так как L — линейное пространство, то функция И1^(?)+Р'2^1 (?) так- же входит в L. Это означает, что /1 • /2 — квазидифферен- цируемая функция. Выразим ее квазидифференциал ^(/1 */2)(^) через квазидифференциалы 3>fi(x) функций
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 135 fi(ж), i = l, 2. Пусть ф — введенное в предыдущем пара- графе отображение, сопоставляющее функции I <= L эле- мент а=[С7, V] пространства выпуклых множеств, при котором справедливо равенство I (g) = max (A, g) + min (fe, g). h(=U h&V Тогда i|)(Zi) = (x), ф(/2) = ^/2(2). Так как отображе- ние яр линейно, то *Hhi^2 + Ц2/1)= Ц1^/2(я)+ц2^/1 (я). В то же время Ц2М = ^(/1’А) (я). Таким об- разом, S) (/1 • /2) (*) = /1 (*)0/ф) + /2(я)0Л(я). Тем самым формула (2.4) доказана. Подобным же обра- зом проверяются формулы (2.3), (2.5) и (2.6). Их рас- шифровка, данная в заключении теоремы, сразу следует из определения алгебраических операций в пространстве выпуклых множеств. Следствие 2.1. Если функции /1 и /2 квазидиф- ференцируемы в точке х, то и их разность /1 — /2 квази- дифференцируема в этой точке. При этом, как вытекает из (2.3) и (2.5), Ф (/1 “ /2) (х) = (х) - 3>f2 (х): Если /2(^)^0, то частное f\ff2 квазидифференцируемо в точке х, причем & (-г) & = \ 7 2 / / 2 Г / Это равенство следует из формул (2.4) и (2.6). Замечание 2.1. Теорема 2.1 вытекает из результа- тов § IV.2, доказательство которых не использует техни- ки пространства выпуклых множеств. Замечание 2.2. Формулы квазидифференциально- го исчисления, полученные в теореме 2.1 (и ниже), име- ют следующий смысл: среди квазидифференциалов функ- ции в некоторой точке существует квазидифференциал указанного вида (остальные квазидифференциалы явля- ются эквивалентными ему парами). Обратимся к операции взятия максимума и минимума. Теорема 2.2. Пусть функции /ь ..., fm определены на открытом множестве X и квазидифференцируемы в точке х е X. Пусть, далее, (х) = max fi (х), ср2 (х) = min Д (х). iei:m iei:m
136 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ Тогда функции ф1 и ф2 квазидифференцируемы в точке х и 0<f>i(x) = [dyi(x), d<pi(x)], ^>ф2 (х) = [дф2 (х), Зф2(х)], где д^(х) = со и (dfk(x)_ 2 (2.7) ьей(х) гея(х)л^д / d<₽i(*) = 2 Ofh(x), дч>2(х)= 2 dfk(x), (2.8) feER(x) ” AeQ(x) “ дф2(.г) = со (J (dfh(x)— 2 5/i(*)\ (2.9) fce<?(x) \ ieQ(x),i^fe - / Здесь [%(#), dfk(x)] — квазидифференциал функции fh в точке х, R(x)={i^I\ f{(x) = ф1(я)}, Q(x) = = {if=I\ fi(x) = ф2(я)}, I = 1: n Доказательство. Ограничимся случаем функции <рь Следствие 1.3.1 показывает, что эта функция диф- ференцируема по направлениям, причем (Ф1)' g) = max /• (х, g), (2.10) ген(х) Функции h (g) = fi (х, g) входят в пространство L, поэто- му, как следует из предложения 1.1, функция 1(g) = = max li(g) также входит в L. Это обстоятельство вме- гей(х) сте с формулой (2.10) показывает, что функция ф1 квазидифференцируема. Формулы (2.7) — (2.9) вытекают непосредственно из предложения 2.1. Замечание 2.2. Ниже в п. 3 приводится другое до- казательство этой теоремы. 3. Существенное место в квазидифференциальном ис- числении занимает теорема о квазидифференцируемости композиции. Приведем ее формулировку. Теорема 2.3. Пусть X — открытое множество в Rn, У — открытое множество в и пусть отображение H(x) = (h{(x), ..., hm(x)) определено на X, принимает значения в Y и его координатные функции ht квазидиф- ференцируемы в точке xq е- X. Пусть, далее, функция f определена на Y и квазидифференцируема по Адамару в точке уо = Н(хо). Тогда функция ф(х) = /(Я(х)) квазидифференцируема в точке х$. При этом кв азид иф-
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 137 ференциал ^ф(яо) = [дф(яо), дф (#о) ] описывается сле- дующим образом: ду (х0) = L | р = 2 (v(i) (Xi + Hi) — v(i)M — v(i)H»)> I i=l V = , v(m>) <= df (y0), Xi e dhi (x0), р,< e dhi (л:0)|, (2.11) Jq>(x0) = Z| I = 2 (v(i)(%i + Hi) + v(i)Xi + v^Hi), I i=l V = (vd),..., v<“>) GE df(yQ), Xi e dhi (*0)> Hie (x0)j. (2-12) Здесь v и v — произвольные векторы, обладающие тем свойством, что v v v Vv G 3/ (j/0) J (—df (у0)). Замечание 2.3. Пара множеств [дср(яо), dcp(#o)], о которой идет речь в теореме, зависит от векторов v, v, которые определяются неоднозначно. Выбирая эти векто- ры различными способами, будем получать различные пары выпуклых компактов. Однако все полученные та- ким образом пары эквивалентны между собой и пред- ставляют один и тот же элемент пространства выпуклых множеств. Теорема 2.3 следует из теоремы IV.4.1 (см. также Приложение III). Приведем три примера на вычисление квазидифферен- циала композиции. Пример 2.1. Пусть функции /и, ..., hm квазидиф- ферепцируемы в точке xq <= X, а функция f непрерывно дифференцируема в точке у0 = (7^ (х0), ..., hm (я0)) е (Rm. Положим Ф (х) = / (х), .. .,hm (х)) Ух е X, и выразим квазидифференциал ^ф(#о)== [дф(#о), Зф(яо) ] функции ф в_точке xq через квазидифференциал ^^(#0) = = [дйг(яо), dhi(xo)] функций в этой точке и градиент v/(Z/o) (^o)j Функции /; считаем, что квазидифферепциал этой функции в точке уо выражается
138 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ парой ^yv/G/o)}> (yV/Ц . Пусть 7х-^е1:т| (у0)<oj, /2 = ] i е 1: т Положим 4^)^) VZe/- Vfe/2’ — ~2 s I» ~~~2~di) Visl2. Воспользовавшись теоремой 2.3, получим дф(*о) = р| 1= 2тю(Уо)н+ 2 ( ieli °У i^I2 "V %i s dhi (x0), s dhi (x0) Vi e 1: mJ, 5<p (x0) = |i | I = 2 (Уо) + *2 Iх’’ \1 2 e dhi (#0), H e (^o) Vi e 1: znj. Пример 2.2. Пусть функции hi, ..., hm определены на открытом множестве X cz Rn и супердифференцируе- мы в точке xq X, т. е. эти функции дифференцируемы по направлениям в точке xQ и для их производных hi (xqi ё) справедливы представления h'i (я0, g} = min (р, g), реУ| где Vt (i е 1: тп)—выпуклые компакты. Понятно, что в качестве квазидифференциала IZZh^xo) можно рассмо- треть пару [{0}, У<]. Пусть, далее, функция / определена на открытом множестве У, содержащем точку уо = = (Ai(^o), ..hm(x0)) и субдифференцируема в этой точке, иными словами, существует квазидифференциал
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 139 ^/(хо) вида [U, {0}]. Положим <p(x) = f(h1(x)1 hm(x)) (2.13) и найдем квазидифференциал ^ф(#о). Пусть вектор v == = (v(1\ ..., v(7n>) е таков, что O^v, v^v Vvef/. Применяя теорему 2.3, получим (#о) = [5<р (#о), <5ф(#о)], где {т _ W | W = S (v(i) — v(i)) 1=1 Vi <= Vi Xfi e 1: zn, v = (v(D, ..., vW) €= t/}, (2.14) дф (#0) = Iw | w = 2 v(i4, Vi = 2 (2.15) I i=l ' Замечание 2.4. Пусть компакт U целиком лежит в конусе R™, состоящем из векторов с неположительны- ми компонентами. Тогда в качестве v можно принять ну- левой вектор. В этом случае множество дф(#о), опреде- ленное формулой (2.15), состоит лишь из нуля, т. е. функция ф субдифференцируема. Ее субдифференциал определяется формулой (2.14) при vW = 0 Xfi е 1 : т. Рассмотрим случай, когда / — выпуклая функция, а Л1, ..., hm — вогнутые функции. Тогда / субдифференци- руема, ..., hm супердифференцируемы и квазидиффе- ренциал композиции (2.13) находится с помощью фор- мул (2.14) и (2.15), где U = df (уо)— суб дифференциал функции / в точке yQ, a Vt = dh (xq) — супердифференци- ал функции hi в точке xq. Пример 2.3. Пусть / — та же функция, что в при- мере 2.2, а функции /ц, ..., hm субдифференцируемы; пусть квазидифференциал 0hi(xQ) функции hi в точке хо совпадает с парой [Vi, {0}]. Вычислим квазидифферен- циал 2)у(хо) функции <р, определенной формулой (2.11), в точке хо. С этой целью рассмотрим вектор v = (v(1), ... ..v<m)) e удовлетворяющий неравенствам v<0, v<v VveCZ,
140 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ где Z7, как и выше, выпуклый компакт, обладающий тем свойством, что /' (у0, g) = max (р, g). pf=U Применяя теорему 2.3, получим (*о) = [дф (яо), дф (х0) ], где дф (х0) = lip| w = 2 (v(i) — v(i)) vi Vi i:m, I i=l “ v = (y(i), ..., v(™))G=tz), (2.16) m 5ф(х0)= Sv(i)Fi. (2.17) i=l” Замечание 2.5. Если множество U лежит в кону- се 0?+ векторов с неотрицательными компонентами, то можно считать, что v== 0. В этом случае функция ср суб- дифференцируема. Если функции f и fei, ..., hm выпуклы, то их компози- ция (2.13) квазидифференцируема и ее квазидифферен- циал находится с помощью формул (2.16) и (2.17), где Vi = dhi(xQ), U = df(yo) — субдифференциалы соответствующих функций. Если, кроме того, функция / возрастает (т. е. неравенство х\ > х% влечет f(x\)>f(x2)) то, как нетрудно проверить, функция <р выпукла. Из мо- нотонности / следует, что субдифференциал df (уо) лежит в конусе (R*. Поэтому, как указывалось в замечании 2.5, можно считать, что v — 0. В данном случае субдиф- ференциал д<р(хо) выпуклой функции (р]я)=/(Л1 (я), ... ..., hm(x)) в точке xq может быть вычислен с помощью формулы (2.14) при v = 0: । т дер (х0) = I w = 2 v(i)Vi, Vi <= dhi (xQ), v = (vW, ..., vt”*)) <= df (y0)}. Используя теорему 2.3, выведем формулу для квази- дифференциала функции максимума. Пусть <р(а:) = п1ах(Л1(«), ..., hm(x)),
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 141 где Л1, ..hm — квазидифференцируемые функции, опре- деленные на открытом множестве X и имеющие_в точке хо <= X квазидифференциал 3)hi (хо) = [dhi (хо), dhi (хо) ]. Представим функцию ф как композицию отображения Я: Х->1Рт, определенного равенством Н(х) = (h\ (х), ... ..hm(x)) И функции /, где / (у) = max у^, ieirm Здесь у = (yd), ..., у(™>) е 0?т. Функция / сублинейна. Ее производная /'(у, g) вычисляется по формуле /' (у, g) = max gU\ где g = (gW, ..., e IRW, R (y) = {i e 1 : m\ y{i) — = /(y)}. Пусть yo = (M#o), ..^m(xo)). Легко прове- рить, что субдифференциал df(yo) имеет вид df (у0) = |v | v — (v(1\ ..., v<m)): S v(i> = 1, v<*) 0 I i=i Vie 1 : n, v«) = 0 УЦфЯ (y0)|; квазидифференциал 35f(yo) совпадаете парой [d/(yo), {0}]. Найдем квазидифференциал SZq (хо) = [дер (хо), дф (хо) ] функции ф в точке хо. С этой целью воспользуемся фор- мулами (2.11) и (2.12), положив 0, v=(v(1), ... ..., v(m)), где (0, если i^R(y0), _ (1, если гел(г/0). Имеем дЧ> (я0) = р I I = 5 v«> (а{ + РО — 3 Pt, I leBW lsB(y0) р{Е5й{(а;0), 3 v{=l, v‘>0 Ni‘=R{y^\, J 5<p(x0)= 2 0M*o). (2.18) iSB(V0)
142 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Если w е дф (хо), то w = 2 vW(ai + р4)_/ 2 v(‘>W 2 М = ieH(Vo) \ie«(v0) /\fteRW / = 2 v<1) (ai — 2 Ph + M = iSR(«0) ( feeR(v0) ) = 2 — 2 PhY ieRW \ heR(v0),h^i / Здесь v(,) 0, 2 = 1) a< ® dhi(x0), dht(xo). Из leR(«o) “ , x сказанного следует, что множество Sep (#о) может быть представлено в виде дф(х0) = со U (д1ц(х0) — 2 dhh(x0)\. (2.19) teR(5/0) I - hSR(V0) I \ h^i ' Формулы (2.18) и (2.19) совпадают с формулами для вычисления квазидифференциала функции максимума, приведенными в теореме 2.2. 4. Пусть (8, S, ц) — вероятностное пространство с мерой. Рассмотрим функцию /($, ж), определенную на S X X, где X — открытое множество в К • Предположим, что при любом s <= 8 функция /($, •): x^f(s, х) квазди- дифференцируема и при любом х^Х функция /(•, х): 5 •-* f(s, х) суммируема. Положим <р (я) = [/($,#) dpi (s). s Оказывается, что при некоторых естественных предполо- жениях функция ср квазидифференцируема. Это легко следует из известной теоремы Штрассена (см., напри- мер, [53]). Приведем ее конечномерный вариант. Теорема 2.4. Пусть (S, S, ц)— пространство с ве- роятностной мерой, функция p(s, х) определена на S X Rn, причем функция p(s, х*-> p(s, х) сублиней- на на каждом s, функция р(^х): s^p(s, х) измерима при каждом х, функция ||р||: 5»->||p(s, .)|| *) суммируема. Тогда функция p(.g)=\ p{s, g)dp(s) s ♦) Здесь || p (в, •) ||= max | p (s, g) ( — норма сублинейной функ- z ч 11611=1 ЦИИ p(s, •)•
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 143 сублинейна. При этом вектор w=<(w{X), ..., м/л)) входит в субдифференциал др тогда и только тогда, когда най- дется такая функция s*-+w(s), где iz?(s) = (w(1) ($), ... ..., w{n)(s)), что 1) ip(s)e dp(s, •) при почти всех s, 2) функция s ($) измерима при всех i, 3) м/i) = j* м?(*) ($) dp, (s). 8 Вернемся к рассмотренной выше функции f(s, х). Пусть /'(s, х, g)— производная функции f{s, •) в точке х по направлению g. Так как f(s, •)— квазидифференци- руемая функция, то справедливо представление /'(s, х, g) = р (s, g) 4- q («, g), (2.20) где функция p{s, •): g «-► p (s, g) сублинейна, а функция g(s, •): g'-^q&g) суперлинейна. По определению про- изводной справедливо равенство /(», x + ag) = /(s, x)+a(p(s, g) + q(s, g)) + o,Ae(a), (2.21) где lim — os,x,g (a) = 0. alo “ Предложение 2.1. Пусть функция о,опре- деленная равенством (2.21), обладает тем свойством, что а при всех g Rn. Предположим, далее, что существует такое разложение (2.20), что функции p(s, g) и q(s, g) измеримы при всех g и, кроме того, функции 8*► || р ($, • ) || и •) II суммируемы. Тогда функция ф(*) = квазидифференцируема в точке х и ее квазидифференци- ал 3hp(x) совпадает с парой множеств [5ф (х), дф(я)], где ду>(х) (соответственно, дср(х)) состоит из всех век- торов w=(u?(1), ..., ip(n)), для которых существует функция ip(s) = (ip(1) (s), ..., w^(n)(s)), обладающая свой- ствами:
144 ГЛ. Ш. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 1) w(s)^dp(s, -) (соответственно, w(s)^ dq{s, •)) при почти всех s, 2) функция s и№ (s) измерима \fi е 1 : п, 3) = J v№ (s) dp, (s). s Доказательство. Имеем, используя (2.21): Ф (х + au) = j / (s, x + au) c?jx (s) = s == J [/ (s. x) + a (p (s, g) + q (S, g)) + o,,x,g (a)] dp (s) = 8 = ф (x) 4- a ( j p (s, g) du (s) + f q (s, g) dp («Й + \s s ) + j os,x,g (a) du (s). s Из условий предложения следует, что функция ф диффе- ренцируема и ее производная ф' (х, g) представима в виде ф' (х, g) = $ р (S, g) dp (s) + J q (S, g) dp (s). 8 8 Это представление означает, что ф квазидифференцируе- ма в точке х. Описание квазидифференциала <?)ф(яо) следует непосредственно из теоремы 2.4. 5. Рассмотрим несколько примеров вычисления квази- дифференци ал ов. Пример 2.4. Пусть /(я)= Ы, хе R1, xq = 0. Име- ем / (х) = max {фх (х), ф2 (я)} = max ф| (х), ф! (х) = х, ф2(я)=— х, / = {1, 2}. Ясно, что R(xo)= {1, 2}, функции Ф1 и ф2 — гладкие. Возьмем £2>ф1 (хо) = [дф1 (яо), дф1(яо)], ^>ф2 (хо) = [£фг («о), дфг (хо) ], где d<Pi (*о) = («о)! = UK ^фх (х0) = {0}, дф2 (*о) = I <₽2 («о)) ={—!}» (*о) = {°}- По формулам (2.7) —(2.8) имеем 5>/(ль) = Р/(х0), 5/(хЬ)], (2.22)
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 145 где dj (Х0) = СО {Зф 1 (х0) — Зф2 (х0) , Зф2 (хо) — dcpi (хо) } = = со {{1}, {-!}}=[-!, 1], 3/(хо) = 3ф1 (xq)+ 3<рг(хо) = {0} + {0} = {0}. Если же в качестве £Z)<pi (хо) и ^ф?(хо) взять пары ^>Ф1 (хо) = [Зф 1 (хо), Зф, (х0) ], ^*ф2 (хо) = [Зф2 (хо), Зфг (хо) ], где 3ф1 (*о) = {°}> д<Р1 (жо) = IФ1 (®о) 1 = {1}, Зф2 (а:о) = (<р2 (*о)1 = {— Зф2 (*о) = {°}> то получим df(x0)], (2.23) где £/ (*о) = со {дер 1 (xq) — дф2 (xq) , дф2 (#о) — дф1 (^о)) = = со{{0}-{0}, {-D - {1}} = со {{0}, {-2}}=[-2, 0], а/(гг0)= Зф1(х0)+дф2(х0)= Ш + {0} = {’1}. Очевидно, что пары (2.22) и (2.23) эквивалентны. Для точек х ¥= 0 имеем I х, х>0, = ж<0. Поэтому можно взять 0/(х) = [3/(х)Л/(х)], (2.24) где ( {!}, х>0, W) = {{-1}, Х<О, df(x) = {0} Ух=£0. Объединяя (2.24) и (2.22), можно взять ^>/(х) = [3/(х), 3/(х)],
146 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ где х> О, а/(,г) = {-1}, х<0, [—1,1], х = О, d/(x)={0} VxeR1. Пример 2.5. Пусть/(х)= — |х|, хей1. Применяя следствие 2.1 и используя пример 2.4, можно взять 0/(х) = Р/(х), 0/(х)], где д/(ж) = {0) VxeR1, df(x) = {—О. {!}. li-мь х> о, х<0, х = 0. Пример 2.6. Пусть х е /(х) = satx = kl<it х> 1, х<— 1. Положим ф1 (х) = X, ф2(х) = 1, фз(х)=—1, ф4(х) = = шахф1(х), фз(х)}. Тодда, как нетрудно видеть, / (х) — min {ф2 (х), ф4 (х)}. Так как функции фь фг и фз дифференцируемы, то мож- но взять ^ф!(х) ='[{!}, {0}], 0ф2(х) = [{0}, {0}], ^Фз(х)=»[{0), {0}]. Тогда по формулам (2.7) — (2.8) имеем ^>ф4(х)=|[3ф4(х), 1ф4(х)], где : дф4(х) — {1}> {0}. ЦО, 1], х> — 1, х< — 1, х = — 1, 5ф4(х) = {0}. Привлекая теперь формулы (2.8) —(2.9), получаем
§ 2. КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ 147 окончательно где 3/(х) = {0}. [0, 1], {1}. |х|>1, X = — 1, ж<=(—1,1], {0} [-1, 0], д?=/= 1, X = 1. Пример 2.7. Пусть х <= Rn, / (х) непрерывно диф- ференцируема на открытом множестве X cz Rn. Образу- ем функцию 1. /(*)>!, F (ж) = sat / (я) = /(ж), — 1</(х)<1, -1, Рассуждая как в примере 2.6, получим &F(x)=>[0F(x), dF(x)], где {ОД /(*)>!, 0F (х) = {/'(х)}, -1</(х)<1, .со{/'(ж), ОД f(x)--1, ^(х)=(<°"Ь /(ж)¥=1’ W lco{On,-f(x)}, 7(х) = 1. Пример 2.8. Пусть х = (а^1), a^2>)s R2, /(«) = = |®п,| — 1х(2>|. Тогда /(х) = ф1(х)+ фз(х), где ф1(я) = = 1х(1)1, фг(х)=— 1х(2,1. Из примеров 2.4 и 2.5 нетрудно усмотреть, что мож- но взять ^Ф1(х)=|[3ф1(«), 5ф1(х)], 0ф2(х)=[3ф2(х), дф2(х)], где 5ф{ (х), d(fi (х) с R2, i=l,2, ’{(1,0)}, ®<«>0, dq>i(a:)= {(—1,0}, я<«<0, lco{(— 1, 0), (1, 0)}, х = 0, дф1(х)-{(0,0)}={0,} Vxe К», 5ф2(®) = {02} УгеЕ2,
148 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ й<р2(х) = '{(0,-1)}, Х<2)>0, {(0, + 1)}, а;<2) < 0, со {(О, -1), (0, 1)}, х=0. По теореме 2.1 = [df(x), df{x)], где df (х) =_dcpi (х) + 5ф2 (х) = (х), df (х) = d(pi (х) + дфг (я) = дф2 (я). § 3. Условия регулярности для множеств, задаваемых с помощью квазидифференцируемых функций С помощью квазидифференциала удается получить легко проверяемые условия регулярности для множеств, задаваемых неравенствами вида h(x)^0 или равенства- ми вида h(x)= 0, где h — квазидифференцируемая функ- ция. В дальнейшем нам понадобится понятие шах-грани выпуклого компакта V (см. § 1), определяемой точкой х. Напомним, что max-грань Gx(7), определяемая точ- кой х, имеет вид Gx (7) = fv е V | (р, х) = max (и', я)} Она совпадает с субдифференциалом dpv(x) опорной функции компакта V в точке х (см. по этому поводу Приложение I). В частности, если х~0, то GX(V)=V. Будем говорить, что упорядоченная пара выпуклых ком- пактов [С7, V] находится в общем положении, если для каждого g max-грань Gg(V) не содержится в шах-гра- ни Gg(U). Приведем несколько примеров. Пример 3.1. Если множества U, V не пересека- ются, то как пара [U, 7], так и пара [7, U} находятся в общем положении. Пример 3.2. Если U <= int V, то пара [Z7, V] на; ходится в общем положении, а пара [V, U] не находит- ся в общем положении. Пример 3.3. Пусть U совпадает с единичным ша- ром $ (в евклидовой норме), V — .$1/2(я), где 1Ы1 = 3/2 (см. рис. 3, где эти множества изображены при п = 2). Тогда ни пара [V, U], ни пара [17, 7] не находятся в общем положении.
§ 3. УСЛОВИЯ РЕГУЛЯРНОСТИ 149 Пример 3.4. Пусть множества U и V телесны, их границы пересекаются и в точках пересечения они не имеют общих опорных плоскостей (см. рис. 4). Тогда как пара [С7, V], так и пара [У, U] находятся в общем положении. Пример 3.5. Пусть U совпадает с квадратом abed, а V — с квадратом ecgf, изображенными на рис. 5. Тогда пара [V, С7] находится в общем положении, а пара [U, V] не обладает этим свойством. Пусть [С7, V]—пара выпуклых компактов и функция 1ли,у] определена равенством l\u,v] (я) = max (A, g) + min (fe, g) = hf=U hEV = max (й, g) — max (h, g) Vg^\Rn. (3.1) hf=U he-V Понятно, что l[Utv] входит в пространство L всех функций, представимых в виде суммы сублинейной и суперлинейной (см. § 1), и является элементом этого пространства, отвечающим при естественном изоморфиз- ме паре [Z7, У]. Предложение 3.1. Пара [£7, —У] находится в общем положении тогда и только тогда, когда для любо- го g^^Rn найдется такой элемент v, что (l[uv})'(g, и)< <0. Доказательство. Пусть пара [С7, —У] находит- ся в общем положении. Тогда для любого элемента g найдется такой элемент w Gg (—У), что w & Gg (U). Применяя теорему отделимости (см. Приложение I), по- лучим, что при некотором v е Rn выполняется неравен- ство (ir, v)> max (w’, v). w'EzGg(U)
150 ГЛ. III. КВАЗИ ДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Тем более max (w, v)> шах (ip', и). (3.2) wSGg(-V) w'EGg(U) Как отмечалось выше, грань Gg(U) компакта U совпа- дает с субдифференциалом dpu(g) опорной функции ри этого компакта в точке g. Поэтому max («/, v) = max (о/, v) = (puY (g, v). w'&GgW) w'^dputg) (Мы воспользовались здесь тем, что для выпуклой функции ри производная по направлению v восстанав- ливается как максимум скалярных произведений и с эле- ментами суб дифференциала.) Подобным же образом max (zp, р) = (p-vY (g, »Y wEGg(—V) где р-у — опорная функция компакта —V. Таким обра- зом, неравенство (3.2) показывает, что (Wi)'(£> v) = (pv-p-v)'(g, v) = = (pv)'(g, v)-(p-v)'(g, v)<o. Предположим теперь, что для каждого g нашлось направление р, при котором (l[u,v])'(g, р)<0. Тогда справедливо неравенство (pu)'(g, v)<(p_v)' (g, р), ко- торое равносильно неравенству (3.2). Последнее пока- зывает, что Gg(—V) не содержится в Gg(U). Предложение 3.1 позволяет выяснить, как общее по- ложение связано с понятием эквивалентности пар, вве- денным при описании пространства выпуклых множеств в § 1. Используя это предложение, можно утверждать, что если [?7i, Vi] и [?7г, V%] — эквивалентные пары вы- пуклых компактов, то пара [ZZi, — VJ находится,в общем положении тогда и только тоцда, когда пара [Ё/г, — Й2] обладает этим свойством. Действительно, из экви- валентности [Z7i, VJ и [{7г, V2] следует, что функции и Чи2>уг]' постРоенные по формуле (3.1), совпа- дают (см. § 1). Поэтому свойство быть в общем поло- жении для пар [С/i, — Vi] и [??2, —V2] выполнено или не выполнено одновременно. 2. Рассмотрим множество Q = {я| Л(х)^О), где Л — квазидифференцируемая в некоторой точке х локально
§ 3. УСЛОВИЯ РЕГУЛЯРНОСТИ < 151 липшицевая функция, причем Л(я)=0. Положим yi(z)=tel М*. Г1(а:)={^| h'(x, g) 0). (3.3) Напомним (см. § 1.4), что условие регулярности для множества Й в точке х означает, что справедливо равен- ство cl Yi {х} = Г1 (х). Если это условие выполнено, то конус Булигапа Г (я, Й) допускает простое описание: Г(я, Й)=Г1(я). Теорема 3.1. Пусть [5А(х), dh(x)]—квазидиффе- ренциал функции h в точке х. Тогда, если пара [dh(x), —dh(x)] находится в общем положении, то в точке х выполнено условие регулярности. Доказательство. Положим U = dh(x), V = = dh(x). Тогда производная h'(x, g) совпадает с функ- цией l[u,vu 'определенной формулой (3.1). Пусть h'(x, g) = 0. Как следует из предложения 3.1, суще- ствует такое v, что U[a,vj)'(£, ^)<0. Поэтому при до- статочно малых <z > 0 выполняется неравенство Н (х, g + av) = l[u,vi (S + ap) = liu,vi (g) + + aZfu.v] (g, v) + о (a) < l[Ut y] (g) = h' (a:, g) = 0. Тем самым g + av 71 (x). Устремляя a к нулю, убе- димся в том, что g cl 71 (х). Замечание 3.1. Как следует из результатов пре- дыдущего пункта, свойство пары [df (x), —df(x)] быть в общем положении сохраняется при переходе к экви- валентной паре; поэтому оно определяется непосред- ственно квазидифференциалом, как классом эквивалент- ных пар. Рассмотрим теперь множество й, которое задано со- отношением Й = Ы h(x)=0}. (3.4) Пусть конусы 71 (я) и Г1(я) определены равенства- ми (3.3)., Рассмотрим, кроме них, конусы 72(z) = {gl h'(x,g)>Q} и r2'(rr) = {gl h'(x,g)>0}. Напомним (см. § 1.4), что для множеств вида (3.4) ус- ловие регулярности в точке х заключается в следующем: с171(я^ Г1(я), с172(я) = Г2(гг). Теорема 3.2. Пусть локально липшицевая функ- ция h квазидифференцируема в точке х е й, где Й за-
152 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ дано формулой (3.4). Тогда, если пары [dh(x), dh(x)] и [dk(x), — dh(x)] находятся в общем положении, то в точке х выполнено условие регулярности. Доказательство легко следует из теоремы 3.1, если применить ее сначала к функции h, а затем к функ- ции —h. § 4. Связь квазидифференциала с субдифференциалами Пено и Кларка 1. Пусть функция / определена на открытом множе- стве X cz Rn и квазидифференцируема в точке х X. Напомним, что концепция квазидифференцируемости связана с представлением производной в виде суммы сублинейной и суперлинейной функций или, что то же самое, разности двух сублинейных функций. Если 3)f (х) = [df (х), df (х) ] — квазидифференциал функции / в точке х, то f (я, g) = max (h, х) + min (h, x) = Леа/(х) Леау(х) — max (h, x) — max (h, x), hedf(x) h^-df(x) С помощью пары множеств [df(x), — df(x)] производная восстанавливается как разность двух максимумов. Гео- метрическая интерпретация производной при этом сво- дится к описанию разности выпуклых множеств. Как уже отмечалось в § 1, эту разность можно понимать неоднозначно. Наиболее естественный путь, при котором вычитание определяется как операция, обратная <к сложе- нию в линейном пространстве, приводит к отысканию разности в пространстве выпуклых множеств. Если а\, аг — элементы этого пространства, отвечающие множе- ствам df(x) и (-df(x)) соответственно, то, как указы- валось в § 1, разность этих элементов имеет вид ai-a2=[df(x), 0] + [0, = = [df(x),'df(x)] = 3)f(x). Таким образом разность множеств df(x) и —df(x), вы- численная в пространстве выпуклых множеств, совпада-
§ 4. КВАЗИ ДИФФЕРЕНЦИАЛ И СУБ ДИФФЕРЕНЦИАЛЫ 153 ет с квазидифференциалом. Это обстоятельство подчер- кивает роль квазидифференциала в рассматриваемом кру- ге вопросов. Наряду с разностью, определяемой операцией вычи- тания в пространстве выпуклых множеств, можно рас- смотреть и другие операции взятия разности. Мы оста- новимся на двух из них (см. § 1): операциях — и —. 2. При описании разностей д/(ж)4-(—df(x)) и (—df(x) + (df(x))) нам понадобится ввести в рассмотре- ние субдифференциал и супердифференциал Пено (см. [166]). Пусть /—локально липшицевая и дифференци- руемая по направлениям в точке х функция. Субдиффе- ренциалом Пено функции / в точке х называется мно- жество = (h, g)^f'(x, g) VgeH- Супердифференциал Пено функции f в точке х опреде- ляется равенством 5>/(х) = {Л| (h,g)^f(x,g) VgeRn). Субдифференциал и супердифферепциал Пено явля- ются выпуклыми замкнутыми множествами. Эти множе- ства могут быть и пустыми. Предположим, что какое- либо из этих множеств, например, d^f(x), непусто. Так как / — липшицева в окрестности точки х, то производ- ная /'(х, g) также удовлетворяет условию Липшица по g (см. предложение 1.3.2), поэтому \f'(x, g)l С Lllgll, где L — липшицева константа, g е Если h d^f(x), то (Ь.g)<b||g|| Vg(=Rn, и потому ||А|| = max (Л, g)<L. И=1 Таким образом, суб дифференциал Пено d^f(x) ограни- чен и, следовательно, является выпуклым компактом. Положим р (g) - max (h, g). Функция p непрерывна и сублинейна. При этом р (g) (*> g) — fx(g)- Покажем, что р — наибольшая субли-
154 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ нейная функция, мажорируемая производной fx- если р — сублинейная функция, p(g)</x(£b то p(g)^p(g) для всех g. Действительно, если h^dp, то (A,g)^ (g) fx (g), а потому h^dp. Включение др^др в силу двойственности Минковского приводит к требуе- мому неравенству. Из сказанного следует, что непустота субдифференциала Пено равносильна существованию сублинейной функции, мажорируемой производной /х- Подобным же образом непустота супердифференциала Пено равносильна существованию суперлинейной функ- ции, минорируемой производной /х. При этом супердиф- ференциал Пено является выпуклым компактом. Вернемся к квазидифференцируемым локально лип- шицевым функциям. Пусть функция / имеет в точке х квазидифференциал ^/(х) = [5/(х), 5/(я)] = [£/(*), Вычислим разности df(x) + (—df(x)) и (—df(x) )+_df(x). (Напомним, что U + V = {h\ fe+Vcz U}.) Предложение 4.1. Справедливы равенства df(x)-^(-df(x))=d<f(x), (4.1) -df(x)^(df(x))=d>f(x). (4.2) Доказательство. Ограничимся доказательством равенства (4.1). Пусть h е df (х) 4- (— df (я)). Тогда h — df(x)^df(x) и, следовательно, для всех вы- полняется неравенство (h, g) + max (h', g)< max g), h'(=(-df(x)) h'^df(x) или, что то же самое, (Л, g)^ max (fe',g)— max (Л', g) = /' (x, g), h'Gdf(x) h't=(-Of(x)) t. e. h^d^f(x). Тем самым проверено включение d^f(x)^> df(x) + (—df(x)). Подобным же образом прове- ряется обратное включение. 3. Обратимся теперь к операции —. Оказывается, что для весьма широкого класса функций эта операция, при-
§ 4. КВАЗИДИФФЕРЕНЦИАЛ И СУБДИФФЕРЕНЦИАЛЫ 155 мененная к множествам df(x) и (—д/(я)), приводит к субдифференциалу Кларка. Напомним, прежде всего, что множество U — V, где J7, V — выпуклые компакты, оп- ределяется так. Рассматривается некоторое множество Т полной меры, в точках g которого существуют градиен- ты Vpu(g) и Vpv(g) опорных функций ри и pv компак- тов U и V соответственно, затем составляются разности VРи (g) —vPv (g). Выпуклое замыкание этих разностей и совпадает с множеством U — V. При этом существование градиента ^Pu(g) равносильно тому, что линейная функ- ция (g, h) достигает максимума на выпуклом компакте U в единственной точке. Эта точка и совпадает с гра- диентом Vpu(g). Пусть / — локально липшицева функция, определен- ная на открытом множестве X, квазидифференцируемая в точке х е X и имеющая в этой точке квазидифферен- циал 3)f(x) = [df(x), df(x)] = [U, V]. Пусть элемент g таков, что линейная функция (g, h) достигает максимума на каждом из множеств U = df(x) is. —V = —df{x) в единственной точке. Обозначим эти точки соответственно через <рс7 (g) и —ipv(g). Из сказанного выше следует, что <Pc/(£r)= ^Pv(g), -^v(g)= vA-n(#)- Легко проверить, что г|)у (g) — единственная точка компакта V «= df(x), в которой достигает минимума на V линейная функ- ция (g, h). Пусть Т cz Rn. Будем говорить, что множество Т об- ладает свойством (<§Г) относительно пары [Z7, = = [df(x), df(x)], если 1) лебегова мера множества Rn\ Т равна нулю, 2) при g Т линейная функция (g, I) достигает мак- симума на множестве U = df(x) и минимума на множе- стве V — df(x) в единственной точке; эти точки совпа- дают соответственно с q>^(g) и ^v(g). Из сказанного выше следует, что множество df (х) — (— df (х)) совпадает с выпуклой замкнутой оболоч- кой сумм <Ptf(g)+ ^v(g), где g пробегает некоторое мно- жество Т, обладающее свойством (^) относительно па- ры [*7, F]. Через М (х) обозначим совокупность функций /, оп- ределенных на открытом множестве X, содержащем точ- ку х и обладающих следующими свойствами:
156 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ а) / удовлетворяет условию Липшица в некоторой окрестности точки х; отсюда следует, что множе- ство Vf точек у^$ь(х), где существует градиент Vf(y), имеет полную меру; б) / квазидифференцируема в точке х; в) найдутся такие подмножество Q V/, имеющее в окрестности ^б(^) полную меру, квазидифференциал [U, Г] = [д/(я), д{(х)] функции / в точке х и множе- ство Г, обладающее свойством (<?Г) относительно пары [£7, 7], что из соотношений gh -* g, а* 10, xk = х + a.kgK S (?, g E T следует <pa(g)+ M?), где фг (g) и xpv (g) — определенные выше отображения. Справедливость свойства в) определяется выбором некоторой конкретной пары [д/(я), df(x)] из квазидиф- ференциала 3)f(x) и соответствующего множества Т. При переходе к эквивалентной паре и другому Т это свойство может нарушиться (см. пример 4.2 ниже). Пусть функция / удовлетворяет условию Липшица в окрестности .$6 (я) точки х, Q <= ^б(я), 7’cz!Rn, причем н(^б(^)\<2)= о, ц(Г\Т) = 0, где ц — мера Лебега. Положим 5т/(я)== cl со £)т, где DT = {y\Bxh = х + ahgh<=Q, gh-*gt=T, aft | 0, V/ (xh) -> p). Предложение 4.2. Пусть функция f входит в М(х), множество Q<=Vh квазидифференциал [CZ, V] = [d/(#), df(x)] и множество Т, обладающее свойством (^Г) отно- сительно пары [{7, V], таковы, что для них выполнено условие в) из определения класса М(х). Тогда дт1 (х) = dj(x) — (— df (х)). Доказательство. Пусть v DT. Тогда найдутся такие последовательности {gA} и {afe}, что gh g, ah I 0, xh = % + Ukgk^Q, Vf(xh)-+v. Так как, с другой
§ 4. КВАЗИДИФФЕРЕНЦИАЛ И СУБДИФФЕРЕНЦИАЛЫ 157 стороны, f^M(x), ТО <Pu(g) + ^v(g), т. О. V = = (pcj(g)+ x|)F(g). Таким образом, DT <= {<pcr(g) + + “фу(^)1 и, следовательно, dTf (*) с с! со {фу (g) + г|)у (g) | g (= Т7} = df (х) — (— df (х)). Проверим обратное включение. Пусть g е Rn, ak I О, еА I 0. Так как пересечение Q с шаром z + aft<$efe(g) не- пусто, то найдется такой элемент gh^ ^eft(g)» что х + a*gA g= Q. (4.3) Таким образом, существует последовательность {gA}, для которой gh g и выполнено (4.3). Пусть g^T. Рас- смотрим элемент v = (ptz(g)+ ipy(g) и последовательности {gfe} и {aj, для которых gk g, aA I 0 и выполнено (4.3). По определению М(х) справедливо соотношение v/(^h)-> i>, т. е. v DT. Из этого обстоятельства сразу следу- ет, что dTf (х) id df (х) — (— df (х)). Следствие 4.1. Пусть f^M(x). Tosda dcif (х) о df (х) — (— df (х)). (4.4) Это утверждение сразу следует из теоремы II.1.2 и предложения 4.2. Следствие 4.1 показывает, что для функций из клас- са М(х) квазидифференциал позволяет дать оценку суб- дифферепциала Кларка снизу. Если найдется пара [df(x), df(x)], для которой вы- полнено свойство в) из определения М(х) при множе- стве Т, совпадающем со всем 0?п, то duf(x) = df(x) — (— df(x)). Равенство Т = Rn выполнено, если множества df(x) и df(x) строго выпуклы или состоят из одной точки. Покажем, что множество М(х) достаточно широко. Прежде всего проверим, что выпуклые функции входят в М(х). С этой целью установим справедливость следу- ющего утверждения. Лемма 4.1. Пусть f—выпуклая функция, onpede- ленная на открытом выпуклом множестве X. codepvica- щем точку х. Пусть xh = х + afegfe, ede aA 10, gh g, при- чем в точках xk существует epadueHT ^f(xk)t Toeda, если
158 ГЛ. Ш. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Vf(xh)-*- v, то (у, g) = max (Л, g), где df(x) — субдиффе- леа/(х) ренциал функции / в точке х. Доказательство. Пусть элементы zh^df(x) та- ковы, что f (х, gk) = max (ft, gh) == (zA, gh). He умаляя лед/(х) общности, считаем, что zh -> z. Тогда f'(х, g) = (z, g). Рассмотрим функцию вещественной переменной фк(а) = = f(x + agk) Vк = 1,2, ... Эта функция выпукла и по- тому ее правая производная (фь)+ (а) не убывает. От- сюда следует, что (фь)+ («ь) > (фл)+ (0)* Так как (<₽л)+ (а) = lim -J- (фк (а + Р) — q>ft (а)) = /'(« + agh, gk), ЭЮ Р то /'(ж*, gk)>f(x, gh). Вспоминая, что f (х, gh) = (zk, gh), f'(xh, gh) = (V/(xh), gk), получим (V/(^), gk)^(zk, gk). Переходя в этом неравенстве к пределу, имеем (и, g) > (z, g) = f (x, g) = max (Л, g). (4.5) hGdftx) Поскольку v^df(x), то соотношения (4.5) показывают, что (у, g) = max (h, g). леадх) Предл о ж e н и e 4.3. Если функция / выпукла в некоторой выпуклой окрестности точки х, то f ^M(x). Доказательство. Пусть Q — множество полной меры, в точках х' которого существует градиент множество Т обладает свойством (^) в точке х. В дан- ном случае это означает, что при g Т линейная функ- ция (g, ft) достигает максимума на множестве U = df(x) в единственной точке ф^я). (Как обычно, в случае вы- пуклой функции рассматриваем ее квазидифференциал вида [Of(x), {0}].) Рассмотрим такие последовательности {gft} и {aj, что gk g, aft I 0, xk = x + ahgh g^T. He умаляя общ- ности, считаем, что существует предел lim Vf(xk) = у. Тогда в силу леммы 4.1 линейная функция (g, h) до- стигает максимума на множестве dj(x) в точке у. Так как g^T, то у = фс; (g). Отсюда и следует соотношение f^M(x).
§ 4. КВАЗИДИФФЕРЕНЦИАЛ И СУБДИФФЕРЕНЦИАЛЫ 159 Предложение 4.4. Пусть функция ..., hm е y=(hi(x), ..., hm(x)) и функция / непрерывно дифференцируема в точке у. Тогда функция F(x') = = /(Л1(^'), ..., hm(x')) входит в множество М(х). Доказательство. Так как hi^M(x), то для каждого i е 1 : ш найдутся такие множество Qi, квази- дифференциал [C7t-, Vi] = [dhi(x), dhi(x)] функции hi в точке х и множество обладающее свойством (ЙГ) от- носительно пары [Ui, V,], что 1) Qi содержится в не- которой окрестности имеет там полную меру и в точках х' е Qi существует градиент V/ч (^); 2) из со- отношений gk g, aft I 0, xk = x + ahgh e Qh g e Ti, следует VAi (g) + i|)y. (g), где (p^ (g) (соответственно, (g))—единственная точка, в которой линейная функция I *-► (g, I) достигает мак- симума на Ui (соответственно, минимума на Vi). Поло- жим Q = Qi Л Q% Л ... П Qm. Ясно, что Q — множество полной меры в «^б(я). По теореме 2.3 функция F квази- дифференцируема. Пример 2.1_ показывает, что квази- дифференциал 3)F(x) = 5F(#)] может быть пред- ставлен в виде «,= 2^(y)Pi+ е dhi (х), Hi ^dhi(x) Vi е 1: mj, (4.6) dF (x) = | w = (У) h + S Ы Xj s dhi (x), Hi ^dhi(x) Vi e 1: mj, (4.7) где Л - {I I («) < o), /.-pl^teoo). Покажем, что множество T = f] Ti обладает свой- i __ ством (^) относительно пары [С7, V] = [dF(#), dF(rr)].
160 ГЛ. Ш. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ С этой целью представим множества dF(x) и dF(x) в виде dF(x) = 2 ду^ (?) | (— dhi (*)) + 2 (?) f?ft* (*)> dF (х) = 2 | ^ (?) | (“ d_hi W) + 2 (?) dhi (*)• x 1 *2 Пусть g s T. Тогда max (g, Z) = zear(x) = 2 77T)(Z/) max (?>Z) + 2 T7i)(?) max (?» 0’ г£1х I дУ I /е-дЛ^(х) ieJ2^ l&dh^x) min (g, Z) = zedF(x) = У T7i)(?)| min (g»0 + 2?%j(?) min (?’0- dyw |ze-9fti(x) iedhi(X) U=L Так как функция I •-> (g, Z) достигает максимума на множестве Ui =j)hi(x) в единственной точке сри{ (g), а на множестве — К = — dhi(x) — в единственной точке — ipvjg), то и па множестве U = dF(x) эта функция достигает максимума в единственной точке <pu(g). При этом Ти (?) = 2 М 'К (?) + 2 -А) (?) (?)• г(=1л °У О=19 °У Подобным же образом проверяется, что функция^ Z •-* >-> (g, Z) достигает минимума на множестве V — dF(x) в единственной точке (g), где (?) = 2 (?) то» (?) + 2 (?) (?)• Заметим, что W (g) + 4’v (if) = 2 (?) (Tv, (?) + ’I’Vi (g)). (4.8) Предположим теперь, что даны последовательности {gA} и {afe}, обладающие теми свойствами, что gk -> g, Як 10, X + a„gft = xk S Q, g^T.
§ 4. КВАЗИДИФФЕРЕНЦИАЛ И СУБДИФФЕРЕНЦИАЛЫ 161 Так как в точке xh множества Q существуют градиенты vMa), то в этой же точке существует градиент VF(xk) функции F, при этом 771 VF (xft) = 2 (^) (**). (4-9) где положено yk~(hi(xk), ..., hm(xk)). Поскольку функ- ция / непрерывно дифференциуема, a W (xk) -> ср^. (g) + + Фу| (?) (это справедливо, поскольку hi^M(x)), то переходя в (4.9) к пределу, получим т VF (хк) -> 2 (^ (*) + 4>v4 (?))• (4.10) i=l Привлекая (4.8) и (4.10), придем к соотношению VF(rrft)-> <pt7(?)+ фУ(?), которое и показывает, что е=М(я).Я Следствие 4.2. Множество М(х) с каждыми дву- мя своими элементами содержит их сумму, произведение и частное (если знаменатель отличен от нуля). Для доказательства достаточно рассмотреть в про- странстве R2 функции /(z/(1), г/(2)) = ?/(1) + У{2\ f(y{X\ У(2)) = = ^(1),У(2\ f(y(i\ У{2)) = У{Х)/у{2) и применить теорему. Замечание 4.1. Из доказательства предложения 4.4 следует, что один из квазедифференциалов dF(z)] функции F, при котором выполняется свой- ство в) из определения класса М(х), вычисляется по формулам (4.6) и (4.7). При этом в качестве множе- ства Т выбирается Q г Замечание 4.2. Пусть / = /1 + /2, где /1 — выпук- лая, /2 — вогнутая функции. Поскольку dcifi(x) совпа- дает с субдифференциалом dj\ (х), a dciM#)—с супер- дифференциалом д/г(^), то (см. предложение II.1.12) сумма df\(x)+ df2(x) дает оценку субдифференциала Кларка сверху: dclf(x) <=dfa (х) + dfo(x). В то же время, как легко следует из предложений 4.3, 4.4, замечания 4.1 и следствия 4.2, функция / входит в М(х), причем свойство в) из определения М(х) выпол- няется для пары [df(x), df(x)]. Отсюда вытекает (см.
162 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ следствие 4.1), что разность —(—д/2(#)) дает оценку субдифференциала Кларка снизу. Итак, 3/1 (*) — (—Лг (*)) <= 5с1 (/г + /2) (*) (*) + ^/2 (х). Предложение 4.5. Пусть функции Л1, ..., Лт, оп- ределенные на открытом множестве X cz Rn> входят в М(х), где х^Хи h(x') = max /^(я'), h(x') = min hi(x') Va/e X. ~~ lEl'.m iEl'-m Тогда функции huh содержатся в М(х). Доказательство. Ограничимся рассмотрением функции h. Пусть множества Qi, квазидифференциалы [Ui, VJ = [дЛДя), dhi(x)] и множества Ti определены по функции hi так же, как при доказательстве предло- жения 4.4. Напомним, что один из квазидифференциалов функции h_B точке х имеет вид [dh(x)9 dh(x)] = [U, 7], где U = со (J [dhi(x)— 2 <ев(х) 1“ ) v= s dh^x)- (4.11) i(=H(x) здесь, как обычно, 7?(rr)={f| hi(x) = h(x)}. Пусть T — множество в Rn, обладающее свойством (<§Г) относительно пары [Z7, V]. Положим Q = П Qi, Т = ( П П Рассмотрим такие последовательности {gj и {aj, что gh -> g, g^T, ak I 0, xh = x + ahgh e Q. Так как Л<^Л/(гс), то VAi (xk) -> (pt7i (g) + гру. (g) Vi f= 1: m, (4.12) где, как обычно, ^u^g} и фуД#)—точки максимума и минимума линейной функции I (g, I) на множествах Ui и Vi соответственно. Выберем такой индекс i(g)^ R(x), что (g, <Pung) (g) + ^yi(g) (g)) = max (g, Фи. (g) + (g)). ,ER(X) (4.13) Непосредственно из определения множеств U и V
§ 4. КВАЗИДИФФЕРЕНЦИАЛ И СУБДИФФЕРЕНЦИАЛЫ 163 следует, что <Pu(g) + M’v (g) = <Pui(g) + (?)• (4.14) Так как hr (x, g) = max h'i(x, g), to ~ iefi(x) h(x + aq) = h (x) + a max h\ (x, q) + о (a, g), (4.15) “ - iGR(x) из липшицевости функции h.) Равенство (4.15) показы- вает, что i(g)^ R(xh) при достаточно больших к. Кроме того, как вытекает из этого равенства, i(g)^ R(x') для х', достаточно близких к указанным xh. Предположим, что в точках xk существует градиент Vh(xk) функции h. Тогда, как показывают приведенные выше рассуждения, h(xk)= h4g}(xk), Vh(xk)=Vhi{g}(xk). Используя (4.12) и (4.14), получим V h (xft) = VZ>i(g) (xh) -> <pu.(g) (g) + i|)y.(g) (g) = Замечание 4.3. Один из квазидифференциалов [dh(x), dh(x)] = [U, V] функции А, при котором выпол- няется свойство в) из определения класса М(х), вычис- ляется по формулам (4.11). По- । добное же утверждение справед- ливо и для функции минимума h (х). При этом в качестве Т вы- бирается (П Г) 7\ \ Приведем два примера. —+—V------- Пример 4.1. Для точки z = \ / = (я, I/) К2 положим \ / У) = max {min {х, —у}; х — у}. ~1 Нас будет интересовать поведе- Рис. 6 ние этой функции вблизи точ- ки ио = (О, 0). Функция / рассматривалась Ф. Клар- ком в [120]. Там с помощью теоремы II.1.2 показано, что множество dci/(zo) совпадает с треугольником, на- тянутым на точки (1, 0), (0, —1), (—1, 1) (см. рис. 6).
164 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Положим /1(я, у) = min к, -I/}, f2(x, у) = х-у, /з(*, у)=я, ft(x, у)=-у. Функции /з и /4 непрерывно дифференцируемы и потому входят в #(zo). Из предложения 4.5 следует, что функции у) и f(x, у) также входят в M(zo). Вычислим ква- зидифференциалы этих функций, используя формулы для вычисления квазидифференциала максимума и минимума, приведенные в теореме 2.2. В результате получим квази- дифференциал [С7, V] = [d/(zo), dj(zo)] функции / в точке zo, где df(z0) совпадает с треугольником, натянутым на вер- шины (1, —1), (0, 1), (—1, 0), a d/(z0)—с отрезком, имеющим концами точки (0, 1) и (—1, 0) (см. рис. 7, 8). Замечание 4.3 показывает, что свойство в) из опреде- ления класса М(х) выполняется, если в качестве ква- зидифференциала рассмотреть указанную пару [С7, У]. Множество Т в данном случае состоит из таких точек g, что линейная функция I »-► (g, I) достигает максимума на треугольнике df(zo) лишь в его вершинах и миниму- ма на отрезке df(zo) лишь в его концах. Нетрудно про- верить, что Т совпадает со всей плоскостью, за исклю- чением лучей_ с вершиной в_ пуле, проходящих через точки _ (-1/V2, 1/V2), (2/V5, 1/V5), (1/V2, —1/У2), (—1/V5, 2/1/5). Простой подсчет показывает, что элемен- ты <P(/(g)+t|?v(g) для указанных g совпадают с одной из точек (0, — 1), (1, 0) и (—1, 1). Поэтому множество д/ (и0) — (— д/ (z0)) представляет собой треугольник с вершинами в данных точках. В рассматриваемом случае это множество совпадает с субдифференциалом Кларка.
§ 4. КЙЛЗЙДЙФФЁРЁНЦЙАЛ Й СУБДЙФФЕРЕЙЦЙАЛЫ 165 Пример 4.2. Пусть функция / определена на пло- скости R2 формулой f(x, У)~ max {у — 0) + min {у + х2, 0). Эта функция рассматривалась в § II.1 (см. при- мер II.1.7), где показано, что в точке zo = (O, 0) она име- ет градиент v/(z0)=e2, а ее субдифференциал Кларка dci/(zo) представляет собой отрезок U с концами Zo и вг. Здесь б2 = (0, 1)— единичный орт. Из предложений 4.4, 4.5 и замечаний 4.1, 4.3 сле- дует, что /eM(zo), причем в квазидифферепциале [df(zo), df(zo)], относительно которого выполняется свойство в) из определения класса М(х), как субдиффе- ренциал df(zo), так и супердифферепциал df(zo) совпа- дает с отрезком U. Множество Т в данном случае со- стоит из векторов g = (g(1), g(2)), у которых g(2) ¥= 0. Для •любых g^T выполняется равенство • <Ptf(£)+M£) = e2. Поэтому в данном случае d/(z0) — (—d/(z0)) = {е2}. При ЭТОМ ea=V/(z0)<=C7 = dcl/(z0), но 5/(Zo)^(_5y(Zo))^5cl/(Zo). Рассмотрим другой квазидпфференциал функции / в точке Zo, а именно квазидифференциал [С7, У] = [{£2)7 {0}]. Здесь в качестве Т можно взять множество нену- левых векторов g е R2. При этом для любого g^T вы- полняется равенство <М£)+М£)=е2. Пусть =(1, 0), g = ci, gk — ei при всех A, ah I 0, zk = zq + ahgh = aftei. Тогда v/(zft) = 0, и, следовательно, v/(zA) не сходится к вектору <ptz(g)+^v(g)= е2. Таким образом, относительно пары [J7, V] и указанного мно- жества Т свойство в) из определения множества М(х) не выполняется. Это свойство, однако, будет выполнять- ся, если сузить множество Т7, выкинув из него векторы g == (g\ ё2), У которых g2 0.
166 г ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ § 5. Верхние выпуклые аппроксимации 1. Рассмотрим некоторую функцию f, определенную на открытом множестве X в Rn и имеющую в точке х е X производную по направлениям /' (х, g) = fx (g). Если эта производная сублинейна, то, как уже отмеча- лось в § 1, ее можно «квазилинеаризовать», выразить через линейные функции с помощью операции взятия максимума: fx (g) = max (й, g) Xfg <= Rn. (5.1) Леи В общем случае такая квазилинеаризация не всегда воз- можна. Однако для многих задач достаточно вместо ра- венства иметь лишь неравенство /х (g)<max(/i, g), hfEU где U — выпуклый компакт. Иными словами, достаточно уметь мажорировать функцию fx некоторой сублинейной функцией р. Поясним это па простом примере. Пусть известна сублинейная функция р, мажорирующая про- изводную fx. Выпишем с ее помощью необходимые ус- ловия минимума. Если / достигает локального минимума в точке х, то, как хорошо известно (см. § V.l), fx(g)^O при Bcexge[Rn. Поэтому p(g)^O при всех а это означает, что 0 др, где др — субдифференциал функ- ции р. Тем самым необходимые условия записаны в привычной для специалиста по выпуклым задачам фор- ме: некоторое множество должно содержать нуль. Ко- нечно, чем меньше р отличается от /х, тем точнее ука- занные условия. Перейдем к точным определениям. Пусть функция / определена на открытом множестве X a Rn. Сублинейная функция р называется верхней выпуклой аппроксимацией (в. в. а.) функции f в точке х^ е X, если существует производная по направлениям fx И р (g) > fx (g) для всех g <= Rn. Непосредственно из определения следует, что f(x + ag)^f(x) + ap(g)+ og{a), (5.2) где og(a)/a -> 0 при а I 0. Отметим сразу же, что термин «верхняя выпуклая аппроксимация» не совсем точно отражает суть дела.
§ 5. ВЕРХНИЕ ВЫПУКЛЫЕ АППРОКСИМАЦИИ 167 Как уже отмечалось выше, точнее было бы говорить о «верхней выпуклой мажорации» и называть р выпуклой мажорантой. Симметричным образом вводится понятие нижней вогнутой аппроксимации (н. в. а.). Так называется су- перлинейная функция q, обладающая тем свойством, что q(gXf'x(g) при всех g. Понятно, что в. в. а. и н. в. а. функции / в точке х определяются не однозначно. Приведем несколько примеров. Пример 5.1. Пусть / — выпуклая функция. Так как производная fx сублинейна, то она выступает в каче- стве в. в. а. При этом fx—наименьшая в. в. а. В каче- стве н. в. а. в данном случае можно взять линейные функции q(g) = (h, g), где h — элемент субдифференциа- ла df(x). Понятно, что наибольшей н. в. а. в данном слу- чае не существует. Для вогнутой функции / картина симметрична. В ка- честве н. в. а. можно принять производную /х, а_в. в. а. порождаются элементами супердифференциала df(x). Пример 5.2. Пусть / — локально липшицева функ- ция, имеющая производную по направлениям в точке х. Тогда верхняя производная Кларка g •-> /ci (я, g) и ниж- няя производная Кларка g •-* /ci (я, g) являются соот- ветственно в. в. а. и н. в. а. функции / в точке х. Дей- ствительно (см. § II.1), функция /ci (#, g) сублинейна, а функция /ci (х, g) суперлинейна по g. Кроме того, /ci (х, g) < /' (х, g) < (х, g). Пример 5.3. Пусть, как и выше, / — локально лип- шицева функция, имеющая производную по направле- ниям fx- Функция fx удовлетворяет условию Липшица, поэтому имеет смысл рассмотреть производную Клар- ка р функции f'x в нуле: p(g) = (/x)ci (0, g). Понятно, что р — сублинейная функция; при этом, как нетрудно проверить, р (g) fx (g) (данное неравенство следует, например, из результатов следующего пункта). Таким образом, р — в. в. а. функции в точке х. Функция р, определенная выше, представляет само- стоятельный интерес. В п. 2 выясним некоторые ее свой- ства, а затем вернемся к примеру 5.3.
168 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 2. Пусть h — положительно однородная первой сте- пени локально липшицевая функция, определенная на Rn. Положим Ph (g) = sup (h (и + g) — h(u)). (5.3) Лемма 5.1. Пусть e, 6 — произвольные положитель- ные числа. Тогда sup 4- (h (и + ag) — h (и)) = ph (g). (5.4) JMI<£,0<a<6 a Доказательство. Используя положительную од- нородность функции fe, имеем 4- (^ (u + ag) — h (и)) = h (-J- + g) — h (-£-). Любой элемент u g F может быть записан в виде и = = и /а, где llu'II < е, а < S. Поэтому sup 4“ (h (“ + а?) — h (“)) = 1М<е,ае(о,б) а Т> I U , \ -J ( и \ = sup hl------------|-g) — hl— 1 = ||и||<е,ае(о,б) \ a / \ a / = sup (h (u + g) — h (u)) = ph (g). ueRn Пре дложение 5.1. Справедливо равенство Ph(g) = h£i(0, g). Доказательство. По определению feci(0, g) = inf sup -l-(h(u + ag) — h(u)). e|o,6 jo ||w||<e,ae(o,6) a Поэтому справедливость предложения вытекает из лем- мы 5.1. Следствие 5.1. Функция ра, определенная форму- лой (5.3), сублинейна. Следствие 5.2. При всех g G F выполняется не- равенство fcci(0, g)>fe(g). Действительно, feci (0, g) = ph (g), а неравенство вытекает непосредственно из (5.3): sup(A(u + g) — fe(u))>fe(z/0 + g) — h(u.) при u0 = 0. u
§ 5. ЙЁРХЯЙЁ ВЫПУКЛЫЕ АППРОКСИМАЦИЙ 169 Отметим еще одно интересное свойство функции рл. Напомним, что в § 1 для выпуклых компактов была определена операция вычитания -н Эта операция может быть подобным образом определена и для произвольных множеств. Если С/, V — некоторые подмножества Rn, то U + V = U| x+VczU}. Напомним, что для функции й, заданной на Rn, надгра- фик epi h определен равенством epi h = {[х, X] I X > <*h(x)}. Если h — положительно однородна первой сте- пени, то epi h — конус. Если функция h сублинейна, то( epi h — выпуклый конус. Предложение 5.2. Справедливо равенство epi рь = epi h 4- epi fe. Доказательство. 1) Пусть [g, X] e epi h + epi h. Тогда [g, IX] + epi h <= epi ft, t. e. [g, ^] + lu, p] e epi h V [u, p] e epi h. Это включение показывает, что Х + р> h(g + и), если р>Л(и). В частности, при p = fe(u) имеем X>p(g + + u)—p(u) для любого и, откуда следует неравенство %>sup(p(g + и)— р (и)) = Ph (g). (5.5) и Соотношение (5.5) означает, что [g, X] е epi Тем са- мым установлено включение epi h 4- epi h <= epi ph. 2) Проверим обратное включение. Пусть [g, X] epi ph. Тогда при всех wg?1 выполняется неравенство X > > h(g + и) — h(u), которое показывает, что [g + u, Х + h(u)] = [g, X] + [u, fe(u)]eepife. Если [u, р] е epi Л, то р^Л(и) и потому [g, X] + [и, р] е е epi h. Это означает, что [g, X] + epi h <=: epi Л, т. е. [g, X] epi h 4- epi h. 3. Вернемся к примерам в. в. а. Из результатов пре- дыдущего пункта следует, что в. в. a. p(g) = (/* )ci (0, g), рассмотренная в примере 5.3, может быть записана так: P(g) = sup (/x(g + и) — f'x(u)). U(ElRn Следующий пример связан с понятием квазидиффе- ренцируемости и раскрывает роль этого понятия с точки зрения в. в. а. и н. в. а.
170 ГЛ. tit КВАЗЙДЙФФЕРЕНЦЙР^ ЕМЫЕ ФУНКЦИИ Пример 5.4. Пусть функция / квазидифференци- руема в точке х, т. е. 4 (g) = max (/, g) + min (Z', g), l f=U v&v где [C7, V] = [df (x), df(x) ] — квазидифференциал функ- ции / в точке х. Положим ри (g) = max (Z, g), qv (g) = zeu = min(Z', g). Понятно, что Z'ev qv(g) + U, g)<fx(g)<Pu(g) + (l\ g) при всех Z e I' <= V. Так как функция qi(g)~ qv (g) + + (/, g) суперлинейпа, а функция py (g) = pu (g) + (Z', g) сублинейна, то каждая из функций qt (I е U) является н. в. а. функции / в точке х, а каждая из функций Рг (V е V)— в. в. а. функции / в этой точке. _ Таким образом, квазидифференциал [Of(x), df(x)]~ = [17, V] функции / в точке х доставляет целый набор в. в. а. {рг | Z'е V} и н. в. a. {gj 1<=U}. Эти наборы, как нетрудно проверить, обладают следующим свой- ством: для каждого geRn найдутся такие V V и l^U, что /x(g)=(Z',g)+pU(g) = (/. g) + 3V(g). Это обстоятельство показывает, что /х (g) = min pv (g), /х (g) = max qt (g). Z'eV leu 4. Рассмотрим некоторую совокупность в. в. а. {pj А} функции / в точке х. Назовем эту совокуп- ность исчерпывающим семейством в. в. а., если infpx(g) = fx(g) для всех geRn. Подобным же обра- х зом, совокупность н. в. a. {gj л £Л} функции / в точ- ке х называется исчерпывающим семейством н. в. а,, если supgx(g) = f'x(g). х Семейства {рг | Z'eF} и {qt | Zet7}, построенные в примере 4 для квазидифференцируемой функции, представляют собой примеры исчерпывающих семейств в. в. а. и н. в. а. Можно ли гарантировать существова- ние таких семейств без предположения о квазидиффе- ренцируемости? Ответ дается следующей теоремой.
§ 5. ВЕРХНИЕ ВЫПУКЛЫЕ АППРОКСИМАЦИИ 171 Теорема 5.1. Пусть функция f определена на от- крытом множестве X и имеет производную по направ- лениям fx в точке х X, которая ограничена в том смысле, что sup /' (g) < + оо. Тогда, если производная И<1 /ж полунепрерывна сверху как функция направления, то f допускает исчерпывающее семейство в. в. а.; если же fx полунепрерывна снизу, то f допускает исчерпыва- ющее семейство н. в, а. Доказательство сразу вытекает из следующего ут- верждения. Лемма 5.2. Пусть функция h задана на Rn, поло- жительно однородна первой степени и ограничена в том смысле, что supA(g)<oo. Тогда, если h полунепрерыв- на сверху, то существует такое семейство сублинейных функций {/ъ.1 % е А}, что h (g) = inf px(g); если же h ХбА полунепрерывна снизу, то существует такое семейство суперлинейных функций {gj л^Л), 4Toh(g) = supg2l(g). АЛЕЛ При этом множество индексов Л можно выбрать одним и тем же для всех h. Доказательство. Ограничимся случаем полуне- прерывной снизу функции. Положим A = SX(0, 1), где S = {gl llgll = 1} и сконструируем семейство функций {ZjJ X е Л}, обладаю- щее тем свойством, что h (g) = sup lK (g) Vg(=S. (5.6) XeA Пусть л^А, т. е. % = е], где u^S, е^(0, 1). Так как функция h полунепрерывна снизу в точке и, то най- дется такое б, что h(g)>h(u)~ е при g'^<#6(u). По- ложим h (?) = - 4 (Л (U) - е - M)tg -и II2 + (h (ц) - 8) VgeS, О где число М выбрано так, что inf h (g) > М + 1, (1 - 62/2) (h (u) - е) > М. (5.7) geS Укажем некоторые свойства функции 1с 1) 1% (u) = h (и) — 8, (5.8) 2) М?)< h (g) Vg<=S. (5.9)
172 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Действительно, если ge^6(u), то ft(g)> Л(и)—е > > 1к (g). Здесь используется неравенство h (и) — е > > inf h(g) — 1>М. Если же 11g —гД> 6, то geS h (g) = - у к - g \? (h (u) - е - М) + (Л (и) - е) < <-(Л(и)-е-М) + (h(u)-e.) =M<h(g). Из (5.8) и (5.9) следует равенство (5.6). Пусть % = [«, е]еЛ. Тоцца u^S. Поэтому, если ge ^S, то Hu — gll2 = 2 — 2(u, g). Используя это обстоя- тельство, имеем h (g) = - 4- (A (u) - 8 - М) (2 - 2 (и, g)) + (k (и) - 8) = О = (А (и) - 8 - М) (и, g)- -^h (и) - 8) (1 - )-М). (5.10) Положим Р1=4(Л(и)-8-М), р2 = О = _А((Л(и)- е)(1-т)“М)’ Тогда, как следует из (5.7), Pi > 0, Рг < 0. Определим на К" функцию qK, положив g*(g) = (“, g)Pi + Мр2- Так как ^2 < 0, то функция q% суперлинейна. В то же время из (5.10) вытекает, что Q*(g) = M£) ПРИ 8е S. Поэтому, как следует из положительной однородности функций h и при всех g из Rn выполняется равен- ство fe(g) = supgx(g). Хед § 6. е-квазидифференциалы 1. Если функция / квазидифференцируема в точке х, то ее производная может быть представлена в виде суммы максимума и минимума линейных функций. В случае, если такое представление не имеет места, можно попы-
§ 6. е-КВАЗИДИФФЕРЕНЦИАЛЫ 173 таться дать приближенное с точностью до заданного е > О представление производной в виде указанной суммы. По- добная попытка приводит к понятию 8-квазидифферен- циала и аппроксимативной квазидифференцируемости. Перейдем к точным определениям. Рассмотрим функцию /, определенную на открытом множестве X cz 0?п и дифференцируемую по направле- ниям в_ точке х е X. Пусть е > 0. Пару компактов [<9е/ (Д dBf(x)] назовем г-квазидифференциалом функ- ции f в точке х, если f(x, g) — ( max (у, g) + min (w, g)\ l< ^veae/(x) we3E/(x) J | <8k|| V?e_Rn. (6.1) Из формулы (6.1) следует, что пара [де/(я), d&f(x)] яв- ляется 8-квазидифференциалом в том и только том слу- чае, когда любая эквивалентная ей (в смысле § 1) пара является 8-квазидифференциалом. Таким образом, е-ква- зидифференциал можно рассматривать как элемент про- странства выпуклых множеств. Понятно, что существуют и неэквивалентные пары, являющиеся 8-квазидифферен- циалами функции / в точке х. Каждый е-квазидифферен- циал является и е'-квазидифференциалом при 8' > 8. Говорят, что функция f аппроксимативно квазидиф- ференцируема в точке х, если существует 8-квазидиффе- ренциал этой функции в данной точке при любом 8 > 0. Понятно, что каждая квазидифференцируемая функция является и аппроксимативно квазидифференцируемой; обратное утверждение неверно. Следующая теорема пока- зывает, что класс аппроксимативно квазидифференцируе- мых функций весьма широк. Теорема 6.1. Функция /, определенная на откры- том множестве X cz Rn и дифференцируемая по направ- лениям в точке х^Х, является аппроксимативно ква- зидифференцируемой в том и только том случае, когда ее производная по направлениям f (х, g) = fx (g) непрерыв- на как функция направления. Доказательство теоремы 6.1 легко вытекает из извест- ной теоремы Стоуна — Вейерштрасса, которую мы сфор- мулируем в следующем виде. Т е о р е м а 6.2. Пусть Z — линейное подпространство пространства С (Q) всех непрерывных вещественнознач-
174 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ ных функций, определенных на компакте Q. Предполо- жим, что Z содержит константы и является решеткой, т. е. наряду с любыми двумя своими элементами Zi и Z2 это подпространство содержит функции z(x) = max {z\(x), Z2^x)}, z(x) = min {z\(x), Z2(x)}. Тогда подпространство Z плотно в C(Q) no равномерной норме, т. е. для любой функции h, непрерывной на Q, и любого е>0 найдется такой элемент z^Z, что |и(я)~ — h(x) I < 8 при всех х Q. Доказательство теоремы 6.1. 1) Рассмотрим пространство L всех функций, определенных на Rn и представимых в виде суммы сублинейной и суперлиней- ной. Это пространство изучалось в § 1. Так как функции из L положительно однородны, то они полностью опреде- ляются своими значениями на единичной сфере S = = {g е Rn | || g|| = 1). Обозначим через Z совокупность всех функций, определенных на S и являющихся сужением на S функций из L, иными словами, z е Z, если z(g)=Z(g) для некоторой функции I L и g S. Понятно, что Z с: czC(S). Так как L является линейным пространством и решеткой (см. § 1), то и Z обладает указанными свойст- вами, наконец, Z содержит константы: функция z(g)=c является сужением на S функции s(g)ecllgll, которая сублинейна при с > 0 и суперлинейна при с С 0. Таким образом, -все условия теоремы 6.2 выполнены. В силу этой теоремы каждую непрерывную на S функцию можно с любой степенью точности равномерно приблизить элемен- тами из Z. 2) Пусть производная по направлениям /х функции / в точке х непрерывна как функция направления. Из сказанного следует, что для любого 8 > 0 найдется такая функция z е Z, что 1/х(?) — z(g)|<e Vg<=S. (6-2) По определению Z найдется такая функция l^L, что z(g) = /(g), если Ugll = 1. Так как функции fx и I поло- жительно однородны, то неравенство (6.2) показывает, что l/ite)-ng)l<8||g|| VgsR". (6.3)
§ 6. е-КВАЗИДИФФЕРЕНЦИАЛЫ 175 Пусть I (?) = max (u, g) + min (p, g). veV Тогда, как следует из (6.3), пара [t7, F] является 8-ква- зидифференциалом функции / в точке х. Ввиду произвольности 8 > 0 убеждаемся в том, что функция / аппроксимативно квазидифференцируема. 3) Пусть функция / аппроксимативно квазидифферен- цируема. Тогда для любого к найдется такая функция lk е L, что |/х (?) —М?)|<е V?e^. Таким образом на единичном шаре & функция /х пред- ставима как равномерный предел последовательности не- прерывных функций lh и потому сама является непрерыв- ной. Так как /х положительно однородна, то из непре- рывности этой функции на шаре следует ее непрерыв- ность на всем пространстве. 2. Приведем теорему о е-квазидифференцируемости композиции. Рассмотрим функции Л1, ..., hm, определенные и диф- ференцируемые по направлениям на открытом множестве X cz 0? , и отображение Н: X—имеющее hi, ..., hm своими координатными функциями: Н (х') = (h} (х'), ... . ..,Лт(х')) Уя'еХ.Пусть х^Х, у = Н(х) и функция / дифференцируема по Адамару в точке у. Зададим век- тор е =(е1? . ..,8w)ePw, где 8i>0, а также число е>0. Рассмотрим 8гквазидифференциалы функций hi в точке х и 8-квазидифференциал функции / в точке у: (х) = [d^hi (х), de.hi (я)] V г <= 1: т, Положим М = max (2 (*i {X, ?))2)1/2, (6.4) llell<i С1= max ||р||, С2 = max ||р||, С = max(Сп С2). (6-5)
178 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИЙ Предполагаем, что число определенное формулой (6.4), конечно. Это заведомо так в случае, когда производные hi (х, g) непрерывны как функции направления. Опреде- лим число ео, положив 8о = &М + IlfillC, где Hell — евклидова норма вектора е. Рассмотрим, кроме того, векторы v =(vi, ..., vm) и v = (vi, ..., vm), обладаю- щие тем свойством, что v<v<v Vvg^/(^) (J (—d~/(i/)). Теорема 6.3. При сделанных выше предположениях пара множеств [СЛ и, где U = |и | и = Vi (Х{ + щ) — v{Xi — v = (v1( ..., vOT) e d~f (у); Х4 f= de.hi (x), Hi g= d4 hi («)}, (6-6) {m VI v = s Vi (Xt + Hi) + V{Xi + ViHi: i=l “ v = (Vp ..., vm) g= d~f (y), Xi e d~f (y), Hi e de.hi (x)| (6.7) является Ео-квазидифференциалом функции Ф (х') = / (ж'), ..., hm (х')) \fx' e X (6.8) в точке x. Доказательство. Как следует из теоремы 1.3.3, функция ф, определенная формулой (6.8), дифференци- руема по направлениям в точке х, причем ф'С*. ?) = /'(!/, Н'(х, ?))» где Н'(х, g) = (h'i(x, g), ..., hm(x, gj). Положим Л = 3~/(у), Л = д~/(у), a (g) = max (h, g), a (g) = min (h, g), a (g) = a (g) + a (g). Тогда, как следует непосредственно из определения
8 в. е-КВАЗИДИФФЕРЕНЦИАЛЬТ 1?? е-квазидифференциала, выполняется неравенство |/'G/. g)~ «(#)К е|?| Vg<=Rn. Покажем, что a(g) удовлетворяет условию Липшица с константой С, определенной формулой (6.5). С этой целью отметим, что для каждого g е Rn найдется такой элемент pi е А, что a/g) = (Hi, g)- Поэтому £(g)^ Cllpillllgll где C\ также определено форму- лой (6.5). Так как функция a(g) сублинейна, то дляgl, имеем £(gi) = £( (gi - gs) + g2) £ (gi - g2) + a (g2), откуда следует неравенство a(gi)-a(g2)<£(gi -g2)<Cillgi -g2H. (6.9) Аналогично устанавливается, что £(?2) - £(gi) CJIgi - g2ll. (6.10) Неравенства (6.9) и (6.10) показывают, что а удовлетво- ряет условию Липшица с константой Подобным же образом а удовлетворяет условию Липшица с константой С2, определенной формулой (6.5). Чтобы убедиться в этом, достаточно рассмотреть сублинейную функцию —а и применить к ней проведенные выше рассуждения. Из сказанного и следует, что функция а = а + а удовлетво- ряет условию Липшица с константой С = max(Ci, С2). Положим Ui = deihi (х), Vi == d^hi (я), li (g) = max (p, g) + min (v, g). gelTj veYj Через 2? обозначим отображение с координат- ными функциями Z<: 24g)=(M£), Из определения егквазидифференциала имеем: IIН' (X, g) - s (g) II = (21 h- (X, g) - li (g) I*)1'2 < <(2e?||gll2)1/2 = hllkll-
178 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Используя это неравенство, липшицевость (с констан- той С) функции а и определение числа М, для geRn получаем II/'Су, Я'(^, £))_ а(<?(£))||< < I /' (у» н' (*, £)) — « (#' Сл £)) I + h (#' (*> £)) — ~ а (g)) I < е~|| Н' (х, g) || + СII Я' (х, g)-& (g) || С W(x, g))2]1/2 + CkllklK <8M||g|| + C||e||||g|| = eokl|. Для завершения доказательства следует проверить, что функция ty(g) = a(S? (g)) может быть представлена в виде ф (g) = max (u, g) + min (p, g), ueU veV где множества U и V определены равенствами (6.6) и (6.7) соответственно. Так как функция гр положительно однородна, то ф' (0, g) = lim -±- [ф (ag) — Ip (0)1 = ip (g). a|o a Подобным же образом Ji (0> g) = Ji te), a'(°, g) = a(g). Используя теорему 2.2 (о квазидифференциале компози- ции), имеем Ф (g) = Ф' (°, g) = max (ы> g) + min (р, g)j иедф(о) vedip(o) где dip (0) = I и = 2 (v4 (Xi + Pi) — Vjli — v<p.{): v = (vlt ..., vm) e da (0), e dli (0), dli (0) Vi e 1: mj; dip (0) = L | v = 2 (v» {h + Hi) + vAi + *<Hi): I i=l ~ v = (vx, ..., vm) e da (0), Xj e dli (0), р4е5/{(0) Vie 1 :тп),
§ 7. ЗВЕЗДНЫЕ МНОЖЕСТВА И НВЛЗИДИФФЕРЕНЦИРУЕМОСТЬ 179 а векторы v и v обладают тем свойством, что v v для всех v е 5a(0)U (—да(0)). Так как пара М, А] = [d~f(y), дг / (г/)] является квазидифференциалом функции а в нуле, а пара [Ui, Vi] = [d£.hi (х), d^hi (я)] — квазидифференциалом функции li в нуле, то дх|>(0) совпадает с множеством £7, а 5ф(0) — с множеством V. Теорема 6.3 позволяет установить формулы для вы- числения 8-квазидифференциала суммы, произведения, частного, поточечного максимума и минимума. Мы, одна- ко, не останавливаемся на этом. § 7. Звездные множества и квазидифференцируемость 1. Рассмотрим функцию /, квазидифференцируемую в точке х е X, где X — открытое множество в Rn. Квази- дифференцируемость этой функции означает, что ее про- изводная представима в виде разности двух сублинейных функций g) = Pl(g)~P2(g). (7.1) Переход от этих функций к квазидифференциалу осуще- ствляется с помощью двойственности Минковского, со- поставляющей каждой сублинейной функции р ее суб- дифференциал др. (При этом др\ = df(x), др2 = —df(x).) Таким образом, ква'эидифференциал представляет собой в определенном смысле двойственный объект. Уточним это обстоятельство. Если различать исходное пространство Rn и сопряженное ему пространство линейных функций (Rn)+, которое, конечно, изометрично, (Rn, то функции Pi, р2 определены на Rn, а соответствующие им в силу двойственности множества др^, др% содержатся в (iRn)+. Наряду с двойственным геометрическим описанием производной /х можно дать ее «прямое» геометрическое описание, в терминах исходного пространства. С этой целью следует воспользоваться понятием калибра (калиб- ровочной функции Минковского) выпуклого множества. Оказывается, что это понятие может быть использовано для геометрической интерпретации производной по на-
180 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУ ЕМЫЕ ФУНКЦИИ правлениям без всяких предположений о выпуклости, в частности без предположения о том, что производная /х разлагается в разность двух сублинейных функций. Достаточно лишь предположить, что эта производная не- прерывна как функция направления. При этом вместо выпуклых множеств следует говорить о так называемых звездных (точнее, звездных относительно нуля) мно- жествах. В этом параграфе кратко без доказательств излагаются те свойства звездных множеств, которые используются при геометрической интерпретации производной, дается эта интерпретация и устанавливается ее связь с квази- дифференциалом в случае, когда функция квазидиффе- ренцируема. 2. Замкнутое множество Q, лежащее в пространстве Rn, назовем звездным, если оно содержит нуль в качест- ве внутренней точки и всякий луч, исходящий из нуля, либо целиком лежит в Q, либо пересекает границу Q ров- но в одной точке. Как известно, множество Q, содержащее нуль, назы- вается звездным относительно нуля, если с каждой своей точкой х оно содержит и отрезок Oud Х^[0, 1]}. Понят- но, что каждое звездное множество является и звездным относительно нуля. Каждое выпуклое множество, содер- жащее нуль своей внутренней точкой, является звездным. Пусть х ¥* 0 и 3?х = {'кх\ Х>0} —луч, исходящий из нуля через точку х. Если Q — звездное множество, то, как следует из определения, либо S?x целиком лежит b_Q, либо найдется такое число X > 0, что \х е Q при К X и \х Q при X > X (это число определяется условием: точ- ка \х лежит на границе Q). Рассмотрим функцию |я|0 = inf {ц > 01 (7.2) В первом из указанных случаев (^^й) справедливо равенство Ыо_= 0. Во втором случае, как нетрудно про- верить, |х|0 = Л. Функция 11о, определенная равенством (7.2), назы- вается калибром (калибровочной функцией Минковского) множества Й. В качестве простого, но очень важного при- мера отметим, что калибр единичного по некоторой норме шара & совпадает с этой нормой. Непосредственно из определения следует, что калибр — неотрицательная и по-
§ 7. ЗВЕЗДНЫЕ МНОЖЕСТВА И КВАЗИДИФФЕРЕНЦИРУЕМОСТЬ 181 ложительно однородная первой степени функция. Оказы- вается, что справедливо следующее утверждение. Теорема 7.1. Пусть функция I определена на Rn. Следующие условия эквивалентны: а) функция I положительно однородна, неотрицатель- на и непрерывна} б) I совпадает с калибром некоторого звездного мно- жества Й; при этом й имеет вид Й = {я| 1(х)^ О. Доказательство этой теоремы см., например, в [179]. Непосредственно из определения вытекают следующие свойства калибров и звездных множеств: 1) если Й1 = %Й2 при % > 0, то |#|й1 = -у-| z|q2 при всех х е Rn; 2) если Й1 <= й2, то |я|й1 > | я|й2 при всех xeRn; 3) звездное множество й содержит луч 3?x = {kxl X > 0} в том и только том случае, когда klQ = 0; 4) звездное множество Й выпукло тогда и только тог- да, когда функция 1-1а выпукла и, следовательно, суб- линейна. Так как звездное множество й содержит нуль как внутреннюю точку, то свойства 1)—2) и равенства | • | % = || • || показывают, что существует такая константа С, что Izlо < С\х\о при всех х. Укажем, как вычислить множество Й1 ® йг, калибр которого совпадает с суммой калибров данных звездных множеств Й1 и Йг. Оно имеет вид Й2 ф Й2 = cl U айх П (1 — а) й2. (7.3) (Здесь предполагается, что 0-Й= Г| аЙЛ а>о ) Множество Й1 ® Йг называется инверсной суммой мно- жеств Й1 и Йг. В случае, когда Й1 и йг выпуклы, его называют также конволюцией указанных множеств. Пусть Й1, ..., йт — звездные множества,й = U Й{, й = — = П Й|. Нетрудно видеть, что множества Й и Й звездны, г — причем | x|q = min | |x|f2 = тах|х|й.. (7.4) i i
182 ГЛ. III. КВАЗИДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Замечание 7.1. Совокупность звездных множеств образует полулинейное пространство относительно алгеб- раических операций О и ®, где Х©Й=-^-йпри %>0 и X 0 й = 1Кппри % = О, операция ® определена формулой (7.3). Отображение (р: й>-*| • |q устанавливает взаимно однозначное соответствие между указанной совокуп- ностью и конусом всех неотрицательных положительно однородных первой степени функций, определенных на Rn. Это соответствие сохраняет алгебраические операции: ср(й1 Ф Й2) = Ф(Й1) + <р (Й2), ф(Х Ф Й) = Хф(Й) и «перевора- чивает» порядок: соотношения Й1 => й2 эквивалентны не- равенству | • |qi^| • |q2- Используя указанные обстоятель- ства и рассуждая по той же схеме, что и при построении пространства выпуклых множеств (см. § 1), можно по- строить пространство звездных множеств как совокуп- ность классов эквивалентных пар звездных множеств. Приведем несколько примеров. Пример 7.1. Пусть Й представляет собой полупро- странство вида й = {х| (g, Если с^О, то Й не является звездным множеством. Если же с > 0, то Й звездно. В этом случае — (g, х), О (7.5) Пример 7.2. Рассмотрим выпуклое многогранное множество, содержащее нуль своей внутренней точкой. Это множество звездно. Оно может быть задано системой линейных неравенств (gi, х) Vx е 1: п, где С;>0. Положим йг = {я| (g, rr)^cj. Тогдай = f) й» и потому, как следует из (7.4) и (7.5), |*|q = шах Д iei:(n+i) \ ci ] положено gn+i = 0, cn+i = 1. Пример 7.3. На плоскости (R2 рассмотрим множест- ва (см. рис. 9) Q1 = {x=(x(l)t ж(2))| ^(1)^1), Й2 = {я = (а:(1), я(2))| л(2)^1>.
§ 7. ЗВЁЗДНЫЕ МНОЖЕСТВА И КВАЗЙДЙФФЕРЕНЦЙРУЕМОСТЬ 183 Каждое из этих множеств звездно. При этом | х |Й1 = = max с}, | <t|q2 = max {х№, 0}. Пересечение Q Рис. 9 множеств Qi и Q2 (см. рис. 10) имеет калибр |я|^= =max{rc<1),x<2\ 0}, а калибр объединения £2 (см. рис. 11) вычисляется по формуле _ toning1), я<2>}, если д:(2)^0, х *2 (0, если < 0 или < 0. Отметим, что множество Q невыпукло. Калибр инверсной суммы Qi Ф Q2 (см. рис. 12) по определению выписывает- ся так: I х |й1Фй2 = max {д*1*, 0} + max {х&\ 0} = rrd) + a;(2)t если 3^2) >0, я*1), если >0, Х<2) < 0, я(2>, если X<l)s со, 0, 0, если Ж*1) S ^0, 0. 3. Пусть F — непрерывная положительно однородная первой степени функция, определенная на Rn. Предста- вим F в виде разности F = F[ — F2i где Fi, F2 — непре- рывные положительно однородные неотрицательные функ- ции. Можно, например, положить Fi(g) = max{F(g), 0J, F2(g) = max {—F(g), 0). Понятно, что представление в виде разности неотрицательных функций неоднозначно (этот вопрос можно исследовать в рамках пространства звездных множеств, о котором шла речь в замечании 7.1). В частности, F\ и F2 всегда можно выбрать строго поло- жительными. Функции F\ и F2 представляют собой калибры неко- торых звездных множеств Qi и йг. Если Fx и F2 строго положительны, то эти множества ограничены. Иными
184 ГЛ. Ш. КЙАЗИДИФФЁРЁЙЦИРУёМЫЁ функций словами, справедливо представление Fi(g) = inf а >01 geWJ, F2(g) = inf{X>0l ge%Q2}, F(g) = inf {% >01 geWJ-inf {A >01 geXQJ, или, что то же самое, F(g) = inf {X > 01 g^XQi}+supa<Ol gG=(-X)Q2}. (7.6) Рассмотрим теперь функцию /, определенную на от- крытом множестве X и имеющую производную по на- правлениям /' (х, g) = fx (g) в точке х^Х. Считаем, что функция /х непрерывна. Так как,кроме того, эта функция положительно однородна, то при некоторых звездных мно- жествах Qi и Йг справедливо представление вида (7.6): /х(g) = inf{Х>01 geWJ + sup{X<0| Х)й2}. Обозначим Qi = d^f(x), йг = d'f(x). Пара [d^f(x), d*f(x)] дает геометрическую интерпретацию производной в «пря- мых» терминах, т. е. терминах исходного пространства (см. п. 1). Разумеется, они определяются не единствен- ным образом, а с точностью до некоторой эквивалентно- сти, определяемой в рамках пространства звездных мно- жеств (см. замечание 7.1). Используя связи между алгеб- раическими операциями над калибрами и звездными множествами, можно установить «исчисление» пар вида 4. Предположим, что функция / квазидифференцируе- ма в точке х. Тогда ее производная /х представима как сумма сублинейной и суперлинейной функций. При этом слагаемые всегда можно выбрать неотрицательными. Со- ответствующая таким слагаемым пара [df(x), df(x)] со- стоит из выпуклых компактов, содержащих нуль. С дру-
§ 7. ЗВЕЗДНЫЕ МНОЖЕСТВА И КВАЗИДИФФЕРЕНЦИРУЕМОСТЬ 185 гой стороны, функции fx отвечает пара звездных множеств [d*f(x), д;/(я)]. Эти множества также можно считать выпуклыми. Связь между указанными парами осуществ- ляется с помощью операции взятия поляры. Напомним, что полярой множества й cz Rn называется множество Й° = {/| (Z, я)<1 Укажем основные свойства поляры: 1) поляра Й° к любому множеству Й выпукла замк- нута и содержит нуль; 2) если й выпукло, замкнуто и содержит нуль, то Й = Й°°; 3) если O^intQ, то множество й° компактно; 4) если й выпукло и звезддо (т. е. й замкнуто и O^intfi), то калибр |-|0 множества й совпадает с опор- ной функцией рйо поляры ЙР (в этом случае Й° ком- пактно). Иными словами inf{^>0| ХЙ} = max(Z, х). (7.7) ZGQ0 Равенство (7.7) и помогает установить связь между парами множеств [df(x), df(x)] и [d^f(x), d*f(x)] соот- ветственно, а именно: df(x) = (d*f(x)Y\ —df(x) = (d*f(x))Q.
ГЛАВА IV КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ § 1. Определение и примеры кодифференцируемых функций 1. Пусть X cz — открытое множество и х^Х. Бу- дем говорить, что функция /, заданная и конечная на X, кодифференцируема в точке х, если существуют такие выпуклые компакты df(x} cz Rn+1 и df{x) cz Rn+1, что /(я + Д) = /(я)+ФДД)+ох(Д), (1.1) где фх(Д) = max [а + (р, Д)] + min [Ь + (?р, Д)], [a,r]Ed/(x) [b,w]Cd/(x) (1.2) уАеГ. (1-3) a a i о Здесь a, feeiR1; v, w^\Rn. Естественно, здесь также пред- полагается, что со {я, х + Д) с= X. Если (1.3) имеет место равномерно по Де5 = = {Де1йп| ||Д||=1},то будем говорить, что функция / кодифференцируема в х равномерно по направлениям. Пара множеств Df(x) = [dj(x), df(x)\ называется кодиф- ференциалом функции / в точке х, множество df(x) на- зывается гиподифференциалом, а множество d/(<r)—ги- пердифференциалом. Ясно, что, как и квазидифференциал, кодифференциал определяется неоднозначно. Если функ- ция / кодифференцируема в некоторой окрестности точки х, то отображение Df назовем кодифференциальным. Функция / называется непрерывно кодифференциру- емой в точке х, если она кодифференцируема в некото- рой окрестности точки х и если существует непрерывное (по Хаусдорфу) в этой точке кодифференциальное ото- бражение Df. Функция f называется гипо дифференцируе- мой в точке х, если существует кодифференциал вида
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 187 Df(x)==[df(x), {0n+i)]. Функция / называется гипердиф- ференцируемой в точке х, если существует кодифферен- циал вида Df(x) = [{0п-ь1}, df(x)]. Здесь 0™ —нулевой эле- мент пространства R™. Аналогично определяются непрерывно гиподифферен- цируемые функции и непрерывно гипердифференцируе- мые функции. Из (1.1)—-(1.2) видно, что кодифференцируемая в точ- ке х функция допускает аппроксимацию первого порядка в окрестности точки х, при этом в качестве аппроксима- ции можно взять функцию F3C(A) = /(#) +ФХ(А). Если функция / кодифференцируема в х равномерно по на- правлениям, то ^(Д) является аппроксимацией / в окре- стности х равномерно по направлениям. Для непрерывно кодифференцируемой функции аппроксимация FX(A), по- строенная с помощью кодифференциала, является непре- рывной функцией и по х, что в некотором смысле роднит непрерывно кодифференцируемые функции с непрерывно дифференцируемыми, позволяя тем самым избежать мно- гих неприятностей, вызванных негладкостью функции /. Предложение 1.1. Множество кодифференцируе- мых в точке х функций совпадает с множеством квази- дифференцируемых функций. Доказательство. Действительно, пусть функция / — квазидифференцируема в точке х. Тогда f (х + А) = f (х) + max (р, А) + min (w, А) + ох (А), г>ед/(х) weay(x) где df (х) cz Rn, df (х) cz Rn — выпуклые компакты, VAsR". а a J, о Отсюда ясно, что / является и кодифференцируемой в точке х, так как в качестве кодифференциала можно взять Df(x) = \df{x), 3f(x)], где d/(x) = {[а,р] | а = 0, v <= df (х)} cz Rn+1, (1.4) df(x) = {[b,w]\ b = 0, we5/(x)}czRn+1. (1.5) Обратно, если функция / кодифференцируема в точке х, то имеет место (1.1) — (1.2). Тогда /х (g) = lim 4“ [/ (х + ag)— /(х)] = max (р, g) + min (ip , g), «И a VSdf(X) wt=9f(x)
188 ГЛ. IV. КОДЙФФЁРЕНЦЙРУЕМЬТЕ ФУНЙЦЙЙ где dj(x) = [pg Rn| [а, р] е df(x)}, (1.6) df (х) = {rr е Rn| [b, w]^ df(x)}, (1.7) a = max{a| [a, p] e df(x)}, 5 = min{&l [b, w]^ df(x)}. А это и значит, что f квазидифференцируема в точке х, причем в качестве квазидифференциала можно взять 3)f(x) = [df(x), df(x) ], где df(x), df(x) есть множества, определяемые соответственно соотношениями (1.6) —(1.7). . Следствие 1.1. Всякая гиподифференцируемаяфунк- ция является субдифференцируемой*), а всякая гипер- дифференцируемая функция является супердифференци- руемой. Верно и обратное. Замечание 1.1. Хотя класс ко дифференцируемых функций совпадает с классом квазидифференцируемых функций, использование понятия кодифференциала позво- ляет выделить подмножество непрерывно кодифференци- руемых функций, в то время как для негладких функций квазидифференциальное отображение по существу явля- ется, вообще говоря, разрывным. Отметим также, что квазидифференциал — это пара выпуклых компактов пространства Rns а кодифферен- циал — пара выпуклых компактов пространства Rn+1. Важное значение (особенно с вычислительной точки зрения) представляют кодифференцируемые функции, у которых гипо- и гипердифференциалы представляют со- бой выпуклые оболочки конечного числа точек. Такие кодифференциалы будем называть многогранными. 2. Примеры непрерывно кодифференцируемых функции. 1. Пусть / непрерывно дифференцируема в окрестно- сти точки х X. Тогда f(x + \)^f{x)+\f\x). Д)+ох(Д), где vtt------► 0, f (х) — градиент функции / в точке х. IIА II ||Д||->0 Очевидно, что функция / непрерывно кодифференцируема в окрестности точки х равномерно по направлениям и что в качестве кодифференциала можно взять *) См. определение в § II 1.2.
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 189 Df(x) = [df(x), df(x)], где df (х) = {{0, f (х)]} с (Rn+1, df (х) = {Оп+1} с Rn+1. Отображение Df(x) непрерывно. В качестве кодифферен- циала можно также взять и пару множеств Df(x) = = \df(x), df(x)], где df(x) = {0n+i), d/(x) = {[0, /'(я)]). Таким образом, является одновременно и гипо-, и гипер- дифференцируемой функцией (и даже непрерывно гипо- и гипердифференцируемой). 2. Пусть f — выпуклая конечная на X функция, х X, и пусть Xq — произвольное замкнутое ограниченное под- множество X, содержащее х в качестве своей внутренней точки. Так как ♦) / (я) = max [/ (z) + (и (z), x — z)], где p(z) —произвольный вектор из d/(z)*) **), то очевидно, что при достаточно малых ПАН будет я + AeintXo и потому f(x + А) = f(x) + max [/ (z)—f(x) + (p(z), x—z) + (v(z), A)] = = f (x) + max [a + (у, Д)], [мМ(х) где df(x) = vo {[a, vj| a = = /(z)~/(#) + (v(z), x — z), v(z)^df(z), z^Xq}. (1.8) Таким образом, выпуклая функция является непрерывно кодифференцируемой (и даже гиподифференцируемой). В качестве кодифференциала можно взять Df(x)=: = [df(x), df(x)]> оде df(x) задано (1.8), а df\x) = {0n+i}. Замечание 1.2. Конечно, существенным для прак- тического использования является вопрос о том, как кон- структивно построить множество df для выпуклой функ- ции. Этот вопрос необходимо решать для конкретных классов выпуклых функций. *) См. Приложение I. **) df (z) — суб дифференциал выпуклой функции —см. При- ложение I.
190 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 3. Аналогично устанавливается, что вогнутая функция является непрерывно кодифференцируемой (и даже ги- пердифференцируемой) . _________ 4. Пусть f(x) = -llxll = У(х, х) (евклидова норма). Так как f(x) = max (х, г), то (м)<1 / (х + А) = / (х) + max ((х, v) — / (х) + (и, А)). Отсюда /(х + А) = / (х) + шах \а + (р, А)], (1.9) [a,v]ed/(x) где d/(x)={[a, у] | а = (х, и) —/(х), (у, и)=С1}. (1.10) Значит, / является непрерывно кодифференцируемой (даже гиподифференцируемой) функцией, причем в ка- честве кодифференциала в точке х можно взять пару множеств Z>/(x) = [d/(x), df(x)], где df(x) задано соот- ношением (1.10), a d/(x)= {0n+i). Очевидно, что множество df(x) является выпуклым. 5. Пусть /(х) = max ср (х, у), (1.11) y^G где G — компакт некоторого пространства, а функция ф непрерывна на X X G и непрерывно дифференцируема по х на X при каждом фиксированном у G. Тогда f(x + А) = max [<р (х, у) + (<рх(а-,у), А) + ох(А, у)], y^G где фх (х, у) — градиент функции ф по х при фиксиро- ванном I/, Если (1.12) имеет место равномерно по у G, то /(« + А) = f(x) + max [а + (р, А)] + ох(А), (1.13) [a,v]Ed/(x) где df(x) = со {[а, и] | а = ф(х, у) — /(х), v = фх (х, у), у s G], ох(аД) . о (1.14) -----—>0 равномерно по Ае5. а а|о
§ 1. ОПРЕДЕЛЕНИЕ И ПРИМЕРЫ 191 Отсюда ясно, что функция /, заданная (1.11), является непрерывно кодифференцируемой на X, а в качестве ее кодифференциала можно взять Df(x) = [df(x), df(x)]> (1.15) где df(x) задано (1.14), a df(x)= {Qn+i}. Таким образом, функция максимума гиподифференци- руема. 6. Аналогично показывается, что функция / (я) = = min ср (х, у), где <р и G — такие же, как и в примере 5 y(=G является непрерывно кодифференцируемой, причем в ка- честве Df(x) можно взять пару множеств Df(x) = = W(x), df(x)], оде df(x) = {On+i}, df (x) = co {[b, iv] | b = = ф(*, У) ~~ w = = <Рх(я, */), ?/G= G}. Таким образом, функция минимума гипердифферен- цируема. 3. Поясним введенные понятия на примере функции f(x)= Ы, где (рис. 13). Поскольку /(я) = max {я, —я}, то функция / диффе- ренцируема по направлениям на R1, причем /'(*, g) = g, х>0, Ж О, х = 0. Здесь geR1. Функция / квазидифференцируема (даже субдифференцируема) на R1, причем в качестве ее квази- дифференциала можно взять 0f(x) = [df(x), df(x)], где д/(х) = 1, -1, [-1,1], х> 0, 0, х =0. W) = {0}. Здесь [—1, 1] — отрезок на R1. Очевидно, что квазидиф- ференциальное отображение S)f терпит разрыв в точке х = 0.
192 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Так как /—функция максимума, то она кодифферен- цируема и по формуле (1.15) 3)f(x) = [df(x), df(x)], где df(x) = co{(x — Ixl, 1), (—х — Ixl, — 1)}, df(x) = {(0, 0)}. Нетрудно видеть, что (со {(0,1), (—2х, — 1)}, х>0, У <*) = (со {(2х, 1), (0, - 1)}, х < 0. Отображение Df является непрерывным на О?1. Имеем (ж) + max { Д, — 2х — Д}, х > 0, / (я + Д) = _|_ щах{2х + Д, — Д}, 0, т. е. ( я + тах{Д, — 2х — Д}, я>0, /(^ + А) = х тах{2я + Д, — Д}, Отметим, что здесь слагаемое ож(Д) (см. (1. 13)) отсут- ствует, т. е. с помощью кодифференциала функция / пред- ставляется точно в виде (1.16). § 2. Основные формулы кодифференциального исчисления Везде ниже все рассматриваемые функции предпола- гаются заданными и конечными на открытом множестве Xcz[Rn. Лемма 2.1. Если /ь ..., /N — кодифференцируемые (непрерывно кодифференцируемые) в точке х^Х функ- ции, то и функция / = 2 cifv г^е Ci R1, тоже кодиф- i=i ференцируема (непрерывно кодифференцируема) в этой точке, при этом N Df(x) = ^CiDf^x). (2.1) i=l Здесь Dfi(x) = [dfi(x), dfi(x)] — кодифференциал функции fi в точке х. Доказательство очевидно, если учесть, что fi (х + А) = fi (х) + + max [а + (р, А)] + min [Ь + (ip, А)] + oix(A). (a,®]ed/j(x) [b,w]ed/j(x)
§ 2. ФОРМУЛЫ К О ДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 193 Замечание 2.1. Точнее говоря, лемма 2.1 должна звучать так: Если /1, ..., — кодифференцируемые (непрерывно кодифференцируемые) в точке х^Х функции, то и функ- N ция / = 2 cifi, где ci е IR1, тоже кодифференцируема 1=1 (непрерывно кодифференцируема) в этой же точке. При этом если Dfi(x), i^ l :N,— кодифференциал функции fi в точке х, то среди кодифференциалов функций / есть ко- дифференциал вида N Df(x)= (2.1) i=l Если вдобавок отображения Dfi, 1:N, непрерывны, то и кодифференциальное отображение функции / вида (2.1) тоже непрерывно. Аналогичные замечания можно сделать и по поводу лемм 2.2—2.4. Лемма 2.2. Если функции f\ и fz кодифференцируе- мы (непрерывно кодифференцируемы) в точке х^Х, то и функция f = f\ • /2 является кодифференцируемой (не- прерывно кодифференцируемой) в этой точке, при этом Df (х) = fi (х) Df2 (х) + /2 (х)Dfi (х). (2.2) Доказательство. Пусть /1 (х + А) = А (х) + Ф1«(А) + 01 (А), (2.3) /2(я+А) = /2(я)+Ф2х(А) + о2(А), (2.4) где Фгх (Д) = шах [а + (о, А)] + min [6 + (ю, А)], [a,v]Gd/j(x) [b,w]edfi(x) о Vis Г. a ajo Так как Фгх(0) = 0, то max а + min 6 = 0. [a»^]G_d/i(x) [b.wJed/iCx) Без ограничения общности можно считать, что max а = min 6 = 0. (2.5) [a.vjed/^x) [btw]^dfi(x)
194 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Положим Ф;х(А) = max [а' + (у, А)], “ F.a,v]ed/j(x) Фгх (А) = min [6 + (ip, A)]. [b,w]ed/$(x) В силу (2.5) max (р, А) Ф$х(А)з^ max (у, А). [O,v]Gd/j(x) [a,v]ed/|(x) Отсюда |Фгх(А)К max |(v, Д)|<£н ||А||, (2.6) — [a,t]ed/j(x) где Zii = max ||i>||. Аналогично, в силу (2.5) mip (ip, А)^Ф{Ж(А)^ min (w, A). [o,w]ed/f(JC) [ft,w]ed/i(x) Отсюда |Ф1Х(А)|< max |(w, A)| = max | (w, A) |^L2i||A||, (b,w]e[-d/i(x)] [b,w]Ed/i(x) (2-7) где L2i = max ||w||. Из (2.6) и (2.7) вытекает, что [b,w]ed/j(x) |Ф1Х(Д)| sSZJIAll, |Ф&(А)| CL2HAII, (2.8) где £( = Ьи + ^2<, i = l, 2. Очевидно, что в силу компакт- ности dfi(x) и dfi(x) будет Lt< г = 1, 2. Отметим, что (2.8) справедливо независимо от пред- положения (2.5). Теперь из (2.3) и (2.4) имеем f(x + А) = /, (х + А)/2(х + А) = /1 (х)/2(х)+ /, (^)Ф2х(А) + + /2(х)Ф1х(А) + /1(х)о2(Д) + /2(х)О1(А) + + Ф1х(А)Ф2х(А)+о1(А)о2(А). В силу (2.8) ясно, что f(x + Д)=/(а:) + Л (*)Ф2х(А)+ Ш)Ф1х(А) + о(А), где —аА-—> 0 VAeR”. Учитывая вид Ф{Х(А), имеем а СЦО / (х + А) = / (х) + Д (х) Г max (а + (v, А)) + | [a,i>]Sd/2(x)
§ 2. ФОРМУЛЫ КОДИФФЕРЕНЦИАЛЬНОГО ИСЧИСЛЕНИЯ 195 + min {Ь + (а;, А))1 + /2 {х) Г max (а + {и, А)) + [b,w]Sd/2(x) ] [[a.vjedy/x) + min {b + (zp, A))l + о (A). [b,w]ed/2(x) J По правилам сложения и умножения на число в прост- ранстве множеств (см. § III.2) f(x+ А) = f (х) + + max (а + (v, А)) + min (b+(u>, А)) + о (А), [a,v]ed/(x) [b,w]Gd/(x) где Df{x) = [d/(rr), £/(*)] = /1 {x)Df2{x) + h{x)Dfx (я), т. e. функция f кодифференцируема в точке x. При этом, если функции /1, /2 были кодифференци- руемы равномерно по направлениям, то и f будет кодиф- ференцируема равномерно по направлениям. Если же функции /1 и /2 непрерывно кодифференци- руемы в точке х, то и функция / тоже непрерывно кодиф- ференцируема в этой точке, ибо в этом случае отображе- ние Df, полученное по формуле (2.2), тоже будет непре- рывно, так как /1 и /2 непрерывны в точке х, a Dfa и непрерывны по предположению. Лемма 2.3. Если функция f\ кодифференцируема {непрерывно кодифференцируема) в точке х и f\{x)=£O, то и функция / = 1//1 является кодифференцируемой {не- прерывно кодифференцируемой) в точке х, при этом (2.9) /1 \х> Доказательство. Пусть h (х + А) = /, (х) + Ф1в( А) + 01 (А), где Ф1ДЛ) = max [а + (v, А)] + min [6 + (u^ А)]г [a.tjedfjtx) [b.wjed/^x) ог (А) = ох (х, А), —*0 VAeRn. (2.10) Как и при доказательстве леммы 2.2, показывается, что |Ф1Я(Д) I LjIlAH, где £,<00. (2.11)
196 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Имеем /(х+ А) —/(*) = 1 1 _ - Ф1Х (А) - ог (Д) /1(х) + Ф1х(Д) + <>1(Д) f^x) /1(т)(/1(а;)+Ф1х(Д)+01(Д)) = _ Ф1*(Д) . ф1х(А) + Ф1х(Л)о1(А) -о1(А) /г(*) /?(*) /®(х)(/1(^ + Ф1х(Д) + о1(Д)) ' ' Из (2.11) следует, что Фхх (А) = о (А), поэтому из (2.12) / (х + А) = / (х) - - J- Ф1х (А) + о (А), (2.13) *1 \х) где 2-^. О VA <= R”. Из (2.13), (2.10) имеем (2.9). а аю Лемма 2.4. Если функции <рй i е / =1: А', кодиффе- ренцируемы (непрерывно кодифференцируемы) в точке х, то и функции Л (у) = max ср* (у) и /2 (у) = min <р$ (у) то- i^I гЕЛ же являются кодифференцируемыми (непрерывно кодиф- ференцируемыми) в этой точке, при этом Dfx(x)^[dh(x), dfx(x)], Dfi(x) = [dh(x), df2(x)], где dfi (x) = =co(d<pft (x) — 2 dq>i (x) + {[q>ft (x) — /x (x), 0n]} | k e= l], [“ J dfi (x) = 2 dffi (x), df2 (x) = 2 ЙЧ (*), iei “ iei ~ df2 (x) = = cold<pft(;r) — 2 d<fi(x) + {[<pft(x) — /2(x),0n]}| fceZl. [ iez\{fe}- J Доказательство. Рассмотрим только функцию /ь Имеем <р{ (х + Д)= <pi (х) + Ф|Х (А) + (A) Vi е 7, где (J)ix(A)= max [а+.(р, А)]+ min [6 + (iz>, А)], [a,®]Gd<Pi(x) [b,w]ed<Pi(x) °jx (aA)VAeRn (2-14) QUO a
§ 3. ПРИМЕРЫ 197 Тогда /х (х + А) = max ф| (х + А) = iel = /i (я) + max{Ф{х (А) + <pi (х) — (х) + oix (А)} = i<=I = Д (х) + max {Ф{Ж (А) + <р{ (х) — ft (z)} + ох (А), iel где ох(А) [min0{Х(А), maxO|X (А)1. Очевидно, что-—” —> L ге/ гег J а аю ->0 VAg7\ Теперь осталось, учитывая (2.14), вос- пользоваться предложением III. 1.1. Отметим, что если для кодифференциалов функций фг- было выполнено условие (2.5), то и для кодифференциа- лов функций -/1 и /2 тоже выполнены аналогичные усло- вия, так как для функции /1 будет фА(я) —/1(я)^0, а для функции /2 будет фА(я)-/2(я)>0. В § 5 будет показано, что суперпозиция кодифферен- цируемых (непрерывно кодифференцируемых функций) является кодифференцируемой (непрерывно кодифферен- цируемой) функцией. Таким образом, класс кодифференцируемых (непре- рывно кодифференцируемых) функций представляет со- бой линейное пространство, замкнутое относительно всех «гладких» операций и, что особенно важно, относительно операций взятия поточечных максимума и минимума от конечного числа функций. § 3. Примеры Рассмотрим несколько примеров применения фор- мул § 2. 1. Пример 3.1. Пусть / (я) = sat Л (я), где /1 —диф- ференцируемая на Rn функция, а sat а = а, если 1, если — 1, если |а|<1, а> 1, а < — 1. Легко видеть, что /(^) = min{l, max{—1, fi(x)}}. Поло- жим ф1(я)=1, ср2(я) = —1, фз(я) = тах {ф2(я), /i(rr)}. Тогда /(я) = пнп{ф1(я), фз(гг)}. Поскольку /1, ф1 и фг — дифференцируемые функции, то (см. § 1) можно взять % = [dfi (*), dfi(x)], где dACr) = {[0, /!(«)]} cz Rn+1,
198 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ f1) = {0»+1} с Rn+1, /i (х)—градиент функции ft в точке х, £>ф1(х) = [Йф1(ж), 5ф1(х)] , Рф2(х)= [Йф2(х), Йф2(х)], _б/ф1(х) = {[1, 0„]}, йф1(х) = 5ф2(х) = {0n+J, <йр2(х) = {[—1, 0„]}. По правилу вычисления кодифференциала функции мак- симума (лемма 2.4) £>фз(х) = [йфз(х), <?фз(х)], где <йрз(х) = со {йф2(х) — d/i(x) + {[ф2(х) — Фз(я), 0п]), dft(x)- 5ф2(х) + {[/i(x)- фз(х), 0„]Н = == со {—dft (х) + {[—'1 — фз (х), 0„]}, dft(x)+ {[/i(x)- фз(ж), 0„]}}, Зц>з(х) = <2ф2(х) + dft(x) = {0n+i}. По правилу вычисления кодифференциала функции ми- нимума (лемма 2.4) Dfi(x) = [df(x), df(x)], где df(x) = _йф1 (х) + _йфз (х) =_^фз'(х), (3.1) d/(x) = со {<2ф1 (х) — йфз (х) + {[ф 1 (х) —/(х), 0„]}, 5фз(х) — Йф1 (х) + { [фз (х) —/(х), 0„]}} = = со{—dq>3(x)+{[1 —/(х),0„]), {[фз(х)-/(х),0„]}}. (3.2) Применим формулы (3.1) — (3.2) к случаю /)(х) = х3, х eR1. Тогда (рис. 14) dft (x)={(013x2))cz R2, d/x(x) = = {(0, 0)} cz R2. Для xo = T имеем ФзЫ = = max{—l,xo} = max{—1,1}=1, /1(х0) = 1, /(х0) = 1, й/(х0)=_йфз(«о) = = со{{(-1-1, 0)}, {(0, 3) + (1 - 1, 0)}} = = со{(—2, 0), (0, 3)}, J/(x0)= со{-Лфз(х0)+ {(1 - 1, 0)}, {(1-1, 0)} = = со{(0, 0), (2, 0), (0, -3)}. Тогда по формуле (1.1), (1.2) имеем /(х0 + А) = /(х0) + ФЖо(Д) + ож (А), где Фя (А) = max {— 2; ЗА) + min {2, 0, — ЗА}.
§ 3. ПРИМЕРЫ 199 На рис. 15 изображен график функции Fr (х) = /(х0) + + Фх0(я — #0)- Нетрудно показать, что для этой же функции квазидифференциал в точке xQ = 1 есть 0/Ы = [df(xo), df(xo) ], где df (х0) = [/i (z0)} = {3} с= R1, df(x0) = co {0, — Л(х0)) = [0, — 3]. Поэтому / (х0 + А) = / (ж0) + max (v, А) + + min (w, А) + о(А) =/(л:0) + ФХ(>(А) + о(А), wea/(x0) где Ф*(А) = ЗА + min {О, -ЗА}. На_рис. 16 изображен график функции F±(x) = f(x0) + + Ф*0(я —х0), являющейся аппроксимацией / в окрест- ности точки хо=1, получен- ной с помощью квазидиффе- ренциала. Сравнивая Fi (х) и F\(x), видим, что в окрестно- сти точки хо = 1 функции Fi и Fi совпадают. Рассмотрим теперь точку %о — —4/2. Имеем <Рз(#о) = max {—1, —1/8} = —1/8, /1(^0) =-1/8, /(гео) = -1/8, dfi (хо) = {(0, 3/4)}, dfi (х0) = {(0, 0)), d^3(xo) = = со {{(-1 + 1/8, 0)}, {(0, 3/4)+{(-1/8+ 1/8, 0)}} = = со {(-7/8, 0), (0, 3/4)},
200 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ й/(хо)=_&рз>(®о) = со{(—7/8, 0), (0, 3/4)}, 3f(x0) = со{-d<p3(xo)+ {(1 + 1/8, 0)}, (-1/8 +1/8, 0)} = = со{(2, 0), (9/8, —3/4), (0, 0)}, ФЖо(Д) = тах{— 7/8,ЗД/4} + min {2,0, 9/8 — ЗД/4}; / (х0 + Д) = / (ж0) + ФЖо (Д) + ох (Д). На рис. 17 изображен график функции Fi(x) = /(—1/2) + + Ф-1/2(я + 1/2), значение которой в точке £о = —1/2 совпадает со значением функции f(x). Построим теперь квазидифференциал функции / в точке хо = —1/2. Имеем 3)f(xo) = [df(xo), df(xo)], где d/(*o) = {/1 (®оЯ = IM) ={3/4}, 3/(х0)= {о}. Поэтому / (х0 + Д) = / (х0) + max (у, Д) + min (u>, Д) + о (Д) = ved/(«0) wed/(x0) = -4-+ф*0(А) + °(Д)’ г«е Фх0(Л) = +Л- На рис. 18 изображен график функции F1(x)=f(x0) + 1^7/ ч 1 । 3 / . 1 \ 3 1 + Фх0 (х — ХО) = — -g-,+ -4- ^ + — J =— ^ + —, ЯВЛЯ- ющейся аппроксимацией функции / в окрестности точки хо = —1/2, полученной с помощью квазидифференциала. Наконец, рассмотрим точку xq= 1,1. Имеем Фз(яо)= max {ф2(#о), /i(#o)) = max {—1; 1,331} = 1,331, /1(х0)=1,331, /(хо) = 1, dfi(rro)={(O; 3,63)}, d/i(rro)={(O, 0)},
§ 3. ПРИМЕРЫ 201 <2фз (хо) = = со {{(-1-1,331; 0), (0; 3,63)+ (1,331-1,331; 0)} = = со {(-2,331; 0), (0; 3,63)}, <1фз (#о) = {(0, 0)}, df(xo) = <йрз(;го) = со {(—2,331; 0); (0; 3,63)}, df(xt)) = -cm (со { (2,331; 0); (0; —3,63)} + + {(il-l; 0)}; (0,331; 0)} = = со {(2,331; 0); (0; -3,63); (0,331; 0)}. По формуле (1.1), (1.2) имеем /(+> + А) = /(+>) + Ф*О(А) + МА), где ФХв(Д)= = тах{— 2,331; 3,63Д} + min {2,331; 0,331; — 3, 63Д). На рис. 19 изображен график функции = /(я:0) + + Фх0(я — ^о), являющейся аппроксимацией функции / в окрестности точки = 1, 1, полученной с помощью ко- дифференциала. Квазидифференциал функции / в точке хо=1,1 есть ®/Uo) = [{(O)}, {(0)}], т. е. Ф1(Д) = 0 и Л(х) = 1 V#. Ясно, что F\ {x) лучше аппроксимирует / в окрест- ности точки хо = 1,1, чем функция F\(x). 2. Пример 3.2. Пусть (рис. 20) /1(я) = ;г, /2(^) = —/з(л:) = 0, /4(я)=1-я2, /5 (ж) = max {/i (я), /2 (х)}, /6 (х) = max {/3 (х), /4 (ж)}, /fx)=min {/5 (я), fa(x)}.
202 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Рис. 20 Поскольку функции /1, /2, /з и /4 —гладкие, то положим Z>/1(x) = [d/1(x), #i(x)] = [{(0, 1)}, {(0, 0)}], Df2(x) = [df2(x), <1/2(х)] = [{(0, -1)}, ((0, 0)}], Df3(x) = [df3(x), d/3(x)] = [{(0, 0)}, {(0, 0)}], D/4(x) = [d/4(x), d/4(x)] = [<(0, —2х)}, {(0, 0)}]. Используя лемму 2.4, имеем Df6(x) = [df6(x), df5(x)], dfb(x) = со (dft(x)~ df2(x) + {(/i(x) — fs(x), 0)», df2 (X) — d/i (x) + {(/2 (x) - /5 (x) , 0) } = = co{(0, l)-(0, 0)+{(x-/5(x), 0)}}, {(0, -l)-(0, 0) + (-x-/5(x), 0)} = = co{(x —/s(«), 1), (—X — fs(x), —1)}, d/5 (x) = d/t (x) + d/2 (x) = {(0, 0)}; 2)/б(х)= [d/6(x), d/e(x)], где dfa(x) = co {df3(x)~ d/4(x) + {(/з(х) — /в(я)» ОР» dft(x)- df3(x)+ {(/4(x)-/6(x), 0)}} = = co{(0, 0) —(0, 0) + (0-/6(x), 0), (О, —2х) + (1 — х2 —/6(х), 0)} = = со{(0, 0)-(0, 0) + (0-/6(х), 0), (О, —2х) + (1 — х2 —/в(х), 0)} = = со{(-/6(х), 0), (1-х2-/6(х), -2х)}, d/e(x) = 5/з(х) + 5/4(х) = {(0, 0)}; D/(x)^[d/(x), J/(x)],
§ 3. ПРИМЕРЫ 203 где df(x) = dfe (х) + dfe (х) = = со{(х —/s(x), 1), (—х — /s(x), —!)}+' + со{(-/6(х), 0), (1-х2-/6(х), —2х)} = = со{(х-/5(х)-/б(х), 1), (1 + х — х2 — h(x) — fe(x), 1 —2х), (-x-U(x)-fe(x), -1), (1 — х — х2 — h{x) — fe(x), —1 —2a:)}, d/(x) = co {dfe(x)— dfe(x)+ {(fs(x) — f(x), 0)}, dfe(x) — dfe(x) + {(/6(x) — f(x), 0)}} = = co{(0, 0) —co {(—/e(®), 0), (1 - x2 - /6(x), —2x)} + + <(h(x)-f(x), 0)}, (0, 0)- — co{(x — fs(x), 1), (—x — /б(х), —1)} + + <(/e(x)-/(x), 0) }} = co {(/5 (x) + /6 (*)-/(*), 0), (-1 + x2 + f6(x) + fs(x)-f(x), 2x), (fe(x)-f(x)-x + f5(x), -1), (f6(x)-f(x) + x + f5(x), 1)}. Рассмотрим точку хо = 1/2. Имеем /1(х0)=1/2, /2(х0) = -1/2, /3.(хо) = О, /4 (*о) = 1 - 1/4 = 3/4, /5 (х0) = max {/1 (х0), /2 (х0)) = 1/2, /в (хо) = max {/3 (xq) , /4 (х0)) = 3/4, /(х0) = min {/з(хо), /6(хо)} = 1/2, df(x0) = со {(1/2 - 1/2 - 3/4, 1), (1 + 1/2-1/4-1/2-3/4, 1-2-1/2), (-1/2 - 1/2 - 3/4, -1), (1-1/2-1/4-1/2-3/4, -1-1)1 = = со((-3/4, 1), (0, 0), (-7/4, -1), (-1, -2)}, df(х0) = со {(1/2 + 3/4 - 1/2, 0), (-1 + 1/4+ 3/4+1/2-1/2, 1), (3/4 - 1/2 - 1/2 + 1/2, -1), (3/4-1/2+1/2+1/2, 1)} = = со ((3/4, 0), (0, 1), (1/4, -1), (5/4, 1)}. Отсюда (рис. 21) / (х0 + А) = / (х0) + Фж# (А) + о (А) = 1/2 + ФХо (А) + о (А), где Фх0 (А) = тах{— 3/4 + А, 0, - 7/4 - А, - 1 - 2А} + + min {3/4, А, 1/4 — А, 5/4+ А).
204 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ На рис. 22 изображен график функции Fr (х) = / (.г0) + + Ф*о (я — я0), являющейся аппроксимацией функции / в окрестности точки xq = 1/2, полученной с помощью ко- дифференциала. В то же время аппроксимацией функ- ции / в окрестности той же точки #о, полученной с по- мощью квазидифференциала, является функция F\(x) = x. § 4. Недифференцируемость суперпозиции Пусть z = (z(1), ..., z(m)) <= Rm, х е Rn и пу(сть У\ (х), ..., ут (х)— кодифференцируемые в точке xq функ- ции. Предположим, что функция F(z) = F(z(1), ..., zw) кодифференцируема в точке zq = (у\ (xq) , ..., ут (xq) ).
s 4. КОДИФФЕРЕНЦИРУЕМОСТЬ СУПЕРПОЗИЦИИ 205 Тогда yt (х0 + Ах) = yi (х0) + ~ jnax [а{ + (уг, Ах)] + + min [tj + (ipj, Ax)] + Oi (Ax) Vi el: m, (4.1) F (z0 + Az) = F (z0) + max [a + (y, Az)] + [a,i>]edF(z0) + min [6 + (w, Az)] + о (Az). (4.2) [b,w]edF(z0) Здесь 2^ — 0 VAxeR", VAzeRm, a ajo a ajo dyi(xo), dyi(xo) — выпуклые компакты в Rn+1s dF(zo), dF(zo) — выпуклые компакты в Rm+1. В этом параграфе используем обозначения Аж и Az вместо А, чтобы отличать приращения по разным пере- менным. Образуем функцию /(ж) = Г(г/1(ж), ..., у™(х)). Теорема 4.1 (о кодифференцируемости су- перпозиции). Функция f(x) кодифференцируема в точке жо. Если функции г/1(ж), ..., ym(x) непрерывно ко- дифференцируемы в окрестности точки ж0, а функция F (z) непрерывно кодифференцируема в окрестности точ- ки zo, то и функция /(ж) также непрерывно кодифферен- цируема в окрестности точки жо. Доказательство. Положим т\(Аж) = max [a$ + (у и Аж)], КЛ]е^г(х0) п(Аж) = jnin + (u?i, Аж)], ri (Аж) = r'i (Аж) + r\ (Аж), r'(Az)= max [a +(p, Az)], [a,v]edF(z0) r" (Az) = min [ft + (a?, Az)], r (Az) = r' (Az) + r" (Az). [b,w]edF(z0)
206 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Из (4.1) и (4.2) заключаем, что max а, + min bi = 0 Viel: т, [J'i.S'iJedVi^) [bi.^i]edVi(«0) max a + min b — 0. [a,v]e_dF(z0) [b,w]SdF(z0) Отсюда нетрудно получить (см. доказательство лем- мы 2.2), что |rf(Ax)| <^11Дх11, (4.3) lr(Az)l ^KIlAzll, (4.4) где Ki =______max |pi||+___________min ||н>{||,. R,~i]edvi(x0) [bi.wi]edWi(x0) К = max || v || + min || w ||. [a,D]edF(z0) [6,w]edF(z0) Имеем j(xQ + Aa:) = F(j/i(x0 + Aar), ..., ym(x0 + Aa:)) = = F(yi(x0) + ri(Aa:) + oi(Aa:), ... ..., ут(х0) + гт(Дх)+ om(Aa:)) = F(zo + Az), (4.5) где Az = (n(Aa:) + oi(Aa:), ..., rm(Aa:) + om(Aa:)). Из (4.3) ясно, что для достаточно малых 11Да:11 можно найти Ко такое, что IIAzIl С К011Аа:11. (4.6) Из (4.5) и (4.2) имеем f(x0 + Aa:) = f(x0) + max U + 2 Рг[Г{(Да:) + о{(Аа:)]} + [a,»]edF(z0) I i=l J + min p+ У, Ю{[г{(Аа:) + oj(Aa:)]| + o(\z). (4.7) [b,w]edF(z0) I i=1 > Здесь v = (ox, ..., vm) e Rm, w = («>!, ..., wm) e Rm. Из (4.6) ясно, что в (4.7) o(Az) = о(Да:). (4.8) Из (4.4), (4.6), (4.7) и (4.8) заключаем, что т / (а:0 + Да:) = / (х0) + max а + 2 viri (д*) fa,»]edF(z0) L i=l + + min [6,w]edF(ze) m Ь + 2 wiri (^x) i=X + o(Ax). (4.9)
§ 4. КОДИФФЕРЕНЦИРУЕМОСТЬ СУПЕРПОЗИЦИИ 207 Выберем положительные числа Ri, Rt такие, что — R'i <Vi <Ri, —Ri<Z — Wi<zRi Vie l: m. (4.10) Из (4.9) имеем / (x0 + Ax) = =‘f(xo) + max 1° + 2(yi + + [a,r]EdF(x0) + 2(*>i ~ R”i) ri (Ml — 2 Rir'i (Лх) + 2 Rir"i (M + + min {ft + 2(№i — + [b,w]edF(z0) + 2 (wi + R'i) r"i (Ml + 2 Rif 'i (M — 2 -йХ(М + °(М = = /(x0)+ max {a + + #i)ri(M + [a,i)]edF(zoj + 2(yi —-^i)ri(Ml+ mLn +2(^i —-fti) ri(M + [b,w](=dF(zQ) + 2(wi + #i) r'i (Ml + O(M- (4.11) Поскольку из (4.10) следует Vi + Rt > 0, p, — Ri<i 0, wi + Ri > 0, Wi — Ri < 0, то из (4.11) получаем f(xo + Ax) = !m r a+ 2 max [(Pi + R'i) (a, + <=i[ [^]е^(х0) + (Pi, Az))] + ~ max [(pj — R"i) (К + (иЪ, Ax))] 1)+ [Ь^]е<й^(«0) J j Im b + 2 min [(“’i— Ri) (ai+(Pi, Ax))] 4- i=i[ [^Jedvi^) + [(<Pi + Ri) (bi + (i»i, Ax))] j + o(Ax) = [^,wi]edwi(xo) J J = /(x0) + max f max [a + 2 ((^ + R'i) at + [a,»]Gd_F(z0) |[<Ч.^]е^/{(х0) + (p{ — 7?i)&i)+ (2((pi + Ri) Vi + (Vi — R"i)Wi), Ax)]) + + min ( jnin [ft +2((y«+ R'i)ai + (wi 4-7?i)^i + [b,w]SdF(z0) R.»i]sdVi(*0) (b^.wJedWi^) + (2 ((«4 — R'i) Vi + (wi + R\) Wi), Ах))П + O (Ax).
208 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Отсюда ясно, что / (х0 + Дх) = / (х0) + max (а' + (v', Дх)) + [u',v']ed/{x0) + min (b' + (и/, Дх)) + о(Дх), (4.12) где J/ (х0) = = |[а', И е R”+11 а' = а + 2 ((pi + #i)«i + (yi — I 1=1 V' = 2 (Gi + R'i) Vi + (yi — R“i) u/j); [a, v] ge dF (z0); 1=1 — [а{, £] e= dyt (x0), [bi, uj ge dyi (x0)}, (4.13) df(x0) = {[b', w/] s R”+1| b' = = & + 2 ((wi — ^i) ®i + (wi + Ri) &i), i=l w' = 2 ((“4 — #i) fi + («’i + #i) f’i), [6, id e dF(z0), 1=1 [«». Pi] GE dyi (x0), [bi, u?i] <= dyi (x0)}. (4.14) Осталось установить, что множества df(xo) и d/(#o)> определенные по формулам (4.13) и (4.14) соответствен- но, являются выпуклыми. Докажем, например, выпук- лость множества df(xo). Пусть [ai, z?i] е df (xQ) и [a^, ed/(^0)‘ Надо показать, что для всех a^[0, 1] будет [a;, Va] е df(x0), где аа = aai + (1 — а) а2, г« = а^-|- + (1 — a) v2. Имеем а1 = а1 + 2 ((pli + -Si) ап + {уп — Rif \i)i 1=1 V1 — 2 ((pll + Ri) vli + (PH — Ri) ^11), 1=1 ^2 = a2 + 2 ((^21 + Ri) a2i + (p2i — Ri) ^2i)^ 1=1 v2 = 2 ((^21 + Ri) ^21 + kV2i — Ri) ^2i)i 1=1
§ 4. КОДИФФЕРЕНЦИРУЕМОСТЬ СУПЕРПОЗИЦИИ 209 где [a,, Vj]^dF(z0), [ац, е dy^Xo), [5J(, wit] е dyf(x0), / = 1, 2. Тогда а'а = аах + (1 — а) а2 + 2 [а(^н + $) «н + + (1 — а) (v2j + B't) a2i + а (vH — /?•) Ьц + + (1 — а) (p2i — Bi) b2i] = ааг + (1 — а) а2 + + S£(a(pli + Ri) + (1 — а) (y2i + Ri)) X Положим сц = а (р1{ + B'i) + (1 — a) (p2i + B'i) = = a^ii + (1 — a) v2i + c2i = a (vxi — Bi) + (1 — a) (u>2i — B'-) = = avu + (1 — a) p2i — B’i в ._(!-«) v. . ^2i — 7 j r2i — -------------------- Vi G 1. Hl. C2i C2i В силу (4.10) а«>0* Ph^Oj ан + Рн = 1> Ci»>0 Viel:m, (4.16) «2»>0, ₽2i>0, а2Г+р2{ = 1, c21<0 Viel: m.
210 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Поэтому из (4.15) получаем аа = аа + [(rai + Ri) (<Xii^ii + (1 — 0&ii) Я2г) + г=1 + — R’i) (a2Ai + (1 — a2i) 62i)], (4.17) где aa = aax + (1 — a) a2, pai = avu + (1 — a) v2i Vi e 1: m. Аналогично получим va = 2 [(L'ai + Ri) {^li^ii + (1 — V2i) + i=l + (vai — Ri) (a2iSH + (1 — a2i) zp2i)]. (4.18) В силу (4.16) и выпуклости множеств dF(zo), dyi(xo) и dyi(xQ) будет [aa, va]^dF(zo), [aai, vai]^dyi(x0), [£ai, wai] e= dyi(xo). Здесь va = (uab ..., vam), aai = Янаи + (1 — an)a2t, Pat = auvu + (1 — aH)r2i, bai = а2Ли + (1 — a2f) fr2i, = a2twi< + (1 — a*) w2i. Отсюда и из (4.13), (4.17), (4.18) заключаем, что [4, Pa] е df(x0) Vа (= [0, 1]. А это и значит, что df(xv)—выпуклое множество. Ана- логично устанавливается выпуклость множества, df(xo). Из (4.12) заключаем, что функция / является кодиф- ференцируемой в точке xq, а ее кодифференциал вычис- ляется по формулам (4.13) и (4.14). Из (4.13), (4.14) ясно также, что если отображения DF (z) = [dF (z), dF (z)], Dyi (x) = [dyi (x), dyi (x)] Vi e 1: m непрерывны (по Хаусдорфу) соответственно в точках zo и хо, то и отображение Z)/(x) = [d/(x), d/(x)] тоже не- прерывно в точке хо. Теорема доказана.
§ 5. НЕПРЕРЫВНО КОДИФФЕРЕНЦИРУЕМЫЕ МНОЖЕСТВА 211 § 5. Непрерывно кодифференцируемые множества Пусть й = (ze=Rn| Л(«)<01, (5.1) где A: Rn->|R1— кодифференцируемая на X функция, X cz 0?п — открытое множество такое, что Q <= X. Зафиксируем х е X. Положим V (х) = х + К(х), К(х) = (AeRn| h(x) + h^x, А) < 0}, (5-2) где ht (х, А) — hL (А) = = max [а + (у, А)] + min [6 + (ip, А)]. (5.3) [a,»]edh(x) [b,w]Gdft(x) Рассмотрим также множества Vx(j:) = (AeRn| h(x) + h^x^XO], (5.4) Т1(т) = [АеЙп| h(x) + MU)<0). (5.5) Ранее (в § 1.4) были введены множества Yi(x)= {AeRnp'(x,A)<0}, (5.6) I\ (х) = {А е 0?п | h' (х, А) < 0}, (5.7) где Л'(^А) = max (у, А) + min А), ФЬ(х) = vedh(x) W(=dh(x) = [dh(x), d/z(rr) ]— квази дифференциал функции h в точ- ке х. Будем говорить, что в х выполнено условие регу- лярности, если cl Yi (х) — Г (ж). Лемма 5.1. Пусть h(x) = 0. Если в точке х выпол- нено условие регулярности, то множество Г (я) (см. (5.2)) является аппроксимацией первого порядка для множества Q в окрестности точки х. Доказательство. По условию регулярности cl7i(z)= Г1(я). (5.8) Поскольку для Ао = 0 h[ (До, g) = fe'(A0, g), то по тео- реме 1.4.1 множество Г1(я) является аппроксимацией первого порядка для множества К(х) в окрестности точ- ки До = 0, а тогда множество Г (х) = х + К(х) является
212 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ аппроксимацией первого порядка для множества Q в окрестности точки х. Будем говорить, что в точке х выполнено условие нерегулярности, если cl^i (я) =Ti (я). (5.9) Лемма 5.2. Пусть х^Х. Если функция h непрерыв- но кодифференцируема в точке х и выполнено условие нерегулярности, то отображение К непрерывно по Каку- тани в точке х. Доказательство. Установим вначале полунепре- рывность сверху. Пусть xk-*x, АЬ-*Д, Xk^K(xk), т. е. Aft)^0. (5.10) Так как отображение Dh непрерывно по Хаусдорфу, то (см. (5.3)) функция h\ непрерывна по совокупности я, А и потому из (5.10) следует h(x) + h\(x, А)^0, т. е. отображение К полунепрерывно м сверху в точке х. Отметим, что при Рис. 23 доказательстве полунепрерывности сверху условие (5.9) не использо- валось. Возьмем \^К(х). Выберем про- извольную последовательность {xk}: хк-+х. Если h(x) + h{ (х, А)<0, то в силу непрерывности h и Dh при достаточно больших к будет h(xh) + h^Xk, А)^0, т. е. k^K(xh). Если же h(x) + hi(x, А) = 0, то в силу условия нере- гулярности (5.9) найдется последовательность {А(5)}, та- кая, что А(5)->0, Д(3) е ^(я). Возьмем А(1). Так как h(x)+ hi(x, А(1))<0, то найдется к{ такое, что h(xk) + + hl(xk, Д(1))<0 \fk>kv Теперь возьмем А(2). Найдет- ся к2> кь такое, что h(xk)+hi(xh, А(2))<0 \fk^k2. Далее поступаем аналогично: пусть уже определено kh Возьмем Аи+1). Найдется ki+i>kt такое, что h(xh) + + hi(xh, Au+1))<0 Vk^ki+1. Положим . ]'Д(0) Ab = 1 /П 1Д(г) У£б=[/сг: Аг+1-1]. Очевидно, что Xh^K(xh), Aft-> А. Значит, отображение К полунепрерывно сверху в точке х. Замечание 5.1. Отметим, что отображение К опре- делено и для х Ф Q,
§ 5. НЕПРЕРЫВНО КОДИФФЕРЕНЦИРУЕМЫЕ МНОЖЕСТВА 213 Пример 5.1. Пусть яеК2, Л=(1, 0), В = (0, 1), hi (х) = (х - Л)2 - 1, h2(x) = (х - В)2 - 1, h(x) = = max{fei(;r), Q = {#eR2| h(x)^.O} (рис. 23). Так как"/zi, h2— гладкие функции, то в качестве их ко- дифференциалов можно взять Dhi (х) = [dhi (х), dhi (х) ], Dh2 (х) = [dh2 (х), dh2 (х) ], где dftjx) = ([0, hi(х)]}, dh1(x) = {03}, dh2(x) = {[0, h2 (х)]}, dh3(x) = {03}. Отсюда dh(x) = со {dhi(x)— dhz(x)+ {[Л] (х) — h(x), О2Р, dh^x) — dhi (x) + { [h2(x)~ h(x), O2] B, dh(x) = dhi(x)+ dhi(x) = {O3}, t. e. dh (2) = co {[fej (x) —h (x); 2 (x—Л)], [h2 (x)—h (x); 2(x—B)]}, K(x) = = {A e R21 max {h± (x) + 2 (x — A, A), h2 (x) + + 2(x-B,A)}<0}. При ar0 = (l/'10, 1/10) имеем hi (xo) = —18/100, /12(20) = = —18/100. Очевидно, что xoeQ, Я(х0) = (л _ ГС21 ( 18 18 * , 2 A 18 . 2 A |AeR I maxj. 100 10 Ax + 10 A2; 100 + 10 -4UM-
214 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ На рис. 24 изображено множество Г(яо) = яо+ K(xq). При хо = (—1/10, 0) имеем Л1(х0) = 21/100, Л2(яо)= 1/Ю0. Очевидно, что = [R!| -JOO jo Ai — 2А2<oj. На рис. 25 изображено множество Г(хо) = яо + K(xq). § 6. Дважды кодифференцируемые функции 1. Определение и примеры дважды кодифференцируе- мых функций. В классическом анализе аппроксимации второго порядка строятся с помощью первых и вторых производных. В негладком случае первые производные сами являются разрывными, поэтому необходим другой подход к решению задачи аппроксимации. Пусть функция / задана и конечна на открытом мно- жестве X cz (Rn. Будем говорить, что функция / дважды кодифференцируема в точке х^ X, если существуют вы- пуклые компакты d2f(x) и х Rn X Rnxn такие, что / (х + Л) = / (х) + шах [а + (р, Л) + (-4Л, А)] + [a,v,A]ed2/(x) L J + min \b + (w, A) + —- (BA, A)1 + о (A2), (6.1) [b,w,B]e?/(x) L J где ) —> 0. Здесь RnXn — пространство веще- а а । о ственных (п X п)-матриц. Конечно, предполагается, что отрезок со {х, х + А) <= X. Пару множеств D2/(rc) = [d2f(x), d2f(x)] назовем вто- рым кодифференциалом функции f в точке х. Множе- ство d2f(x) называется вторым гиподифференциалом, а множество d2j(x)—вторым гипердифференциалом функции f в точке х. Если функция / дважды кодиффе- ренцируема в некоторой окрестности точки х и отобра- жение D2f непрерывно в метрике Хаусдорфа в точке х, то функция / называется дважды непрерывно кодиффе- ренцируемой в точке х. Очевидно, что второй кодифференциал определяется неоднозначно. Если среди вторых кодифференциалов
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 215 функции / в точке х есть кодифференциал вида D2f(x) = e[d2/(tf), {О}], то функция / называется дважды гипо- дифференцируемой. Если же есть второй кодифферен- циал вида D2f{x} = [{О}, d2f(x)}^ то функция / называ- ется дважды гипердифференцируемой. Здесь О — [0, 0п, Onxnle^xO^xR^”. Замечание 6.1. Нетрудно видеть, что всякая дваж- ды кодифференцируемая функция (дважды непрерывно кодифференцируемая функция) является кодифференци- руемой (непрерывно кодифференцируемой). Действитель- но, из (6.1) видно, что / (х + А) = / (х) + + max [а + (р, Д)] + min [b + (гр, А)] + о(Д), [o,u]ed/(x) [b,w]ed/(x) где df(x) = {[а, р] | ЗА е Rnxn: [а, v,A]^d2f(x)}, df (х) = {[&, w] | ЗВ е= Rnxn: [6, иц В] g= d2f (х)}, Примеры дважды кодифференцируемых функций. 1. Пусть f — выпуклая конечная на X функция, х X и пусть Хо — произвольное замкнутое ограниченное под- множество X такое, что x^intXo. Так как (см. (1.8)) f(x + Д) = f(x) + max [а + (р, Д)], (6.2) [M]ed/(x) где df(x) = oo{ [а, р] I а = /(и) + (р, x — z), p(z)ed/(z), z^Xq}, то (6.2) можно переписать в виде /(х + А) = f{x) + max [а + (v, А) + -у- д) » [a,v,A]ed2/(x) L (6.3) где d2/(x) = со {[а, v, А] I а = /(z) + (p(z), x — z), p(z)^a/(z), л OnXn) Z е Хо). Здесь p(z)e df(z)—произвольное, но фиксированное для каждого z^Xo, df(z) — субдифференциал / © точке z. Таким образом, любая выпуклая функция является дважды непрерывно кодифференцируемой (и даже дваж-
216 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ ды непрерывно гиподифференцируемой), причем D2j(x) = = [/У(*),{0}]. 2. Аналогично, любая вогнутая функция является дважды непрерывно кодифференцируемой (и даже дваж- ды непрерывно гипердифференцируемой). 3. Любая кодифференцируемая в точке х функция / такая, что /(я + Л) =/(х) + max [a + (f,A)]+ min [b + (w, A)], [a,v]ed/(x) [b,w]ed/(x)’ (т. e. в (1.1) ox(A) = 0 VA), является дважды кодиф- ференцируемой, причем Р2У(я) = [^2У(я), d2f(x)], где d2/(«) = {[a, v, A] I [a, u] g= df(x), A = 0nXn), <i2/(z) = {[&, w, В] I [ft, w] ^df(x), B = 0„xn). В частности, рассмотренная в § 1 функция /(#)= Ы = = V (х, х) является дважды непрерывно кодифференци- руемой. При этом (см. (1.10)) D*f(x) = [d?f(x), d2f(x)], где d2/(x)={[a, v, Л] I а = (х, v)—f(x), (у, п)<1, Л = 0пХп1, d2/(x)={[0, 0„, 0nXn]}. 4. Пусть / — дважды непрерывно дифференцируемая функция, т. е. / (X + Д) = / (х) + (/' (X), Д) + 4- (/" (*) Д, Д) + о (Д2). Здесь /" (х) — матрица вторых производных функции f в точке х. Очевидно, что f — дважды непрерывно кодиф- ференцируема, причем в качестве D2f можно взять как пару множеств Z?W) = [£W), d2f(x)], где d2y(z)={[0, f(x), f"(x)]}. d2f(x)^{[0, 0n, OnxnP, (6.4)
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 217 так и пару множеств D2f(x) = [d2f(x), d2f(x)], где d2/(rr) = {[0, On, Onxn]}, d2f(x) = {[0, /' (x), f" (x) ]}. (6.5) Таким образом, дважды непрерывно дифференцируе- мая функция является и дважды гиподифференцируемой, и дважды гипердифференцируемой. 5. Пусть / (х) = max <р (х, у), (6.6) y^G где G — компакт некоторого пространства, а функция ф непрерывна на X X G и дважды непрерывно дифферен- цируема по х на X при каждом фиксированном у ^G. Тогда f{x + А) = тахГф(я:, у) + (фх(я, у), А) + yt=G L + 4- (фхх (*, У) А, А) + ох (А2, р)1,; (6.7) & 2 где фх (х, у) — градиент функции ф по х, а фхх (х, у) — матрица вторых производных по х при фиксированном у, °* (Д2. у)_________________________0 Д2 11Д1Н0 Если (6.8) имеет место равномерно по y^G, то fix + А) = ](х) + max la + (v, A) + -|-(ЛА, A) + [a,v,A]ed2f(x) L (6.8) + ох(А2), (6.9) где ср/ (х) = со {[а, у, А] | а = ф (х, у) — / (х), v = фх (х, у), А = ф"х (х, у), y<=G], (6.10) —2 > 0 равномерно по Л е=. $ = {Д е IRn 11| Д || ^1}. а а|о Таким образом, функция (6.6) является дважды не- прерывно кодифференцируемой (даже гиподифференци- руемой) .
218 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 6. Аналогично показывается, что функция / (х) = min ф (х, у), (6.11) yeG где ф и G — такие же, как выше, является дважды не- прерывно кодифференцируемой, причем в качестве D2f(x) можно взять пару множеств D*f(x) = [d2f(x), £2/(я)], где J2/(z)={[0, 0n, 0nX„]}, d2f (x) = co {[b, w, B] | b = ф (x, y) — f (x), w = фх (я, у), в = фхх (я, у), y^G]. Таким образом, функция минимума (6.11) дважды непрерывно гипердифференцируема. 2. Простейшие формулы исчисления вторых кодиф- ференциалов. Покажем, что основные «гладкие» опера- ции сохраняют свойство дважды кодифференцируемости. Пусть ^=[£1,^], Р1=[с2,с2], Cl, CjcR1 X Rn X Rnxn, i = 1, 2. Определим, как обычно, сумму пар множеств и произ- ведение на вещественное число + D* = [С, С], где + C = Ci+.C2, 2 ([XCi, XCJ, если %^0, 1 [ХСх, XCJ, если Х<0. Лемма 6.1. Если функции fa являются дважды непрерывно кодифференцируемыми в точке х^Х, то и функция / = 2 сг/г» г^е Ci е (R1, тоже дважды не- i^I прерывно кодифференцируема в точке.х, причем Р2/(^)= 2с«/>7г(^)- (6.12). Лемма 6.2. Если функции f\ и /2 являются дважды кодифференцируемыми (дважды непрерывно кодифферен- цируемыми) в точке х^ X, то и функция f = f\ • /2 явля- ется дважды кодифференцируемой (дважды непрерывно кодифференцируемой) в точке х.
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 219 Доказательство. Имеем /1 (х + Л) = Л (х) + г[ (Л) + < (А) + ог (А2), /2 (х + А) = /2 (х) + г'г (А) + г2 (А) + о2 (А2), (6-13) где r-(A)=r-(x, А) = max | at + (р{, А) + -i- (ЛА, А)1, [0{,^,А{]Е<(2/г(х) L J r"i = (х, А)= min Гь{ + (u>{) А)+-^-(В{А, А)1, гь{,ю1,В{]е52/|(х) I J г= 1, 2. Положим г{ (А) = r'i (А) + r"i (A), i = 1, 2. Тогда f(x + А) = /,(х + A)/2(x + A) = /i(a:)/2(x) + + /1(ж)г2(Д) + /2(х)г1(Д) + г1(Д)г2(Д) + о(А2). (6.15) Вычисление в (6.15) всех слагаемых, кроме ri(A)r2(A), не представляет трудностей. Найдем Г1(Д)г2(А). Имеем Г1 (А) г2 (А) = ri (A) r2 (А) + r'i (А) г"2 (А) + + гИА)г;(А) + г;(А)г;(А). <e.i6) Для любого 6 > 0 найдется такое R < °°, что для i = l,2 1| = | ai + (р., Д) -|- -L (ЛА, А) | < R У[а},Г{,Л1]ей2/4(я:), IЪ | = | + (Wi, А) + 4 А) | < R V [bj, Wi, B,] s t?/i(x), (6.17) (Л1Д,Д) X Зафиксируем некоторое б > 0. Поскольку Ti (A) r2 (А) = max yi • max у2 = = max |а1 + (^1, А) + (a1,®1,A1jed2y1(x) L X max Гa2 + (y2, A) + [a2,D2,A2Jed2/2(x) I = (max (yi + R) — R) (max (y2 + R) — R) = = max (-ух + Я) max (y2 + R) — R max (yi 4- Я) — — Я max (y2 + Я) + Я2,
220 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ то, учитывая, что (см. (6.17)) уг+ Д>0, у2 + 7?>0, получим r'i (Д) Г2 (Д) = = max [?ГТ2 + + Та)] + min [-Я(ъ + Та)], т. е. Л (Л) г’2 (А) = max (aj.VpAJed’/^x) L |a2,»2,A2]ed2/2(x) л + a2 + (y2’ Д) !--------2~ A) + min p^Ajed^x) max [ata2 + R (ax + a2) + (a2vx+ arv2 + ]ai,»i,A1]ed2/i(x) ]a2,t>2,A2]ed2/2(x) !>i + Rv2, A) + d]A2 + -y c^A-l + Vji>2 + + + А> Д)1 + 0 (А2) + min 1 > J [“rVAileA<x>L [a2,i>2,A2]ed2/2(x) — R(y1 + v2, A) — -j- (R (. — R (ах + а2)— Итак, окончательно получаем: Fj (Д) r2 (Д) = max [a,v>A]ed2(r1,r2) “ a + (у, A) + -у (AA, A)] min [btW.Bjed^rprj) (5Д, Л) +о(Л2)
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 221 где & (г'ъ ri) = = {[a, v, А] | а = аха2 + Z?(ax + а2); р=а2рх + ахр2 + 7?рх + 7?р2, Л = (ах + Л) А2 + (а2 + R) Аг + 2рхр*; I«i, yi, [a2, v2, A2] e= ^/2(x)}, (P (ri, ri) = {[b, w, B]\b = — R(at + a2), «’ = — B(vt + v2), R = -R(Al + A2), [ah pi, ^i]Ed2/i(x), [a2, v2, A2] <=d2f2(x)}. Здесь *— знак транспонирования. Аналогично, используя (6.17), имеем ri (Л) r'i (А) = min [yiyi + R (yi — yi) ] + max [ R (yi — yi) ] = = min IVaj + (pn A) + 4-(A1A, A)Wb2 + (w2, A) + [a^.Ajed2/^*) IA / \ [^2’W2 ’"®2 + “у (^2^» + R (b2 + (iv2, Д) + ~2 (В2Л, A) —ar — — (у1, A) — 4-(Ад, ДЙ] + max [^(«1 +(yn A) + [a^pAJed2/^*) L \ [b2,w2,A2]ed2/2(x) + 4 (4XA, A) - b2 - (u>2, A) - 4 (B2A, A)j] = = max|tf (ax —bx)+ (fl(px —и?х), A)+ 4 (R(Ai~Вг)^ д)] + + min [агЪ2 + (a1w1 + b2vr + R (w2 r- vx), A) + H—g" ((^2^1 + ^i-B2 + 2v^w2 + RR2 — -^^i) A, A)1 + 0 (A2). Итак, r;(A)/2(A) = max I a + (у, A) + -у (ЛА, A) + [a,v,A]Gd2(r1,r2) L J b + (IP, A) + 4 (B\, A)] + 0 (A2), (6.19) min [b,w,B]ed2(r1,r2)
222 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ где & (r'i, г2) = = {[a, v, А] | а = R (аг — b2), v = Rfa—w2), A =R(A1—В2), [ар Л J (.г), [fe2, w2, B2] e= d4 5/., (x)), (^, r'i) = {[ft, w, В] I b = arb2 — — R (a, — &,), iv = a,iv2 + b2v, + R (w2 — vA, В = (b2 - R) A i + (a( + R)B2 + 2viiv2*, [ai, vi, 4i] e d2/i(x), [&2, u>2, Bo]^ d2f2(x)}. Подобным же образом получаем: r'i(A)ri(A) = max „ , la 4- (y, A) + (4A, A) 4- [a,v,A]ed!(r1,r2) L J 4- min [ft 4-(w, A) 4-4-(5A, A)14-o(A2), (6 где & (Hi, = {[alt ъ\, 4] | a = R(a2 — bj, v= R(y2 — wj, A = R (A2 — Bj), [a2, v2, A2] <= cP/2 (x), [blt u\, Bj&Pf^x)}, c? (r'i, ri) = {[&, w, B] | b = a2bi — R (a2 — br), iv = a2wt + &it>2 4- R (w2 — v^, В = (Ьг — R) A2 4- 4" (^2 + R) "b 2^2^!, [a2, v2, 42] <= d72 (x), [blt wv BJ sd2/i (*)}• Наконец, rr (A) r2 (A) = min ух min y2 = = max (yiy'i — R (yi 4- yi)) 4- min (7? (y'i 4- yi)) = = max Га 4- (у, A) 4- (4Д, A)] 4- [a.^iAled^Tx,^) * 4- min [b 4- (w, A) 4- 4-(BA, A)] 4- о (A2), (6.21) [b,w,B]ed2(ri,ri) L -1 где (r'i, r'i) = {[a, v, Л] | a = btb2 — R^y b2\,
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 223 b = (Ь2 — 7?) + (Ь1 — R)w2; А = (Ъ2-— R) Вг + + (&!— R)B2 + 2irx^2» [&n BJ (= d2/! (x), [b2. w2, B2] g= &f2 (я)}, t? (rL rD = {[&, I b = R (br + b2); w = R (ipx + w2), B=R(B1 + B2), [Ь1,7Р1,В1]е^2/1(л:), [b2, w2, B2](=d2f2(x)}. Из (6.15), (6.16), (6.18) — (6.21) окончательно заключа- ем, что при А имеет место представление f(x + А) = f(x) + max Га + (v, А) + -у (ЛА, А) [a,®,A]ed2/(x) L + + min |д + (^,А)+4-(7?Д, А)]+ о(А2), (6.22) [b,w.B]Sd2J(x) I J где D2/ (x) = A (x) D2f2 (x) + A (x) П (x) + P2 (rx, r2), (6.23) D2 [rlt r2] = [d2 (rv r2), d2 (rx> r2)J, d2 (ri, ri) = r’n) + (ri, r2) + d2 (r'i, r2) 4- r2), (ri> rs) = (rn r'z) + (ri. r"z) + (ri, г'г) + & (ri> Л}- Из (6.22) — (6.23) ясно,, что если /i, /2 — дважды непре- рывно кодифференцируемые функции, то и / = /1/2 явля- ется дважды непрерывно кодифференцируемой функцией в точке х. Лемма 6.3. Пусть /1 — дважды кодифференцируемая (дважды непрерывно кодифференцируемая) в точке х функция и /i(rr)¥=O. Тогда и функция f(x) = \ : явля- /х \х/ ется дважды кодифференцируемой (дважды непрерывно кодифференцируемой) функцией в этой точке. Доказательство. Имеем /,(х + А)=./1(х)+г(А) + о(А2), г(Д) = г' + г", а + (у, А) + где г' = max [a.v.Aied2/^*) - 4(ЛД- д)]- г" = min [b.w,B]ed2/1(x) b + (w, A)+ 4 (ДА, A)]-
224 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Поскольку 1 1 1 । 2 2 t / 9\ ттт; = ------га + —а + °(а 2)> то + А) = fi (х + Д) = /(*) - (7^)2 + +°(Д2)- (6.24) Здесь учтено то, что ♦) |r(A) I < LllAll. Рассуждая, как при доказательстве леммы 6.2, из (6.24) получаем для А f(x + А) = / (х) + max Га + (у, А) + -у (ЛА, А)1 + [a,v,A]e?/(x) L -I + min Гг> + (а>, А) + 4(5А> а)] 4-о (А2), (6.25) [b,w,B]ed2/(x) L J где Л2/(т) = [^/(х), ^/(х)] = --(7Л<Х,’ЛМ+ D^r2)=[^r2, a2r2], r')+d2(r', r")+d2(r", r') + d2(r", r"), d2(r2) = d2(r', r^ + d2^', r")+d2(r", r') + d2(r", r"), d2 (r', r') = = {[a, v, Л] | a=a1a2 + T?(a1 + a2), v=a2v1+a1v2+Rvt+Rv2, Л = (®i + R) Л2 + (a2 + R) Лх + 2pxp2, [ax, vv AJ g= d2^ (x), [a2, v2, A2] e (x)}, d2(r', r") = = {[a, v, A] | a=R(ai — bi), v = R(vt~ Wi), A = R(Al-Bl), [ai, vi, Ai]ed2/i(x), [bi, wi, 5|]sd2/i(x)}, ♦) См. доказательство леммы 2.2.
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 225 d2(r", г') = = {[a, v, Л] I a = R(ai — bi), v =<R(vi — Wi), A=R(A1-Bi), [ai, Pi, Ai]^d?ft(x), [bi, wi, d2 (r", r") = = {[a, v, Л] | ~a = b-fi2 -R^A- b2), b = (b2 — R) и>г + + (Ь1 — R) WV A = (b2 — R) B± + (bx — R) B2 + 2W]U%, [bx, wlt Bx] <= d2/! (x), [b2, w2, B2]ge d2/x (x)}, d2(r', rz) = = {[b, ip, В] I b = — R(a,i + a2), ip = — R(yi + p2), B=—R(Al + A2), [ai, vi, 24i]ed2/i(x), [a2, v2, A2]^d?f2(x)}, d? (rz, r") = = {[b, w, В] I b = a1b1 — R (aj — bt), w = + + bjPi + R {wx — v,), В = (bi — B) At + (аг + В) Bi + 2v1Wi; [Др vv A1](^d2fl (x); [bi, 1P1, BJ ge d2/! (x)}, ^(r',rz) = ={[b,w,B] I b=axbi—R{al-b^),w=alw1-\-b1vl+R(w1—v^, В = (bx — В) Лх + (ax + B) Bi + 2v1w1*, [ap Pi, Л1] ge d2/! (x); [bx, w\, BJ e d^fx (я)}, d2(rzz, r") = = {[b, w, В] I b=B(bi + b2), ip = B(ipi + ip2), B = B(Bi + B2), [bi, iPi,Bi]ed2/i(a:), [b2, w2, B2]^32fi(x)}. Здесь число B<°° удовлетворяет, как в (6.17), нера- венствам | а + (р, А) + (ЛА, А) | < В V [а, р, Л] <= d2/! (х), VAe^6. | b + (ip, А) + (ВА, А) | < В V [b, w, В] е ^/х (х),
226 гл. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ Из (6.25) и заключаем, что / является дважды кодиффе- ренцируемой (дважды непрерывно кодифференцируемой функцией) в точке х. Лемма 6.4. Если функции <ръ i^I = 4:7V, дважды (непрерывно) кодифференцируемы в точке х, то ц функ- ции /1 (У) = max Ф1 (У)> /2 (У) = min Ф* (У) iel iei тоже являются дважды (непрерывно) кодифференцируе- мыми функциями в этой точке, при этом = й2Л(х)], £>2/2(х) = Н/2(х), ^(х)], (6.26) где («) = со [(Рфь (х) — 5 (*) + “ »е/\{М +{[фл (х) — f№; 0n; 0nXn]} I k е z), 52/1 (х) = 5 ^Ф1 (Д <*72 (*) = 2 (*)’ iei ” iei б?/2 (х) = со (х) — i ^ф» (х) + + {[фл (х) — fi (х)> О™ °nxn]} I k e Zj. Доказательство проводится дословно так же, как доказательство леммы 2.4. Лемма 6.5. Если функции ф1(я), ..., фт (я) — дваж- ды (непрерывно) кодифференцируемы в точке х$, а функ- ция F(Z)=>F(zi, .. .,zm) дважды (непрерывно) диффе- ренцируема в точке 7° = (ф1(яо), ..фт (xq) ), то функция /(х) = Г(ф1(х), ..., фт(я)) является дважды (непрерыв- но) кодифференцируемой функцией в точке xq. Доказательство. Имеем F(Z° + AZ) = F(zi + bZ1, ...,z°m + Azm) = = F (Z°) + (F'z (Z°), \Z) + 4" (Z°) AZ, AZ) + o((AZ)2), (6.27) ф,(хо + А)=’ф<(яо)+ г<(Д)+ о«((А)2), (6.28)
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 227 1 1 ai + (pi, A) + у (^iAjA) L где Л ё= Rn, AZ = (Azx, ..., Azm) e Rm, r{ (A) = r'i + r'i r'i = max [ai.’’Mi]s±2«’i(«0) r'i = min [ bi + (Wi, A) + -y (-SjA, A)l, [Ь|,и,|,в4]е<г2ф|(х0)1 J Fz (Z°) — градиент функции F в точке Zo, a F’zz (Z°) — матрица вторых производных функции F в точке Z°: \ zmzi * * ’ zmzm/ Из (6.27) и (6.28) имеем /(х0 + А) = F(Z° + AZ) = F (Z°) + + 2 F^i (A) + 2 F''rj (A) rk (A) + о (A2) + о ((AZ)2). i=l Mei: m 3 (6.29) Поскольку (см. (2.8)) |r«(A)| ДИДИ, где Lt<°°, то при Azj = r<(A) + o<(A2) имеем O((AZ)2) = O(A2). (6.30) Из (6.29) и (6.30) имеем f(x0 + A)=f(x0)+ 2f'r,(A) + + 2 FZzftr?(A)rft(A) + o(A2). (6.31) Mei: m J Для любого 6 > 0 найдется R < «> такое, что | а{ + (Vi, А) + -i- (Л|А, А) | < R V [ait vit Л4] е (х0), (6.32) | bi + (w?i, А) + -i- (BjA, А) | < R V [&i, wb e (x0). Неравенства (6.32) имеют место для всех г^1:тп, Де е Зафиксируем некоторое 6 > 0. Рассуждая, как при
228 ГЛ. IV. КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ доказательстве леммы 6.2, получаем при А^«$б /(я0 + А) =/(я0) + тах [a^,A]ed2/(«0) а + (v, Д) + у (ЛА, А) + + min Г& + (w, Д) + 4 (5Д, Д)1 + о (А2), (6.33) [b,w,B]Gd2/(x0) L J где D2j(x0) = [&f(x0), d2/(x0)] = = 2 F'Zi (Z°) D2^(x.) +4 2 F"w (Z°)2)2 tr>’ r*l ’ i=l i,fc(=i: m D2 (g, rft] = [d2 (r}, rk), d2 (rj, rft)], & (ri> rk) = & (r'j, r'k) + d2 (r'j, rk) + d2 (r", r'i) + d2 (r", r*), (ri> rk) = & (r'j, r'k) + d2 (r'j, rh) + d2 (r”, rk) + d2 (г-, r£), (r'j, r^ = = {[a, v, A] a = djdk + R(a} + ah)-, v=dhVj + djVk+R(Vj + vh), A = (a} + R) Ah + (aft 4- R) A} + 2vjVk-, [aj, vjt Aj](= G= d2^ (x0), [aft, vh, A] e d2<pft (x0)}, &(r'j, ri) = {[a, v, 4] I a = R — bh), v = R(Vj — wh), A=R(Aj—Bh), [aj, Vj, Aj] €= d2<p;(x0), [bftl wk, Bft]ed2<pft(x0)}, (r”j, r'h) = ={[a, v, A] I a = R(ah — bj), v = R(yh—Wj), A=R(Ak—Bj), lak, 4^] e jPcpfe(z0), [fej, Wj, Bj} e d2<pj (x0)}, ^(r"j, r"i) = {[a,v,4]| a = bjbh—R(bj + bk), b=*(bk—R)Wj + + (bj — R) Wh, A = (bk — R) Bj + (bj — R) Bk + 2iVjWh, [&;, Wj, Bj] e= &<pj (x0), [6fe, wh, Bft] <= d2<pft (x0)}, (r'j, ri) = {[&, w, 5] I b = — R (aj + dh), w=—R (Vj + vh), B = —R(Aj + Ak), [dj, Vj, 4j] e_d2<p,- (x0), [dh, vh, Ak] e ecPq^Zo)},
§ 6. ДВАЖДЫ КОДИФФЕРЕНЦИРУЕМЫЕ ФУНКЦИИ 229 (G, гл) = {(&, В] I Ь=а5Ьк—R (aj—bk), ю=а^к+Ь^ + + В (wk — yj), В = (Ък — R) Aj + (#j + R) Вк + 2vjWki [ah vh Xj] (=d2<pj (z0), [bhl wh, Bk] (= d2^ (z0)}f d2 (rh r'k) = {lb, w, B] | b = akbj —R(ak — b^ w = (aftzpj + bjVk + R (Wj — vk), В = (b} — R)Ah + + (ak + R) Вj + 2vkWj 9- K, vk, Ak] g= d2(pft (xQ), [&;, ipj, Bj] g= d2^ (*0)h d2 (rh rk) = {[&, w, 5] | b = R (6; + bk), w = R (wj + wk), B=R{B^Bk). [bj.w^B^d2^^), [bk,wh,Bh]^d2^k(xQ)}. f(6.34) Замечание 6.1. В (6.32) вместо константы R мож- но выбрать свое Ri для каждого I. Таким образом, множество дважды кодифференцируе- мых функций (дважды непрерывно кодифференцируемых функций) представляет собой линейное пространство, замкнутое относительно всех «гладких» операций и, что особенно важно, относительно операций взятия поточеч- ных максимума и минимума от конечного числа функций. Можно доказать кодифференцируемость суперпозиции кодифференцируемых функций. Замечание 6.2. Теперь понятно, как следует вве- сти понятие к раз кодифференцируемой функции: / на- зывается к раз кодифференцируемой в точке х, если /(* + Д) =/(ж)+ max ф(Д)+ min ф (Д) + о (|| Д ||1), Ф()ел 1|>(-)ев где ф(Д) и ф(А) — многомерные полиномы (от А) степе- ни к, а А и В — выпуклые компакты таких полиномов. Можно построить и соответствующее исчисление.
ГЛАВА V ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ § 1. Необходимые и достаточные условия экстремума 1. Пусть функция / задана на открытом множестве Xc=[Rn. Рассмотрим для определенности задачу минимизации функции / на множестве й <= X. Наша ближайшая цель — установить необходимые (а по возможности и достаточ- ные) условия, которым должна удовлетворять точка ми- нимума. Эти условия должны быть сравнительно просты- ми и удобными для проверки. Определение. Точка я* Й называется точкой ло- кального минимума функции / на множестве й, если су- ществует такое б > О, что /(*)>/ (я*) ух (= Й П (х*), (1.1) где ^б (я*) = { х е Rn | || я — я* | < б). Если при этом б = «>, то точка х* называется точкой глобального минимума. Ясно, что тогда (1.1) имеет вид /(я)^/(я*) ух ей. (1-2) Точка х* й называется точкой строгого локального минимума функции / на множестве Й, если существует такое б > 0, что /(#)>/(#*) уяе йП (**),. х=£х*. (1.3) Аналогично определяются точки локального и гло- бального максимума. Конечно, (1.1) является одновременно и необходи- мым, и достаточным условием минимума, но это условие неконструктивно и, вообще говоря, непроверяемо. Для получения конструктивных и легко проверяемых условий надо воспользоваться некоторым математическим аппа- ратом. Для этого естественно взять аппроксимацию функ- ции / и работать с ней. Пусть /(# +Д) = ГХ(Д)+о(Д), а х* & й — точка минимума функции / на Й. Будет ли
§ 1. УСЛОВИЯ ЭКСТРЕМУМА 231 тогда Д = 0п точкой минимума функции FX*(A) на мно- жестве йх* = {А <= Rn | х* + Д е Q}. К сожалению, это верно не для всякой аппроксимации. Проиллюстрируем это на следующем простом примере. Пусть f(x)=\x\, Функция FX(A)= Ы — Д2 является аппроксима- цией первого порядка функции / в окрестности точки х^ О?1, ибо /(я) = Ас(Д)+Д2, при этом Д2 = о(Д). Очевид- но, что х* = 0 есть точка минимума / на О?1, но функция /^♦(Д) =—Д2 не достигает минимума в точке Д = 0, по- этому, уже находясь в точке х* ==• 0, мы не сможем с по- мощью аппроксимации (Д) даже заподозрить, что ях- точка минимума. Отсюда ясно, что (по крайней мере с точки зрения проверки необходимых условий) не всякая аппроксима- ция годится для использования. Поэтому естественно привлекать лишь те аппроксимации, с помощью которых можно получить более или менее полную информацию о поведении функции в окрестности рассматриваемой точки. С точки зрения оптимизации нас интересуют аппрок- симации, с помощью которых можно решить следующие задачи: 1. Описать конструктивные необходимые (а по воз- можности и достаточные) условия экстремума. 2. Если эти условия еще не выполнены, то найти «лучшие» точки. Под этим углом мы и будем рассматривать существу- ющие аппроксимации. Необходимые условия, полученные с помощью аппрок- симации Л-го порядка, будем называть необходимыми ус- ловиями Л-порядка. 2. Рассмотрим вначале задачу минимизации / на Rn (т. е. случай Q = Rn}. Лемма 1.1 Пусть функция / дифференцируема по направлениям в точке х* Q. Для того чтобы точка х* была точкой минимума функции f на Rn, необходимо, чтобы f'(x*,b)^0 УДе=Кп. (1.4) Если функция / локально липшицева в окрестности точ- ки х* и оказалось, что f (я*, Д) > 0 УД е (Rn, Д Ф 0п, (1.5) то х* — точка строгого локального минимума / на Rn
232 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ (т. е. условие (1.5)—достаточное условие локального ми- нимума) . Доказательство. Необходимость. Так как функция / дифференцируема в точке я* по направлени- ям, то /(ж* + аА) = /(я*) + а/'(ж*, А) + о (а) VaJ>0, VAeRn где о (а) = о (а, X*, Д), _> о V Д <= Rn. х ' 4 п а а|о Отсюда сразу вытекает (1.4). Достаточность. Пусть функция / липшицева и выполнено условие (1.5). Утверждается, что ж* — точка строгого локального минимума f на Rn. Допустим про- тивное. Тогда для любого бА > О найдется Аа такое, что /(я* + АаК/(я*), HAJI бА. (1.6) Без ограничения общности можем считать, что gk=* = Аа/НАа11—*g. Положим aA=-HAAll. Тогда aAlO, (1.7) f(x* + Aa) - f(x*) = f(x* + aAgA) - f(x*) = « /(x* + akg) - /(x*) + f (s* aAgA) - f(x* + aAg). (1.8) Так как функция f локально липшицева, то 1/(я* + aftgft) —/(я* + aAg) I ^LaAHgA-gll, (1.9) где L<oo — константа Липшица. Из (1.6), (1.8), (1.9) получаем + ahg) — — g|. (1.10) Переходя в (1.10) к пределу при к <» и учитывая (1.7), имеем /' (л?*, g) < 0, что противоречит предположению (1.5). Замечание. 1.1. Аналогично устанавливается, что условие /'(ж**,Л)<0 (1.11) является необходимым условием максимума функции / на iRn, и если / — локально липшицевая функция в
§ 1. УСЛОВИЯ ЭКСТРЕМУМА 233 окрестности точки я**, то условие /' (х**, А) < О VA (= Rn, А 0п (1.12) является достаточным условием локального максимума. Точку я*, удовлетворяющую условию (1.4), будем на- зывать ini-стационарной точкой функции / на (Rn, а точ- ку я**, удовлетворяющую условию (1.11), будем назы- вать snp-стационарной. Напомним, что условия (1.4) —(1.11) являются необ- ходимыми условиями первого порядка. Используя аппрок- симации второго порядка, можно получить более тонкие необходимые условия. Замечание 1.2. Отметим, что в гладком случае (т. е. когда / — дифференцируемая функция) /'(я, А) = = (/'(#), А), где f'{x) — градиент функции / в точке х. Тогда условия (1.4) и (1.11) имеют соответственно вид /'(^J^On или /'(#**) = On, и поэтому случаи (1.5) и (1.12) невозможны, т. е. условия (1.5) и (1.12) имеют место лишь для существенно негладких функций. Замечание 1.3. Лемма 1.1 справедлива и для зада- чи минимизации на множестве й, когда х*: е int й. Определение. Пусть функция / дифференцируема по направлениям в точке S71 и в xq не выполнено необходимое условие минимума (1.4). Если llgoll = 1 и f(xo,go) = inf/'Gw). (1-13) lie ll=i то направление go называется направлением наискорей- шего спуска (н. н. с.) функции f в точке xQ. Если llg°H =• = 1 и /'CW°) = sup f{x^g\ llg||=i то направление g° называется направлением наискорей- шего подъема (н. н. п.) функции f в точке хо. Если функция / локально липшицева, то (см. § 1.3) функция f(xo, g) непрерывна по g, поэтому инфимум в (1.13) и супремум выше достигаются, т. е. н. н. с. и н. н. п. существуют. Замечание 1.4. Выражение «направление спуска функции / в точке хо» является общепринятым, хотя пра- вильнее было бы говорить: «... из точки хо». 3. Перейдем к задаче «условной» минимизации, т. е. к задаче минимизации функции / на множестве й. Как
234 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ и в п. 1, предполагаем, что / задана на открытом множе- стве X cz Rn и что £2 с: X. Лемма 1.2. Пусть функция f локально липшицева в окрестности точки х* и дифференцируема по направлени- ям в точке х* <= £2. Для того, чтобы в точке х* функция f достигала наименьшего на £2 значения, необходимо, чтобы /'(a;*,g)^O yger(tf*), (1.14) где Г (я*) — конус Булигана (см. § 1.1). Если оказалось, что f'(x*>g)>® yge=T (х*), g^0ni (1.15) то х* является точкой строгого локального минимума функции f на £2. Доказательство. Пусть х* — точка минимума / на £2. Допустим, что (1.14) не выполнено. Тогда найдет- ся go Г (х*) такое, что /'(х*, go)=-a<O. (1.16) По определению Г (ж*) существует последовательность xk — х* точек {хА} такая, что xk^Q, gk = -г---*ij“>g0- Поло- ll xh~'x |1 жим -ал = Илл — я*И. Тогда /(*л) =•/(** + (^ - х*)) = / (лг* + ahgh) = = / (х* + а^о) + (аА), (1.17) где q),fe(aft) = /(^* + aAgA)-/(n:* + aftgo). Так (как /—лип- шицевая функция, то l<pA(aA) I ^7xxAllgA —goll. Из (1.16) и (1.17) имеем Ж) = /(**) + aj'(^*, go) +о (aft) + <pA(aA) С <f(x*) + ah(-a + L\\gk - goll) + о (aA). При достаточно малых aA будет / (^») </(**)—4 <1л8) Поскольку то (1.18) противоречит тому, что х* — точка минимума. Достаточность условия (1.15) устанавливается так же, как достаточность условия (1.5) в лемме 1.1 (с учетом того, что получающееся при доказательстве от противного направление принадлежит конусу Г (я*)).
§ 1. УСЛОВИЯ ЭКСТРЕМУМА 235 Определение. Точка я*^£2, в которой выполнено условие (1.14), называется inf-стационарной точкой функ- ции f на множестве £2. Если точка не является inf-стационарной точкой функции / на £2, то направление goe Г (ж*), llgoll = 1, такое, что (^о>^о)= inf 7'CW), Ilell=i,gsr(«o) называется направлением наискорейшего спуска (н. н. с.) функции / на множестве £2 в точке хо- Если функция / липшицева, то /'(#о, g) является непрерывной функцией направления g и потому инфимум выше достигается, сле- довательно, н. н. с. существует. Аналогично формулируются необходимое и достаточ- ное условия максимума и вводятся определения sup-cra- ционарной точки и направления наискорейшего подъема функции / на множестве £2. Замечание 1.5. В лемме 1.2 можно рассмотреть и случай х* с! £2 (ибо если даже £2 ограниченное множест- во, но не является замкнутым, то inf f (х) может и не достигаться). В этом случае Г (я*) определяется как обычно. 4. Пусть теперь / — произвольная липшицевая функ- ция (не обязательно дифференцируемая по направлени- ям), заданная на открытом множестве X czRn. Тогда (см. § 1.3) для любых х^Х и geRn существуют конечные верхняя и нижняя производные Дини /d (я, g) == liin-i- [/(х + ag) — f(x)], Mo а /d (х, g) = lim A [f(x + ag) — f(x)]. Mo При этом f(x + ag) = f(x) + (Х/d (x,g) 4- o(a) ya>0,(1.19) f(x + ag) = f(x) + и/d (x, g) + o(a) ya> 0, (1.20) где о (a) = о (a, g, x), lim —= 0, (1-21) axo “ о (a) = о (a, g, x), lim -=-^- = 0. (1.22) " aTo “
236 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Лемма 1.3. Пусть в точке множество Q до- пускает равномерную коническую аппроксимацию перво- го порядка, а функция f локально липшицева в окрест- ности точки х*. Для того, чтобы в точке х* функция j достигала своего наименьшего на & значения, необходи- мо, чтобы /d (X*, g) > 0 yg <= Г (ж*). (1.23) Если оказалось, что /d («*,£)> о у£€=Г(х*), g#=On, (1.24) то х* является точкой строгого локального минимума функции / на Q. Доказательство. Необходимость. Допустим противное. Тогда найдется goe Г (я*) такое, что = (1.25) Пусть последовательность {aj такова, что Ok 4 О, [/(х* + aftgo) - f (х*)] «л -* Ит [/ (х* + ag0) — / (х*)]. афо Без ограничения общности можно считать, что (см. (1.25)) /(х* + aftg0) —/(х*Х —yafta ук. (1.26) С другой стороны, поскольку £оеГ(я*), а множество Q в точке х* допускает равномерную коническую аппрок- симацию первого порядка, то найдется последователь- ность {хк} такая, что хк Q, lhfc — х* — a*goll = о (<хл). Имеем /(^) = /(** + <Мо) + [f (Хк) - /(х* + aftgo) ]. (1.27) Так как функция / липшицева, то -/(«* + сад) I Ы1х» - X* - a^oll = L • о (<хк). Поэтому из (1.26) и (1.27) получаем /(xft)^/(x*)— —у aaft+L-o(ал). При достаточно больших к будет /(^л)</(^*)—что противоречит тому, что х* — точка минимума функции / на Q (ибо хк^ Q). Достаточность. Пусть выполнено (1.24). Дока- жем, что тогда ж* — точка строго локального минимума
§ 1. УСЛОВИЯ ЭКСТРЕМУМА 237 функции / на Q. Допустим противное. Тогда найдется последовательность точек такая, что xk-+x*. f(xh)<f(x*). (1.28) Без ограничения xk “ общности можно считать, что gk = irr—Ясно, что £о'^Г(я*). Положим ал = — Х II =а|1ял — я*Н. Тогда xh = х* + ahgh. Из (1.28) имеем O^f(Xk) - f(x*) = f(xk) - /(х* + (Zfcgo) + f (x* + ahgo) - /(x*). Отсюда о > 4" [/ (х* + aftgft) — / (х* + aftg0)] + ak + ^-[f(x* + akg0)-f(x^]. (1.29) Так как функция f липшицева, то \f(x* + aftgft) -f(x* + akg0) I < Laftllg* - goll. Отсюда и из (1.29) следует fo(x*, go)^0, что противоре- чит (1.24). Замечание 1.6. При доказательстве достаточности не использовался тот факт, что Q допускает равномерную коническую аппроксимацию в точке х*. Замечание 1.7. Аналогично формулируются необ- ходимые и достаточные условия локального максимума: в предположениях леммы 1.3 необходимое условие ма- ксимума имеет вид rt>(x**,g)^0 V^r(z*), (1.30) а достаточное условие строгого локального максимума таково: /л (х**, g) < О \fg е Г (х*),^=^ 0п/ Точка удовлетворяющая условию (1.23), назы- вается Дини-\п1-стационарной точкой функции f на мно- жестве Q. Если хо Q не является Дини-ш£-стационарной точкой функции / на Q, то направление £о ^Г(я*), llgo'l1=41, для которого /d(«o,^o)= inf «6Г(«О) IKU-1
238 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ называется, по-прежнему, направлением наискорейшего спуска (н. н. с.) функции f на Q. Точка #**eQ, удовлетворяющая условию (1.30), на- зывается Дини-ъщу-стационарной точкой функции / на Q. Если точка не является Дини-вир-стационарной точкой функции f на Q, то направление £о^Г(#о), llg°ll = 1, такое, что /d (я0, g°) = sup (*o> вег(«о) 11^11=1 называется направлением наискорейшего подъема (н. н. п.) функции f на Q. Замечание 1.8. Из изложенного выше следует, что необходимые условия экстремума близки к достаточным условиям локального экстремума. Это свидетельствует о том, что производные по направлениям (или, если они не существуют, то производные Дини) позволяют строить вполне удовлетворительные аппроксимации функций. В § 1.2 отмечалось, что и конические аппроксимации то- же описываются с помощью производных Дини функций, задающих множество Q. Замечание 1.9. Полученные выше условия экстре- мума в приведенном виде неконструктивны. Для их практического использования необходимо уметь вычис- лять производные по направлениям (или производные Дини) и строить конусы Булигана. Это делается для конкретных классов функций и множеств, некоторые из них рассматриваются ниже. § 2. Условия минимума субдифференцируемой функции 1. Пусть функция / задана и субдифференцируема на открытом множестве X cr Rn, т. е. в каждой точке х <= X функция / дифференцируема по направлениям, причем существует выпуклый компакт df(x) cz Rnтакой, что*) /'(z,g) = max (u,g). (2.1) vedy(x) Рассмотрим задачу минимизации функции / на замк- нутом множестве Q cz X. Из леммы 1.2 вытекает ♦) Для упрощения записи в этом параграфе будем писать df вместо df.
§ 2. УСЛОВИЯ МИНИМУМА СУБДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 239 Лемма 2.1. Для того чтобы в точке х* Q функция / достигала своего наименьшего на fi значения, необхо- димо, чтобы max (v,g)^0 у£<еГ(я*). (2.2) v<=d/(x*) Зафиксируем х е fi. Пусть A cz Г(х)— выпуклый замкнутый конус такой, что и пусть %(х)—се- мейство выпуклых конусов таких, что Лс=Г(гг) уЛеЯ(4 U 4=Г(я). (2.3) Ае^(х) Всегда можно найти семейство 91 (х), удовлетворяющее (2.3). Например, можно взять % (х) = [I е Rn 11 = {g = %g011 > 0}, g0 e г (x), || g01| = 1|. Через А* обозначим конус, сопряженный конусу А: A+ = lqeR"|(g,g)>0 ygf=A}. Лемма 2.2. Условие (2.2) эквивалентно условию д/(х*)П4+ #=0 уЯ<=91(х*).. (2.4) Доказательство. Допустим противное. д/(я*)А4+ = 0. Найдем min ||ш — р|| = ||и>0 — р0||= а. wf=A+ v£d/(x*) Очевидно, что в силу (2.5) а > 0. Положим g0 = Из (2.6) имеем max (g0, v) = — а < 0, (2.7) vg3/(x*) (?».?)> ° (2-8) Из (2.8) следует £о^Л++=Л, т. е. £оеГ(я*). Теперь, как и при доказательстве леммы 1.2, находим такие точ- ки что f(xh)</(я*), что противоречит тому, что х* — точка минимума. Следствие 2.1. Если х* intfi, то условие (2.4) имеет вид 0ле=5/(х*). Пусть (2.5) (2-6) wo~vo к-м*
240 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Предположим, что я <= Я не является стационарной точкой функции / на Я. Тогда найдется конус А такой, что df(x)f) А+ = 0. Найдем min ||р — ш|| = ||гл(х) — и>д(х)||= аА(х). (2.10) WEA+ а/(х) Очевидно, что аА(я)>0. Так как А* и df(x)— выпуклые множества, то вектор Va (х) — wA (х) единствен (хотя может существовать це- лое семейство пар точек [уа(гг), wa(x)], удовлетворяю- щих (2.10)). Нетрудно видеть, что направление £а(я) = = „ (wA(а?) — vA(x))—направление спуска функции / аА \х' на Я, т. е. gA (х)е= Г (я) и шах (у, gA (х)) = — аА (х) < 0. t?ea/(x) Найдем sup аА (х) = а (х). (2.11) Ае^(х) Можно показать, что супремум в (2.10) достигается. Пусть он достигается на А (х). Тогда направление g0 (х) =« = —(^а(х)(^)—^а(х)(^)) является направлением наиско- рейшего спуска функции / на множестве Я в точке х. Так как элемент А (х) не обязательно единствен, то и направлений наискорейшего спуска может быть несколько. Замечание 2.1. Если геш1Я, то из (2.9) получа- ем, что направление £М = -йУ|Г’ где || z (х) || = min ЦиЦ, является единственным н. н. с. zedf(x) Таким образом, проверка необходимого условия мини- мума сводится к решению задач математического про- граммирования (2.10). Количество этих задач зависит от количества множеств А в семействе 51 (х). Конечно, мы заинтересованы в том, чтобы их число было как можно меньше. Если, например, Г (я)—выпуклый конус, то в качестве 51 (х) можно взять множество конусов, содержа- щее только конус Г (я). Если конус Г (я) выпуклый (и точка х е Q не является стационарной), то существует единственное направление наискорейшего спуска. Это связано с тем, что в (2.9) норма евклидова, если же
§ 2. УСЛОВИЯ МИНИМУМА СУБДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 241 взять, например, m-норму*. || х\\т = шах] х^ |, где х = iei:n = (я{1), ..., я{п)), то н. н. с. может быть много, но мно- жество направлений наискорейшего спуска является выпуклым. 2. Рассмотрим случай, когда / — гладкая функция. Тогда условие (2.4) эквивалентно условию Л**)^(**), (2.12) где f (х)—градиент функции /-в точке х, a 2? (х) = П А+. Если, в частности, оказалось ^(х*) = {ОД ае^(х) то условие (2.12) имеет вид/'(#*)= 0п. Пример 2.1. Пусть х = (я(1),я(2)) <= R2, х$ =(0, 0), Q = Qi U Й2, где Йх = R+ = {яе О?2 0, я(2) 0}, Й2 = {я = (——а)1 ае[0, 1]}. Очевидно, что (см. рис. 26) Р(х0) = Л1иЛ2, где Лх = R+, Л2 = {я = (— а, — а) | а 0}. Ясно, что = А,, Л* = {же R21 (я, I) >0}, I = (- 1, — 1). Имеем ^(хо) = Л+л^“{(О,О)}. Поэтому, чтобы в точке #о=(О, 0) гладкая функция / достигала наименьшего значения, необходимо, чтобы /' (яо) = 02. . Сравним необходимые . условия (2.4) и (2.12). Они эквивалентны. Таким обра- зом, для гладкой функции проверять точку на экстре- мальность можно и с по- мощью соотношения (2.4), и с помощью соотношения (2.12). Выше уже было по- рис 26 казано, как с помощью (2.4) можно найти направление (или направления, если их много) наискорейшего спуска функции / на Й. Можно ли этоеделатыс помощью условия (2.12), действуя так же, как в случае (2.4) ? Найдем min || v — /' (х) || = |] v (х) — f (х) ve^(x) ~ V (х) — /' (х) Однако направление g = \—тгттг не имеет ни- II»w — / w II чего общего с направлением наискорейшего спуска и во-
242 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ обще может не принадлежать конусу возможных на- правлений. Пример 2.2. Пусть £2.еР2, жо=(О, 0), £2 i2i U £22, где £2Х = {х е R21 х = (ж<1>, 0), х^ е [0,1]}, £22 = {х е О?21 х — (0, жФ), ж<2>е (0,1)}, Ясно, что (см. рис. 27) Г(жо)~Л1 U А2, где Al = {ig R21 х ₽ 0), ж<»> 0}, Ал = {х е IR21 х = (0, ж(2)), х№ 0}. Имеем А+ = {х е R21 (х, Zi) > 0}, Zi = (1, 0), т. е. Л? = {х = (ж<«л жй>) I 3& > 0}, л+ = {х е R21 (ж, Z2) > 0), Z2 = (0,1), т. е. Д+ = = (^(1), д;(2)) | ^2) о}. Тогда 2?(.-r0) = AfftAt = 1Р^ = {ж = (ж<» ж(2>)| ж<У>0, ж<2) > 0). Возьмем функцию f(x)=—ж(1) — ж(2\ Ясно, что /'.(жо) = = (—1, —1), и условие (2.12) не выполнено. Найдем (см. рис. 28) min ||v — /'{ж0)|| = || — /'(®0)11- Направле- »е2’(«0) _ ние g = — //(жо)/И/'(а;о)11 =(1/V2, 1/У2) не принадлежит Рис. 28 Рис. 27
§ 2. УСЛОВИЯ МИНИМУМА СУБДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 243 конусу Г(хо). В то же время, проверяя условие (2.4), найдем min И/'^о) — И-|/'(*о) — р1И> гДе Ух = (0, — 1), min II f (жо) — v || = || /' (х0) — р21|, где v2 = (— 1, 0). Отсюда имеем два направления gl_____»1-и*о) . д(10) g н*о.)_=(о п ё1 к-/'(*o)ii (8* к-т)п ( > } При этом /'(*о, gl)='(f'(xo), gl)=— 1, f(xo, g2)=^(f'(xo), g2) = -l, т. e. оба направления являются н. н. с. С помощью усло- вия (2.12) этого факта нам установить не удалось. Таким образом, не всякое необходимое условие удоб- но не только для проверки того, является ли рассматри- ваемая точка стационарной, но и для нахождения на- правлений наискорейшего спуска. 3. Выше было показано, как с помощью (2.4) найти н. н. с. субдифференцируемой функции / на множестве Q в точке х Q. Это направление g(x) принадлежит кону- су возможных направлений Г (ж). Однако оно может ока- заться недопустимым, т. е. может оказаться, что х + ag(x)t£Q Va>0. Лемма 2.3. Если A cz Rn —выпуклый конус и ШЛ ¥=0, (2.13) В czRn — выпуклый компакт, т, > 0 — произвольное чис- ло, то условие (2.14) эквивалентно условию Qn^co{B\]Tn{A)}, (2.15) где Тц(А) = Rn| i-е [— А+], ||i?|| = r||. Доказательство. Вначале покажем, что из (2.14) следует (2.15). Если имеет место (2.14), то существует такое и, что v е В, v А+, поэтому v\ = е [—А+], где 0 = —2/НрН. Составим выпуклую комбинацию ipa = ар + + (1 — a)Pi e av + (1 — а)0Р = ((1 — Р)а+ Р)р; при
244 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ «о----Т=-р = бУДет = °”- При этом “0е е(0, 1),т.е. Wae(BU7,(4)}. Пусть теперь выполнено (2.15). Тогда найдутся та- кие ае[0, 1], vi В и v2^ Тп(А), что avi+(l — а)п2 = 0п. ‘ (2.16) Вначале покажем, что а ¥= 0. Допустим противное. Тогда V2 = 0„, т. е. 0песо7\(Л). (2.17) По предположению имеет место (2.13). Пусть ipeint.4, т. е. существует г>0 такое, что &T(w)<= А. Пусть sin у = г/ПгрП (случай IIи>11 = 0тривиален). Тогда Г = cone (ip) с А. Так как Г+=>Л+, то 7,(А)сГ,(Г). (2.18) Но из рис. 29 видно, что || VII > т] sin у УгеГ^Г). Отсюда и из (2.18) следует 0п Тп(А), что противоречит (2.17). Итак, в (2.16) а¥=0. Тогда (2.19) Но vi В, a V2 7\(Л), поэтому р = — 1 - а р2 е Л+- Значит, из (2.19) следует (2.14). Замечание 2.2. Условие (2.13) существенно, что видно из следующего примера. Пример 2.3. Пусть х = (я(1>, я<2>) е R2f А = = {х ==(х{1), 0)1 я(1) >0), Тогда (см. рис..30) inf 4 я
§ 2. УСЛОВИЯ МИНИМУМА СУБДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 245 А+ = {v = (v(1), v(2)) I v(1) > 0). Так как 0necoTn(4) Vt)> 0, то условие (2.15) имеет место для любого В Следствие 2.2. Если int 4 =/= 0 V4 <=[% (я*),. (2.20) то условие (2.4) эквивалентно условию 0я е со {df (х*) U М)} V4 е Я (л*). (2.21) Здесь г, > 0 — произвольное (но фиксированное) число. Пусть х -е Q не является стационарной точкой, т. е. условие (2.21) (или, эквивалентно, (2.4)) не выполнено. Для каждого А е §1 (х) найдем min || v || = || vA (х) ||, где VGC(A) с (А) = со {df(x) П (4)}. Пусть max || vA (х) || = || vA(x) (х) ||, АеЖх) Тогда направление gn(x)= — vA(x}(x)/\\vA(x}(x)l\ (2.22) является допустимым направлением спуска, т. е. (у, gn (*)) < — II yA(z) О) II Vw €= df (х), gn(x)^ int4(a:)<= int Г (x). (2-23J В ряде случаев (например, когда Q задается с помощью неравенств) из условия (2.23) следует, что существует ао > 0 такое, что х + ag^ е Q Va е [0, а0]. Поэтому при численном решении задач минимизации условие (2.21) использовать удобнее, чем условие (2.14). Отметим, что если 91 (х) содержит более чем одно множе- ство 4, то направление gn(x) может оказаться неединст- венным. Замечание 2.3. Нетрудно показать, что для gn(x) (см. (2.22)),имеет место утверждение: если (2.24) то g (х)направление наискорейшего спуска функции / на й в точке х. В силу неединственности gn(x) предел в (2.24) тоже может быть неединственным. Замечание 2.4. Пусть Q описывается с помощью неравенств Q = {xeRn| hi(x^Q Vi<= /}, где ht е С1, I = 1 : N. Если же Q, max hi (х)=0 и iei 0nсо{Aj(ж)| (2.25)
246 гл. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ где fe»(x)=O}, то*) Г(х) — выпуклый ко- нус, при этом (Г (я))+= Г+(я) == cone {— h'i(x)\ ie=Q(x)]. (2.26) В этом случае условие (2.21) эквивалентно условию On е= со [{df (х)} и {h-(x) I if=Q (rr)}}. (2.27) Условие (2.25) называется условием Слейтера. Замечание 2.5. Если (см. замечание 2.4) функции / и ht — выпуклые на Rn, и имеет место условие Слейте- ра (2.25), то условие (2.27) является и достаточным. Замечание 2.6. Очевидно, условие (2.14) эквива- лентно условию 0п^[В- Л+]. (2.28) Более того, если (2.14) не выполнено, то при решении задач min ||р —1р|| = ||р0 —ш0|| и min ||z|l = llzoll ге[в—А+] weA+ получаем один и тот же вектор zq = vQ — wq. Аналогично, (2.4) эквивалентно условию 0пе= [д/(ж*)-Я+] VAe?l(?), и для нахождения направлений наискорейшего спуска надо найти max min || z ||. Ае5((хо) ze[d/(x0)-A+] Лемма 2.4. Достаточное условие max (v, g) > 0 Vg е Г (ж*), g =£ 0п, (2.29) ved/(x*) в случае (2.3) эквивалентно условию One=int[d/(z*) —А+] УЛ е= Я (х*). (2.30) *) См, Приложение I,
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИР^ЕМОЙ ФУНКЦИЙ 247 § 3. Условия экстремума квазидифференцируемой функции 1. Случай отсутствия ограничении. Пусть функция / задана и квазидифференцируема на 0?п. Пусть S)f(x) = = [д/(я)? df(x)] — квазидифференцдал функции f в точ- ке х. Из леммы 1.1 и замечания 1.1 следует Теорема 3.1. Для того чтобы функция / достигала в точке х* своего наименьшего на Rn значения, необхо* димо, чтобы —l)f(x*)^df(x*). (3.1J Если _ —3/(ж*)<= int df(x*), (3.2) то точка х* — точка строгого локального минимума функ- ции / на Rn. Для того чтобы функция f достигала в точке х** сво- его наибольшего значения, необходимо, чтобы —df(x**)cdf(x**). (3.3) Условие _ -5/(я**)с int df(x**) (3.4) является достаточным условием строго локального макси- мума функции f на Rn. Доказательство немедленно следует из леммы 1.1 и соотношений (1.11) и (1.12), если учесть, что /' g) = max (v, g) + min (w, g). (3.5) wea/(x) Проведение соответствующих выкладок предоставляется читателю в качестве упражнения. Замечание 3.1. Теорема 3.1 справедлива и для случая оптимизации / на множестве Q cz Rn, если х* int Q. Пусть х Rn не является inf-стационарной точкой функции / на (т. е. условие (2.1) не выполнено). Возьмем w df(x) и вычислим min || v + w\\ = || v (ip) + w\\ = pi (w). vea/(x> Так как df(x) — выпуклый компакт, то v(w)— единствен-
248 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ нал точка. Найдем max Pj(zp) = Р1(^(я)). Точка w(x) не wGdf(x) обязательно определяется однозначно. Так как х не яв- ляется inf-стационарной точкой, то pi(u?(#))>0. На- правление , . = _ V (W (х)) + W (х) „ g. ' .11«’ (“’(«)) + «’(«) II ' является направлением наискорейшего спуска функции /на Rn в точке х. При этом f (х, £1(я)) = —р1(и>(я))« Таких направлений может быть много (и их множество не обязательно выпукло). Пусть теперь х е Rn не является sup-стационарной точкой функции / на (Rn (т. е. (3.3) не имеет места). Возьмем w^df(x) и найдем min \\v + ш|| = |р + u?(u)|| = р2(и) wed/(x) И max p2(v) =p2(v(x)). (3.7) ued/(x) Направление , . _ P (x) + u> (v (x)) _ (x) + u> (l> (x)) g2' ’ II V (x) + w (v (x)) II P2 (»(*)) является направлением наискорейшего подъема функции / на Rn в точке х и при этом f (х, gz(x)) = p2(v(x)). Как и выше, таких направлений может быть много. Пример 3.1. Пусть х = (г<1), ^j))eR2, жо = (О, 0), /(х) = (|ж(1)| — |ж.(2,| + 1) (|х(1)| + 2 |а:<2)| + 1). Найдем ^/(хо). Имеем/(x) = /i(x)/2(x), где /!(«)= |х(1)| - |а:(2>| + 1, /2(х) = + 2 |®(2)| + 1. По правилам вычисления квазидифференциала имеем 0/1 (*o)= [З/i (*о), д/i (я0) ], 0/г (х0) = [df2 (х0), df2 (х0) ], где 5/1(хо)=со{(1, 0), (-1, 0)}, 3/1 (жо) = со {(0, 1), (0,-1)}, dh(x0)= со {(1, 2), (1, -2), (-1, 2), (-1, -2)}, 3/2(х0)= {(0, 0)}.
§ 3. ЭКСТРЕМУМ КВАЗИ ДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 249 Так как по правилам квазидифференциального исчисле- ния (см. § III.2) ^>/(o:) = /2(x)^fi(a:)+/i(x)^/2(a;), а /1(^о) = /г(я:о)= 1, то 3>f (*о) = ^>/1 (*о) + ^>/2(^0) = P/(«o), df(x0) ], где df (я0) =5/1 (х0) + 5/2 (х0) = = со{(2, 2), (2, -2), (0, 2), (0, -2), (-2, 2), (-2, -2)}, 5/(хо)=5/1(а;о)+5/2(хо)=со{(0,.1), (0, -1)}. Из рис. 31 видно, что —5/(i\))c: int5/(a^), т. е. точка xq является inf-стационарной точкой (3.3) не выполнено, при этом су- ществует четыре решения задачи (3.7): i>i(*o) = (2, 2) при И’(Р1(хо))=(О, 1), У2(жо) = (—2, 2) при ш(У2(^о)) = (О, 1), 1>з(*о) = (—2, 2) при w(v3(xo)) = (O, —1), i>4(zo) = (2, —2) при w(vi(xo)) = (0, —1) функции /; условие Рис. 31 и соответственно 4 направления наискорейшего подъема: „ /г ч (*о)) _ <2/ 1Л13 3/1Z13) gl ( о) “ II *1 (*о) (*о)И_" { l V 13’ 3/ V ^W = (-2//i3, 3//13)^ ^з(^о) = (-2//13,-3//13), g4(*0)-(2//l3,-3//i3). При этом скорость наискорейшего подъема /' (#0, gi (я0)) = = /13 Vie 1:4. Замечание 3.2. Условие (3.1) может быть записа- но в виде — w^df (я*) ytw^dj (л:*) или 0n е df (х*) + w У/w^df (ж*).
250 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Отсюда 0n е= n [df (я*) + w] . и (я*). (3.8) wea/(x*) Как и в п. 2 § 2 (см. условие (2.12)), можно пока- зать, что хотя условия (3.1) и (3.8) эквивалентны, одна- ко, если (3.8) не выполнено для некоторой точки х, то с помощью (3.8) не удастся получить, вообще говоря, не только направление наискорейшего спуска, но даже про- сто направление спуска (см. пример 2.2) (может слу- читься, что множество L' (х) пусто). Пример 3.2. Пусть х = (я(1>, э№) <= (R2,_х$ =(0, 0), f(x) = k(1)| — k(2)|. Тогда 3)f(xQ) = [d/(a?o), d/(£o)], где £/(х0)=со{(1, 0), (-1, 0)}, 5/(xo) = co{(0, 1), (0, -1)}. Очевидно, что множество L' (х0) = П [df (xQ) + w\ пу- ^(хо) “ сто. Таким образом, условие (3.8) в точке, не являю- щейся inf-стационарной, не дает никакой информации о поведении функции в точке xq (правда, мы устанавли- ваем, что точка xq не является inf-стационарной, но ни- чего о направлениях спуска мы узнать не можем). 2. Квазидифференцируемые множества и условия оп- тимальности. Множество Q cz Rn называется квазидиффе- ренцируемым, если оно может быть представлено в виде Q= {xe=Rn| ад<0}, (3.9) где h — квазидифференцируемая функция. Возьмем х е Q. Рассмотрим конусы Ti (*) = [g е R” | К (х, g) < 0), Г1(х) = {?еГ| A'(x,g)<0}. Пусть h(x)=0. Говорят (см. § 1.4), что в точке х вы- полнено условие регулярности, если С\^(х)=Г1(х). (3.10) Через Г (я) обозначим, как обычно (см. § 1.1), конус воз- можных направлений множества Q в точке х Q. Выше уже было отмечено (см. § 1.4), что если h(x)<0, то Г(я) = Кп, а если h(x)=0 и выполнено условие регу- лярности (3.10), то (З.И) Г(Я)=Г!(Х).
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 251 Для определенности рассмотрим задачу минимизации квазидифференцируемой на открытом множестве X Q функции / на множестве J2. Пусть х* — точка, подо- зрительная на минимум. Если h(x*)<0 (тогда sintQ), то (см. теорему 3.1 и замечание 3.1) имеет место условие (2.1). Поэтому 'будем изучать случай Л(я*)=0. Теорема 3.2. Пусть функции / и h липшицевы и квазидифференцируемы в некоторой окрестности точки я* е Q и Л(я*)=0. Предположим также, что в точке х* выполнено условие регулярности (3.10). Для того, чтобы функция / достигала в точке х* своего наименьшего на Q значения, необходимо, чтобы (df(x*) + w)(] [-с1(сопе(5Л(х*)+ ш'))]=£0 (3.12) для всех w е df(x*), w' dh(x*). Доказательство. По лемме 1.2 f(z*,g)>0 Vger(?). Из (3.5) и (3.11) min Г max (у + w, g)1^0 V^eTJa:*). (3.13) wGd/(x*) LveS/(x*) J Так как I\ (я*) = fg е Rn | min Г max (v‘ + и/, g)l 01 = I w'f=dh(x*) pedh(x*) J J = U Г iw'l w’&dh(x*) где Tlw/ = fgeRn| max (v, g) 01, to (3.13) экви- 1 ve[dft(x*)+w'] J валентно условию max (v, (3.14) ve[d/(x*)+w] для всех w^df(x*), w' dh(x*). Применяя теперь лемму 2.2, получаем (df (х*) + w) П r+, =/= 0 Vw^df(x*), Vw'e=dh(x*)t Осталось только заметить ♦), что rjo' = — cl (cone (dh (x*) + w')). ♦) См. Приложение I.
252 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Следствие 3.1. Нетрудно видеть, что (3.12) экви- валентно условию _ (3.15) где L (х) = П [df (х) + cl (cone (dh (х) + ip))]. (3.16) Отметим, что L(x)—выпуклое множество. Оно непустое, поскольку ~df(x)^L(x). (3.17) Нетрудно видеть, что условие (1.15) эквивалентно условию _ -df(x*)^ intL(x*). (3.18) Пусть х •е Q, h (х) = 0. Если точка х не является inf-стационарной, то найдем min || z + z' || = ||z (ip, ip') + z' (w, ip')||=d (ip, ip'). zE9/(x)+ir z'ecl(cone(dh(x)+w')) Теперь пусть p (x) = max d (ip, ip') = d (ip0, icQ. w&df(x) w'^dh(x) Так как (3.12) не выполнено (ибо х—не inf-стационар- ная точка), то р(я)> 0. Предложение 3.1. Если Л(х)=0 и выполнено ус- ловие регулярности (3.10), то направление _ = _ % + № (%) go II + w (%) II является направлением наискорейшего спуска функции f на множестве Q в точке х, причем f (*. е») - min /' (*. ?л)---!»« + “’ (’•) I -—р W- Используем теперь условие (3.15). Если х е Q не яв- ляется inf-стационарной точкой, т. е. —df(x)<£ L(x), то найдем направление __ v(x) + w(v(x)) 8 || р М Ш (р (z)) || ’
§ 3. ЭКСТРЕМУМ КВАЗИ ДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 253 где v (х) = arg max р (p)t р (у) = min || v + w || = || v + w (v) ||. veL(x) Однако это направление может не быть допустимым (см. пример 3.5 ниже). Таким образом, и условие (3.12), и условие (3.15) по- зволяют получить направления наискорейшего спуска, если точка еще не является inf-стационарной. Грубо го- воря, эти условия эквивалентны не только в inf-стацио- нарных точках, но и в остальных точках (в том смысле, что мы получаем с их помощью одну и ту же информа- цию о направлениях наискорейшего спуска). Замечание 3.3. Как и в замечании 3.2, можно по- казать, что условие (3.12) эквивалентно условию 0n е f] [df (я*) + w + cl (cone (Oh(x*) + w'))] = L'(x*). wGdftx*) “ w'edh(x*) (3.19) Если точка x e Q не является inf-стационарной (т. e. On L' (x)) и если множество L' (я) непусто, то можно найти min || z || = || z (х) ||. zeL'(x) Однако, направление g(x) = — z(z)/llz(x) II не является, вообще говорящ ие только направлением наискорейшего спуска, но даже и возможным направлением. Как и в примере 3.2, множество L' (х) может оказаться пустым. Замечание 3.4. Положим для х е Q, wr ^dh{x) A(w\ х)= — cl (cone (дЛ (я) + w')). Если int Л (и/, #)=/= 0, то (см. лемму 2.3 и замечание 2.3) можно показать, что условие • (d/(z*)+и;) А Л (и/, z)=# 0, где и?ед/(я*), эквивалентно условию 0п е со {(д/(я*)+ ir)U (dh(x*) + и/)} й(я*, п?, w'). (3.20) Очевидно, имеет место следующая
254 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Лемма 3.1. Если для всех w' е 5Л(я*) будет int(cone(d/&(z*) + 0, (3.21) то условие (3.12) эквивалентно условию Опе8(л*,ю,о/) Vired/(a;*), У/w’^~dh(x*\ (3.22) Напомним, что здесь, как и выше, рассматривается случай Л(я*)= 0. Пусть для точки х е Q такой, что й(я)=0, и для всех w' ^dh(x) выполнено (3.21). Найдем min || 21) = || z (х, w, w') || zeft(x,w»w') И max || z (я, w, w') || = || z (.г, w (х), wf (х)) Ц. (3.23) wedj(x) w'eWx) Тогда направление 0 = _ (х)) /о 24к IIz (#, W (z), w’ (х)) || ' ’ ' является направлением спуска функции / на й в точке О 1 2~ 3 *Я(1) -1 Рис. 32 X) и при этом это направление допустимое, т. е. при до- статочно малых а > 0 будет [х + <xg {х) ] •<= £2. Замечание^ 3.5. Условие (3.22) удобно проверять в случае, когда df(x) и dh(x) представляют собой выпук- лые оболочки конечного числа точек. Тогда надо прове- рить (3.22) лишь для w, w', являющихся вершинами df(x) и dh(x) соответственно. Замечание 3.6. Условие (3.21) выполнено, напри- мер, если int3ft(j:*)^0. (3.25)
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУ ЕМОЙ ФУНКЦИИ 255 Но (3.21) может быть выполнено и тогда, когда (3.25) не имеет места. Пример 3.3. Пусть х = х(2)) s О?2, жо = (0, 0), 7г(х)= —|х(|>| + 2х(1) + 1х<2)|. Имеем S>h(xo) = [dh(xo), dh(xo)], где (см. рис. 32) dh(xo) = co{(0, 1), (0, -1)}, dfe(xo)=co{(l, 0), (3, 0)}. Очевидно, что (3.21) выполнено. На рис. 33 изображены конусы сопе(дЛ(а:о) + (1, 0)), соне(5Л(;Го)+(2, 0)), cone(dfe(xo) + (3, 0)). Рис. 33 Рис. 34 Пример 3.4. Пусть снова x=(xW, ^2>)sR2, х0=(0, 0), h(x) = — |х(1,| + |х<2)|. Имеем S)h(xo) = [ЗЛ(хо), <?/г(хо)], где (см. рис. 34) 5Л(х0)=со{(0, 1), (0, -1)}, дХ(х0)=со{(-1, 0),(1, 0)}. Ясно, что при wo =(0, 0)^ Oh(xo) будет cone (dh (х0) + w0) = {х = (0, х(2)) | я^2) е О?1} sss Р. Так как intP = 0, то условие (3.21) не выполнено. Обсудим подробнее условие (3.22). Предварительно докажем следующие леммы. Лемма 3.2. Пусть A cz Rn, В с IRn — выпуклые множества. Если 0„ е со {(Л + iPi)U В}, Опе=со{(Л + и>2)и Д), (3.26)
256 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ то для любого а [О, 1] будет Оя е со {(Л + Ша) и В}, (3.27) где Wa = aw\ +(1 — ос) w2. Доказательство. Из (3.26) следует, что сущест- вуют oci^[0, 1], a2^[0, 1] и ai, а2еЛ; Ь2^В та- кие, что ai(ai + Ш1) + (1 - ai)6i = 0п, (3.28) <х2(а2 + ш2) + (1 — а2)Ь2 = 0п. (3.29) Рассмотрим более сложный случай a^(0, 1), ai е(0, 1), a2^(0, 1) (если одно или несколько из чисел a, он, ос2 равны 0 или 1, то доказательство разве лишь упро- щается). Умножая (3.28) на 71, а (3.29)—на у2 и складывая полученные равенства, получим (aiYiai + a2y2a2) + (aiYiw;i + oc272w2) + + (1 — ai) y 1 &i + (1 — oc2) 72&2 = 0n. (3.30) Постараемся подобрать P e [0, 1], Pre[0, 1], 71 и ^2 так, чтобы (3.30) имело вид ₽(aa + ipa) + (l - a) (Mi +(1 - Ш = On. (3.31) Здесь аа = ocai + (1 — oc)a2. Приравнивая в (3.30) и (3.31) коэффициенты при ai, a2, bi, &2, w\ и ip2, имеем равенства aiYi = оф, (1 — ai)7i =(1 — Мь a2Tf2 =(1 — oc)[J, (1 — ос2)у2 =(1 — [}) (1 — ₽i). Решая эту нелинейную систему 4 уравнений с 4 неиз- вестными, получим □_________(^а1)аа2______ P1 “ ai) aa2 + (! - a2) (1 “ a) ai’ Y1 = A ?2.ILz^, n 04 a2 aiPi (l-aja + a^/ ₽ = Очевидно, что fJe(O, 1), [Ji s(0, 1). Таким образом, найдены {J, 0i, 71, 72, удовлетворяю- щие (3.31), а это и значит, что имеет место (3.27). * Следствие 3.2. Если 0п е со {(4 + w) (J В} С, (3.32)
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУ ЕМОЙ ФУНКЦИИ 257 где С — множество всех крайних точек* *) выпуклого мно- жества С, то 0п е со {(Л + iv) (J В} Vip е С. (3.33) Здесь, как и в лемме 3.2, А, В cz!Rn — выпуклые множества. Лемма 3.3. Пусть 4, В cRn— выпуклые множест- ва. Если 0п <= со {(Л + iv) U (В + w')} Viv е С, w' е В, (3.34) где С и D — множества всех крайних точек соответствен- но выпуклых множеств С и D, то 0п е со {(4 + iv) U (В + iz/)} Vip е С, iv' е D. (3.35) Доказательство. Зафиксируем любое w'^D. По лемме 3.2 0пе со {(4 + w) (J (В + w')} У/w^C. (3.36) (3.36) имеет место для любого w' ^D. Фиксируя теперь w е С и применяя лемму 3.2 (где теперь роль 4 играет В, а роль В — множество 4 + ip), получим, что 0п е со {(4 + w) U (В + и/)} Xfiv'^D. (3.37) Лемма доказана, ибо (3.37) справедливо для всех w^C. Следствие 3.3. Таким образом, условие (3.22) до- статочно проверять лишь для крайних точек множеств 5/(х*) и dh(x*). Эта процедура особенно упрощается, если df(x*) и dh(x*)— многогранники. Тогда (3.22) на- до проверить лишь для вершин этих многогранников. Аналогично можно показать, что и условие (3.12) до- статочно проверить лишь для крайних точек множеств df(x*) и dh(x*). 3. Получим еще одно полезное условие минимума. По-прежнему предполагаем, что Q задано (3.9). Теорема 3.3. Пусть x*^Q и h(x*)=Q. Предполо- жим, что функции / и h квазидифференцируемы на 0?п. Для того чтобы в точке х* функция / достигала своего наименьшего на Q значения, необходимо, чтобы L{{x*)^L2{x*), (3.38) *) Точка х называется крайней точкой выпуклого множест- ва С, если не существует таких у, z^C, as (0, 1), что ху, х z, х = ay + (1 — a)z.
258 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ где Lx (х) = - [df(x)+lh (х) ], (3.39) L2(x)= со {df(x)— dh(x), dh(x)— df(x)}. (3.40) Доказательство. Пусть /♦ = / (х*) = min / (х), xeQ h(x*) = 0. Рассмотрим функцию F(x)= max {f(x*)— f*, h (x)}. Ясно, что F (x) 0 Vze Rn. Поскольку F(x*) = 0, то точка x* — точка минимума функции F на Rn. По теореме 3.1 должно быть выполнено условие —dF(x*)czdF(x^), (3.41) Вычисляя квазидифференциал функции F по форму- ле квазидифференциального ^исчисления (см. § III.2), получаем &F (х*) — [dF (х*), 5F(x*)], где 5F(x*)= со {df(x*) — 7)h(x*), dh(x*)--df(x*)}, (3.42) dF (я*) = df (х*) + dh (я*). (3.43) Отсюда и из (3.41) и вытекает (3.38). Теорема 3.4. Если Л(я*)=0 и оказалось, что Li(z*)cintL2(**), (3.44) где L\(x) и Lz(x) заданы соотношениями (3.39) и (3.40), то точка х* является точкой строгого локального мини- мума функции f на множестве Й, т. е. условие (3.44) — достаточное условие строгого локального минимума. Доказательство следует из (3.2) и соотношений (3.10), (3.42), (3.43). Теорема 3.5. Пусть h(x*)=0. Предположим, что в точке х* выполнено условие регулярности (3.10). Тогда условие (3.38) эквивалентно условию f (**, g) > 0 Vg Г (ж*), (3.45) где Г(х*)—конус возможных направлений множества й в точке х*. Доказательство. Пусть выполнено (3.38). Тогда max (v, g) max (v, g) Vg e Rn, pgL^x*) veL2(x*) t. e. max (v, g) max _ (v, g) Vg Rn. (3.46) [а/+ал] ®есо{э/—ал.ал—a/]
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 259 Здесь для сокращения записи обозначено df = df(x*)i dh = dh(x*) и т. д. Из (3.46) шах (— гр — g) wea/ w'^dh < max (a (у — w') + (1 — a) (y' — w), g) Vg <= (Rn. ae[o,i]^ red/, we 9/ v'edft,w'ed/i Так как все указанные множества друг от друга не зави- сят, то max (— гр, g) + max (— гр', g) w^df w'Gdh max Г a max (у, g) + (1 — a) max (— wt g) + ae[o,l] L vedf + (1 — a) max (i/, g) + a max (— w’, g)l Vg e Rn. (3.47) w'eaft J Ho max (— w, g) = — min (w, g), поэтому из (3.47) имеем icEA we a 0 max Га fmax (p, g) + min (гр, g)\ + ae[o,i] L \vGdf ^-Qf ) + (1 — a) flmax (p', g) + min (гр', g)\l Vg e Rne (3.48) \v't=dh w'^dh Ji Если g^T(^*), to h'(x*, g)^0. Поэтому max a (max (p, g) + min (гр, g)\ ^5 0 Vg^T(x*). ae[o,i] \v<=df w^qj J Отсюда f g) = max (p, g) + min (ip, g) > 0 VgG Г (z*). (3.49) v(=<y wed/ Действительно, если бы оказалось f'(x*, g)=—а<0, то в силу того, что имеет место (3.10) и (3.11), найдется g'^4i(x), достаточно близкое к g и такое, что /' (х*, g')^ при этом h' (я*, g')= — Ъ < 0. Поэтому max [а/' (я*, g') + (1 — а) К (я*, g')] = ае[о,1] = max {/' (я*, g'), h’ (ж*, g')} max |— б} < 0, что противоречит (3.48). Тем самым (3.49) установлено, т. е. имеет место (3.45).
260 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Пусть теперь выполнено (3.45). Допустим, что при этом (3.38) не имеет места, т. е. найдется такое ze£i(j;*), что z^Z^#*). По теореме отделимости най- дутся g е (Rn и а > 0 такие, что (z, g) > (z, g) + a Vz^L2 (x*). (3.50) Из (3.39), (3.40), (3.50) имеем для z=w + w', где w 5/, w' Sfe, — (w + w', g) >(a (y — wr) + (1 — a) (v' —w)$ g) + a Vae[0, 1], df, w^df, v’^dh, wf ^dh. Тем более это верно при w = w, w' = w', т. e. a (y + iv, g) + (1 — a) (y' + iv', g) — a Vae [0, 1], v^df, v'^dh. (3.51) При a = 1 из (3.51) получаем (у + w, g) — a Vye df, t. e. max (y, g) + (iy, g) — а. Тем более max (у, g) + V^df v^df + min(ty, g)=C — a, t. e. we'd/ /'(я*, g)^-a. (3.52) При a = 0 из (3.51) получаем (у' + и/, g) a Vy'e dh. Как и выше, отсюда h'(x*, g)^—a, (3.53) т. е. £ <=Г1(я*). Но (3.52) противоречит (3.45). Полу- ченное противоречие и завершает доказательство. Замечание 3.7. Условие (3.38) получено без пред- положения об условии регулярности в точке х*. Замечание 3.8. Пусть Q, Л(я)=0. Предполо- жим, что условие (3.38) не имеет места. Найдем d (х) = max р (у) = р (у (х)), (3.54) veL^x) где р (у) = "min || у — w || = || у — w (у) ||. (3.55) wGL2(x) Так как условие (3.38) не выполняется, то р(у(я))>0. Множества L\(x) и L2(x)—выпуклые, поэтому для
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУ ЕМОЙ ФУНКЦИИ 261 каждого v^Li(x) существует единственная точка w(v), удовлетворяющая (3.55) (напомним, что у нас евклидова норма), но p(ip), удовлетворяющее (3.54), уже не обяза- тельно единственно. Предложение 3.2. Направление v(x)-w(v(x)) ,356 является направлением спуска функции f на множестве Q в точке х. Доказательство дословно повторяет доказатель- ство второй части теоремы 3.5. Замечание 3.9. Направление (3.56) не обязатель- но единственно. Отметим, что множество Q можно записать и так Q = {^eRn| Ап(я)^0}, где hr](x)= K]h(x), ц > 0. Поэтому из (3.38) получаем такое необходимое условие минимума: Zzin(^)c=L2n(^), (3.57) где L^(x) = — [д/(я) + цдЛ (х) ], со {d/(x)— T\dh(x), T\dh(x) — df(x)}. Если h(x)=0, а точка х не удовлетворяет еще условию (3.57), то можно построить направление спуска gn{x) (по формулам, аналогичным (3.54) — (3.56)). Можно так- же показать, что если то go — направление наискорейшего спуска функции / на множестве Q. При этом для любого ц > 0 направление £л(я) является допустимым, т. е. при достаточно малых а > 0 будет х + agn(#)'e Q- Замечание 3.10. Все описанные выше условия имеют место независимо от того, какие взять квазидиф- ференциалы функций / и h (ведь квазидифференциал определяется неединственным образом). Конечно, с вы- числительной точки зрения лучше взять наиболее про- стые в каком-то смысле квазидифференциалы. 4. Рассмотрим несколько иллюстративных примеров применения полученных выше результатов.
262 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Пример 3.5. Пусть х = (л^), е R2, х0 = (О, О), А(д;) = |^(1)|—1|я(2)|, й = {лей2| Л(^)<0}. Множе- ство Й изображено на рис. 35. Ясно, что хо^Й, S)h(xo) — = [д/Цяо), dh(xo)], где 5А(х0)=со{(1, 0), (-1, 0)}, дА(яо)= со {(0, 1/2), (0, -1/2)}. Нетрудно видеть, что в точке xq -е й выполнено условие регулярности (3.10). Рис. 35 Рис. 36 Рассмотрим функцию /(#) = — к(1)1 + 1я(2)1 — #(1). Имеем (по правилам квазидифференциального ис- числения) _ S>/(xo) = [5/(rro), 5/(х0)], где 5/(*о) = со{(-1, 1), (-1, — 1)}, 5/(х0)=со{(1, 0), (-1, 0)}. Проверим выполнение условия минимума (3.12) в точке xq. Как уже отмечалось (см. следствие 3.3), надо прове- рить (3.12) лишь для крайних точек множеств д/(#о) и dh(xQ). Положим н>1=(1, 0), u>2e(—1, 0), ыг =(0,1/2), п?2 = (0, — 1/2). Имеем А = Ш) + u;, = со{(— 1, 1), (- 1, - 1)}+ (1, 0) = = со {(0,1), (0,-1)},
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 263 А2 = df(x0) + u>2 = со{(— 1, 1), (- 1, - 1)} + (- 1, 0) = = со {(-2, 1), (- 2,-1)},. В1 = dh (х0) + w[ = со{(1, 0), (- 1, 0)} + (0, 1/2) = = со{(1, 1/2), (-1, 1/2)},. В2 = dh{x0) + w2 = со{(1, 0), (- 1, 0)} + (0, - 1/2) = = со{1, - 1/2), (-1, - 1/2)},. = — cl (cone С2 = — cl (cone В2). Из рис. 36 и 37 ясно, что At П 0 V i, j = 1, 2, т. е. ус- ловие (3.12) выполнено. Проверим условие (3.15). Имеем (см. (3.16)) В (х0) = p/(z0) - Cj] Л (£/(хо) - С2]. Из рис. 38 видно, что L(xo) — со {(1, 0), (—3, 0), (—1, 1), (—1, —1)}. Ясно, что —д/(хо)= со {(—1, 0), (1, O)}<=Z(xo), т. е. условие (3.15) также выполнено. Рис. 37 ' Рис. 38 Проверим теперь условие (3.22). Имеем 2Х = 8 (х0, wv w'j) = со {df (х0) + wlt dh (х0) + = = со {4V Вг} = со{(0, 1), (0, - 1), (1, 1/2), (- 1, 1/2)}, 82 = 8 (х0, wv w'2) = со{Лх, В2} = = со{(0, 1), (0, - 1), (1, - 1/2), (- 1, - 1/2)}, е8 = 2 («О’ “>2’ w'l) = С0 {Л2’ В1) = = со{(— 2, 1), (- 2, - 1), (1, 1/2), (- 1, 1/2)}, 84 = 8 (х0, w2, w2) = со {А2, В2} = = со {(— 2, 1), (- 2, - 1), (1, - 1/2), (-1, - 1/2)}.
264 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Из рис. 39 и 40 видно, что 02 е i = 1, 4, т. е. условие (3.22) выполнено. Проверим теперь условие (3.38). Имеем £t(^o)= — [d/(z0) + 5/Ц.го)] = = -[со|{(1, 0), (-1, 0)} + со {(0, 1/2), (0,-1/2)}] = = -со{(1, 1/2), (-1, 1/2), (1, -1/2), (-1, -1/2)} = = со{(-1, -1/2), (1, -1/2), (-1, 1/2), (1, 1/2)1, 5/(х0)— dh(xo) = = со{(-1, 1), (-1, -1)}-со{(0, 1/2), (0, -1/2)} = = со{(-1, 3/2), (-1, 1/2), (-1, — 1/2), (-1, -3/2)}, dh(x0) — df(i0) = = со{(1, 0), (-1, 0)} — со {(1, 0), (-1, 0)} = = со{(2, 0), (0, 0), (-2, 0), (0, 0)} = = со{(0, 0), (2, 0), (-2, 0)}, L2(хо) = со {5/(хо) — dh(xo), dh(xo) — df(xo)) = = со{(-1, 3/2), (-1, 1/2)? (-1, -1/2), (-1, -3/2), (0, 0), (2, 0), (-2, 0)}. Из рис. 41 ясно, что L\ (xq)<=. L2(xo), т. е. условие (3.38) также выполнено. Наконец, построим множество L'(xo) (см. (3.19)): L'(х0)=(41 - СО П (41 - С2)П (42 - Ci) Л (42 - С2). Имеем Р1=(41-С1)Л(41-С2) = = со{(2, 0), (-2, 0), (0, 1), (0, -1)},
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 265 Р2=(Л2-С1)П(Л2-С2) = = со{(—4, 0), (0, 0), (-2, 1), (-2, -1)}. Отсюда L'(xo) = Pi ПР2 = со{(-2, 0), (0, 0), (-1, 1/2), (—1, —1/2)), т. е. (см. рис. 42) О2 е£'(хо), т. е. условие (3.19) тоже выполнено. Пример 3.6. Пусть Q — множество, рассмотренное в примере 3.5. Возьмем 1ж(1)1 — 1хг(2)[ — 2х(1), хо = = (0, 0)'е Q. Тогда 5/(а:о)= со {(—3, 0), (-1, 0)}, д/(ж0) = со{(0, 1), (0, -1)}. Проверим, выполняется ли условие (3.12). Достаточно проверить (3.12) лишь для крайних точек множеств df(x0), dh(xo). Положим ipi=(0, 1), wz = (0, —1); u>x = = (011/2),^ = (0,-1/2), Al=df(x0)+wl = co{(-3, 1), (-1, 1)},
266 ГЛ- V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ = df (х0) + и>2 = со {(- 3, — 1), (— 1, — 1)}, — dh(x0) + u’i = со{(1,1/2), (—1, 1/2)}, B2 = dh(r0) + w2 = со{(1, — 1/2), (— 1, — 1/2)}, Cx = cone Bu C2 = — cone B2. Из рис. 43 ясно, что Ai П С\ = 0, Ai Л С2 0, Аг Л С\ & ¥= 0, Аг Л Сг = 0. Найдем max min || v — ip || = min || рх — w Ц = || — и?х ||, t>eAx weCj- wecx max min || v — w|| = min|| v2 — w|| = || v2 — w2||s VGA2 wEiC^ где pi=(-1, 1), ^=(-2/5,-1/5), p2=(—1, —1), w2 =(—2/5, 1/5). Имеем _ ||P1 _ Ш1|| = II (-3/5, 6/5)11 = 3 У5/5, IIv2 - ip2II = 'I (-3/5, -6/5)11 = 3 V5/5. Значит, существует два направления наискорейшего спуска _ _ _ _ gi =(1/V5, -2/V5), g2 =(1 /V5, 2/V5), (3.58) при этом скорость наискорейшего спуска /'(*0, gi) = f(xo, £2)=НУ1 —Will = llt>2 —W2II = —3 V5/5. Проверим условие (3.15). Имеем L(x0) = (df(x0)-СОЛ^Дяо)- С2).
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУ ЕМОЙ ФУНКЦИИ 267 Из рис. 44 ясно, что L(xq)= со {(—3, 0), (—1, 0)}. шая задачу min ||i> —w||-> max f получим wGL(x0) рис. 44) два ^направления =(/2/2, -/2/2). Ре- (см. max gi = (/2/2, /2/2), g2 = Однако ни одно из этих направле- ний не является допустимым направлением (они даже не принадлежат Г(хо)). Проверим теперь условие (3.22). Имеем Si = 8 (х0, wv w'i) = со {df (х0) + wv dh (х0) + u^} = = со {Л, В,} = со {(— 3, 1), (- 1,1), (1, 1/2), (- 1, 1/2)}; 82 = 8 (х0, wt, w2) = со {Лп .В2} = = со{(- 3, 1), (- 1, 1), (1, - 1/2) (- 1, - 1/2)}, 8Я = 8 (х0, w2, w'j) = со {Л2, = = со {(— 3, -1), (- 1, - 1), (1, 1/2), (- 1, 1/2)}, 84 = 8 (х0, w2, w2) = со {А2, В2} = =со{(— 3, - 1), (- 1, - 1), (1, - 1/2), (- 1, - 1/2)}. Из рис. 45 и 46 ясно, что 02^Й2, 02 ^ &з, но 02^8i, 02^84. Из рис. 45 получаем два направления спуска gi = (0, 1), g2 = (0, — 1). Нетрудно вычислить, что /'(*0, ^i) = /,(^o, g2)= — 1. При этом gi е int Г (хо), g2 е int Г (хо) • Ранее мы уже нашли направления наискорейшего спуска (см. (3.58)) и скорость наискорейшего спу- ска —3/V5.
268 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Обратимся к условиям (3.38). Имеем Li(x0)= — [d/(zo)+ dh(xo)] — = —[со{(0, 1), (0, -1)} + со {(0, 1/2), (0, -1/2)}] = = со{(0, 3/2), (0, -1/2), (О, 1/2), (0, -3/2)} = = со{(0, -3/2), (0, 3/2)}, Qi = df(xo)— dh(xo) = = со{(—3, 0), (-1, 0)}- co {(0, 1/2), (0,-1/2)} = = co{(-3, -1/2), (-3, 1/2), (-1, -1/2), (-1, 1/2)}, Qi = dh (xq) — df(xQ) = = co{(l, 0), (-1, 0)} —co{(0, 1), (0, -1)} = = co{(l, 1), (1, -1), (-1, 1), (-1, -1)}, ^2(^0)= co {<>1, Qi} = = co{(—3, -1/2), (-3, 1/2), (-1, -1/2), (-1, 1/2), (1, 1), (1, -1), (-1, 1), (-1, -1)}. Из рис. 47 ясно, что L\(xo)<£- L2(xq). Найдем max min || z — z' || = min || z0 — z' || = zeLi(xo) 2'еЧ*о) 2'6I-2(«o) (3.59) Очевидно, что существует две точки zo, удовлетворяющие (3.59): zo=(O, 3/2) (ему соответствует z'(zo) = (O, 1)) и Рис. 45 zo=(O, —3/2) (c z'(zo) = (O, —1)). Отсюда находим два направления спуска g"i = (0, 1) и g2 = (0, — 1) (совпада- ющие с найденными выше направлениями gi и g2, полу- ченными с помощью условия (3.22)). Замечание 3.10. Предоставляем читателю прове- рить, случайно ли это совпадение.
§ 3. ЭКСТРЕМУМ КВАЗИДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 269 Наконец, проверим условие (3.19) . Построим £'(хо) = (Л! - СОП (Л! - С2)П(Л2 - С0П(Л2 - С2)\ Так как (Л1 — С1)П(Л1 — С2) = Ац (Л2 — Ci) Л (Л2 — С2)== = Л2 (см. рис. 48), а множества Л1 и Л2 не пере- секаются, то L'(xo)=0. Таким образом, необ- ходимое условие (3.19) не выполнено, но больше никакой информации мы извлечь не можем. | Итак, с помощью всех рассмотренных условий мы нашли, что точка Zo не является стационар- ной. Условие (3.12) по- зволило найти все направления наискорейшего спус- ка, а с помощью условий (3.22) и (3.38) были най- дены допустимые направления спуска, которые ведут внутрь множества Q; условие (3.19) лишь «просигнали- ло» о том, что точка %о не является стационарной, а ус- ловие (3.15), кроме того, привело к направлению, кото- рое не является даже возможным. Поэтому этим услови- ем надо пользоваться с осторожностью. Практически можно рекомендовать условия (3.12) (для нахождения н. н. с.) и (3.22) и (3.38) (для нахождения допустимых направлений спуска).
270 гл. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ § 4. Условия минимума гиподифференцируемой функции 1. Пусть функция / задана и непрерывно кодифферен- цируема на открытом множестве X cz Rn, а множество £2 задано соотношением Q= Uf=R”| ад<0), (4.1) где h — непрерывно кодифференцируемая на X функция, Так как всякая кодифференцируемая функция явля- ется квазидифференцируемой, то справедливы все резуль- таты пп. 2—3 § 3. Если точка не является inf-ста- ционарной, то полученные с помощью условий (3.12), (3.22), (3.38) направления наискорейшего спуска и до- пустимые направления являются, вообще говоря, разрыв- ными (как функции х). Использование кодифференциа- лов в случае непрерывно кодифференцируемых функций У и Л позволяет получать направления спуска, непре- рывно зависящие от х. Покажем это для непрерывно гиподифференцируемых функций / и h. Итак, пусть функции / и h являются липшицевыми и непрерывно гиподифференцируемыми на X, т. е. У (х + А) = / (я) + max [а + (р, А)] + (А), (4.2) [a,v]ed/(x) \h (х + А) = h (х) + max [а' + (/, А)] + о2 (А), (4.3) £ [a',v']edA(x) где ————► 0, i = 1, 2, df(x), dh(x) cz Rn+1 — компак- ос а | о ты, причем отображения df и dh непрерывны (в метрике Хаусдорфа) на X. Из (4.2) и (4.3) следует max а = max а' = 0. (4.4) [a,®]Gd/(x) [a',v']edh(x) Отметим, что функции f и h тогда являются субдиффе- ренцируемыми, т. е. / {х + ag) = / (х) + a max (v, g) + ох (a), w=a/(x) h (x + ag) = h (x) + a max (1/, g) + o2 (a), ®'еОЛ(х) где 5/(я) и d/s(r)cRn— выпуклые компакты (субдиф-
§ 4. МИНИМУМ ГИПОДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 271 ференциалы функций / и h соответственно), причем df (х) = [v е Rn | [0, v] е df (х))г dh (х) = [i/ е Rn | [0, v'J е dh (я)). Теорема 4.1. Для того чтобы в точке я* Q функ- ция f бостигала своего наименьшего на Q значения, не- обходимо, чтобы On+ieсо{df(x*), dh(x*) + [h(x), On]} = L(x*). (4.5) Доказательство. Предположим, что х* — точка минимума, но (4.5) не имеет места. Тогда по теореме от- делимости найдутся число у > 0 и вектор g = [6, g] е = Rn+1 (где SeR1, geRn) такиег что (Р1 i)< — Y L(x*). (4.6) При этом можно выбрать g такое, что 6 > 0. Действи- тельно, так как а^О, а' С 0, А(х*)^0, то взяв g = = —z/llzll, где II zl|= min || z ||, заключаем, что g = [S, g], zGL(x*) где S > 0, так как первые компоненты у всех векторов из £(#*) неположительны, а потому и первая компонен- та z тоже неположительна, а тогда 6 >0. Из (4.6) имеем «б + (у, ?Х — V V 1а> е df (**)> (4-7) (а' + h (z*)) 6 + (у’, g)<, — y V К» У'1 е dh (**)• (4-8) Поскольку из (4.7) следует (у, g) — у < 0 Vv е df (х*), то g^0n- Из (4.2) и (4.7) получаем f(x* + ag) = f(x*) + max [a + a (v, g)] + ox (a)< [a,v]ed/(x*) / (я*) + max la + a (— v — a$)l + °i (a) = [a,®]ed/(x*) = /(«*) —ay + max [a(l — a6)] + ox(a). (4.9) [a,»]ed/(x*) При достаточно малых a > 0 будет 1 — аб > 0, поэтому из (4.4) следует, что max [а (1 — аб)] = (1 — аб) max а = 0. [a,u]ed/(x*) [а,р]ей/(х*> Отсюда и из (4.9) получаем /(x*L+ag)^/(x*) — а\ H-Oi(a). (4.10)
272 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Аналогично из (4.3) и (4.8) имеем h (х* + ag) h (я*) + max [а' + а (— у — (а' + [a',v']edh(x*) + h (х*)) б] + о2 (а) = h (х*) + max [а' (1 — аб)] — [а',v']edft(x*) — а (у + h (х*) б) + о2 (а). (4.11) При достаточно малых а > 0 будет 1 — аб > О, и из (4.4) имеем max [а' (1 — аб)] = (1 — аб) max а' = 0. [а' ,v']Gdft(x*) [a',v']Gd/i(x*) Поэтому из (4.11) следует, что h(x* + ag)^h(x*) — а(у + h{x*)S)+ о2(а). (4.12) Если h(x*)<0, то при достаточно малых а>0 из (4.12) будет h(x* + ag)< h{x*)/2 < 0. Если же h(x*) = 0, то из (4.12) следует h(x* + ag)^ — ay + 02(a), и снова при до- статочно малых a > 0 получаем h(x* + ag)<0, (4.13) т. е. х* + ag е Q. Неравенства (4.10) и (4.13) противоречат тому, что х* — точка минимума / на Q. Замечание 4.1. Отметим, что мы не предполагали, что Л(я*) = 0, т. е. не различали случаи h(x*) = 0 и &(#*)¥= 0. Следствие 4.1. Если h{x*)<0, то из (4.4) и (4.5) следует On+i = df{x*) (4.14) (элементы из dh(x*)+[h(x*), 0п] не могут участвовать в выпуклой комбинации, дающей 0n+i), а так как шах а = 0, то из (4.14) следует (a,vjed/(x*) 0пе5/(я*), (4.15) где df(x)—субдифференциал функции f в точке х. Если же h(x*) = 0, то из (4.4) и (4.5) следует 0п е со {д/(я*), dh(x*)}. (4.16) Из (4.15) и (4.16) видно, что из (4.5) вытекают стан- дартные условия минимума суб дифференцируемой функ- ции на субдифференцируемом множестве.
§ 4. МИНИМУМ ГИПОДИФФЕРЕНЦИРУЕМОЙ ФУНКЦИИ 273 Пусть теперь условие (4.5) в точке x^Q не выпол- нено. Найдем min || z || = || z (х) ||. Ясно, что Hz (х) II > 0. Пусть z (х) = [т) (х), z (х) ], т] (я) е R1, z (х) е Лемма 4.1. Направление g(z) = —z(x)/llz(#)ll (4.17) является направлением спуска функции f на множестве Q. При этом f'(x, g(z))<-Hz(я)II. (4.18) Доказательство фактически проведено при до- казательстве теоремы 4.1. Там же было показано, что z(x)^=Qn. Замечание 4.2. В силу предположения функции / и Л —непрерывно кодифференцируемы, поэтому и g(x) (а также z(x)) тоже непрерывные вектор-функции. Этот факт является существенным и может быть использован для разработки численных методов. Например, имеет место аналог непрерывного гради- ентного метода. Предложение 4.1. Рассмотрим систему обыкно- венных дифференциальных уравнений i = -z(x), (4.19) я(О) = ;го^Й. (4.20) Если множество Q ограничено, то любая предельная точ- ка решения системы (4.19) с начальным условием (4.20) является стационарной (т. е. выполнено условие (4.5)). Доказательство. Существование решения следу- ет из непрерывности функции z(x). Пусть x(t, х$) = = х(t) — решение (4.19) — (4.20). Если z(z)¥=0n, то, как и при доказательстве теоремы 4.1, можно показать, что /' (х, g(x))^ — llz(я) II, где g(x) = = —z(#)/llz(#)ll. Поэтому t = f(x0) + J f(x(x), g(*(T)))-||z(x(r))||dT< 0 t < / (*o) - J (z (* (T))2 dx. (4.21)
274 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ При этом h (х (£))< 0 Vi>>0, т. е. (4.22) Из (4.21), (4.22) и ограниченности / на й следует z (х (0) tZZ 0, а эт0 и означает, что все предельные точ- ки являются стационарными. § 5. Мртод кодифференциальпого спуска 1. Безусловная минимизация. Пусть функция / зада-* на, липшицева и непрерывно кодифференцируема на от- крытом множестве X a: Rn. Требуется найти минимум / на й <= X. Вначале рассмотрим случай й = X = R". Тогда / (х + Д) = / (х) + max [а + (г, Д)] + [a,®]ed/(x) + min [6 + (it, Д)] + о(Д), (5.1) [b,w]e5/(x) где df(x), d/(x)czRn— выпуклые компакты, а отобра- жение Df = [df, df] непрерывно по Хауодорфу, -° ^4) —>0 VAe=Rn. al о Без ограничения общности можно предполагать, что выполнено условие (4.4). Тогда необходимое условие ми- нимума (3.1) имеет вид On+1 е {df (х*) + [0, w]} V [02 w] <= df (х*). (5.2) Пусть в точке х е Rn условие (5.2) не выполнено. Тогда найдется такое w = [0, w] е df(x), что 0n+1 [df (х) -\-w}sL- (х). (5.3) Найдем min |z| = ||z-(x) |. Из (5.3) следует, что Zw И = Zw <Ж)] °«+1- Как и при доказательстве теоремы 4.1, заключаем, что Z- (х) ф 0п, И что для направления g- (^) = — z- (х)/|| z-(x) || будет
б 5. МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА 275 Опишем следующий «принципиальный» («концепту- альный», по терминологии Э. Полака) алгоритм: Зафиксируем любое ц > 0. Выберем произвольное Rn. Пусть уже построено xh Если в точке хк выполнено (5.2), то точка xh— inf-стационарная, и про- цесс прекращается. В противном случае для каждого w^dg/(^A), где d^(x) = {w df(x)\ w = (co, ip), О^со^ц}, (5.4) находим min = (5.5) 2eLS(^) r«e zkw = Kw’zto]’ Lw^xki = + И Из (5.1) сле- дует, что / (хк — az.-) </(хк) + max Г (a + w) — [a,v]ed/(xft) u -a(v + w,zk-)] + o(a). (5.6) Из (5.5) имеем (5.7) t. e. (a + u;)(-T]ft-)-(p +w,zft-)<-||ift-|2, (5.8) ИЛИ -(v + w’zk»)<-1Vwll2 +(« + <>)nftw V [а, V] e= df (xk). Из (5.6) и (5.8) следует </(arft)+ max [(« + ®) —a|zft-|2 + a(a + ®)r]ft-] + (o,v]ed/(xft) + <’fe(a) = /(^)-a|zft-||2 + + max Г (a + co) (1 + + oft(a). (5.9) [a ,©]ed/(xk) При достаточно малых a>0. будет (1 + ocT)ft-)> 0, поэтому из (5.9) получаем / (xft - azk~) С / (xh) - a I ~zk-12 + + (1 + anftw) max t(a + ®)1 + °h (a) = = /(*k)-a|zft-| + (1 + ar^-) co + oft (a). (5.10)
276 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Отметим, что здесь (о е [0, р,], поэтому направление — может и не быть направлением спуска (даже если ||z^|]>0). Но так как в точке хк не удовлетворяется условие (5.2), то найдется хоть одно w0^df(xk) такое, что ||zfcw0||> 0, а тогда (в этом случае и?о = О) из (5.10) видно, что направление — является направлением спуска. Теперь найдем вначале для каждого w с1^(хк) min / (xft - azft-) = /(xft - aft-zft-), (5.11) а затем _ min f (xft - afc-zft-) = / (xfc - aft- zft- ). (5.12) Положим xk+1 = Xk akwhzhw>k Далее продолжаем анало- гичпо. В результате строим последовательность {яА} та- кую, что /(rrft+1)</(rrfe). (5.13) Теорема 5.1. Пусть множество P={x^n\f(x)^f[x0)} (5.14) ограничено, х* — предельная точка последовательности {хк}, а функция о(А) = о(х, А) в (5.1) такова, что о (х, аД) л а----0 равномерно по х из некоторой окрестности х* и по А из 5= [Де Rn||| А|| = 1}. Тогда точка х* является стационарной точкой функции / на Rn (т. в. выполнено условие (5.2)). Доказательство. Существование предельных то- чек последовательности {х^ вытекает из ограниченности (и замкнутости) множества (5.14) и неравенства (5.13). Пусть я*. Предположим, что в х* не выполнено ус- ловие (5.2). Тогда найдется w = [0, w\<^df(x*) такое, что 0п+1 [df(x*) + w] ss L*. По непрерывности кодифферен- циального отображения найдется последовательность такая, что wks = [<ofts, wfts] Тог- да по непрерывности df(x) будет Zfet->z , z = [ц*, z*], ||z*|| = min ||z||>-0. По свойствам функции o(x, А) име- zeL*
§ 5. МЕТОД КОДИФФЕРЕНЦИАЛЬПОГО СПУСКА 277 ем из (5.10), что найдется ао > 0 такое, что при доста- точно больших к, / (xk — + 2«v Так как то при достаточно больших к, f(Xks—aozfts)^ —-Г Iz* I- Там более /(^+1)</(^)— Отсюда и из (5.13) следует /(xft)-►—«>, что противоре- чит ограниченности непрерывной функции f на ограни- ченном замкнутом множестве Р (см. (5.14)). Замечание 5.1. Из (5.10) видно, что направление xh+i—xh может и не быть направлением спуска (в этом направлении функция может вначале возрастать, а затем убывать, т. е. алгоритм позволяет «выходить» из неко- торых точек локального минимума). Замечание 5.2. Для практического использования описанного алгоритма необходимо уметь эффективно ре- шать задачи (5.5), (5.11) и (5.12). Задача (5.5) явля- ется задачей квадратичного программирования, а если вместо евклидовой нормы взять тп-норму, то она превра- щается в задачи линейного программирования (если вдо- бавок df есть многогранник, то достаточно рассмотреть только его вершины). Задача (5.11) является задачей одномерной миними- зации, и для ее решения существует много эффективных алгоритмов. Задача (5.12) может быть эффективно реше- на, если df есть многогранник, заданный своими вер- шинами. 2. Условная минимизация. Пусть X Rn — откры- тое множество, Q=|xERn|AW<0]. (5.15) Предположим, что Q<=X, функции / и h липшицевы и непрерывно кодифференцируемы на X. Тогда /(«+Д) = /(«) + + шах [а + (р, Д)] + min [Ь + (о?, Д)] + Oj (Д), [a,v]ed/(x) [b,wi<=di(x) (5.16) h (х + Д) = h (х) 4- + max [а' + (р', Д)] + min [У + (и/, Д)] +о2(Д). [a',»']edh(x) [b',w'](=dh(x) (5.17) Как и в § 3, нетрудно установить следующее
278 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Предложение 5.1. Для того чтобы функция / в точке х* е Q достигала своего наименьшего на й значе- ния, необходимо, чтобы On+i е со [df (х*) + [0, w], dh (х*) + [0, w'] + [h (х*), 0п]} = = L(x*lw, w') Vw ^df(x*),w’^dh(x*), (5.18) где df(x) = [w e Rn J [0, w] e d/ (я)}, dh (x) = = {w' <= IRn | [0, w'] e dh (x)]. Доказательство. Допустим противное, тогда най- дутся wo^dffx*) и w0^dh(x*), такие что On+1^L(x*,wo,w'0) = Lo. (5.19) Найдем min||z|| = ||z0||, (5.20) zet0 где zo = [т]о, 2о]. Из (5.19) Hzoll > 0. (5.21) Возьмем go — — zo = [б, go]. Из (5.20) следует, что (Я go) <- № Vzei0. Отсюда и из определения Lo имеем (z, go) < -1 ZoI2 Vz e= [df (x*) + [0, w0]}, (5.22) (z,go)< — llzol2 Vze \dh(x*) + [ft(x*),w^]}. (5.23) Из (5.22) и (5.23) получаем аб + (v + w0, g0) < — | z0 В2 V [a, v] e df (x*), (a' + h (x*)) 6 + (v’ + Wo, g0) < —1| z0Ja V [a', v’] e dh (x*). Отсюда (V + w0, g0)< — |ZOI2 — аб V [a, v] (= df (x*), (5.24) (i/ + w'Ol ga) < — | z0 ] + (a' + h (x*)) б V [a'i a'] e dh (x*). (5.25)
§ 5. МЕТОД КОДИФФЕРЕНЦИАЛЬНОГО СПУСКА 279 Из (5.16) и (5.24) имеем /(ж* + ag0)< </(«*) 4- max [а — а | z012 — ааб] 4- ох (а) = [a,v]ed/(x*) = /(ж*) — a|z0]|2 4- max ((1 — аб) а] 4- Qi (а). (5.26) [a,t]ed/(x*) Из (5.17) и (5.25) получаем h (х* 4- ag0) < t^h(x*) 4- max [а' — а || z01|2 — а (а' 4- h (ж*)) 6] 4- [o',v']edA(x*) 4- о2 (а) — h (х*) — а || z01|2 4- max [а' (1 — аб)] — [a',v']edft(x*) — ah (х*) б 4- о2 (а). (5.27) Так как при достаточно малых а>0 будет (1 —аб)>0, то из (4.4), (5.26) и (5.27) получаем /(ж* 4-ag0)</(x*) — а||г0||2 4-(1 — аб) max а 4- [a,v]&d/(x*) + °i (а) = / (X*) — а I z0 К2 4- ОХ (а), (5.28) h (х* 4- ago) < h (х*) — allzoll2 — ah (ж*) 6 L+ 02 (а). (5.29) Если h(x*)<0, то при достаточно малых а>0 будет h (х* 4- ago) < 4 h < °’ (5-30) а если Л(^*) = 0, то из (5.29) следует h (х* + ago) —allzoll2 + 02(a). (5.31) Из (5.30), (5.31) заключаем, что при достаточно малых а>0 будет /&(z*‘+ago)< 0, т. е. z* + ago^Q, а из (5.28) /(х* + ago)</(^*), что противоречит тому, что ^ — точ- ка минимума f на й. Теперь с помощью условия (5.18) можно построить, как и в п. 1, численный метод, на описании которого мы здесь останавливаться не будем.
280 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ § 6. Условия минимума второго порядка для дважды кодифференцируемой функции Пусть функция / дважды кодифференцируема на Кяг т. е. + А) = f(x) + max а + (р, А) + -% (ЛА, А) + [a,v,A]ed2/(x) L J + min [d + (ip,A) + -g-(BA,A)l + o(A2), (6.1) [&,w,B]ed2/(x) L J где D2f(x) = [d2f(x), d2f(x)], d2f(x)'d2f(x)^lX^nX^nx\ Здесь RnXn— пространство вещест- венных (nXn)-матриц. Без ограничения общности можно считать, что max а = min 6 = 0. (6.2) [a,v,A]Gd2/(x) [&,w,B]ed2/(x) Напомним, что с помощью второго кодифференциала D2f легко построить и первый ко дифференциал £>/, и квази- дифференциал 2)f. Так, например, ^/(х).= [£/(х),6/(^)], где й/(х)=[реГ| ЗЛеГхп: [0,р, A]f=(Ff(x)]f df (х) = [w е= Rn | ЭВ е= RnXn: [0, ip, В] g= d2f (я)}. Рассмотрим задачу минимизации / на Rn. Из теоремы 3.1 имеем такое необходимое условие: для того, чтобы в точке е Rn функция / достигала своего наименьшего значения, необходимо, чтобы -6/(я*)с=д/(я*). (6.3) Точка я*, для которой выполнено (6.3), называется inf- стационарной точкой первого порядка функции f на Rn. Теорема 6.1. Для того чтобы в точке функция f достигала своего наименьшего на Rn значе- ния, необходимо, чтобы 1) выполнялось включение (6.3) и 2) для каждого llgll = 1, было бы а) либо
§ 6. УСЛОВИЯ МИНИМУМА ВТОРОГО ПОРЯДКА 281 /' (#*, g)>0, б) либо (если У(х*> g) = 0) для любого w df(x*) или имеет место неравенство max (v + w, g)>0, или, если max (v + w,g) = 0, — неравенство i?ea/(x*) max [(у + w, q) + ((4 + В) g, g)] > 0 [i),A]eC(w,g) (g V?sRn, VB: |0,»,В]е?/(Д где C(x*, w, g) = C(w, g) = = {[v,A]l [0, v, A]<=d?f(x*), (v+w, g) = 0). (6.5) Доказательство. Для любых g, q e Rn из (6.1) fix* + ag + 4-a2g) = f(x*) + max |a+a(p, g) + \ ' [a,v,A]ed2y(x*) L + a2 ((p, q) + (Ag, g))l + min [&4-a(iP, g) + J [b,w,B]sd2/(x*) L +4a2 *))]+° <“2)- м Все утверждения теоремы, кроме (6.4), следуют из (6.3). Докажем (6.4). Допустим противное, тогда найдутся (?gF, w^df(x*) и ВеКпХп такие, что [0, w, d2f(x*), max (и + w, g) = 0 и ved/(x*> max [(p + ip, q) + ((4 + B) g, g)J = — у < 0. (6.7) AeC(w,g) Рассмотрим отображение ф (e) = {[a, v, A] e d2f (x*) | — e a 0, (p, g) = max (v', g) — el, e 0. (6.8) [a,v',A]ed2/(x*) J Поскольку d2/(я*) —выпуклый компакт, то отображение ф(е) непрерывно в точке е = 0, поэтому из (6.7) заклю- чаем, что при достаточно малых е > 0 будет (v + w, q) + ((Л + В) g, g)< — у/2 УЛ: [а, и, А] (= ф(е), (6.9)
282 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ а тогда из (6.6) получаем /(х* + ag)</(я*) +max {(pi (а), <рг(а)} + о(а2), (6.10) где <р,(а) = max [а + а (v + w, g) + -|-а2 ((i> + w, q) + [a,i>,A]ei|>(e) L л + (И + В) g, g)], <p2 (a) = sup Га + a (y + w, g) + [a,vjA]ed2/(x*)\i|)(E) [ +4 “2 +w> & + <(л+& g)]« Но из (6.9) имеем Ф1(а)< —4"a2Y’ (6Л1) а из (6.8) — <p2(a)<—e—ae+-|-a2 max [(i?+w, g) + ((4+5)g, g)J. При достаточно малых a > 0 будет фг(а)<—e/2. (6.12) Из (6.10) и (6.12) заключаем, что при достаточно ма- лых a > 0 /(#* + ag)</(x*). Полученное противоречие завершает доказательство тео- ремы. Определение. Точка x*eRn, удовлетворяющая условию (6.4), называется int-стационарной точкой вто- рого порядка функции на Rn. Замечание 6.1. Если max (и + it,g) = 0, то иеа/(х*) при q = 0 из (6.4) имеем условие max [((4 + В) gf g)] > 0 V5: [0, w, В] e (x*), (6.13) AeC0(w,g) где ' • Co (w, g) = e Rnxn | [0, v, A] g= (x*), (v + w, g) = 0}. I Условие (6.4) получено из (6.1) при Д = ag + a?q, а условие (6.13) —при A=ag. Условие (6.4) позволяет
§ 6. УСЛОВИЯ МИНИМУМА ВТОРОГО ПОРЯДКА 283 провести более тонкое исследование условий минимума, чем (6.13), что видно из следующего примера. Пример 6.1. Рассмотрим функцию /(я) = /(я(1)} ^(2)) = max{/i(x), /г(ж)}, (6.14) гДе1/1 (х) =’^2) + у (^х))2, /2 (#) = —я(2) — (#(1))2- Здесь zgR2. Возьмем #о = (О, 0), Д=(Д(1), Д(2)). Имеем А (х0 + А) = А(2) + ± (А(1))2, /2 (х0 + А) = - ± А(2) - -1(Д(1>)\ (6.15) т. е. ^/1 0\Ц 0; (0,1); O/JJ1 ^/1(®о) = {[о;(О1О);(® £)]}, ГГ / 4 \ (— 1 о\п (^о) = [ v ’ 2~/’ \ 0 0/ J,; ^/2(®о) = {[о;(ОлО);(о о)]}' Отсюда ^7(*о) = со([о; (0,1); (* ®)], [б; (б, -±); (“* ° ^7(*0) = {[О; (0л 0); (° °)]}. Имеем 5/Сг0) = со{(0, 1); (0, —1/2)}, 3/(х0) = {(0, 0)}, т. е. — df(xo)^ д/(#о), и необходимое условие первого по- рядка (6.3) выполнено. Очевидно, что если g = (g(1), g(2))> ТО /' (х0, g) = max g<2>}, поэтому /' (х0, g) = 0, если g<2) = 0. /° 0\ Для рассматриваемого случая w = (0, 0)г В = I 0 0 I (•/1 о\ /—1 0\) и С9(wt g) = соП0 J, I 0 JL если gi =(1,0) и g2 =
284 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ = (—1, 0). Напомним, что мы рассматриваем g такие, что llgll = 1. Имеем , I7/1 °\ \ 1 Ш = тах|Ц0 0 0)М1 = = max{(g(i))2,-(g(«)2} = (g(i>)2. Поэтому ip(gi) = t|)(g2)= 1 > 0, т. е. необходимое условие (6.13) выполнено. Проверим теперь условие (6.4). Имеем для g\ и g2* /1 0\ w = (0, 0), £ = (0 J. (г /1 о\] Г/ i\ /— 1 0\1) C(*o,u>,g) = co[[(0,l),[0 J], [(0,-у], ( 0 Положим ?=(д(1’, ?(2)). Найдем Ф (g> Ч) = max {(р, q) + (Ag, g)} = [v,A]eC(x0,w,g) = max[g(2> + (g(1))2, —g(2) — (g(1))2V Для gi=(l, 0) и g2 = (-l, 0) будет Ф (?i, 0 = Ф (g2> ?) = max ^(2) + 1, — у «(2) — 1}- Взяв go = (O, —3/2), получим Ф(£Гь ?o)=^(g2, go) = max {—1/2, —1/4) = —1/4 < 0, т. e. условие (6.4) не выполнено, и точка %о не является точкой минимума. Действительно, взяв д=+ 4"а2?о=“С1’ °) +4 а2(0, — 4)=(а’—та2)* имеем / (хй + А) = max (— у а2 4- у а2, у -у а2---а2) = = а2тах(-------------------|-а2<0 Va> 0, I 4 о ) о а для А = agi, например, будет /(х0 + А) = j(x0 + agi) = тах[у a2, — у а2) = = ±а2>0 Va>0,
§ 7. ДИФФЕРЕНЦИРУЕМОСТЬ ПО НАПРАВЛЕНИЯМ 285 т. е. с помощью «лучей» найти меньшее значение функ- ции не удается. Кривые второго порядка использовались для вывода необходимых и достаточных условий минимума некото- рых классов функций максимума в работах А. Бен-Тала и Й. Цове [112]. § 7. Дифференцируемость по направлениям функции расстояния до гиподифференциала Рассмотрим функцию максимума f(x) = max фг(я), гег где <pti(a;)^C'2(X), X cz Rn— открытое множество. Функ- ция / является кодифференцируемой (и даже гиподиф- ференцируемой). Ниже устанавливается дифференцируе- мость по направлениям функции ар (я) = min ||z||, zed/(x) где df(x)— гипо дифференциал функции f в точке х, ze Rn+1. 1. Вначале рассмотрим гладкую функцию. Пусть функция / дважды непрерывно дифференцируема на от- крытом множестве X cz Rn. Необходимое условие мини- мума /'(«*) = 0» (7.1) может быть использовано для разыскания точки ми- нимума. Один из подходов состоит в том, что для точки xk пи- шем разложение (7.1) /' (хк + А) = Г (хк) А + о (А), (7.2) где /" (хк) — матрица вторых частных производных / в точке хк. Отбрасывая в (7.2) о (А) и решая уравнение f (хк) +f" (хк)& = 0, получаем (в предположении, что det/" (xft)¥= 0)
286 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ затем полагаем (7.3) Тем самым описан метод Ньютона [43]. Другой подход основан на том, что уравнение (7.1) эквивалентно решению задачи минимизации функции tW-yW П-4) Нетрудно видеть, что ф'(#) = /" (x)f'(x). Если i|)z(x)^ ¥=0п, то направление g(x)e—ф'(я)/11ф'(х)11 является на- правлением наискорейшего спуска этой функции в точ- ке х. Таким образом, точка х* является точкой минимума как функции /, так и функции ф. Если в точке х оказалось /' (х)¥=0п и 0п, то имеем два направления / \ /' М , х f" (х) f (х) 81 iTTWil и 82 II/"(*)/'(*) II’ являющиеся направлениями наискорейшего спуска соот- ветственно функций / и ф в точке х. Эти направления определяют двумерную плоскость, проходящую через точку х: Р (х) =-{z «= Rn | Z = x+ agt + 0g2, a, 0 e= R1}- Существуют численные методы, основанные на сведе- нии задачи минимизации / на Rn к последовательности задач двумерной минимизации (см. [201]). В ряде слу- чаев (особенно при наличии эффективных алгоритмов двумерной оптимизации) эти методы оказываются доста- точно конкурентноспособными. 2. Пусть / (х) = шах (я), (7.5) iei где I = 1: N, ф,<(я) С2 (X), X с Rn — открытое мно- жество. Функция / является дважды непрерывно кодиф- ференцируемой (даже гиподифференцируемой) на X. Пусть х еХ. Тогда (см. (IV.1.14) и (IV.6.10)) df (х) = со {[<р4 (х) - / (х), <р- (х)] | ie= Z)t ~df (х) = {0n+i}, &f (x) = co {[(pi (x) — / (x), <p{ (x), <p- (x) j | i Z}, (7.6) (x) = {[02 0ni 0nXn]}«
§ 7. ДИФФЕРЕНЦИРУЕМОСТЬ ПО НАПРАВЛЕНИЯМ 287 Пусть х* е X. Так как X — открытое множество, то по теореме V.4.1 для того, чтобы точка х* была точкой ло- кального минимума / на X, необходимо, чтобы On+1Ed/(^). (7.7) Использование условия (7.7) для построения метода, аналогичного методу Ньютона, требует привлечения ап- парата дифференцируемости многозначных отображений, который в настоящее время только разрабатывается (см. [126, 207]). Поэтому обсудим второй подход, связанный со сведе- нием задачи (7.7) к задаче минимизации. Задача нахождения точки #*, удовлетворяющей (7.7), эквивалентна задаче минимизации функции 1|>(X)= min = <7-8) ze=d/(x) Z (если существует точка х*, удовлетворяющая (7.7), то минимум в (7.8) равен нулю и достигается в точке х*}. Изучим дифференциальные свойства функции ф. Уста- новим дифференцируемость функции ф по направлениям. Учитывая (7.6), имеем ф (я) = min 4- 2°й(а:)2=4' 2 а« им*) Г, (7-9) iGl ‘ ’ гег где vi (х) = [фг (я) — / (я), (я)] G= Rn+1 Vl е 7, Я = Га = (ап ..., aN) I > 0, 2 = llcz I J Точка z (х) = 2 щ (х) Vi (х) = [z0 (х), z (ж)] единствен- iel на (так как функция -^-ЦиЦ2 строго выпуклая), но век- тор а(х) = (а\(х), ..., ау(д:))еЯ может оказаться, конеч- но, неединственным. По правилу дифференцирования функции по на- правлениям имеем Ф' к g) = min кк)> S к, g\ aeQ(x) \ iei (7.10)
288 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ где а = (ап ..., aN) е 211 гр (х) = ]2 »'i (*, g) = [ (<Pi (*),g) — f (*, g\ чч (*) d» f (x, g) = max (cpj (x), g), R (x) = {j(=I\ <p} (x) = / (a:)}. jeR(x) Отсюда fz (x), 2 ад (*, ?)'| =f[ 2 а»фг (я) — f (x); 2 a»<Pi (^)1. \ iei / \LieI ieI 17 2 ajtpi (*), fiA — f (x, g),( 2 а»ф’ (*) g'jl'j = LveI / veI /J/ = Zo (*) 17 2 »i<Pi (x), g) — f (x, g)l + (z (x), 2 ®i<Pi (*) A LveI / J \ ieI / (7.11) Здесь z(z)= 2 a»<Pi(*), z0(z) = 2 W — /(a:)<0 (7.12) isi iel (уже отмечалось, что zq(x) и z(x) не зависят от выбора ае<?(х)). Из (7.12) и (7.11) ((я), 2 ад (я, g)1) = \ _ = max I((— z0 (x))(<pj (x) — z(x)) + ( 2«i<Pi (*)Vz (x), A = J = max [7(— z0(x))(q>’j(x) — z(x))+ 2 »i<Pi (*)V z(x), gYI= jeH(a) [( iei ) ] = max [(q>j (x) (— z0 (x)) + (z0 (x) E + 2 a»<Pi (aA (ж), g\l. jeR(x) [ \ iei J )] (7.13) Здесь E — единичная (тг X n) -матрица. Положим Aja) = z0(x)E + 2 «iVi (*)• it=T Из (7.13) и (7.10) заключаем •ф'(а\#)= min max [(Л (a)z(x) + ( — z0 (a:)) <p-(x), g)]. aeQ(x) jeR(x) (7-14)
§ 8. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ ЭКСТРЕМУМА 289 Так как Q(a) выпуклое, то из (7.14) следует, что min гр'(х, g) = min min max [(Л (a)z(x) — (rr)q?j(rr), g)]. ||g||«i aeQ(x)||g||<i JeB(x) (7.15) Так как (см. [27], § 1.6) min max [(Cj , g)] = min[|z||, (7.16) IlgllCl JGB(X) z£L где Z/ = co{Cjl j^R(x)}, то для того, чтобы найти на- правление наискорейшего спуска функции гр (по форму- ле (7.15)), надо решить столько задач вида (7.16), сколько а содержится в Q(x). Покажите, что можно ог- раничиться только крайними точками множества Q(x). В частности, если Z = {1}, то 7?(я) = {1}, (?(#)= Ш, ио = О, z(x) = <pl(«r), Л = ф1(х), гр'(я, g) = <piU) (pi (я), и для направления наискорейшего спуска функции гр в точке х имеем выражение _ q/j (х) <pj (х) 8 х || Ф1 (^) (^) [Г что совпадает с полученным в п. 1 выражением для на- правления наискорейшего спуска функции (7.4). § 8. Дифференцируемость функции экстремума по е-субдифференциальному отображению выпуклой функции Идея, описанная в § 7, может быть использована и для минимизации произвольной выпуклой функции. Здесь, однако, нельзя работать непосредственно с субдифферен- циалом выпуклой функции, ибо субдиффере!нциальное отображение не является, вообще говоря, непрерывным. 1. Пусть / — выпуклая конечная функция, заданная на Rn. Положим *) df (х) = {у е Rn | / (z) — f (х)z — x) Vze Rn}, 5е/(я) = {pe Rn| f(z) — (y, z — x) — e VzeRn). Здесь e >0. Множества Of(x) и dzf(x) называются соот- ветственно субдифференциалом и ь-субдифференциалом функции f в точке х. Они являются непустыми выпуклы- *) В § 8 и 9 используются обозначения df и def вместо df и dRf соответственно.
290 ГЛ. у. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ ми компактами. Отображение df (х) полунепрерывно сверху, а отображение де/(я) при любом фиксированном е>0 непрерывно в метрике Хаусдорфа*). Эти отобра- жения играют существенную роль в выпуклом анализе. Так, оказывается, что (см. гл. Ш) + — f(x)l = max (v, g). a|o ved/(x) Величина max (v, g) vedg/(x) называется ъ-производной функции f в точке х по на- правлению g. В Приложении I отмечено, что /е (я, g) = inf 4 (/ (ж + аё) — /(*) + е1 • (8.1) Выпуклая функция / называется коэрцитивной, если + “• (8-2> Здесь, естественно, 1Ы1 — евклидова норма вектора х. За- фиксируем е > 0 и х^ Rn. Справедлива следующая лег- ко доказываемая * Лемма 8.1. Если f — коэрцитивная функция, то найдутся такие R<°° и б>0 (зависящие от е и xq), что def(x) = k е=R”| /(z) — /(х)>(р, z — х) —е. Уге^л(х0)}, (8-3) где х^^б(хо), ^e(x0) = {хе Rn| ||х —х0||<: 6}. Следствие 8.1. Если llgll = 1, то в (8.1) имеет ме- сто равенство ft (я, g) = min 4 If (* + ag) — / (*) + 8L ае(о,В] г Лемма 8.2. Если f — коэрцитивная функция, то df (х) cz int 5е/ (х) Уе > 0, Vx e Rn. (8.4) Доказательство. Допустим противное. Тогда для некоторых и е > 0 множества df(x) и def(x) ♦) Приложение I.
§ 8. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ ЭКСТРЕМУМА 291 имеют общие граничные точки и потому найдется такое ge Rn, ||g|| = 1, что fe(x, g) = f(x,g). Но в [27, лем- ма 1.8.4] показано, что в этом случае f(x + ag) = f(x) + + df'(x, g) Va^O, что противоречит (8.2). Везде далее функция / предполагается коэрцитивной. Положим h(x, z, v) = f(x) — /(z) + (y, z — x)—&. Тогда из (8.3) следует, что def(x) = [ре Rn| h(x, z, v)^0 Vze JfB(a:0)). (8.5) Введем множества Y g, v) = = {iv e R n | Ha0> 0: v + awG <4 (x + <*g) Va <= [0, a0]} Г(я, g, p)=cl y(z, g, v), Q(x, v)= {ze <%R(x)\ h(x, z, v)=0), если (? (#, tf) = 0, B(x, g, v) = • [ire Rn| (i^ z- я) - (p, g) + f {x, g)0 Vze^(rr, z?)}, если Q(x, v)=£0. Множество Г(я, g, v) называется множеством воз- можных направлений первого порядка в точке о^дЛ/(х) по направлению g (для отображения def(x) в точке х). Рассуждая, как при доказательстве леммы 1.8 в [23], и используя (8.4) и (8.5), можно установить, что спра- ведлива Лемма 8.3. Если х int(#о), то Г (*, g, v) = B(x, g, v). (8.6) В отличие от [23], функция h в (8.5) не является дифференцируемой, а лишь дифференцируема по направ- лениям. Рассмотрим теперь функцию <р(я) == sup F(x, v) Положим R (x) = {v def (x) I qp(rr) = F(x, и)}. Пусть Gc cz Rn — такой выпуклый компакт, что def (x)^ int G Vx^<%&(xq)(b силу свойств отображения 0&f такое G най- дется). Из теоремы 1.6.1 вытекает Теорема 8.1. Пусть функция F(x, b) непрерывна вместе с Fx и Fv на &ъ(хо)Х G и вогнута по v в окрест- ности множества R (х). Тогда функция <р дифференцируе- ма в каждой точкё х е int.$6(xo) tio направлениям,
292 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ причем ф' (х, g) = sup sup [(X, (х, v), w) + (F'x (x, v), g)]. vefl(x) wer(x,g,D) (8-7) 2. В формуле (8.7) необходимо находить супремум по множеству Г (.г, g, v). Изучим это множество подробнее для нашего случая, используя лемму 8.3. Зафиксируем Из (8.1) получаем inf •£-[/(* + «?) —/(*) + е] = а>0 а = max (vvq)^(y, q) Vq^Rn. V1eae/(x) Отсюда ^-[/(x + ag) —/(x) + e] —(p, g)>0 Vg e= Rn, Va>0. (8-8) Далее, sup h(x, z, v) = — inf [—&(#, и, p)] = zeRn zeRn = - inf infa[/(g + a9)-/(l)te-(p>g)l. (8.9) geRn a>o L “ J Положим »(“> 4) = 4- [/ (Ж + a?) “/GO + 8] — (P> ?)• Из (8.8) имеем s(a, ?)>0 Va>0, V?eR”. Поэтому ясно, что инфимум в (8.9) достигается и равен нулю лишь при «е Р(х, p)=={g<=IRn| h||=l, f{x, g) = (p, g)l И a e SI (x, v, g) = (a > 01 + cts) — / W + e = 0>O P ) Если v Gint def (x), to Q(x, v)=®. Окончательно полу- чаем: если v s int 5е/(я), то Г (х, g, v) = Rn. Если же
§ 8. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ ЭКСТРЕМУМА 293 v — граничная точка множества 5е/(х), то Г (х, g, v) = {ip е Rn | (ip, q) < < g) — f (*, £)] Vg e= P (x, v), Va (g) <= Я (x, v, g)}. (8Л0) Если функция f не имеет линейных участков (напри- мер, является строго выпуклой), то максимум по z функ- ции h в (8.9) достигается в единственной точке. Дей- ствительно, из вида функции h следует, что в точке мак- симума z* должно быть v^dj(z*). Если существуют две такие точки zi и Z2, то по лемме 1.5.8 из [27] функция / линейна на отрезке, соединяющем точки Z\ и Z2. Итак, точка максимума по z функции h единственна в рассма- триваемом случае. Пусть v — граничная точка def(x) и пусть q е Rn, |] дЦ = 1, таково, что (р, q) — max (vn q) = = /e(rr, g). Тогда (v, q) = inf-l[/(x + ag) — /(x) + e] = a>o a = 4- [f (x + ag) — / (x) + e]. a Очевидно, что f(x)— f(x + ag)— e + (v, ag)=0, т. е.при z* = x + ag имеем h(x, z*, v) = 0, t. e. Q(x, v) = {x + ag). Тогда из (8.10) находим г (х, g, v) = Lp Е R” | (ip, g) < zJ— [(p, g) — f (x, g)]l. I a (9) ) (8.11) 3. Рассмотрим два применения теоремы 8.1. Как из- вестно (см. следствие V.2.1), для того, чтобы в точке ж* е Rn функция / достигала своего наименьшего на Rn значения, необходимо и достаточно, чтобы df(x*). Это условие эквивалентно условию Ф(я*)=0, где Ф(я)= min || v Ц2, (8.12) геадх) т. е. задача минимизации функции / эквивалентна зада- че минимизации функции Ф (обе эти функции имеют об- щую точку минимума). В гладком случае использование функции Ф вместо / позволяет разработать методы вто-
ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ 294 рого порядка. В негладком же случае все усложняется из-за разрывности отображения df. Вместо (8.12) рас- смотрим функцию Фс(я)= min ||р||2. (8.13) vede/(x) 1ак как Фе (я) = —ф (я), где ф(я) = max [—||р||2Ь ®еде/(х) а функция F(x, р)= — IIpH2 вогнута, то можно воспользо- ваться теоремой 8.1 и найти производную функции <р по направлению g в точке х. Рассмотрим случай, коцца 0п& def(x), т. е. <р(я)<0. Множество R (х) состоит из единственной точки Л (я) = (и01 |1р0|| = т*п IM1- Из (8.7) и (8.10) имеем I ®еэ£/(х) f ф' (*> g) = sup [— 2 (р0, w)], (8.14) wer(x,g,v0) где г (*. g, i’o) = {«’ s R”| (w, q) < [(i>o, g) — f (*, g)} V? e P (A I’o), Va (?) g=St (x, v0, ?)j. (8.15) Заметим, что gr = — vo/llvoH e Р(я, vq). Из (8.14) и (8.15) ясно, что max {ф'(я, g)| ge^n, ||g|| = 1} достигается, ког- да достигается максимум функции H(g) = (vo, g) — — /' (х, g). Этот максимум легко йайти: arg max {Я (g) ( g е Rrt, || g|| = 1) = ga = — (v0 —T)./|| v6— v ||, где || v0 — v || « min || v0 — v ||. Направление go является red/(x) направлением наискорёйшего подъема функции ф и на- правлением наискорейшего спуска функции Фе в точке х. Это направление можно попытаться использовать и для разработки численных методов минимизации функции /. Если функция / не имеет линейных участков, то из (8.11) и (8.14) получаем ф'(д:»^)==г~—-i(v0,g) — а(~ %) — /'(*, £)]• Здесь «(— i>o) = arg min -L[f(x — аг?0) — / (х) + е]. а>о а 4. Теперь зафиксируем и изучим функцию фг (х) = /Е (х, г) max (р, г), vedE/(x)
§ 8. ДИФФЕРЕНЦИРУЕМОСТЬ ФУНКЦИИ ЭКСТРЕМУМА 295. «где Функция = г)—линейная (а потому и вогнутая), и можно применить теорему 8.1. Имеем R{x, г) = Rr(x) = [v(=dej(x)\ (р, г) =/в(я, г)}. (8.16) Все точки множества R^(x)—граничные точки Зе/(я), поэтому гг (х, g, v) = (ip е Rn I (w, ?X [(”, g) — f (*, •£).] Vg e P (x, v), Va (q) <= $1 (x, v, g) L Из (8.7) получаем фг g) = SUP SUP (r> w)' refi(x,r) «еГДх^.и) (8.17) Если / не имеег линейных участков, то (8Д7) можно упростить, используя (8.11): фг (я? g) = sup sup (г, ip), vCfl(x,r) jrerr(x,g,v) где Гг (X, g, v) = [w <= R” I ,{w, r)< J- [(v, g) — f (p, g)]‘L I a (r) ) Здесь a(r)— одно и то же для всех v<=R(x, г) (это следу- ет из (8.,11), ибо в силу (8.16) г е Р(х, v) Vre R(x,r)). Имеем / 1 Фг (X, g) = sup •=— ,[(р, g) — f (х, ^)] = VER(x,r) а (г) = “ах J-[(t>, g)-f'(x, g)]. (8..18) l>GR(3C,r) a (r) При r — g получаем Ф« g) = ft (^, gy g) = =7T 1 ft (x, g) — f (x, g)].
296 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ § 9. Аппроксимация суб- и супердифференциальных отображений выпукло-вогнутых функций и седловые точки 1. Пусть f(z)=f(x, у)—конечная выпукло-вогнутая на Rn X функция, т. е. при каждом фиксированном функция f(x, у) выпукла по я на Rn и при каж- дом фиксированном х^№п функция f(x, у) вогнута по у на Rm. Зафиксируем е > О, ц > 0 и положим дъ/х (х, у) = = [у е Rn | / (х', у) — f (х, у) (р, х' — х) — е \fx' <= Rn), dyjy (х, у) = = (ше Г| / (х, у') — f (х, у) < (tv, у' — у) + p Vy' е Rw], М*, у, v, x)=f(x, y)-f(x', y) + (v, х - х)-е, (9.1) hz(x, у, iv, y') = f(x, y')-f(x, y)-(iv, y'-y)-p. (9.2) Множества dzfx(x, у) и д^у(х, у) называются соответ- ственно ь-субдифференциалом и ц-супердифференциалом функции / в точке z = [х, у]. Эти множества — непустые выпуклые компакты. При 8 > 0 отображение де/х непре- рывно по Хаусдорфу, а при р, > 0 отображение д^у непре- рывно по Хаусдорфу. При 8 = 0 множество djx(x, у) = — dQfx(x, у) называется субдифференциалом функции fe точке z, а при ц = 0 множество Ofy(x, y)—dofy(x, у) на- зывается супердифференциалом функции / в точке z. Суб дифференциальное и супердиффереициальное отобра- жения являются лишь полунепрерывными сверху. Зафиксируем z0 = [д?0, i/0] е X Rw. Функция / называется коэрцитивной по х в окрестности точки у§, если найдется такое 6 > 0, что II * II ||х|Ноо равномерно по г/^^б(г/о), где (у0) = {у^ Rw| \\у — — г/о11<б}. Аналогично функция / называется коэрцитивной по у в окрестности точки xq, если найдется такое б > 0, что IIУII llz/.H00 равномерно по х е ЗИъ (х^) = [х сн Rn| || х — х^ || 6}.
§ 0. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 297 Лемма 9.1. Если функция f коэрцитивна по х в ок- рестности точки уо, то dfx(x, y)(=intdefx(x, у) Vxt=\Rn, \fy<=£6(yQ) (9.3) и найдутся такие R\ > 0 и 6> > 0, что dEfx (х, у) = {р (= Rn I (х, у, V, х') < О Vx' (= (х0)| (9-4) Vz = [х, у] е (z0) cRnx Rm. Если функция f коэрцитивна по у в окрестности точ- ки то dfy(x, У) <= int д\Лу (*, У) Чу Чх е ^6 (*0) (9.5) и найдутся такие R2 > О и 62 > 0, что (х, у) = {ш е= ROTI h2 (х, у, w, у') С О V/ е $в2 (у0)} (9-6) V2 ^б2 (z0)« Доказательство соотношений (9.3) — (9.6) не представляет трудностей. Везде ниже функция / предполагается коэрцитивной по х в окрестности точки г/о и коэрцитивной по у в ок- рестности точки х$. Зафиксируем g = [gP g2] X IRm. Возьмем v s3e/x(2o). Положим Ti (g, ») = Yi (я0, z/0, g, v) = = e Rn I 3a0: v + av± defx (z0 + ag) Va e [0, a0]}. Множество Ti(g, r>)=clYi(g, v) (замыкание множества Yi (g, v)) назовем множеством возможных направлений в точке v defx(zo) по направлению g (для отображения dzfx в точке zo). Введем множества Qi (v) = Qi (^0- I/o> v) = Iх' е IRn I (х0, Уо, v, х') = 0), Bi (g, v) = R”, если (и) = 0, = {(= Rn I (р15 х' — х0) — (р, У1) + /' (х0, у0, glf 0m) + + /' ( с01 Уо> On, g2) — f (х>, У0> °п» 0 Vx' е (?! (р))> если Ql (v)^0.
298 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Здесь /' (z, g2, om) = = lim [f (x + agr, y) — f (x, г/)] = max (y, gr), a | о v^djx(x,y) f (2» On» S2)'= = Ит 4- [/ (x, у + ag2) — / (x, 1/)] = min (w, g2). al0 ** w&dfy(x,y) Аналогично для yo)’ полагаем ?2 (#, W) = ?2 (*0. У01 g> “’) = = {wx e Rm I 3a0>0: w+aw1^dVLfy (z0+ag); Vae[0, aop}. Множество r2(g, ш)=с1у2(£, w) назовем множеством возможных направлений в точке w^dyfy^zq) по направ- лению g (для отображения djv в точке zo). Введем множества <?2 («’) = Qa (*(Р Уо> w) = I/ Rm| h2 (х0, у0, w, y')~ 0], B2 (g, w) = ,Rm, если Q2(w’)=0, =. {u\ e Rm1 — (ifi, у'—Уо) + (w, g2) — f (x0,'y0, gt, 0m) — — f (*0> I/o> On, gi) + /' (^o> gv °m) < 0 V/ e= Q2 {w)}, если Q2{w}^0. Лемма 9.2. Если в разложениях f(xQ + agh y)==f(xQl y) + af(xQ, у, gb 6w)+o(a, y), f(x, yo + ag2) = f(x, yo) + a/'(z, yo, 0n, g2) + o{ (a, x) t o(a\ y)______л . окажется, что — 0 равномерно по у из некото- о (а, х) рой окрестности множества и а---------------- ТГо ^ав“ иомерно по х йз некоторой окрестности множества Q\(v), то имеют место соотношения IMS, v) = B((g, V), (9:7) ; r'2(g, w)=B-2(g, w). '(9.8) Доказательства Огранйчимся доказательством соотношения (9.7). В случае Qi(v)=0 утверждение
§ 9. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 299 (9.7) очевидно. Предположим, что Qi(v)=£ Возьмем р10 е Г1 (g, v). Тогда существует последовательность {’piJ такая, что Vik-+V{Q, yueYi(g, и), т. е. найдутся такие аол > 0, что v + аохй <= д8/х (г0 + ag) Vа <= {0, аой], т. е. йх (х0 + agx, у0 + ag2, v + aoxft, х’) <0 Vx' е= #Я1(х0), Vag= [0, аой]. Из определения hi теперь имеем (см. (9.1) — (9.2)) /(х0 + agi, go + ag2) — f(x', go + ag2) + + (v + ai>it, x — xo — agi) — 8 0 Vx'ge (x0), Vas{0, аоА]. (9.9) Так как /(xo + agi, go + ag2) = = /(xo, go) + a/'(xo, go, gi, Om)-a/'(zo, go, 0„, g2)+o(a), f(x', yo + <x.g2) = f(x', yD) + a,f(x', go, 0n, g2)+oi(a, x'), где Oi (a, x')^0, (9.10) то из (9.9) получаем / (жо> У о) — f (*'» Уо) + (v> х' — х0) + е + а [(о lft, х' — х0) — -- (у, £1) + /' (*о< Уо, gi> От) + f (х0, g0, 0n, g2) — — /' (*', Уо- On, g2)] + о (a) — ox (a, x') — — a2(pxft, gx)<0 V/e^K(4 Vae[0, aoftJ. (9.11) Отсюда и из (9.10) следует, что hi(x0, у0, v, x') + a.4fc + о (a)- a2(ou, gh)< sg/i|(xo, go, v, x')+a4ft +o(a) —oi(a, x') — a2(vtk, gi)<0. (9.12) Здесь через Ak обозначено выражение в квадратной скоб- ке в (9.11). При х' ^Qi(v) будет fri(xo, go, и, х') = 0, по- этому из (9.12) вытекает а4й + о (а) — a2 (ylh, gx) < 0 Vae [0, аой]. Отсюда получаем 4д^(ои, х'-х0) — (у, gi) + /'(xo, go, gi, 0m) + + /' (*o, Уо, On, gi) - f (x', y0, 0„, g2) 0.
300 гл. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Переходя здесь к пределу при &-><», получим (v10, х' — х0) — (р, gj) + /' (х0, у0, glt 0m) 4- + /' (*о> Уо> 0„, g2) — /' (д', Уо, On, g2) с о Vx' е <2Х (р), т. е. PioeBi(g, и). Так как рю — произвольная точка множества Ti(g, и), то 1Ж v). (9.13) Установим теперь включение противоположного зна- ка. Возьмем i?ioeBi(g, и), т. е. D (Рю, я') = (р10, х' — х0) — (и, gj + /' (х0, у0, gx, 0m) + + /' (*0> У о, 0«> St) — f (х'< У о, °п, £2) <0 Vx' е & (р). (9.14) Выберем v е dfx(xo, уо) и зафиксируем т > 0. Поло- жим vx = Рю + т(р — р), pt(a) = p + apt. Имеем hi (х0 + agi, уо + ag2, р + apt, х') = = /(х0 + agi, уо + ag2) — /(х', у0 + ag2) + + (р+ aPt, х' — хо — agi) — е = (р, х' — хо) + + /(х0, yo)~f(x', Уо) - е + a [/' (х0, у0, gi, 0m) + + /'(хо, уо, On, g2)-f'(x', Уо, On, Я2) + (рю, х'-хо)- — (р, gi)] — a2(pt, gi) + ar(F-v, х' —x0) + o(a) — — oi(a,x')= hi(x0, y0, v, x')+a[D(Pio, x') + + t(p —p, x' — x0)] + o(a)— oi(a, x')— a2(pt, gi). (9.15) Ясно, что (p — p, x' — xo)= Ai(xo, go, v, x')— &i(xo, go, p, x'). (9.16) По определению v имеем / (^', go) — / (xo, Уо) > & x' — xo) Vх' (О-17) Отсюда К (x0, y0, v, x') = (p, x' — x0) + / (x0, g0) — — / (*', y0) — e < — e Vx' e Rn Поэтому из (9.16) получаем (v — p, x' — xo)< — e — — h(xo, yo, v, x"). Выберем 6 > 0 такое, что D (p10, x>) + т (p — p, x' — x0) ep Vx's Qi6 (p)t
§ 9. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 301 где Qu (и) = р (х', (р)) < б], р (х, Q) = min ||х—z||. zeQ Без ограничения общности можем считать, что мо 0 равномерно по х из (?1б(р) (см. условие леммы). Очевидно, что sup h(я0, у0, у, х'} = — а< <0. Из (9.15) ясно, что найдется ао>О такое, что h (*о +' a£i> Уо + v + аут, я') < 0 Va (= [0, а0], Vzz g= SSR1 (х0), т. е. vx е 7i (g, v). Устремляя т к +0 имеем Ую <= Г1 (g, v). Так как ию — произвольное из Bi(g, v), то Bi(g, f)<= <= Г1(р). Отсюда и из (9.13) получаем (9.7). Соотношения (9.8) устанавливаются аналогично. Ниже предполагаем, что условия леммы 9.2 вы- полнены. 2. Рассмотрим подробнее множества Ti(g, v) и r*2(g, w). Для этого вначале найдем множества Qi(v) и (>2(w). Имеем Q1 (у) = <21 (*о> Уо> р) = U' S К” I (*о> Уо> х') = °}- По лемме 9.1 (0 = [х' 6= ^В1 (•*#) I hi (*0, У о, х') = °}- (9.18) Так как (см. Приложение I) inf 4 [/ (х0 + ад, у0) — / (х0, у0) + е] = а>о а = max (v', ?i) V^elR", ®'еэе/х(»й,цв) ТО -7 [/ (хо + Уо) — f (*о> Уо) + е] — (v, ?i) > 0 Vg1eRn, Va>0. (9.19)
302 гл. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Имеем sup h± (х0, у о, V, х') = — inf [— ht (z0, у0, v, ж')] = x'eRn x'eRn = — inf inf [/ (x„ + agx, y0) — f (x0, y0) + e — a (v, gx)] = a>0 . . . , r/(*o + a9i’ vo)~ J/o) + 8 / J = — inf inf a ——-------1—---------------------(v, 5i)I. gi(=Rn a>o L a J (9.20) Положим «(a. 9i) = 7ГI/ (*o + a9i, Уо) — f (*o> Уо) + e] — (i>, 5i)- Поскольку из (9.19) следует s(a, 5x)^0 Va>0, Vy^P”, то инфимум в (9.20) достигается и равен нулю лишь при 9iePj(x0, у0, v) = = |?i е Rn I hlII = 1. Г (*0, Vv 0m) = h> ?1)I и as«(x0, у0, v, 5Х) = = |a>0( -£-[/U0 + a?i, у,) — /(«,, ур) + е] = = min [/ (х0 + а'ух, у0) — / (х0, у0) + е]1. а'>о а J Из (9.18) и (9.19) ясно также, что если v <= е int dtfx(xQ, уо), то Q\ (яо, уъ, и) = 0. Итак, окончательно из (9.7) получаем (xQ, #0, g, v) = Rn, если v е ^intdefx(xQ, уо). Если же v — граничная точка множества Эе/^(хо, уо), то Г1 (g, V) = {ух ё= 0?” | (V, Ух) С < [(”, gl) — / (*0- У0’ gv 0m) — /' (Ж0> Уо, On, g2) + + /' (*О + a hi) 51, у0, On, g2)J V71 <= Pi(x0, y0, v), Va(5i)e5l(a:0) y0, v, 5i)}. (9.21) Аналогично можно установить, что если w е @intdiA(^h Уо)> то Г2(жр, у0, gi w) = Rm. Если же w —
§ 9. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 303 граничная точка множества д^у(хо, уб), то Г2 (g, W) = {u>x е | — {wu q2) < P (0 ) [— g2) + / (*0, У O' £1> 0m) / (^01 J/o’ О», 82) — f (*0, Уо + ₽ (?8) Sv Om)] Vg2 e P2 (x0, y0, w), VP (g2) e= S3 (x0, y0, w, q2)], (9.22) где _ .. Л ta>> Уо> w) = = (g2<= fRm| h2||i= 1, /' (x0, ya, 0n, g2) = (u>, g2)}, й(жо, y0l wt q2) = {₽> О | y[/(x0, г/о+Р^г)—/(^0, £o)-N = - тя y f <*•>’ У<>+ ₽'?*> ~ f <*<•’ У<>) “ И 1 — HidЛ q f I • 0'>O P ' Если функция f\(x)= f(x, уо) не имеет линейных участков, то множество Qi(v) состоит из единственной точки. Действительно, из вида функции h\ следует, что в точке максимума по х' должно быть v^df*(x, уо). Ес- ли существуют две такие точки Xi и хг, то по лемме 1.5.8 из [27] функция fi(x) линейна по х на отрезке, соеди- няющем точки Xi и Х2» Итак, в этом случае множество Qi(v) состоит из_единственной точки. Нетрудно видеть, чтб Qi (р) = {а;о + a?i), где (v, qr) = max (у'г qr) = f’ex (х0, у0, qv 0m) = = inf -±- [f(x0 + aqr, y9) — f(x0, y0) + e] = a>o a == -^ (/(«0 + «?"1> Уо) — f (x0> Уо) + 8]. (9.23) a Тогда из (9.21) получаем Rn, если int5e/3C(x0, y0), Г1 (g, v)= v^n | (px, gx) < 4- [(p, gx) — f (x0, y0, gx, 0m)— a — f («0> Уо, °П» g2) + /' C*o + «?i> Уо, °m £2)1)1 если p e [defx (x0, y0)]tr- (9-24)
304 ГЛ. V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Здесь [А ] fr — множество граничных точек множества А. Аналогично, если функция /2 (*/)=/(«я^о, у) не имеет ли- нейных участков, то множество (?г(^) состоит из един- ственной точки и тогда из (9.22) получаем Rw, если w е int d^fy (я0, у0)л Г2 (g, ip) = [»!«= Rm| — (wlt g2)< <-=- [— (w, g2) + f (xot y0, gt, 0m) "T* p +/ (£()> Уо» Sz) / (•£(>’ Уо+РУа» Sit если w e [d^v (x0, ?/0)]fr, (9.25) где (w, q2) = min (w', q2) = /gV (x0, y0, 0ni q2) = №'еэи/„(х0^0) = sup [/ (z0, y0 + p?2) — / (x0, y0) - p] = 0>O P = T” I/ (^o> Уо “Ь P?2) / (^o’ Уо) Hl* (9.26) p При этом _ <?2(^)={l/o+P?2}. Замечание 9.1. Из того, что каждое из множеств Qi(v) и Сг(^) состоит в случае отсутствия линейных участков у функций fi(x) и /2(1/) из единственной точки можно заключить, что направления qi и д2? удовлетво- ряющие соответственно (9.23) и (9.26), единственны (для каждого v и w). 3. Точка 2* = [х*, у*] е F X Rw называется седло- вой точкой функции f, если / (x*i y)^f (х*> У*) </(я, У*) Rn, VУ е Rm. Пусть е > 0 и ц > 0 фиксированы. Точка z* называется (е, \ь)-седловой точкой функции f, если /(ж*, у) — y*)^f(x, у*) + ь Vze(Rn, Vye(Rm. Для того, чтобы точка z* была седловой точкой вы- пукло-вогнутой функции f, необходимо и достаточно, чтобы 0„e=5/e(s*, у*\, Om^dfv(x\ у*). (9.27)
§ 9. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 305 Для того, чтобы точка z* была (е, -седловой, необ- ходимо и достаточно, чтобы On €5 djx(x*, у*), 0m е д^у(х*, у*). (9.28) Условия (9.27) эквивалентны условию ф(я*, г/*)=0, (9.29) где Ф (х, у) = min || v II2 + min || w ||2t гед/х(х,у) we.Oty(x>V) а условия (9.28) эквивалентны условию феД^*, у*)= 0, (9.30) где феи (х, у) = min || v ||2 + min || w Ц2. Функции ф и фе|* могут быть взяты в качестве крите- риальных при решении задачи нахождения соответствен- но седловых и (е, ц)-седловых точек. Функция ф, вооб- ще говоря, является разрывной, в то время как функция Фец при е > 0 и ц > 0 — непрерывная (это связано с не- прерывностью по Хаусдорфу отображений djx is. d^fy). Покажем, что функция фец является дифференцируемой по направлениям. Так как феДя, у)= — ф(я, ?/), где -ф (х, у) = max [— и2] + max [— ш2], а функции —v2 и — w2 удовлетворяют условиям, при ко- торых имеет место теорема 4.1 из [23], то справедлива Теорема 9.1. Функция ф дифференцируема в точ- ке zo = [#о, Уо] по направлениям, причем t' g) = sup [— 2 (v0,1^)] 4- sup [— 2 (w0, wx)], vieri(S't’o) W-’J 31) где Vq = min . v2, wl = min . w2. veOefx(*o.vo) ^eM.xvv<>) Доказательство аналогично доказательству тео- ремы 4.1 в [23]. Положим Л = sup [—2(р0, vx)], /2 = sup [— 2 (w0, wj]. Vieri(«-,’o) “1еГ2(«.“’о) Из (9.31) имеем ‘Ф* (zo, g) = Ji + h.
306 ГЛ: V. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ Рассмотрим подробнее случай, когда функции f\(x) и /2(1/) не имеют линейных участков и когда v'^[dRfx(xo, уо)]fr, ™<=[дЛУ(хо, Уо)Ьг. В этом случае из (9.24) и (9.25) получим = ~=~ [(^0» 81) / (^0’ Уо> 81* 0w) / (*0> У О' On, S2) “1“ сс +7*(^о +a?i> Уо, О», £2)], j2 = -=- [— Н, £2) + /' («о, Уо, ё1> От) + /' (х0, у0, On, g2) — р — /' (*о, Уо + ₽?2, £1, От)]’* Здесь, как легко вйдеть, q\ = —Pq/HpII, q2 = ы?о/Пtc’oH. По- ложим x0 + agi=x', Уо + Й2 = У- Тогда -yi|/(zo, g)=A + 4-2?, где a \ p a /1 B— Если 1/p — 1/a > 0, to A = max В = min we[(t"i)eM“°,So)+ie/y Если же 17p — 17a < 0, to A = min La \p a} В = max max (v, gx) — >S0/x(«o.Vo) — 4 max (p, gjs P tes/x(x0-,y) Ц mih' (w, g2) + l / 4- 4- min (ip, g2). “ uea/v(x,i/0) (p, gj) 4- min (p, gx), ’е[-=-8'х(х°’й)] (w, Уг)- (*>»o)-|rwo] (V, gi), ja/xpo*)] (ip, g2) 4- min (гр, g2).
§ 9. АППРОКСИМАЦИЯ И СЕДЛОВЫЕ ТОЧКИ 307 В любом случае ф (zo> #) ~ max (z> ё) + min(z, g), z&C z&D где и=[р,1р], реС wt=Rm, С = С1хС2сГхГ D = Dr X D2 cz Rn X R™. Можно теперь найти направле- ние g наискорейшето подъема функции гр: ^'Очг?)= тах Ф'(*о>£)- gelRn+m 11^11=1 Для этого надо найти хаусдорфово полууклонение мно- жества С от множества D max min || zr — z2||. Это направление можно использовать и для построения численных методов разыскания седловых точек. Замечание 9.2. Как отмечалось выше, функция ф является, вообще говоря, разрывной, а функция фвц (при е > 0 и ц > 0) — непрерывной и, как показано, даже дифференцируемой до направлениям.
ГЛАВА VI ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ § 1. Одномерный случай 1. Пусть задана вектор-функция /(z) = /(#, у), где z= [я, у] е R™+n, хе R™, г/e Rn,/ = (/i, ../п). Вопрос о существовании и свойствах функции у(х) такой, что f(x, z/(^)) = 0n, и составляет содержание теорем о неяв- ной функции. Классическая теорема о неявной функции гласит, что если для некоторых g и yQ е Rn ока- залось f(xo, уо) = Оп и если функции fi — гладкие в окре- стности точки [яо, i/o] и при этом определитель матрицы, составленной из yQ), отличен от нуля, то в окре- стности точки xq существует единственная вектор-функ- ция у(х) такая, что f(x, у(х)) = Оп. При этом функция у(х) непрерывно дифференцируема в точке xq. В негладком случае все значительно усложняется. Рассмотрим простейший пример. Пусть х е О?1, у е R1, f(x, у) = х+\у\. Положим яо = О, */о = О. Ясно, что Цяо, */о) = О. При х>0 уравнение z+li/l=0 решения не имеет, а при я<0 существует два решения yi(x) = x и у2(х) = —х. Этот пример показывает, что в негладком случае имеет смысл говорить о существовании неявной функции по данному направлению. Пусть f(xQ, уо) = Оп» Фиксируем g . Требуется установить (достаточные) условия, при которых существуют вектор-функция у (а) и число (Хо > 0 такие, что / (xq + ag, у (a)) = 0n Va e [0, a0], 2/(O) = J/o, и изучить свойства такой функции. Из при- веденного выше примера следует, что для одних направ- лений может оказаться, что таких функций нет, а для других — что их несколько. Вначале рассмотрим случай п = 1. Пусть z = [х, у] е e5m+1, у<=№ и пусть задана функция f(z) = = f(x, у). Предположим, что zq = [хо, у о] —- решение урав- нения /(z) = 0, т. е. fto, уо)=О. (1.1)
§ 1. ОДНОМЕРНЫЙ СЛУЧАЙ 309 Зафиксируем gs R™, llgll = 1, и рассмотрим функцию y) = f(x0 + ug, у). где а>0, yeR1. Если найдутся такие число ао>0 и непрерывная функция у (а), определенная на [0, ао], что у(О) = уо, F У (а)) = ° Vae[O,ao], (1.2) то будем говорить, что (1.2) определяет неявную функ- цию у (а). Очевидно, что y(a) = y(g, а). Чтобы получить более конкретные результаты, надо наложить дополнительные условия на функцию /. Пред- положим теперь, что функция /(z) дифференцируема в точке zo = [#о, г/о] по направлениям, т. е. /(zo + aY]) = /(zo) + a/,(zo, TjJ+o^a), (1.3) где f(z0, п) = f(l^ У о], [g, ?])= = Hm А [/ (z0 + arj) — / (z0)], г] = [g, g] ge Rn+\ OUO a >0 Vr)sRro+1. (1.4) a ajo 1 v 7 Будем предполагать, что (1.4) имеет место равномерно по q, llgll = 1 (напомним, что у нас g^Rm фиксирова- но). Это условие не является ограничительным. Так, если функция / липшицева по z в окрестности точки Zo, то (1.4) имеет место равномерно по T]eRm+1, Нц11 = 1 (см. § 1.3). Положим h(q) = f ([#о, уо], [g, g]). Предположим, что существует g0 е R1 такое, что А(до) = О, т. е. f (zo, Цо) = = 0, где Цо = [g, go]. Введем функцию Н ($) = /'( [#о, Уо], [g, ?о + Р]). Ясно, что Я(0) = 0. Лемма 1.1. Если функция Н дифференцируема в точке Р = 0 справа и слева и если при этом н'+ (0) =/= 0, HL (0) =# О, sign я; (0) = - sign Я1 (0), (1-5) то существуют число ао > 0 и функция у (а), оп- ределенная на [0, ао] и непрерывная (справа) в точ- ке 0 такие, что выполнено (1.2). Кроме того, функция
310 гл. VI. ТЕОРЕМА О НЕЯВНОЕ ФУНКЦИИ у дифференцируема справа в точке а = 0 и у(П) = у0, £/+(O)=go- С1-6) Здесь 4(0) = lim-l[F(a)-F(0)L аю а FL(0) = lim±[F(a)^F(0)]. at о а Доказательство. Из (1.5) следует строгая моно- тонность функции Н в окрестности точки р = 0. Из (1.3) получаем / («о + “£> у О + « (<?о + ₽)>=“ [Я (Р) + — а = afei (a> ₽). где, по предположению, °{а< Р) —» о (1.7) равномерно по Р при Ipl Ро? Ро>О. Из (1.5) и (1.7) вытекает существование таких ао> >0, Pi > 0 и Рг<0, что fti(a, Pi)=^0, Ai(a, £2)^0, signfeja, PJ = — signfex(a, P2) Vae [0, а0]. Конечно, pi и P2 зависят от a, при этом можно выбрать их таким образом, что Pi 0, Р2 0 при a! 0. Тогда из непре- рывности функции h\ по р заключаем, что существует Р(а) такое, что ^i(P(a)) = 0, т. е. /(яо + ag, go + a(go + + ₽(а)) = 0, а это и значит, что существует функция y(a) = go + a(go+Р(а)) такая, что f(xo + agt j/(a)) = O Vae [0, а0]. При этом ясно, что р (a) 0. Ясно также, что имеет место (1.6) и что функция у (а) непрерывна справа в точке а = 0. 2. Рассмотрим теперь случай, когда функция f(z) Квазидифференцируема в точке zq = [#о, go]. Тогда gob Q]) = = max ((v1? g) + v2q) + min ((ш1? g) + w2q). [vrv2]e^(zo) [tprw2]ed/(zo) Поэтому задача разыскания go сводится к решению урав- нения (при фиксированном g) max ((vx, g) + p2g) + min ((u’v g) + w2q) = 0. [iVdWo) [wi.w2]ea/(z0) (1.8)
§ 1. ОДНОМЕРНЫЙ* СЛУЧАЙ 311 Предположим, что решения уравнения (1.8) существуют, и пусть до — некоторое решение уравнения (1.8). По- ломким (Р) = max ((vt, g) + v2 (q0 + p)), ^2 (P) = mil1 ((«’1» Si + W2 (QO + P))- Тогда Я(Р) = Я1(Р)+Я2(Р). Имеем ff'+ (0)" = max v2 + min w<2, (1'9) ®aeW' ’»2е«(’о) гдё R (?) = {vz е I 3 [vn Р2Г<= df (z0); (г15 g) + v2q =Н1 (0)}, (1.10) Q (Q) = {^2 e R11 В[»1, w2pe5/(z0): (<rlt g) + w2q=H 2(0)}. (1.11) Очевидно, что R(q) и Q(q) зависят и от g. Аналогично Я1_('0) = — пНп и2 — Ща!х w2. (1-12) v2eH(g') w2eQ(g»0) Очевидно, что 7?(gb) й @(</о)—отрезки (возМдяшо, вы- рождающиеся в точки). Пусть R(go) = [#i, &1]» <2(?о) = = [^2, 62]. Тогда Н'+ (0) = + а2, Н_ (0) = — а± — Ь2, и условия (1.5) сводятся к условиям bi + аг =^= 0, ai + &2 0, sign (bi + а2) = sign (ai + Ь2) • (1.13) Нетрудно видеть, чтб эти услойя эквивалентны условию 1-<?(^о)ГПЛ(до)=0. (1.13') Таким образдм, прй достаточно малых а при выпол- нении условий (1.13) существует функция Ц(а) такая, что /(w+ag, yo + a(go + P(a)) = O. (1.14) Еслтг квазидйфференциальное отображение S)f полу- непрерывно сверху в окрестности точки zq, то можно
312 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ показать, что при выполнении условия (1.13) функция 0(a) однозначна (при достаточно малых а>0). Дей- ствительно, в противном случае (если найдутся 01 (а) и 02 (а), удовлетворяющие (1.14)), внутри отрезка [01(а), 02(а)] функция hi($) = f(xQ + ag, i/o + <x(?o +0)) дости- гает локального экстремума. Пусть это будет точка 0. По необходимому условию экстремума в этой точке должно быть выполнено одно из включений ; -5М0")<=<*М0), (1.15) г' -5М0)<=дМ0) (1.16) (условие (1.15) выполняется, если £ — точка локального минимума, а (1.16)—если 0— точка локального макси- мума). Но 5А1(0) = 7?(б?о), ЗЛ1(0) = Q(qo). Если отобра- жение 2)f(z) полунепрерывно сверху в окрестности точки zo, то легко видеть, что и отображение S5fti(0) = [5Ai(0), д/и(0)] полунепрерывно сверху при 0 = 0. Из (1.13) тогда следует, что при достаточно малых 0 будет дЛ1(0)П П [—dfei(0)] = 0, поэтому ни одно из условий (1.15) и (1.16) не может быть выполнецо. Значит, теперь можно утверждать, что функция 0(a) не только однозначна, но и непрерывна при достаточно малых а>0. __ Положим А = Рту (df (z0)), В = — Pry (df (z0)), где Ргу С — проекция множества С на ось у. Лемма 1.2. Если = (1.17) то уравнение (1.8) при любом g имеет eduHcreeHHoe ре- шение go —go(g), при этом функция Hgtqffi~f' ([х0, у 0], [g, q0 + Pl) duффepeнцupyeмa в точке 0 = 0 справа и слева, и выполнены условия (1.5). Доказательство. Пусть A ==[ai, 0J, 5 = [аг, 02]. Из (1.10) и (1.11) следует, что R (?) = Rg (?) Ч [«i> 011 Vgt Q(q) = Qg(q)<= I— а2, — М Vg. Из (1.17) заключаем, что для функции Я(^ = Я^9(^) = = /' ([*о, go], [g, qo + ₽]) будет | Н'+ (0) | > с, Н'_ (6) | > с Vg,qQ> где c = max{ai + 02, —аг —£i)>0. Кроме того, при этом sign// +(0) = —sign.H_(0). А это и означает,
§ 1. ОДНОМЕРНЫЙ СЛУЧАЙ 313 что функция Н строго монотонна и потому для каждого g существует единственное qo, являющееся решением уравнения (1.8). Таким образом, выполнены условия леммы 1.1. По- этому справедливо Следствие 1.1. Условие (1.17) является достаточ- ным условием того, что в окрестности точки Xq существу- ет неявная функция у(х), которая является дифферен- ту (*о) цируемои в точке хо по направлениям, при этом ——ss ==у'(xQ, g) = ?o(f)» г^е <7o(g) есть решение уравнения (1.8), и это решение единственно. Если, вдобавок, отображение 2)f(z) полунепрерывно сверху в точке zo, то функция у(х) в окрестности точки Xq однозначна и непрерывна. Таким образом, нам удалось установить не только до- статочные условия существования неявной функции по данному направлению, но и установить достаточные ус- ловия существования неявной функции в обычном смысле. Отметим, что если условие (1.17) не выполнено, то может оказаться, что для одних направлений существует несколько неявных функций (в том смысле, что суще- ствует несколько решений уравнения (1.8), а потому и несколько функций у (а) таких, что /(^o + ag, у(а)) = 0), а для других — таких функций не существует. Следствие 1.2. Если f — субдифференцируемая функция, то в качестве 3)f(zo) можно взять 3)f(zo) = = [5/(zo), {0w+i}], и условие (1.17) эквивалентно условию 0^4. Аналогично, если f—супердифференцируемая функ- ция, то условие (1.14) эквивалентно условию О&В. Если / — гладкая функция, то <Z>/(zo) = [{/'(^о)), {0m+i}], и потому условие (1.17) сводится к хорошо из- вестному классическому условию f'y (xQ, у0) 0. 3. Рассмотрим более подробно случай тп = 1, п=1, т. е. функция / есть функция двух переменных. По- ложим t (Т)) = /' (z0, я) = , Т| €= К2. Найдем решение уравнения ♦00-0 (1.18) при условии 11ц11 = 1.
314 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Предположим, что уравнение (1.18) имеет конечное число решений гр, ..., тр, где = (ри, ргь). Конечно, мо- жет оказаться, что (1.18) имеет или бесконечное число решений, или ци одного. Так, если —d/(zp)<= int 5/(яо) или df(zo)^ int(—df(zo)), то уравнение (1.18) не имеет решений. Возьмем решение r]ft =(pu, P2k)- Если pu> 0, то gu = = PtiJpxh является решением уравнения (g) = max \ух + v2q) + min (wx + w2q) = 0. (vi*va)e^(zo) (wi»w2)e^(zo) (1.19) Если, кроме того, функция h\(q) строго монотонна в цкрестности точки дчА, то существует функция г/ (ос), оп- ределенная на [0, ао], где ао > 0, и непрерывная справд при а = 0, такая, что У(О) = Ко» /(^о + »^(а)) = 0 Vae[0,ao]. (1.20) Функция у(а) дифференцируема сцрава в точке а = 0 и i/+(0)=g1/l. Если, вдобавок, отображение 3)h\(q) полу- непрерывно сверху в окрестности точки q\h, то при доста- точно малых а функция у (а) однозначна и непрерывна по а. Если ри<0, то q2k = P2k/(—p\h) является решением уравнения Д2(?)= (—yi+y2?)+ min (—iri + zr27) = 0. (wvw2)Gdf(7Q) (1.21) Если функция hv^q) строго монотонна в окрестности точки <12ъ tq существует функция у .(а), определенная на [0, ао], где ао > 0, и непрерывная справа при a = 0, та- ран, что У (°) - %, /,(*о — У (а)) = 0 Va е [0, а0]. (1.22) Здесь, как и выше, ао зависит от дгл,- Функция у (а) дифференцируема справа в точке a = 0 и у+ (0) = q2k> Если p\h = 0, то уравнение f^xo + ag, у) == 0 может ц^е^р решение (при g = +l g — — 1), у которого бес- конечная производная в нуле (это решение соответствует точке ти).
§ 1. ОДНОМЕРНЫЙ СЛУЧАЙ 315 Если piA>0 VZcel:Z, то уравнение /(хо —а, у) = 0 в окрестности точки уо не имеет решений при достаточно малых а > 0. Аналогично, если Pi&<0 V&e 1 : Z, то урав- нение /(#о + а, у) = 0 в окрестности точки Уо не имеет решений при достаточно Малых об > 0. Отметим, что-других точек, кроме указанных (гц, ... ..., тр), рассматривать не надо. Точки т]1, ..., т|/ дают возможность решить и обратную задачу: найти решения уравнения /(я, yo + aq) = O (где q = +1 или q = — 1). Так, если р<& > 0 и функция К (g) = max (i^g + v2)+ min (iPxg + iv2) (vvv2)^=^(zo) ' (?rltw2)ea/(z0) строго монотонна в окрестности точки g\k = p\hlp2k, то существуют do>0 и функция я (а), определенная на [0, do] и непрерывная справа при а = 0, такие, что * (0) = f & («), Уо + а) = 0 Va €= [0, а0] (1.23) и х'+ (0) = glk. Айалогйчно, если ръъ, < 0 и функция h2 (g) = max (i?xg — v2) + min (u\g — zr2) (Wi>W2')G^(20) строго монотонна В окрестности ТОЧКИ g2k = Pu/(— £2ь), то существуют ао>О и функция я (а), определённая на {0, do] й непрерывная справа при а == 0, такие что ж(0) = а:0) /(^(а)', у0 — а) = 0 (1.24) й х'+ (0) = g^. Условия единственности й непрерывности функций х (а) устанавливаются, как и выше. Пример 1.1. Пусть f(z) = f(x,y)=\x\ — \y\ + 2y, х^ О?1, у R1. Возьмем точку ио = (О, 0). Очевидно, что /(zo) = O. Нетрудно подсчитать, что в качестве tH)f(zo) можно взять 3)f(zo) = [df(zo), d/(zo)L гДе df(zo) = = со{(—1, 2), (1, 2)}, l/(za)=eo{(0, -1), (0, 1)). На рис. 49 множество df(zo) отмечено жирной линией, а _ df(zo) — пунктиром (в данном случае оказалось -5/(2о) = 5/(ио)). Найдем* решения уравнения t|)(r|) = O при условии HtjII'= 1. Пусть Li — прямая, проходящая через Точки
316 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ (1, 2) и (0, — 1), a Z2 —прямая, проходящая через точки (—1, 2) и (0, —1). Через z\ и Z2 обозначим соответствен- но точки L\ и Z>2, ближайшие к началу координат. Оче- видно, что решениями уравнения 1|)(ц) = 0 являются тц = = (3/У10, -1/У10), ц2 = (-3/У10, -l/VW). Так как рн = = 3/У10>0, то 7н = —1/3. Функция /и (7) (см. (1.19)) строго монотонна в окрестности точки 7п, поэтому уравнение (1.20) имеет решение у (<х) при достаточно малых а > 0 и при этом У+ = — 1/3. Аналогично, так как />21 = = -3/Й0<0, то 721 = -1/3, и уравнение (1.22) имеет ре- шение z/(a) при достаточно малых а>0, и при этом 4(0) = — 1/з. Теперь найдем зависимость х от у. Поскольку вторые ком- поненты векторов T)i и Ц2 от- рицательны, то существуют две непрерывные функции #i(a) и достаточно малых <х>0 и та- кие, что Я1(О) = яо, f(Xi(a), уо — a) = 0, f=l, 2. Более того, функции xt дифференцируемы справа в точке а = 0 и Яц-(0) = 3, я2+(0) =— 3. В то же время уравне- ние f(x, #o + a) = O не имеет решения при а>0. Эти результаты получены с использованием изложен- ной выше теории. Решим эту же задачу непосредственно. Имеем f(xo + ag, Уо + «7)= I«£l ~ 1од1 + 2«7 = 0. (1.25) Отсюда Igl- 171+27 = 0. (1.26) Уравнение (1.26) эквивалентно четырем уравнениям: 1) £ — 7 + 27 = 0 при £>0, 7^0, (1.27) 2) g + g + 2g = 0 при g>0, (1.28) 3) -g - q + 2q — 0 при g^O, (1-29) 4) -g + q + 2q = 0 при g^O, q C 0. (1.30)
§ 1. ОДНОМЕРНЫЙ СЛУЧАЙ 317 При g=l имеем решение ? = —1/3 из (1.28), при g = = —1 имеем решение <? = —1/3 из (1.30). Уравнения (1.27) и (1.29) не имеют решений. Таким образом, при q = 1 существует единственное решение уравнения (1.25) уг (а) =—^-а, а при ? = —1 тоже существует единст- венное решение у2 (а) = _-±а. Аналогично из (1.28) и (1.30) заключаем, что при q = 1 не существует решений (1.25), а при q = —i таких решений два: xi (а) = За, х% (а) = = —За. Таким образом, пря- мые расчеты подтвердили выводы теории. Пример 1.2. Пусть /(я, i/)=k+y2-2|-k2 — — 2у + 11, х е О?1, у^ R1, /(ио) = О. Ясно также, что взять 2>f(zQ) = [df(zo), df(zQ)], где Zo = (l, 1). Очевидно, что в качестве 3)f(zo) можно d/(z0) = со {(1, 2), (-1, -2)}, 3/(zo) = co{(2, -2), (-2, 2)}. Из рис. 50 видно, что уравнение /'(z0, rj) = O при Нт]11 = = 1 имеет четыре решения Гц = (4/П7, 1/У17), г)2 = (-4/У17, - 1/V17), Т]3=(0, 1), Т)4 = (0, -1). Уравнение /(хо + а, ?/(а)) = 0 имеет решение, связанное с точкой т|1, такое, что i/(0) = уо = 1, у+ (0) = 1/4. Анало- гично уравнение f(xo — а, */(а)) = 0 имеет решение, свя- занное с точкой т]2, такое, что у(0) = уо= l,i/+(0) = — 1/4. Точки т]з и т]4 указывают (поскольку р1з = Р14 = 0) на возможность существования решений уравнений (1.20) и (1.22) с бесконечными производными справа в точке а = 0. Проведенные ниже непосредственные вычис- ления показывают, что это действительно так.
318 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Так как г=1, 4, то уравнение f(x, уо + а) = О при достаточно малых а > 0 имеет два решения х\ (а) и #2(а), связанные с точками т)1 и т]2 и такие, что xi (0) = ДО) = ха = 1» ^1+ (0) == 4, Х2+ (0) = 0. Аналогично, уравнение f(x, уо — <х) = 0 имеет два реше- ния хз(а) и #4(а)> связанные с точками т)з и т)4, такие, что ^з(О) =-г4(0) = rr0 = 1, я'+(0) = — 4, 4+ (0) = 0. В данном случае тоже можнд провестй непосредствен- ные вычисления, правда, уже более громоздкие, чем в примере 1.1. Решение уравнения /С*о + <х£, i/(a)j = 0 (1.31) эквивалентно решению следующих четырех систем ра- венств и неравенств: 1. yi + ag — 1 — (1 + a£)2+ 2у — 1 = 0, у2 4- ag — 1 > 0, ;(l + ag)2-2y + l>0. (1.32) 2. ’ у2 + ag — 1 +(1 + ag)2 — 2y + 1 = 0, у2 + ag — 1 > 0, (1 + ag)2 — 2y 4- l<0. (1.33) 3. ’ y2 4- ag — 1 4- (1 4- ag)2 — 2y 4- 1 = 0, ' y2 + ag — 1 < 0 ,- (1 + ag)2 — 2y 4- 1 > 0. (1-34) 4. y2 4- — 1 — (1 + ag)2 4- 2y — 1 < 0, : y2 4- ag — 1 < 0, (1 4- ag)2 — 2y 4- l<0. (1.35) Изучение попарно систем (1.32), (1.35) и затем (1.33), (1.34) показывает, что решениями уравнения (1.31) яв- ляются решения уравнений у2 + 2у - 3 - ag - a?g2 = 0 (1.36) и у2 - 2у + f + 3ag + a2g2 = 01 (1.37)
§ 2. ОБОБЩЕНИЕ ТЕОРЕМЫ КАКУТДНИ 319 Учитывая, что нас интересуют решения г/ (ос) такие, что j/(O) = Z/o=l, получаем сдедующие решения: У1 (а) = — 1 + У4 + ag + .a2g2 (из (1.36)), г/г(а)= 1 + V-?ag-.a2g2 (из (1.37)), уа(а) = 1 - V-3ag - a2g2 (из (1.37)). Так как мы рассматриваем только а>0 и нас инте- ресуют лишь вещественные решения, то приходим к вы- воду, что при g = +l имеется одно решение yi(a) = —1 + + У4 + a + -а2, причем Уг+ (0) = 1/4, а при g = — 1 .есть три решения yi (a) = —1 + V4 — a + -a2, y%(a) = 1 + + У 3a —a2, i/3 (a) = 1 — УЗа — a2. .При этом gi+(0) = — 1/4, а решения r/2(a) и г/з(а) имеют бесконечные прдвые про- изводные в точке а = 0. О возможности существования таких решений мы были «предупреждены» прд .использо- вании теоремы о неявной функции. Пример 1.3. Пусть f(x, у) = 1х + у2 — 2| + 1х2 — 2у + + 11, хе(R1, i/eR1 и zo = (l, 1). Ясно, что /(zo) = O. Нетрудно видеть, что в качестве <Z>/(zo) можно взять ^/(zo) = [5/(zo), d/(zo)], где d/(z0) = со {(3, 0), (-1, 4), (1, -4), (-3, .0)}, 5/.(z0) = {(0, О)}. Так как -#(z0)<= cintd/(zo), то уравнение f'.(zo, т])=.О (при .ЦП = 1) не имеет решений. Поэтому и уравнения (1.20) и (1.22) не имеют решений в окрестности точки zo. § 2. Обобщение теоремы Какутани Пусть К cz Rn — выпуклое замкнутое ограниченное множество, и пусть на К заданы отображения Я: -^2Rnxn, г: K->-Rr \ где Rnxn— пространство веществен- ных (иХ и)-матриц. Предположим, что отображение 81 полунепрерывно сверху на К, а отображение г непрерыв- но на К, и что для каждого х^К множество матриц Я(т) выпукло, замкнуто и ограничено. Теорема 2.1. Если*) min det^>,0 или щах Це1Л,<0 (2.1) АеЯ(т) Ае$((т) тек тек *) В данном случае условия (2.1) эквивалентны условию min | det АI > 0. Ае$Цт) тек
320 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ и отображение Ф(т) = й-1 (т)г(т), где 5С“1(т) = {С = = Л-1| А еЯ(т)}, переводит К в подмножество множе- ства К, то отображение Ф имеет на К неподвижную точ- ку, т. е. существует т* е К такое, что т*еф(т*) (2.2) или, что то же, найдется Лое®(т*), для которого т* = Л^г(т*). (2.3) Доказательство представляет собой модифика- цию доказательства теоремы Какутани (см. [43, 152]). Как и в [43], для любого е > 0 найдется конечная е-сеть для множества К'. xei, ..тЕт(е). Строим функции /ш(е) S <pEj(r) Vie=l:m(e)» 5=1 где фег(т) = тах{е — Пт — тЕД 0). Так как {т^1/ е ^1:тп(е)}— 8-сеть, то хотя бы для одного I будет фег(т)>0. Отметим, что функции фЕ< непрерывны и что т(е) aci (т) > 0, j} aEi (т) = 1. (2.4) i=l Для каждого iel:m(e) выберем произвольные A6i^ ^Я(Тег) и построим однозначное отображение (ТИСЕ) \“1 S Obei (т)-Ле4) г(т). (2.5) 1=1 / Это отображение непрерывно. Нетрудно проверить, что выполнены все условия теоремы Шаудера, и потому су- ществует неподвижная точка отображения Фв, т. е. най- дется те К такое, что (тп(е) \—1 2 OCei (те) • Ле$ I г (те). (2*6) 1=1 / Так как К — компакт, то найдутся последовательность {еА} и точка т* К такие, что EfcJO, T£ft->T*, (TEft) = TEft. (2.7) Теперь, как и в [43], показываем, что для любого фиксированного е > 0 при достаточно больших к в сумме ™(Ел) 2 (2*8) i=l
§ 3. МНОГОМЕРНЫЙ СЛУЧАЙ 321 ненулевые коэффициенты будут разве лишь у тех сла- гаемых, для которых |T8fti — (2.9) Напомним, что Afti<=St(Tefti). (2.10) Отсюда и из (2.6), (2.8), (2.10) по теореме Каратеодори можно считать, что /п2+1 \~т Тел ~ I ,2 (Тел)*^ел{) <ГМ> (2-И) \ i—1 ' где Aefii (= 91 Без ограничения общности можно считать, что —> Ait a8fti (Teft) -> aj. При этом П2+1 cti>0, 2а{=1. (2.12) i=l Имеем /п2+1 \ -1 т*= 2 Mi -г(т*). (2.13) \ i=l / Так как е — произвольное, то учитывая полунепрерыв- ность сверху отображения Я, заключаем, что в (2.13) Лге§[(т*). Поскольку й(т*)—выпуклое множество, то из (2.12) т* = 4^г(т*), (2.14) п2+1 где Ао = 2 аМ|^й(т*). Из (2.14) и заключаем, что i=l т* — неподвижная точка отображения Ф. Теорема до- казана. § 3. Многомерный случай 1. Пусть z = [x, 1/еКп, и пусть функции 1: л, квазидифференцируемы на Rm+n. Рассмотрим систему /г(я, #) = 0 V? е 1: тг,
322 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ которую можно записать в векторной форме /(z) = 0„, !! (3.1) где f = (/i, /„), OneRn. Предположим, что /(zo) = On, где zo = [xo, Уо]. Требу- ется найти вектор-функцию у(х) такую, что fi (х, у (ж)) = 0 Viel:n, VxeX0, где Хо с Нт — некоторая окрестность точки xq. Поскольку, как уже отмечалось в § 1, в такой поста- новке задача может не иметь решения, то рассмотрим задачу о нахождении такой функции не для всех х из Хо, а лишь для х из пересечения заданного луча с Хо. Точнее говоря, рассмотрим систему уравнений fi (х0 + ag, у (а)) = 0 V i (= 1: и, (3.2) где а > 0, g s (Rm. Требуется найти по возможности не- прерывную функцию у (а) такую, что у(О) = уо. Зафик- сируем g е О?”*. Так как функции квазидифференцируемы в точке z0 е Rm+n, то А (*0 + ag, У о + aq)= = fi (®о» Уо) + a/i (z0, [£, у]) + (а, у) = = aft (z0, [g, у]) + Oi (а, q)t (3.3) где fi (z0, fe. У]) = max [(vH, g) + (p2{, y)J + ®ie9A(z0) + min [(u’1{, g) + (w2i, y)]. (3.4) «>ie9/i(zo) Здесь S)fi(z) = [dfi(z), df{(z)] — квазидифференциал функ- ции ft в точке z; dfi (z) cz Rm+n, dfa (z) cz Rm+n соответ- ственно суб- и супердифференциалы функции fi в точке Z; Vi=*[vii, P2i], w{ = [wu, w2i]. Пусть уо <= 7?” — решение системы fi (z0, [g, Уо]) = 0 V i <= 1: п. (3.5) Предположим, что в (3.3) а
§ 3. МНОГОМЕРНЫЙ СЛУЧАЙ 323 равномерно по A (qQ) = {<7 е Rn | || g — q01| <1 6), где 6 > 0 — фиксировано. Это условие не является ограничи- тельным и выполняется, например, если функция / лип- шицева. Будем искать решение у (а) системы (3.2) в виде i/(a) = !/о + а[<7о + т(а)]. Если удастся установить суще- ствование числа ао>О и вектор-функции т(а), удовлет- воряющей системе fi (^0 + Уо + а (<1о + т (а))) = ° Vi €= 1: n, Vae= [0, а0], (3.7) и такой, что т(а)->0, то тем самым решим и исходную задачу о существовании неявной функции, заданной си- стемой (3.1), в направлении g. Возьмем е>0 и введем множества (zo) = {Pi <= dfi (z0) I (pH, g) 4- (v2i, q0) > t max g) + (t>2i, g0)] — e], (38) Ле (z0) = {wi<= dfi (z0) I (wH, g) + (u?2i, q0) < < min [(«4i, g) + (u4, g0)] + e}. Wie^i(2o) Эти множества зависят также и от zo, g, qo. Зафиксируем е > 0. Если IIт11 достаточно мала, то f'i (zo> ?0 + Т]) = max [(р1Ъ g) + (i>2i, g0 + t)1 + rie5ie(xo) + min [(w’n, g) + (ir2i, g0 + t)]. wie®ie(2o) Отсюда min (v2i, t) + min (w2i, %) ®‘e”ie(2o) ®|ей1е(г0) < fi (Z0, 1ёГ. 9o + TD — fi (г0- 9ol) < max (p2i, x) + max (iz’2f, r). (3.9) ®ie£ie(*o) ю{ей{е(го) Учитывая (3.5) и выпуклость множеств Rit(zo) и _R(e(zo), по теореме о среднем найдем такие г?((т) е Л,г(го), гр,(т)е еЛ,е(г0), что f 'i (zo» [£i ?о + т1) = (у2» (т) + w2i (т), т). (3.10)
324 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Множество точек [рг, Wi} е Riz (z0) X Riz (20), удовлетво- ряющих (3.10), обозначим через ЛЦт). Через М(х) обо- значим множество матриц, построенных так: М (т) = 1 А= ••• di = 1>2г + И>2г]Т, [pit iPj] (= Ni (т) Vi Здесь y< = [Ph, wt = [wu, u>2i]. Отображение M вы- пуклозначно (т. e. для каждого т множество М(х) вы- пуклое) и полунепрерывно сверху, т. е. из того, что Ak^M(xk), Ак-+А, следует ЛеЖ(т). Из (3.3) и (3.10) получаем fi (*О + ag, Уо + a (q0 + т)) = = a [(i>2i (т) 4- w2i (т), х) + °* + ^1- (3.11) L j Положим Гг (а, т) = Oj(«, % + т) Fia(T) = (P2i(T)+w2<(x), т)+л(а, т). (3.12) Введем множество матриц M8(ZO) = п at = = [^2i + «’2ilT, y2i e Rie (zo), ^2i S RiS (z0) Vi (3.13) Существует такое Si > 0, что М (т) <= Me, (z0) Vts^6is{t| hlKM- (3-14) Теорема 3.1. Если для некоторого е>0 оказалось min detX>0 или max det24<0, (3.15) АемЕ(20) A£Me(z0) то при достаточно малых положительных а существует решение системы (3.7) или, что то же, системы Fia(r) = 0 \fi е 1: п. Если же вдобавок оказалось min det А > 0 или max detA<0, (3.16) AeM£(^6(z0))
§ 3. МНОГОМЕРНЫЙ СЛУЧАЙ 325 где Ме(^б(г0))= U Me(z), 6>0, то упомянутое ре- llz-zoK6 шение системы (3.7) единственно при достаточно малых а и непрерывно. Доказательство. Положим Л/-1(Т)={С = Л“1| ЛеМ(т)}, г (а, т) = (п (а, т), ..., гп (а, т)). Построим отображение Фа(т)=-М"1(т)г(а, т). Из (3.15) следует полунепрерывность сверху отобра- жения Фа (для каждого фиксированного а > 0) по т на Ясно также, что существует ао>О такое, что Фа (%) с= Va е= (0, а0]. (3.17) Таким образом, выполнены все условия теоремы 2.1, поэтому существует решение системы (3.7). Покажем его единственность при достаточно малых а>0. Допустим противное. Пусть найдутся Ti(a), Тг(а), такие, что Ti(a)¥= тг(а), Ла(т1(а)) = Г^(т2(а)) = 0 Vi е е 1 : п, т. е. /«(*о + ag, у0 + а (q0 + (а))) = = h(*о + ag, Уо + а(9о + х2(а))) = ° Vie=l:n. Рассмотрим функции одного переменного hi (?) = fi (*о + ag, Уо + a (q0 + (а) + + (1 — у)т2(а))) Viel:n. Так как Л,(0) = fej(l) = О, то в интервале (0, 1) функция h((i) достигает либо наибольшего, либо наименьшего на отрезке [0, 1] значения. Пусть этот экстремум (для опре- деленности предположим, что это минимум) достигается в точке Yi . По необходимому условию минимума должно быть h'i+ Но h'i+ (?* ) = fi (k + ag, у0 + aq0 + ат2 (а) 4- + Y*a (тх (а) — т2 (a))], [git 9ij), h'i-(?’) = fi (К + ag, y0 + agQ + ax2 (a) + + T*a (*i (a) - r2 (a))], [gb - 9ij),
326 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ где gt = 0m, 5. = а(т1(а)—т2(а)). Итак, h'i+ (?*) = “[ max (v2i, ti (а) — т2 (а)) + lv2ieyi + min (u’2i, Tj (а) — т2 (а))1 = w2i^Wi J = a [(i>2i + Ь (а) — т2 (а))] > 0, (3.18) (у*) = а Г max (v2i, т2 (а) — тх (а)) + Lv2ieVi + min (w2i, т2 (а) — тх (а))1 = w2ieVyi J = а [(^i + u>2i, т2 (а) — "h (а))] > 0, (3.19) где Vi = {v2i <= Rn | Згц €= Rm: [Гц, v2i] e= e dft (x0 + ag, y0 + а?0 + ат2 (a) + T*a (тх (a) — т2 (а)))|2 Wi = {m2i <= Rn | 3irn e tRm: [u>1{, w2i] e e dfi (*0 + ag, y0 + a?0 + ат2 (a) + y*a (тх (a) — t2 (a)))). Из условия (3.16), соотношений (3.18), (3.19), непре- рывности скалярного произведения и выпуклости мно- жеств Vi и Wi следует, что найдутся v2i Vj и ir2i е Wi такие, что (y2i + u>2i, тх (a) — т2 (a)) = 0. (3.20) Отметим, что, вообще говоря, для разных i точки Yi в (3.18), (3.19) разные. Из (3.20) заключаем, что АУ = 0п, (3.21) ai | • • • L «i = (y*i + ^2i)T> Y = Ti (a) - т2 (a) 0, ап J где А = Но (3.21) противоречит условию (3.16). Полученное противоречие доказывает единственность. Отметим, что решение единственно для данного до. А вообще говоря, решений (для данного направления g) столько, сколько существует до, удовлетворяющих (3.5). Осталось доказать непрерывность т(а) при достаточно малых a > 0. Допустим, что в некоторой точке a > 0 не-
§ 3. МНОГОМЕРНЫЙ СЛУЧАЙ 327 прерывности т(а) нет (и а настолько мало, что уже имеет место единственность т(а)). Выберем последова- тельность {aj такую, что а, т(ал)-> т. По непрерыв- ности функций fi будет О = Л(;го + (Ха£, Уо + аДдо + т(ал))-> ->/Д<г0 + а£, г/о + а(?о + т)) = О, т. е. т является решением уравнения F.- (т) = 0. По уже доказанной единственности других решений это уравне- ние (в окрестности точки до) не имеет, что противоречит допущению. Следствие 3.1. Если до — решение системы (3.5) и выполнено условие (3.15), то система (3.2) имеет ре- шение у (а), определенное на [0, ао] {где ао>0) и та- кое что У+ (0) » lim 1у (а) — у (0)] = д0. а|о а Следствие 3.2. Если для каждого ||^||=1в существует решение (3.5) и выполнено условие (3.15), то в некоторой окрестности точки xq система /i(rr,g) = O \fl^i:n имеет решение. Замечание 3.1. К сожалению, в негладких зада- чах в большинстве случаев оказывается, что решение (3.5) существует не для всех g. Замечание 3.2. Из изложенного выше вытекает следующая процедура решения задачи о неявной функции. Каждому набору Vi^dftfa), Wi^dfi{zo) отвечает си- стема равенств и неравенств (ун + wlb g) + {v2i + w2i, g) = 0 Vie 1 :n, (Vu, g) + (v2i, q) , max [(i^, g) + (v2i, ?)] Vi e 1: n, g) + (w2f, g) < min [(u4,g) + (u4i,g)] Viel:n. wi^^i(zo) Для каждой такой системы получаем решение go = go(g), справедливое на некотором непустом множестве Q ==
328 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ = Q(Pi, Wt) (для этого надо вначале решить систему ра- венств, полученное решение q подставить в системы не- равенств, которые и определят множество Q). Конечно, может оказаться, что множество й пусто. В результате получим множества Й(г>«, Wi) и соответ- ствующие им решения q (как функции g из Wi)). Объединение всех этих решений и дает набор всех q(g). При этом может оказаться, что для некоторых g нет ни одного* набора {v„ wd такого, что gGQ(b‘i, ip<), а для других g таких наборов может оказаться много (и соот- ветственно много q(g)). После этого надо проверить, удовлетворяют ли все полученные q(g) условиям теоремы 3.1. Если удовлетво- ряют, то каждому q соответствует единственная непре- рывная неявная функция у (хо + ag) = у (а), дифферен- цируемая справа в точке а = 0, при этом*/+(0) =q. Для тех q, для которых не выполнены условия теоремы 3.1, может оказаться, что либо неявной функции нет, либо она обладает какими-нибудь особенностями. Эти точки требуют дополнительного исследования. Если квазидифференциалы всех функций fi представ- ляют собой выпуклые оболочки конечного числа точек, то задача упрощается; достаточно исследовать только вер- шины суб- и супердифференциалов. В этом случае опи- санная выше процедура может быть реализована на ЭВМ. Замечание 3.3. Итак, пусть для найдено решение qo системы (3.5). Тогда (если выполнено усло- вие теоремы 3.1) существует непрерывная вектор-функ- ция у(а) такая, что /(я0 + ag, у (а)) = 0 Vae[0, а0]г где ао > 0, у (0) = у0; У+ (0) = д0. В качестве аппроксимации у (а) можно взять yi(a) = = */o + ago, при этом у(а) = у\(а) + о (а). Если же функция / непрерывно кодифференцируема в . окрестности точки Zo, то для получения более точной ап- проксимации надо взять решение системы шах + а [(ун, g) + (r2i, д)]} + lai ♦ i(zo) + min {bi + a [(u?H, g) + (w2i, g)]} = 0 Viel:n. (3.22) Здесь = V2i]r Wi*=[w\i, w%i]. Обозначим через q(a) решение этой системы, Тогда у2(.а) = J/o + <xg(a) является
§ 3. МНОГОМЕРНЫЙ СЛУЧАЙ 329 более точной аппроксимацией функции у (а), чем у\(а), хотя, по-прежнему, д.(а) = У2 (а) + о (а). Возникает вопрос: при каких условиях функция у (%) является непрерывно кодифференцируемой? 2. Теперь рассмотрим частный случай предыдущей за- дачи—задачу об обратной функции. Пусть система (3.1) имеет вид я + Ф(д) = Оп, ( (3.23) т. е. х™ + ф. (у) = о V/G=l:n, где х = (я(1), ..., я(г,))е Rn, у = (i/0, ..., z/(n)) е 0?п» и функции Фг квазидифференцируемы на Rn. Пусть z0 = = [я0, g0] RnxRn— решение (3.23), т. е #о +Ф.(#о) = 0п. Выберем направление g = (gp ..., gn) Rn. Рассмот- рим два вопроса: 1. При каких условиях существуют <хо>0 и непре- рывная вектор-функция у (а) такие, что У (0) = Уо, x0 + ag + Ф (у (а)) = 0n Vae [0, ав]? (3.24) 2. Если указанное у (а) существует, то существует ли у'+ (0)- lim±[у(а)— у(0)}? (3.25) аЮ а Обратимся к теореме 3.1 и следствию из нее. Пусть 2)Ф,(у) = [дФ«(у), дФ< (у) ] — квазидифференциал функ- ции Ф4 в точке у. Тогда Ф{ (У о + аЯ) = (t’i, q) + min wiea®i(i/0) («Ч, q) + oi (a, q). (3.26) В этом случае уравнение (3.5) имеет вид: max (i’i, q) + min (ir{, q) = — gi Viel:n. (3.27) 1>{еаф{(у0) Wiea®i(«0) (a’ q} Предположим, что в (3.26) —-—равномерно по q З&б (go), где б > 0.
330 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИЙ Введем множества Л.е= to<= дФ^//0)|(рь?0)> max (Vi,qo) — el. I - »{е£Фг(У0) i nie = fu’i <= dO>i (y0) I (U’i, q0) < min (wit q0) + el I wi^i(V0) J Введем множество матриц [ “x Me= Л = ••• I L“n «i = + WiF, Vi <= 7?ie, Wi t= Rte где e>0. X ? Из теоремы 3.1 следует y Теорема 3.2. Если для некоторого е > 0 min detX>>0 или max det4<0, (3.28) AGMc(^6(z0)) A6M£(^(z0)) то существуют <х0>0 и единственная непрерывная век- тор-функция у (а) такие, что У (°) = Уо, «0 + as + ф {у (а)) = On Vae[O,ao] « У+ (0) = ?0- Замечание 3.4. В случае, когда множества дФг(у о) и дФ<(уо) для всех i представляют собой выпуклые обо- лочки конечного числа точек, то в формулировке теоремы (в части существования) можно положить е = 0. § 4. Примеры Пример 4.1. Пусть х = (я(1), я(2)) е R2, у = (у(1>у z/2))<= R2, Фх (у) =="min |у(1) — -у у(2), 2у(1) — у(2)}в Ф2 (у) = = min{—y{i) + ^(2), —2у(1) + 3i/(2)}. Рассмотрим уравнения Ь(2) + Ф2 (у) = 0. Очевидно, что точка [яо, Уо], где яо = (О, 0), Уо = (О, 0) — решение системы (4.1). Имеем _ ^Ф1(Уо) = [дФ1(уо), дФ1(Уо)], _ ^>Ф2(уо) = [ЗФ2(уо), 5Ф2(уо)]У
§ 4. ПРИМЕРЫ 331 где 0Ф1 (Уо) = {(0. 0)}, 50»! (УО) = со [(1, - (2, - 1)], К 3/ J (4.2) ?Ф2 (г/о) = {(0> 0)}> дФ2 (уо) = со {(-1,1), (-2, 3)}. Пусть g = (gp g2)eR2, q = (?!, 92)e ^2- Уравнение (3.27) в данном случае эквивалентно системе gi = max qt + -у 9& ~ 29i + ?2}> g2 = max {<?! — q2,2qr — 3?2). (4.3) Для решения этой системы надо решить следующие четыре системы равенств и неравенств: gi = — 41 + 4 ^2 = 41 4v — + 4 ^2 > — 2?1 + 92> — 91 — 9 ч > 2«1 — 3?2. £1 = —?1 + 4-?2» g2 = 2?! — 3g2, — + 4 ^2 > — 29i + 92, 2?! — 3g2 > qr — q2. gl------2gx + q2, §2 ~ 91 ?2’ 1 — Qi + y 92 — %9i + ?2> 9i — ?2 %9i 3g2. gi------2^ + q2, Sz = 2<?i 3<j2, I — 2gx + g2 > — gi + у q2, 291 —3ga>g1 —?2. (4.4) (4.5) (4.6) (4.7) Из (4.4) —(4.7) получаем I- 9i = —y?i —4^> 92 = —y(£i + £2) (4.8)
332 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ на множестве n L , £i-g2<0, | Qi- 3gl + 5g2<0f’ 2. 91 = -4-(9g1 + g2), <Z2 = -j-(2g1 + g2) (4.9) на множестве Й2 = <(£1, £г)1 5gi - g2 < 0, 3gi + 5g2>0}, 3. qi=-gi~g2, q2 = -gi-2g2 (4.10) на множестве ^3 = {(gl, g2)l gl - g2 > 0, gl + 3g2 < 0), 4- <?i = - т + ^з)’ q3 = - 4 tei + (4-Ц) на множестве Й4 = {(gl, g2)l 5gl-g2>0, gl + 3g2>0). Из рис. 51 видно, что в данном случае оказалось U Qi = R2, и у этих множеств нет общих внутренних iei!4 точек. Таким образом, для каждого g определена функ- ция q(g), непрерывная на множестве (J (intQi). Для iei: 4 проверки ее непрерывности на границах множеств доста- точно (в силу положительной однородности функции q(g)) проверить непрерывность, например, в следующих точках: gl =(-1, -IHfijDQa, gn = (-5, 3)eQj П Q2, gni=(l, 5)eQ2QQ4, gIV=(3, -l)eQ3nQ4. Из (4.4) g(gT) = (2, 3), а из (4.6) тоже ?(gI) = (2, 3), из (4.4) g(gn) = (6, 3), а из (4.5) тоже g(gn) = (6, 3), из (4.5) g(gni) = (-2, -3), а из (4.7) тоже g(gni) = (—2, —3), из (4.6) g(gIV) = (3, -1), а из (4.7) тоже Q(gIV) = (3, — 1). Итак, функция q(g) оказалась однозначной и непре- рывной. Необходимости проверять условия теоремы 3.1 нет, так как в данном случае в (3.3) ог(а, д) = 0.
§ 4. ПРИМЕРЫ 333 Но можно эти условия проверить. Так как суб- и су- пердифференциалы функций Ф1 и Ф2 — выпуклые обо- лочки конечного числа точек (см. (4.2)), то в теореме 3.1 можно взять е = 0. Отображение М (зависящее от до = = до(т)) принимает (см. рис. 52) одно из следующих значений: 7 2 —1\ ( 1 —1/3\ 7 2 —1\ / 1 —1/3\ ^-1 1/Ц-1 1 М“2 3Н“2 3 /’ (f 2 —1\ 7 1 — 1/3VI [/ 2 —1\ / 1 — 1/3U с0^-1 1;Ц— 1 1 /j’ с0(\—2 з/’2 з (( 2 —1\ ( 2 —(Г 1 —1/3\ ( 1 -1/3V| С0Ц—1 VV~2 З/J’ СОЦ—1 1 Н~2 3 /г Нетрудно проверить, что определители матриц каждого из этих множеств имеют один и тот же знак. Таким об- разом, условия теоремы 3.1 выполнены для всех g, и каждому g е R2 соответствует единственное решение go(g) уравнения (3.27). Значит, в окрестности точки хо существует однозначная функция у(х), удовлетворяющая системе (4.1). При этом у(х) является дифференцируе- мой по направлениям в точке хо, причем у' (хо, g) = q^g), где go вычисляются по формулам (4.8) —(4.11). В данном случае множество М* (zo) = 5ci [-Ф (z/o) ] (см. теорему 5.1) есть
334 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Нетрудно видеть, что условия теоремы 5.1 выполнены. Поэтому из теоремы 5.1 тоже заключаем, что существует обратная функция у(х), но теорема 5.1 ничего не гово- рит о дифференциальных свойствах этой функции, в то время как с помощью теоремы 3.1 была установлена ее дифференцируемость по направлениям в точке xq и най- дена производная по направлениям в этой точке. Пример 4.2. Пусть х = (я(1), я(2)) е R2, у = (у(1), !/(2)GR!), Ф1(у)= ly(1)l — lgl2)l, Ф2(у)= 2у(1> + у(2), х0 = = (0,0), Уо = (0,0). Очевидно, что точка [#o, Уо] является решением си- стемы х( n + Oi (у) = 0, (4-12) U(2) + Ф2 (у) = 0. Имеем ^Ф1((/о) = [ЗФ1(г/о), дФ1(г/о)1, ^Фг(уо) = рФ2(уо), 5Ф2(г/о)], где £Ф1(у0) = со{(1, 0), (-1, 0)}, “ЗФ1(1/о) = со((0, -1), (0, 1)}, £Ф2(г/о)={(2, 1)}, аФ2(Уо) = {(О, 0)}. Пусть g = (gv g2) f= R2, q = (qlt q.2) e R2. Уравнения (3.27) в данном случае имеют вид gi = -l?il + 1дг1, g2 = -2qi-q2. Для решения этой системы надо рассмотреть четыре си- стемы равенств и неравенств 1- gi =-71 + 72, g2 = -271-72, qi > 0, ?2>0; (4.13) 2. gi = ~qi ~ 7г, g2 = -2?i - 52, 7i > 0, q2 < 0; (4.14) 3. gi = 7i + ?2, g2 = -27i-72, 7i <0, ?2>0; (4.15) 4. gi = 7i~72, g2 = -27i-72, 7i^0, g2<0. (4.16) Из (4.13) — (4.16) получаем 1- Л- —-------------------T<»+ 4ga
§ 4. ПРИМЕРЫ 335 на множестве Qi = {(gi, g2)l gi + g2 0, 2gi-g2^0J; 2. gi = gi-g2; ^2 = -2gi + g2 на множестве Й2 = {(gi, g2)l gi~g2>0, -2gi + g2<0}; 3. ?l = -(gl + gz), ?2 = 2gl + g2 на множестве £2s = {(gi, g2) I gi+g2>0, 2gi + g2>0); 71 = у (gl — g2), 72 = — 4 <2*i + &) на множестве &4 = {(gl, g2)l gi-g2«S0, 2gi + g2>0}. Видно (см. рис. 53), что внутри заштрихованной об- ласти не существует решения системы (4.12), а для g^Qs существует даже по два решения системы. Хотя в данном случае нет необходимости проверять условие теоремы 3.1 (по- скольку, как и в предыду- щем примере, в данном слу- чае в (3.3) о» (а, д) = 0), проведем необходимые рас- четы. Отображение М прини- мает одно из следующих значений: 1 1\ /—1 1\ 2 1J’ \ 2 1;, К1 /-1 Г/1 Р ^1 = соЦ2 2 1)]» М2 = соЦ2 1у>^2 «—1 1\ /— 1— 1\) (11— 1\ (—1 —IV) 2 1/1^ 2 ljj>-^4 = co[\2 2 ijj- Так как для М2 и Мз нарушено условие теоремы 3.1, то надо тщательно рассмотреть те q, которым соответ- ствуют множества М2 и М$. Нетрудно видеть, что М2
336 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ соответствуют д1=(1, 0) и дп=(— 1, 0), а М$ соответ- ствуют gln = (0, 1) и gIV=(0, —1). Возьмем qL =(1, 0). Из (4.13) получаем, что этому q1 соответствует gI=(—1, —2), причем Из (4.14) получаем, что этому ql также соответствует gI = (—1,—2), которое тоже принадлежит Q2. Таким образом, на- правление g1 подлежит более внимательному иссле- дованию. Теперь возьмем gn = (—1, 0). Аналогично из (4.15) и (4.16) заключаем, что этому q11 отвечает gII = (—1, 2), причем gn е й3, gn е= й4. Для gIII==(0, 1) из (4.13) и (4.15) получаем gIII = = (1, —1), причем gine=Q3 (но gin^Qi). Для gIV = (0, —1) из (4.14) и (4.16) получаем gIV = = (1, 1)ей4 (но gIv^Q2). Итак, из теоремы 3.1 заключаем, что обратная функ- ция для системы (4.12) существует для всех направле- ний, кроме внутренних точек множества, заштрихован- ного на рис. 53. Вопрос о существовании обратной функ- ции для направлений gT = (—1, —2), gIT = (-l, 2), gm = (l,-l), gIV==(l, 1) не может быть решен с помощью теоремы 3.1. Для остальных точек множества Q3 существует по две обрат- ные функции. Как уже отмечалось, в данном случае и для направ- лений g1, gn, g111, gIV существуют обратные функции. По- скольку 5С1Ф1(Ы=со{(1, 1), (1, -1), (-1, 1), (-1, -1)}, 5С1Ф2(уо) = {(2, 1)}, то множество Jf*(zo) = dCi[—Ф({7о)] (см. теорему 5.1) есть М* (z0) = со 1 1\ /1 —1\ 7—1 1\ 7—1 2 3/Ц2 3/Ц 2 3^> ( 2 з))- (4.17) Очевидно, что условие теоремы 5.1 не выполнено, и по- тому с помощью теоремы 5.1 никакой информации о су- ществовании обратной функции извлечь нельзя (да она и не существует в обычном смысле: есть направления, для которых обратной функции нет, а есть направления, для которых таких функций несколько).
§ 5. ТЕОРЕМЫ ДЛЯ ЛОКАЛЬНО ЛИШПИЦЕВЫХ ОТОБРАЖЕНИЙ 337 § 5. Теоремы об обратной и неявной функциях для локально липшицевых отображений 1. В этом параграфе изучаются теоремы об обратной и неявной функциях, являющиеся «прямым» обобщением классических результатов, в том смысле, что они выяв- ляют в негладкой ситуации условия, гарантирующие су- ществование и единственность решения соответствующих уравнений. Всюду ниже рассматриваются локально лип- шицевые отображения F, и основным инструментом ис- следования является их обобщенный якобиан дс1^(я) (см. § II.4). Мы обсудим сначала теорему об обратной функции, а затем на ее основе сформулируем теорему о неявной функции. Основное условие, позволяющее гарантировать су- ществование обратной функции у локально липшицевого отображения в окрестности точки хо, заключается в том, что обобщенный якобиан dci^(#o) содержит лишь обра- тимые линейные операторы (неособенные матрицы). Это условие используется лишь с одной целью: оно гаранти- рует, что множества L4g| 4s^clF(a:)} при llgll = 1 и х, близких к хо, в некотором смысле равномерно отделены от нуля. Точная формулировка этого утверждения содер- жится в приведенной ниже лемме 5.1. Пусть локально липшицевое отображение F действует из открытого множества X cz Rn в Rn. Для х X рас- смотрим веер ЛдС1у(х), порожденный множеством dci^(z). По определению (см. § II.4), &dclF(x)—это много- значное отображение, сопоставляющее вектору g Rn множество (#) = {р Iv = AS- А daF (ж)}. Так как дъ\Р(х) — выпуклое компактное множество, то я множества ^аС1г(х) являются выпуклыми компактами. Лемма 5.1. Пусть локально липшицевое отображе- ние F действует из открытого множества X с: Rn в Rn, и точка хо е X такова, что обобщенный якобиан dC\F(xo) содержит лишь обратимые операторы. Тогда существуют числа е > О и 6 > 0, обладающие следующим свойством: для любого вектора g е Rn найдется такой вектор еди- ничной длины I, что соотношения х^$ъ(хо), ^a&CiF(x)(g) влекут неравенство (I, v)> ellgll.
338 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Доказательство. Поскольку множество 5clF(xo) состоит из обратимых операторов, то множество eaCiF(x0)(g) не содержит нуля ни при каком g=A0. (Это обстоятельство уже отмечалось в п. 1 § П.4.) Пусть S — единичная сфера в Rn. Так как отображение fldC1F(x0) замкнуто (это следует из компактности множества dciF(xo)), то множество й0С1^(«о) (S) = и a9ciF(xo) (^) компактно. Кроме того, оно не содержит нуля. Поэтому Р (а0с]Г(*о) (£)’ 0) = 2в > 0. (5.1) Положим Q = дС1Г(яо)+8.$, где единичный шар в пространстве линейных операторов. Так как отображе- ние x^dc\F(x) замкнуто (см. предложение П.4.1), то оно полунепрерывно сверху, поэтому найдется такое 6 > > 0, что неравенство Их — хоИ < б влечет включение flciF(j)cfi. Рассмотрим веер aQ, порожденный множест- вом Q, т. е. многозначное отображение, сопоставляющее элементу g множество aQ(g)={Agl А е Q}. Указанное множество выпукло и компактно при всех g. Если А Q, то при некотором А е dclF(xo) выполняется неравенство ПА — АН < е. Поэтому для g^S имеем WAg — Agll < IIЛ — ЛИ < е. Следовательно IIЛgll > IIAgll — IlAg — Agll > > 2e — e = 8. Отсюда вытекает, что P(flfl(g)>0)= inf ||v||>e VgsS. veaQ(g) Пусть q — элемент с наименьшей нормой в множестве a0(g). Тогда Hgll > 8. Для v^aQ(g) выполняется нера- венство (V, q)> IlgIP. (5.2) Действительно, при а (0, 1) имеем Ид + а(у — q) II2 > Ид112, откуда следует неравенство 2 (у — д, q) + ally — gll2 > 0. Устремив а к нулю, придем к требуемому неравенству (5.2). Пусть Z = g/Hgll. Поскольку llgll > е, то из (5.2) вытекает соотношение (pj)>e У/v^a^g^ Vg(=S. (5.3)
§ 5. ТЕОРЕМЫ ДЛЯ ЛОКАЛЬНО ЛИПШИЦЕВЫХ ОТОБРАЖЕНИЙ 339 Пусть теперь gsF, g^O. Положив g' = g/llgll и вос- пользовавшись положительной однородностью первой сте- пени отображения а0, получим из (5.3), что (M>ekll Vpg= Mg). Для завершения доказательства осталось воспользовать- ся включением a^(g) о flaclF(x)(g), справедливом при ^£$ъ(хо). Теорема 5.1. Пусть локально липшицевое отобра- жение F действует из открытого множества X cz Rn в Rn, а точка Xq такова, что все линейные операторы из обобщенного якобиана 6q\F(xq) обратимы. Положим FxQ=yo. Тогда найдутся такие т) > 0, б>0 и липшице- вое отображение F~x, определенное в открытом шаре mt^n(yo), что р (Р"1 (у)) = У Vy s int (у0); F~'1(Fx) = х Vzs int (я0). Доказательство. Пусть с и б — числа, сущест- вование которых гарантирует лемма 5.1. Прежде всего покажем, что если х\, х% е ^б(яо), то IIT7#! — Fx^\ > ella:i — X2II. (5.4) В силу леммы 5.1 для вектора g = х\ — я2 найдется единичный вектор I, при котором выполняется неравен- ство (I, р)> ellxi — X2II, если v = А (х\ — #2), где А<= dC\F(x\ + >0(х2 — х\)), 0 е [О, 1 ]. Положим fi(x) = (l, Fx). Напомним (см. предложение П.4.2), что dCifi (ж) = а ♦ (Z) вв {А*1 | А <= <?CiF (®)}. Привлекая теорему II.1.3 о среднем и замечание II.1.1, убедимся в том, что найдутся точка и = х\ + 0(^2 — #i)X Х(0^[О, 1]) и элемент Vi е dc\fi (и) такие, что /«(*1) — /1(^2) = (Vt, Х1 — Х2). Так как daft (u) = а * (I), то Vi = А*1 при некото- дс1^(«) ром A&dCiF(u). Поэтому IIFxi— > (Z, Fx\ — Fx2) = = (i>(, xi — X2) = (A*l, Xi — X2) = (I, A (xi — X2)) > 8llxi — хгИ- Тем. самым неравенство (5.4) доказано. Положим т) = еб/2. Зафиксируем точку у, для кото- рой Пу — уоП < Л, и покажем, что найдется вектор х' е е^е(хо), при котором Fx' = y. С этой целью рассмотрим
340 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ функцию Фу (z) = h — II2 Vx <= (х0). Пусть х' — точка, в которой функция (ру достигает мини- мума на множестве Ж(хо). Предположим, что х'— гра- ничная точка шара ^б(хо), Их'— xoll = 6. Учитывая, что по определению точки х' справедливо неравенство Hi/ — Fx'W СHi/ — Fxoll = Hi/ — i/oll, получим eИх' — xoll — IIУ — Fx'W > e6 — Hi/ — 1/0H > s6 — ц = ц. (5.5) С другой стороны, используя соотношение (5.4), имеем ellx' — Хо11 WFx' — Fxoll = WFx' — yoW < WFx' — yW + Wy — i/0H, откуда следует неравенство ellx' — xoll — Wy — Fx'W Wy — i/oll < ц. (5.6) Соотношения (5.5) и (5.6) показывают, что наше пред- положение неверно. Таким образом, х' — внутренняя точ- ка шара ^в(хо). Это обстоятельство позволяет приме- нить необходимые условия минимума (см. предложе- ние II.1.14), в силу которых 0ейС1фу(/). Так как фу(х)= f(Fx), где f(z)=Wy—zW2, то, согласно предложе- нию П.4.3, дс1фу(*') = а * Wx,/V/(F(X')))- 0С]Е(х ) Поскольку vy(z)= 2(z — I/), то dc^y(x')=2{A^(F(x')-y)\ A^dclF(x')}. Таким образом, соотношение 0 дС\(ру(х') возможно лишь в том случае, когда A*(F(x') — у)= 0 при некото- ром А dCiF(х'). Так как множество dC\F(x') состоит лишь из обратимых операторов (это сразу вытекает из леммы 5.1), то F(x') = у. Мы установили, что для точки у е int ^п(уо) нашел- ся такой элемент х' int^(xo), что F(x') = у. Неравен- ство (5.4) показывает, что этот элемент определен един- ственным образом. Тем самым на открытом шаре int^n(i/o) определено отображение F"1, обратное к F. Понятно, что F"1 (F (х)) = х Vx int (х0), Р{Р~1{У>) = У Vj/e int^n(j/0). Переписывая неравенство (5.4) в виде || F~1 (ух)— — УгЧ’ ГДе У'=Р(Х^’ У2 = Р(Х2),
§ 5. ТЕОРЕМЫ ДЛЯ ЛОКАЛЬНО ЛИПШИЦЕВЫХ ОТОБРАЖЕНИЙ 341 убедимся в том, что отображение F-1 удовлетворяет в окрестности int^п(г/о) точки уо условию Липшица. Теорема об обратной функции позволяет стандартным образом получить теорему о неявной функции. Опишем соответствующий переход. Пусть задано локально липшицевое отображение F: где X cz Rn, Y cz —открытые множе- ства, и точка [#о, г/о]еХХУ такова, что F(xq, i/o)= O. Спрашивается: когда найдутся такие достаточно малые окрестности Ух° и Vy точек и у$ соответственно, что при каждом x^VXq уравнение F(x, у)=0 имеет реше- ние в окрестности Vy^ и это решение единственно? Что- бы ответить на этот вопрос, рассмотрим отображение F: X X У->КПХ7П, определенное равенством Г (ж, у) = [х, F(x, у)]. Положим Zo = [#o, у о], Wo = [#о, 0]. Понятно, что F(zq) = = Wq. Предположим, что отображение F обратимо, т. е. существуют такие б > 0 и ц > 0, что для каждого w = =i[u, р] из окрестности int$Sn(wo) найдется, и притом единственный, элемент z = [х, у] из окрестности int^n(zo), для которого F(z)=w. В частности, полагая w = [х, 0], где х int$n(xoh получим F(z)=‘[x, F{x, y)]=i[x, 0], откуда следует, что х = х, а у = у(х) удовлетворяет урав- нению F(x, у) = 0. Из единственности элемента z следует, что это уравнение при данном х имеет единственное ре- шение у(х). Если отображение F"1, сопоставляющее точ- ке w элемент z, удовлетворяет условию Липшица, то и «неявная функция» у(х) удовлетворяет этому условию. Применим к отображению F теорему об обратной функции (и тем самым получим теорему о неявной функции). Для этого выразим обобщенный якобиан dC}F(z) отображения F в точке z = [x, у] через элементы множества dci^z). Нам будет сейчас удобно считать, что элементами обобщенных якобианов выступают мат- рицы, а не линейные операторы. Непосредственно из определения следует, что ((п + тп)Х (и + т)) -матрица JT входит в дС1^(я) тогда и только тогда, когда она пред- ставима в виде НХ X).
342 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ где Е — единичная (п X п) -матрица, А = [Ль Лг] — — ((n + т) X т) -матрица, входящая в dc.\F (z). Понятно, что матрица А не вырождена в том и только том случае, когда матрица Аъ не вырождена. Через Л2дсьР(я, у) обозначим множество всех {т X т) -матриц Л2, обладающих тем свойством, что при некоторой (п X т)-матрице Ai матрица A=[Ai, А2] входит в 3ciF(x, у). Из сказанного выше вытекает спра- ведливость следующего утверждения. Теорема 5.2. Пусть X cz IRn, Y cz — открытые множества, F: X X У->!Рт — локально липишцевое ото- бражение, а точка [яо, I/o]GXX Y такова, что F(xq, уо) = = 0. Предположим, что все матрицы из множества ^>2dc\F(xQ, уо) невырождены. Тогда найдутся такие ц > 0 и б > 0, что при всех x^int$n(xo) уравнение F(х, у) = = 0 имеет в шаре $ь(уо) единственное решение у(х). При этом отображение у удовлетворяет условию Лип- шица. Приведем два примера. Пример 5.1. Пусть отображение F: R1 -> (R1 оп- ределено формулой {ах \fx^O, bx Vx<0. Понятно, что обобщенный якобиан этого отображения в точке х = 0, или, что то же самое, его субдифференциал Кларка, совпадает с отрезком, имеющим своими концами числа а и Ъ. Если эти числа одного знака, то 0 dCiF(0), и применима теорема 5.1 об обратной функции. Если же знаки чисел а и Ъ не совпадают, то 0 е dC\F(x), и эта теорема не применима. Заметим, что в первом случае функция F(x) строго монотонна и имеет обратную на всей прямой, во втором случае эта функция не имеет об- ратной ни в каком интервале, содержащем нуль. Пример 5.2. Пусть отображение F: R1XR’1->R1 определено равенством F(x, У)= шах (у "" я2, 0} + min {у + х2, 0}. Применима ли к этому отображению в окрестности точ- ки Zo ~ [0, 0] теорема 5.2 о неявной функции? Как было показано ранее (см. пример II.1.7), субдифференциал Кларка SgiF(zo) функции F в точке zo (являющийся обобщенным якобцаном этой функции) совпадает с от-
§ 6. ТЁОРЁМЫ ДЛЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 343 резком, имеющим концами точки zo = [O, 0] и = [0, 1]. Так как обобщенный якобиан содержит нуль, то теоре- ма о неявной функции неприменима. С другой стороны, как вытекает непосредственно из определения отображе- ния F, уравнение F(x, i/)=0 имеет в окрестности точки xq = 0 (и даже па всей прямой) бесконечно много реше- ний у(х); а именно, любая функция у(х), удовлетворяю- щая неравенствам — х2 ^у(х) ^х2 VzeR1, является решением этого уравнения («неявной» функ- цией) . § 6. Теоремы об обратной функции для многозначных отображений 1. Рассмотрим некоторое отображение Н: X У, где X, У — конечномерные пространства. Для у У поло- жим Н~х(у)=*{х^Х\ Нх = у}. Отображение Я-1, вооб- ще говоря, является многозначным. То обстоятельство, что исходное отображение Н обратимо в окрестности точ- ки l/о, можно записать так: множество с!отЯ"1 = = {г/1 (у)*& 0} содержит указанную окрестность, при этом в точках у, ей принадлежащих, множество Я-1 (у) состоит лишь из одного элемента. Те или иные теоремы об обратной функции содержат в себе утверждения о су- ществовании решения уравнения Нх = у, единственно- сти этого решения, его непрерывности или липшицевости и т. д. Остановимся сейчас лишь на существовании ре- шения и его липшицевости (в случае неединственности решения последнее надо понимать как существование «липшицевой ветви»). Соответствующие вопросы, которые обычно изучаются в теоремах об обратной функции, мож- но представить в следующей форме (ср. с § 5). Пусть точка z/oе У такова, что множество Я-1(г/о) содержит элемент х0. При каких условиях множество Я"1 (у) не- пусто для всех у из некоторой окрестности точки уо и содержит элементы, достаточно близкие к xq? Когда из множества Я-1 (у) можно выбрать элемент х так, чтобы отображение у х было липшицевым? В таком виде эти вопросы могут быть сформулированы и для многозначно- го отображения а: X -> 2У. Они выглядят так. Пусть точ- ка zo = [zo, уо] входит в график gr а отображения а. Как должно быть устроено отображение а в окрестности точ-
344 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИЙ ки [*о, г/о] , чтобы множество а~'(у) было непусто для всех у, близких к уо, и при этом содержало точки х, близкие к #о? Когда из множества а~{(у) можно выбрать элемент х так, чтобы отображение у х было липши- цевым? Ответ на указанные вопросы может быть дан с по- мощью конуса Булигана Г(г)=Г(2, gra), аппроксими- рующего график gra отображения а в окрестности точки Ио. Напомним, что конус Г (и), где z = [x, у], является графиком многозначного отображения Г (о:, у, и): Г (я, у; u)={p| [и, р] е Г (х, у)К Ниже используется именно это отображение. Оно под- робно изучалось в § 1.1. В данном параграфе нам будет удобно считать, что в пространстве X X Y норма введена так: II [х, г/] II = Ы + + lli/ll. Доказательство приведенной ниже теоремы об обрат- ной функции опирается на следующий результат, кото- рый представляет собой один из вариантов так называе- мого вариационного принципа Экланда (см. [100]). Теорема 6.1. Пусть /—непрерывная функция, определенная на замкнутом подмножестве V конечномер- ного пространства и ограниченная там снизу, и — неко- торая точка из множества V. Тогда для любого е > 0 найдется такая точка v V, что 1) /(a)— f(v)> ellu — pH, (6.1) 2) /(zp) —/(р)> —е||р —zp|| VweF, (6.2) Доказательство. Построим индуктивно некото- рую последовательность {uk}k=Q. Положим uq — и. Пред- положим, что точка uh уже построена, и определим мно- жество Wh равенством Wk = {ip VI /(zp)^/(ил)-eIIu^-zpII}. Понятно, что uh Wk. Если Wh = {aj, то считаем, что Uk+P = иА при всех р > 1. Если же Wh {uh}, то поло- жим /ft = inf{/(ip)| ip е Wk} и в качестве uh+{ возьмем какой-либо из элементов Wh, для которых справедливо неравенство / (uft+1) - л < 4 и <6-3> Понятно, что неравенство (6.3) справедливо и в том
§ 6. ТЕОРЕМЫ ДЛЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 345 случае, когда Wh = {uft}. Из (6.3) следует, что /(«Н1)<у(/(и») + АХ/(«й)- (6.4) Так как функция / ограничена снизу и последователь- ность {f(uk)}Z=Q убывает, то существует предел lim/(uA)>— со. Неравенство f(uh+P)^ f(uh) при р>1 k влечет включение uh+P е в силу которого ellufc - uft+pll «£ /(«*+₽). (6.5) Переходя в (6.5) к пределу по р, получим, что ||и*— — Uk+p II---* 0- Таким образом, последовательность р-^4-оо {u/JfeJTo сходится в себе (т. е. является фундаментальной). Воспользовавшись полнотой рассматриваемого простран- ства, убедимся в том, что существует предел lim uh = v. Так как функция / непрерывна, то /(y) = lim/(ufe). (6.6) Кроме того, переходя в (6.5) к пределу по р, получим, что vll < f(uh)~ /(£>). (6.7) Покажем, что v — искомая точка. Так как ио = и, то при к = 0 из (6.7) вытекает неравенство (6.1). Докажем» неравенство (6.2). Предположим, что при некотором iv е V оно нарушается, т. е. f(v)— dip — wW. (6.8) Так как f(v)^ f(uh) при всех к, то f(iv)^Lf(uk) — е||р — w\\ V к. Таким образом, w <= Wh при всех к. Отсюда следует не- равенство /(ip)> Д. Привлекая (6.4), получим / (Uft+1) <-!-(/ <«*) + А) < -г+ f (№»- Переходя к пределу, придем к соотношению которое, однако, противоречит неравенству (6.8). Теорема 6.2. Пусть X, У — некоторые конечномер- ные пространства, а: X 2У — замкнутое многозначное отображение, точка zq — [#о, Уо] содержится в графике gr а отображения а. Предположим, что существуют числа а [О, 1), ц > О и е > О, обладающие следующим свой- ством; если z = [х, у]^ gr а и к — х0И + Wy — yQW т], то
346 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ для каждого v е Y найдутся такие элементы и^Х и w е У, что 1) V — ю^Г(х, у\ и), (6.9) 2) Hull е cllyll, llwll < allfll. (6.10) Положим f с 4- 2a ti 1 ~ 1—a’ Г 3(1 + I) ’ (6.11) «o’1 (у) = (У) П ^ri (^0), (6-12) «Г1 (</) = a-1 (У) fl &3H (^o)- (6.13) Тогда 1) множество До-1 (2/) непусто при всех у е int^r(yo); 2) для любых yi, 1/2е1п1Ж(уо) и любого xt e a-o 1 (j/J выполняется неравенство р (х^ 1 (i/2)) 11| уг — у2||. Доказательство. Предположим вначале, что пер- вая часть теоремы уже установлена, т. е. справедливо включение int SSr (Vo) с d°m (6.14) где dom — эффективное множество отображения Пусть у\, у2 — различные точки из открытого шара int &т(уо). Положим 5 = Hi/i — V2II. Ясно, что $ < 2г. На интервале ($, 2г) определим функцию е: Эта функция убывает, поэтому, используя (6.11), имеем е(р)<-Аг = г4т-7 = 1 .• (б-15) s + Is 1 + Z 1-|-с + a v С другой стороны, 6 = ГПр > 2г (1 + /) = s 2V (6Л6) Рассмотрим функцию /, определенную на замкнутом множестве gr а формулой /(х, у) = III/ — 1/2II. Пусть Xj е а^1 (i/j) (существование точки Xi следует из (6.14)): zl = [xi, j/i], pe(s, 2г). Применим к функции /,
§ 6. ТЕОРЕМЫ ДЛЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 347 точке zi и числу е(р) теорему 6.1. Согласно этой теореме найдется точка z = [х, у] е gr а, при которой выполняют- ся неравенства 1) — г/2П —— f/2*1 е (р) (Илг1 — xli + Hi/i — j^ll), (6.17) 2) Ну — УгП Иу — У 2^ + ₽(р) (Пя: — xll + Пу — yll) V рг, у] е gr а, [х, у] =/= z. (6.18) Из (6.16) и (6.17) следует, что К - z|| = hi-x|| + ||ух — y|i< 7^-|yj - y2n = ____1 <-21 ~e(p) 3 • Таким образом, II z — zo II < II z - Z1II + II zx — z0 IK + II — x91| + + hi-J/oll + Ir + r = ^- + r(l + 1) f 1 Положим v = у2 — у. Так как Ilz — soil < ть то по ус- ловию теоремы найдутся такие элементы и е X и iv е У, что выполнены соотношения (6.9) и (6.10), т. е. У2 - у - w е Г (х, у\ и), (6.19) Hull с\\у2 — у II, IIшН alli/2 — ^И. (6.20) Расшифруем соотношение (6.19). По определению отображения Г существуют такие последовательности {uk}, {wh}, {**}, что ик -* и, wk-+ у2-у -w, tk ! 0, (х + tkuk, у + tkwk) е= gr а. Заменяя в (6.18) х па х + thuk, у па у + thwk, получим Пу - у2П «£ Иу2 - у - 4«>*п + е (р) (Il4»fcll + ^„ll). (6.21) Полагая vk — уг — у — w — wk, запишем элемент уг — у — — tkwk в виде У 2 — У — tkwk =(i — tk)(y2 — y)+tk(w — vk). Отсюда следует, что Пуг - у - 4u\ll «S (1 - «1.)'Пу2 — уП + У» - р*П. (6.22) Неравенства (6.21) и (6.22) показывают, что Пу - УгН <(1 - 4) "у — У211 + fjltp - njl + + е(р)^(Пи*Н + HipJI).
348 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ Поделив это соотношение на th и переходя к пределу при к -> 00, получим Ну — у2Н Hu?ll + е (р) (Hull + IIz/2 — у — м>11). (6.23) (Здесь используются соотношения vh 0 и tvk у2 — — у — iv.) Воспользовавшись неравенствами (6.20) и со- отношением Нг/2 — у — ipH < И^/2 — у И + Hi^ll, получим НиЛ1 + е(р) (Hull + llz/2 — у — w\\)^ (а + е (р)) (1 + с + а) Wy2 — fi Если У2 у, то, как следует из (6.23), 1 — а С е(р) (1 + с + а). В то же время, в силу (6.15) выполня- ется противоположное неравенство. Таким образом, У2 = = у, т. е. #2е а (л)-Мы проверили, что множество а“1(*/2) непусто. Полагая в (6.17) уъ = у, получим Hj/i — Z/2II > е(р) (llxi — xll + llz/i — уг'1) или, что то же самое, IIх — Х1К — 1) Вспомнив, что е (р) = при- дем к неравенству Их — xjl С Zp; поскольку р < 2г, то Их — #111 21г. Так как (уг), то Пхо — xjl 1г. Таким образом, х^«^з/г(хо). Поскольку, кроме того, хед-1 (j/2), то areaf1^). Далее, р (аг1( аТ1 (р2)) < ^||xj — х||< pZ. При р -> $ = llz/i — у2П, получим p(*i, «Г1О/2))<Лг/1 —г/2И- (6.24) Положим теперь [хь yi] = [xo, Уо]. В этом случае IIу2 — i/iИ < г. Заменив всюду в приведенном выше доказа- тельстве [xi, i/i] на [хо, уо], а 2г на г, убедимся в том, что оно останется справедливым. При этом включение (6.14) не используется. В данной ситуации это доказа- тельство показывает, что для любого у2 е int &г(уо) най- дется х2 е (у2) = а~Г (Z/2) П &1т (я0)- Таким образом, предположение о справедливости включения (6.14), сде- ланное в начале доказательства, проверено, и первое утверждение теоремы доказано. Второе утверждение вы- текает из формулы (6.24). 2. Недостаток теоремы 6.2 заключается в том, что про- верку ее условий требуется проводить не в одной точке zo = [*о, Уо], а для всех точек z из некоторой окрестности точки zq. Иногда удается доказать существование «обрат- ной функции» при условиях, наложенных лишь па точ- ку zo. При этом требуется, однако, рассматривать более сложные по сравнению с конусом Булигапа аппроксими- рующие объекты. В одном из подобных утверждений,
§ 6. ТЕОРЕМЫ ДЛЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 349 принадлежащих Б. Н. Пшеничному [202], используются так называемые шатры [7]. Эти конусы весьма интерес- ны, однако в нашей книге они не рассматриваются, по- этому мы не приводим результатов Пшеничного. Другой подход основан на использовании касательно- го конуса Кларка (см. § IL2). Приведем теорему об об- ратной функции в терминах этого конуса. Нам понадо- бится следующее утверждение. Лемма 6.1. Рассмотрим многозначное отображение а: X 2У, где X, Y — конечномерные пространства, и точку zo =: [#о, Уо], принадлежащую графику gr а отобра- жения а. Пусть b: X 2Y — многозначное отображение, график которого grb совпадает с касательным конусом T(zo)=T(zo, gr а) к множеству gr а в точке zo. Предполо- жим, что b(X)= Y, т. е. для каждого v^Y найдется та- кое и^Х, что [u, v]^T(zo). Тогда для любого а>0 су- ществуют числа т) > 0 и с > 0, обладающие следующим свойством: если z = [х, у]^ gr а и Ilz — zoll т), то для лю- бого v^Y существуют элементы и^Х и w^Y, удовлет- воряющие соотношениям v — w (х, у; и), Hull cllull, llidl allyll. Доказательство. Пусть $, как обычно, единич- ный шар. Покажем, что множество Ъ($) содержит неко- торый шар с центром в нуле. Используя то обстоятель- ство, что конус gr Ъ = Т(zo) является выпуклым, нетруд- но проверить, что Ъ(&)—выпуклое множество. При этом 0 &(0)<= b(Z#). Если нуль — граничная точка множест- ва Ь(^), то, применяя теорему отделимости, найдем та- кой вектор I 0, что (Z, у) 0 Чу (^). Пусть у е b (X). Тогда при некотором X > 0 выполня- ется соотношение \у Ъ(&), и потому (Z, i/)=^0. Отсюда следует, что (Z, у)^0. Мы показали, что множество Ъ(Х) содержится в некотором полупространстве, что противо- речит условию леммы. Это противоречие показывает, что нуль — внутренняя точка множества Ъ ($), т. е. b ($)) => «^б при некотором б > 0. Пусть v^Y, р ¥= 0 и р = . Тогда v е и потому, как следует из сказанного выше, при некотором й $ выполняется включение г?^&(й). Воспользуемся теперь теоремой П.2.1, в силу которой gr b = Т (z0) = lim inf T(z), z->z0 z= gra где r(z)=T(z, gra)—конус Булигана к множеству gra
350 ГЛ. VI. ТЕОРЕМА О НЕЯВНОЙ ФУНКЦИИ в точке z. Так как [й>, то по определению ниж- него предела (см. § II.2) для любого а>0 найдется та- кое т) > 0, что р( [и, F], Г(и))^аб (6.25) для таких z gr а, что 'llz — zqII < ц. Соотношение (6.25) показывает, что для каждого z^&n(zo) найдется такой элемент [uz, w'] е Г (и), что II и — u'll + IlF — и/II аб. По- ложим v — w' = w". Тогда [и', г? — Г(и). Так как Г» / \ II II “ II v || t Г (и)— конус и то полагая и = -^ u , w = =получим [iz, V—ip]^r(z). Отсюда заключаем, что v — w^V(x, у; и). В то же время Ik II = ^||«' || < ^ (к - и' II + И ЙII) < СIIVII, где С — ад + 1; I М = ^КВ = ^к-И<ак11- Непосредственно из теоремы 6.1 и леммы 6.1 вытекает следующее утверждение. Теорема 6.2. Пусть а: X 2У — замкнутое много- значное отображение, zo = [#о, */о]е gr а и Т (zo) — каса- тельный конус Кларка в точке zq к множеству gr а. Пред- положим, что для любого v Y существует такое и^Х, что [и, T(zQ). Тогда найдутся такие числа г и I, что отображение а^г и а^1, определенные формулами (6.12) и (6.13) соответственно, обладают следующими свойствами: 1) множество (^(у) непусто при всех у sint^r(*/o), 2) для любых yi, i/2е int^r(i/o) и каждого х^ е ^(Г1 (У1) выполняется неравенство р (ях, а^1 (у2)) ^1\\У1-Уг\\- Теорему 6.2 можно применить и к однозначным ото- бражениям F: XX, считая, что а(х)= {Fx}. В случае, когда F непрерывно дифференцируемо в окрестности точ- ки хо, нетрудно проверить, используя теорему П.2.1 и за- мечание 1.5.1, что конус Кларка Т{хо, Fxo) в точке [яо, ^о] к графику отображения F совпадает с конусом Булигана и имеет вид {[u, v] I v = F' (х0) (и)}, где F' (#о) — дифференциал отображения F в точке хо. Поэтому утверж- дение «для любого v X существует такое и е X, что [и, Т(хо, Fxo)» справедливо в том и только том слу- чае, когда линейный оператор F'(хо) обратим. Таким об-
§ 6. ТЕОРЕМЫ ДЛЯ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ 351 разом, в рассматриваемом «классическом» случае теоре- ма 6.2 переходит в «классическую» теорему об обратной функции. В применении к однозначным отображениям теоре- ма 6.2 оказывается достаточно грубой. Опа не улавливает существование обратной функции даже в некоторых очень простых ситуациях. Приведем соответствующий пример. Пример 6.1. Пусть отображение F: опре- делено равенством Vrc^O, \bx Нетрудно проверить, используя, например, теорему II.2.1, что при всех а =/= Ъ касательный конус Кларка T(zo) в точке zo = [0, 0] к графику отображения F совпадает с нулем. Следовательно, теорема 6.2 здесь неприменима. Та- ким образом, эта теорема не различает случаи, когда а и Ъ одного знака (функция F монотонна и имеет обратную) и разных знаков (ни в каком интервале, содержащем нуль, обратной функции не существует). Напомним (см. пример 5.1), что теорема 5.1 различает эти случаи.
ГЛАВА VII НЕКОТОРЫЕ ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА § 1. Негладкие задачи оптимального управления 1. Постановка задачи. Пусть движение объекта опи- сывается системой обыкновенных дифференциальных уравнений я(£) = /(^(0» и(0, 0» (1.1) ^(0) = ^оеГ (1.2) Здесь z<n))e Rn, и = (и(1), ..u(r>) eRr, / = = (/(1)7 • * -> /П)) Kn, [0, Г], Т > 0 фиксировано. Через Л9 обозначим множество r-мерных вектор-функ- ций, заданных и кусочно-непрерывных (справа) на [0, Т]. Положим C7 = {ug= A*|u(0g=F Vie[0, Z]}, где V cz Rn — компактное множество. Множество U на- зывается классом допустимых управлений, а любое и е U — управлением. Пусть X cz Rn — некоторое открытое множество, xq еХ. Предположим, что вектор-функция / задана и не- прерывна по х и и на X X U X [0, Т], удовлетворяет там условию Липшица по х, кусочно-непрерывна по t, каждая компонента ее дифференцируема по направлениям по х. Тогда для любого и е U существует единственное реше- ние x(t)=x(t, и) системы (1.1) с начальным условием (1.2) на некотором отрезке [0, Т]. Предположим, что мно- жество X достаточно «велико», так что для всех и U ре- шение x(t, и)^Х Vie [0, Т]. Требуется минимизировать функционал 7(и)=Ф(ж(^, и)), (1.3) где Ф(я)—липшицевая дифференцируемая по направле- ниям функция. Предположим, что u*ei7, I (u*) = min I (и) (1.4) йен
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 353 (вопрос существования управления u* е J7, удовлетворя- ющего (1.4), здесь не обсуждается). Набор {х*, и*}, где x*(t)=x(t, и*), называется оптимальным процессом, и* (0 — оптимальным управлением, х* (£) — оптимальной траекторией. Ниже будут установлены необходимые условия мини- мума функционала Ци). 2. Вариации управления и траектории. Пусть g= U — некоторое управление (подозрительное на экстре- мум). Для вывода необходимых условий минимума ис- пользуется семейство управлений следующего вида uz=* и* + \uz&U, е > 0. (1.5) Функция Дие называется вариацией управления и*. Положим xz(t) = x(t, uz), x*(t) = x(t, и*). Если существу- ет предел h (t) = (i), ..., fe(n) (£)) = lim_L [z (t1 uc) — x (^ u*)], tlo 8 (1.6) то вектор-функция h называется вариацией траектории, вызванной вариацией управления (1.5). Используя раз- ные вариации управления, можно получить различные ва- риации траектории. 2.1. Игольчатая вариация. Положим а.?, t LU, U + е), где у & V, 0 е [О, Т] — точка непрерывности (справа) управления и*, е > 0. Функция \ue(t) называется иголь- чатой вариацией управления. Очевидно, что Л(£)=0 VZ s [0, 0). При t > 0 + е имеем е хг(1) = x(t, иг) = х0 + У f(x* (т), и*(т), x)dx + о e+е t + J /(^е(т), Ух x)dx + У /(яе(т), U* (т), 1) dx. о е+е Введем обозначение gt (t) = — (хе (t) — х* (/)). Тогда в силу предположенной дифференцируемости функций А,
-354 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА i е 1: п, по направлениям будет fi (*е(0, и* (Z), t) = fi (х* (Z) + ege (Z), U* (Z), t) = 5/{ (x* (Z), u* (/), t) dg^t) = fi (x* (Z), u* (Z), Z) + e + + о»(е, ge(i), 0 Viel:n, Z>0 + e. Здесь fl/JA w*, t) 4 -----------= lim a (x* + w*’z) — (x*’ u*' *)]• °8 а Ю a Тогда при t > 0 + e -L(x^(Z)-x(i>(Z)) = {e+e f [/i (xe (т), у, t) — fi (x* (t), u*(t), t)] dx + e , С Г/Л(Х*(Т)> «*(T)> T) , , M xLI W 4 + J ---------¥70-------+°1(8»<е(т), T) dx , ViGl:n. 6+jL e J J (1-8) dfi (xt u, t) (.4 Введем обозначение----------= F (t, g) 1 in. Пред- положим, что 1) Функции F{i)(t,g), измеримы no t при любом фиксированном g. 2) Функции F(i)(£, g), Ze 1 : и, непрерывны по g при любом фиксированном t е [О, Т] (это свойство автомати- чески выполнено вследствие предположения о том, что А (я, и, Z), i е 1 : п, липшицевы по х). 3) На любом компакте К cz Rn+1 функции F(i)(Z, g), i e 1 : n, ограничены. 4) Функции F{i) (A g), f e 1 : n, липшицевы no g. 5) Oi (e, Z, g)/e 0 равномерно no [0, 71], i 1 : n, t, g) из разложения в (1.8)). 6) Для любого ge F найдутся числа ео > 0 и 6 > 0. такие, что при е^(0, во), g e^(g)= {^1 Hg — gll < 6} выполнено неравенство 1оДе, A g) I < еб.
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 355 Тогда можно показать, что предел в (1.6) существу- ет и при этом 4-/iU* (0), к, 0) — Л (л:*(0), и*(0), 0), iel:n. (1.9) Соотношение (1.9) эквивалентно дифференциальному уравнению Чп (t), и* (П, t) о h (0= -^70---’J v*>0 <1Л°) с начальным условием /i(i)(0)= A„/i(x*(0), u*(0), 0). (1.11) Здесь &vft(x*, и*, Q) = fi(x*, у, Q)—f(x*, и*, 0), V озна- чает «для почти всех». Напомним, что h(t) = Q VtO. (1.12) Решение системы (1.10) существует и единственно. 2.2. Многоточечная игольчатая вариа- ция. Положим Д«е (0 = yi — и* (Z), 0, t е [0{, 0< + е?<) V i е 1: т, t<£ U [9i, 9i + e)t iei:m где yt e V, 0, e [0, T], lt > 0, Vie 1: m, e>0, m— произ- вольное фиксированное натуральное число. Предполагает- ся, конечно, что е достаточно мало, так что отрезки [0„ 0( + е) не пересекаются и что 01 < 02 < ... < 0m. Очевидно, что xe(t) = x*(t) при t < 0ь При t > 0[ имеем А «в (t) = X (t, u6) = x0 4- J / (x* (т), u* (t), t) dx + 0 ej+efj e2 + J / (x6 (x), i/л, t) dx + J /(хе(т), u*(t), x)dx + 01 01+ezx e2+ez2 + J / (^8 (г), У2, t) dx + • • • ea
•356 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА . • . + J / (Мт)> ym(t), т) dr + 6тп(9 t. + J /(^(4 и*(т),т)й, (1-13) где m(t)^ 1 : т таково, что 0m(t) “1“ < t 0m(t) + l. (1.14) При m(t) = т получим 0m+i e Т. Пусть снова выполнены условия, наложенные в пунк- те 2.1 на F(h. t). Тогда из (1.13) для t, удовлетворяющих (1.14), получим h (/) = lim -L [х& («) _ (z)] = ?1Д f (ж* (Q,), (9J, 0X) + MO b 1 ' e2 + J (** (0s)> U* (02)’ 02) + . 03 + f df[X41hM{X}' X) dx + (0s)’ u* <’6^ 0з) + • • • J Ut9f ty J 0a • • • + ^п(<)Лут({)/ (9m(t)), u* (0m(o), 6m(t)) + + j a,(,,l’w(T)'T>^ (1-15) Для i e 1: m введем функции Ло(О = О [О, Л; ht(t) = O Vt<6i, функция hi(t) удовлетворяет системе дифференциальных уравнений hi (0 = Sf {Х* S’ m (<)> °- > 0 <1л6) (г; с начальным условием (О,) = + k&Vif (x* (Qi), u* (Qi), Qi). (1.17) Тогда из (1.15) получаем h(t)— hm{t}(t).
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 357 Таким образом, вектор-функция h(t) (зависящая от {у}, {0J, {ZJ) является кусочно-непрерывной функцией, удов- летворяющей системе дифференциальных уравнений (1.16) с несколькими «скачками» (по формуле (1.17)). ' 2.3. Пакет вариаций в точке. Положим t е [в», 4- е/{), t [0 + e), где > 0, Vi e 1: m, У Ц = 1, 0X = 0, 0<+i = i=i = 0i + eij Vi el: (m—1), 0m+eZm = 0 + e, m — произ- вольное фиксированное натуральное число. Функция Дие(£) называется пакетом вариаций управления. Пред- положим, что выполнены условия, наложенные в пунк- те 2.1 па F(fe, t). Очевидно, что h (0 = 0 VJ(=[O, 0). Для почти всех £ > 0 имеем h (t) = 2 k\y.f (х* (0), u* (0), 0) + J iel 0 (1.18) Вариация трактории h(t) удовлетворяет системе диф- ференциальных уравнений (1.10) с начальным условием h (0) = 2 ZjА,./ (х* (0), и* (0), 0). (1.19) i=l Вектор-функция h(t) зависит от {yi}, {ZJ и 0. 2.4. .Многоточечный пакет вариаций. Пусть Аие (<) = </ij — «* (О, 0, t ф и [0<, 0i + eZi), iei:W где e>0, 0<е=[О, T), yi} е V, li} > 0, Zi0 = 0 Vi e 1: m, yel: Mi, S 1ц = 1; Mi, m— натуральные числа. Функция Auc(£) называется многоточечным пакетом вариаций управления. Как и выше, предположим, что вы- полнены условия, наложенные в пункте 2.1 на функцию
358 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА F(h, t). Введем функции А (0 = 0 V£e[0, Т]; hi (t) = 0 VZ<0|, а при t^Qi функция hi(t) удовлетворяет системе диф- ференциальных уравнений (1.16) с начальным условием. (0{) = h^Qi) + 2 liiAVihHz* (0i), u* (0i), 0i). k=Q Как и в n. 2.2, показывается, что h(t) = hm(t)(t), где m(t) определяется по формуле (1.14). Функция h(t) зависит, конечно, от {у01, {0J и {Ц. 2.5. Классическая вариация. Наложим еще дополнительные условия: предположим, что множество U выпуклое и что каждая компонента вектор-фуикции f дифференцируема по направлениям в пространстве Rn X Rr,. т. е. существуют df. (х, ut t) j а [h' q] = Ит — f/i (ж + ah, и + aq, t) — fi (x, u, /)], (1.20) и что / удовлетворяет условию Липшица по совокупности * и и на XX С7Х[0, Г]. Здесь feeF, ?eF. Возьмем Аце(t) = е(u(t) — zq(t), u^U. Предположим, что для вектор-фупкции F^h' z) =-------— выполнены условия, аналогичные наложенным в п. 1.2 на функцию F(h, t). Рассуждая, как выше, получим, что функция h(t) удовлетворяет следующей системе диф- ференциальных уравнений ; m _ df(** (о, u* (/), о 2П д [h (0, q (0] ’ fe(0) = 0. (1.22) Для всех рассмотренных вариаций управлений имеем яе(0 = **(0+еЛ(£)+о(8, t), (1.23) г/je ---g 0 равномерно по г.
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 359 3. Необходимые условия оптимальности. Установим необходимые условия минимума для задачи (1.4). Так как функция Ф(я) (см. (1.3)) дифференцируема по на- правлениям и липшицева, то, используя (1.23), имеем I ы = Ф (я* (Л + ей (Г) + о (е, Л) = = Ф (X* (Л) + 8 dZh(T)}} + ° (е’ Т}' Отсюда получаем следующий результат. Теорема 1.1. Для того чтобы управление и* & U было оптимальным управлением, необходимо, чтобы дФ (х* (Г)) dh (Т) >0 (1.24) для всех допустимых вариаций траектории h(T). Для того чтобы получить более конструктивные необ- ходимые условия, нужно использовать специфические свойства функций £ и Ф и различные вариации управ-, ления. Рассмотрим вначале случай, когда fi — гладкие по х функции, и выбрана игольчатая вариация. Тогда управ- ление (1.9) имеет вид А= (0^* (0, о h(«) \ft> 0 (1.25) с начальным условием (1.11). По формуле Коши h(T)= Y(T)У-1(0)Ду/(^*(0), а*(0), 9), (1.26) где У (Т)—фундаментальная матрица решений системы (1.25), т. е. Y (0 = Y (/) У(0) = Я (Е — единичная матрица). Предположим теперь, что функция Ф квазидифференцируема в точке х*(Т). Тогда (1.24) имеет вид = тах (р> МЛ) + min (ш, МЛ)> ' 1?е5Ф(х*(Т)) и:едФ(х*(Т)) (1-27) где [дФ (х* (Г)), дФ (х* (Т)) ] — квазидифференциал функ-
360 гл. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА ции Ф в точке я*(Т). Из (1.26) и (1.27) получаем тах ((^(ПУ-1(0))ТР, 0)) + иедФ(х*(т» + min ((У (Г) У-1 (0))т w, bvf (х*, и*, 0)). юеаФ(х*(Т)) Здесь верхний индекс т— знак транспонирования матри- цы. Полагая (0)=(у(Т)у-1 (0))Ч резФ(^*(?)), гр„(0) = (у (Г) У-1 (0)) V w е 5Ф (ж* (Т)), нетрудно видеть, что функция грД0) удовлетворяет систе- ме дифференциальных уравнений (0) л/Т (я*, и*, 0) Т = - ~<Гх (°)’ 6 <Т (1-28) с начальным условием гр,(Т) = р, р е ЗФ (я* (Г)), (1.29) a гр«>(0) — системе ---------др (X*. U*. 6) (0)1 0 т (1 30) ОлЗ-------(JX с начальным условием гр„(Т) = е ^Ф(^*(Т)). (1.31) В этом случае теорема 1.1 имеет вид Теорема 1.2. Для того чтобы управление u*&U 'было оптимальным, необходимо, чтобы min Г max \УН (х*, и*, грг, 0) + y^v [«едФ(х*(Т)) + min куН (х*, и*, гр„, 0)1 = 0 V0 е= [0, Т), (1.32) иебФ(х*(Т)) 1 где Н(х, и, ф, 0) = (/(л:(0), и(0), 0), -ф(О)), &уН(х*, и*, гр, 0)=Я(я*, у, гр, 0)—Я(я*, и*, гр, 0). Условие (1.32) является обобщением принципа макси- мума Л. С. Понтрягина. Функции гр,(£) и грю(£), как обыч- но, называются сопряженными функциями, а системы (1.28) и (1.30)— сопряженными системами, Н — функция Гамильтона.
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 361 Используя многоточечную игольчатую вариацию, полу- чаем следующее необходимое условие. Теорема 1.3. Для того чтобы управление u*&U было оптимальным, необходимо, чтобы inf max 5 и*, 0$) + {Vj}ev |»е£Ф(х*(Т)) i=i + min 2 (х* w*, 1|)W, 0i)l = 0 (1.33) weW(T))i=1 j для любых наборов {JJ Zt >0, i e 1 : m}, и почти всех на- боров {0j0 0i < 02 < ... < 0m < Т}. Здесь тп — нату- ральное число. С помощью пакета вариаций в точке из (1.18) и теоре- мы 1.1 с учетом (1.27) имеем следующее условие. Теорема 1.4. Для того чтобы управление и* U было оптимальным, необходимо, чтобы inf I max 2 h&yJI (я*, u*, 0) + {V|]eV |гедФ(х*(Т)) {=»i + min 2 и*, 0)| = 0 (1.34) 1гедФ(х*(т»i=1 ) для любых {li | Vtel: m}, и почти всех 0 [0, Г]. Здесь m — произвольное натуральное число. Используя многоточечную игольчатую вариацию, мож- но получить следующее необходимое условие. Теорема 1.5. Для того чтобы управление и* U было оптимальным, необходимо, чтобы {т max f ДиЯ (х* (т), и* (т), (т), т) dx + ®е$Ф(х*(Т)) j т 1 + min J ДиЯ (х* (т), к* (т), ^|)w (т), т) dx 1гедФ(х*(Т» о < = 0. (1.35) Наконец, в случае выпуклости множества допустимых управлений U и гладкости f(x, и, t) поя и и можно по- лучить следующее линеаризованное необходимое условие.
362 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА Теорема 1.6. Для того чтобы управление u*^U было оптимальным, необходимо, чтобы 1т Г 1дЩх* (т), u* (т), %(т), т) \ max 1 —----------------------, и (т)—и*(т) dT + ved<D(x*(T))J \ ои / г . CldH (х* (т), u* (т), %, (1), т) \ + min II—--------------—--------—, и(т)—и*(т) Idx? =0. w^0<I>(x*(T))q ' ' . (1.36) Если Ф — гладкая функция, то все условия (1.32) — (1.35) эквивалентны. В негладком случае условие (1.35) может оказаться «сильнее» предыдущих. Пример 1.1. Рассмотрим систему двух уравнений х(1) = и, х<2) = — + и с начальным условием х(1>(0) = а:(2)(0)-0. Здесь х = (;г(1), ж<2)) s (R2, и s (R1. Задан функционал Z(u)= Ф(х(1, u)) = Isin х(1) (1, и) I — I sin х(2) (1, u) I. Найдем квазидифференциал функции Ф в точке хо ™ -(0, 0) = 0: Ф(х)— Isin х(1>| — Isin х(2)|, 0Ф(хо)=- = [со {(cos 0; 0); (—cos 0; 0)); со {(0; cos 0); (0; —cos 0))] = = [со{(1, 0), (-1, 0)};со{(0, 1), (0,-1)}]. Пусть V = [—1, 1]. Возьмем u(t) = 0 Vis [0, 1]. Тогда и) = (0, 0) Vis [0,1]; Z(u) = 0. Функции и (см. (1.28), (1.30)) удовлетворяют од- ной и той же системе (ф(» = |^(2) = о. Поэтому фв(6) = (V<1), р<2>), %(0)=(“?(1)1 «>(2)) V0SIO, 1].
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 363 Имеем Н (х, и, тр», 0) = Н (х, и, 0) = О V0 е [0, 1], Н (х, и, i|)v, 0) = p(1)u + jX2)u2, (1.37) Н (х, и, ipw, 0) = + иХ2>и2. Проверим вначале условие (1.32): max (г(1)г/ + y<2>i/2) + min (w^y + u,(2h/2) = оееф(°) шеаФ(о) = max {— у, у} + min {— у2, у2} = = |y|-№>0 Vye[-1, 1], V0e[O, 1], т. е. условие (1.32) выполнено. А теперь проверим условие (1.36). Из (1.37) следует дН(х, и, %, 6) = у(1) дН fi, и, %, 8) = } ди ’ ди ’ 1 1 max f v^u (9) dO + min f w^u (0) d0 = 1>едФ(о) Q weao(0) о т. e. условие (1.36) также выполнено. Покажем теперь, что условие (1.35) не выполнено. Возьмем - I 1, t<= [0,1/2), fе= [1/2,1]. Тогда {1 max f (v^u (9) + №и? (0)) d0 + veMKo) q i + min J ™едФ(о) о (u?(i)u(9) + ^2)u2(9)) d0 < i max f (v^u (0) + p(2)u2 (0)) dQ + гедФ(О) Q i _ + min J (0) + w^u2 (0)) dQ = и>едФ(0) 0
364 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА + min max Ji?(0)d0, - Ju2(0)d0 О о Ju(0)d0 - Ju2(0)d0-------КО, О о т. е. условие (1.35) нарушено. Таким образом, с помощью условия (1.35) мы смогли установить, что управление и не является оптимальным, в то время как с помощью ус- ловий (1.32) и (1.36) нам этого сделать не удалось. 4. Случай неособого управления. Управление u* U называется неособым (а соответствующая траектория #*(£) = #(£, и*)—неособой), если почти для всех е[0, Г] функция /(я*, u*, t) дифференцируема по х вдоль траектории x*(t). В этом случае л) We=[0, Г]. df{ (х* (0, и* (0, 0 7 дц (*♦ (0, и* (О, О dh \ дх (1.38) Траектория, для которой (1.38) не имеет места, называет- ся особой траекторией, а управление, порождающее ее,— особым управлением. Пусть x*(t) = x(t, zz*)—неособая траектория. Предположим, что множество точек, в кото- рых (1.38) не имеет места, конечно. Обозначим их t\, ... ..., tN и пусть t\ < ... < tN. Рассмотрим вариацию управ- ления и* в некоторой точке 0 G 4], к е 1 : (N + 1). Здесь 7о = 0, tN+\ в Т. Тогда h(t) = O Vf<0. Если 0 > О, то система (1.10) — (1.11) допускает декомпозицию в N — к + 1 линейных систем вида h (0 = Ак (t)h(t) V*e=[0, *ft) с начальным условием Л(0)в (я*, и*, 0) и h (0 = (0 h (0 Vf е [^_х, J,-], V/ е= (к + 1): (N + 1), (1.39) Ит й(/).
$ 1, НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 365 Здесь Л(0= Vie [О-i,у, V/eA:(JV+l), А„/(х*, и*, 9) = /(х*(9), у, 9) — /(х*(9), и*(9), 9). Функция h(t) представима в виде h (0 = Yh (i) Уг1 (9) Ай/ (х*. и*, 9) Vi е [9, th), h (l) = У,- (i) УГ1 (O-i) h (t^) Vt e= [O-i, 0), V/ > k, где Yj — фундаментальная матрица решений системы (1.39) для / e/c:(7V+ 1). Ввведем обозначения Pi (t, т) = У5 (0 У/ (т) V/ е к: (N + 1), [ П ^(УО-i), k<N+i, Rk = ;-(/<+1): (Л’4-1) (Е, k=-N + 1, где Е — единичная (п X п) -матрица. Тогда Л(Т) = ВД(Л 0)Ду/(я*, а*, 0). (1.40) Подставляя (1.40) в (1.27) и преобразуя скалярное про- изведение под знаком максимума и минимума, получим (р, h (Т7)) = (у, RhFh (Г, 9) Ду/ (я*, и*, 9)) = = Ай/(х*,М*,9)), (w, h (Г)) = (FlRlw, Ай/ (х*. «*, 9)). Здесь верхний индекс т означает транспонирование. Вве- дем функции i|)0 (9) = Fl (Т, 9) Rlv, 1|>ш (9) = Fl (Т, 0) Rlw. Тогда теорема 1.2 может быть записана в следующем виде. Теорема 1.7. Пусть и* U — неособое управление и KI i е 1 : N} — множество всех точек, в которых наруше- но условие (1.38). Тогда для того чтобы и* было опти- мальным управлением, необходимо, чтобы max (^ (9), Ду/ (я*, и*, 9)) + ФедФ(х*(Т)> + min (ф™(9), Ау/^*, и*, 9));> 0 (1.41) г^еЭФ(х*(Т)) для всех y^V и почти для всех 9^[£a-i, th), Ле=1:(АГ+1).
366 гл. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА Здесь ф„(0)—решение линейной системы уравнений Ф (0) = - АI (0) (0) V0 <= th) (1.42) с конечным условием ф» (tk) = А’*v, v е дФ (х* (Т)), а г|у(0)— решение системы (1.42) с конечным условием % (*л) = Rlu\ и><==дф (х* (Т)). Пример 1.2. На решениях системы ’ (D _ J2) f ’ (1.43) Ь(2) = 2|х(2)|-|х(1)| + и с начальным условием a.(D(0)=a;(2>(0) = 0 (1.44) рассмотрим функционал 71(и)=Ф1(х(1, и))= |х(1)(1, и)| + |ж<2)(1, и)|. Пусть U = {ие .У| u(t) е [— 1, 1] Vte[0,1]}. Иссле- дуем на оптимальность управление и* (t) = 0 Vt s [0,1]. Тогда х(1)* (t) = л(2)# (t) = 0 VtsfO, 1], 71(u*) = 0. Функции /(” = х<2’, /<2’ = 2|х(2,| - |х(1)|, Ф(х) = |х(1>| + |х<2>| квазидифференцируемы на R2 ив качестве их квазидиф- ференциалов можно взять дф (0) = со{(— 1, - 1), (- 1,1), (1, - 1), (1,1)}, 0Ф(О) = {(0, 0)} ?/(1) (0 = {(0,1)}, dfw (0 = {(0,0)} Vt е [0,1], d/2)(t) = co{(0, 2), (0,-2)}, d/(2) (t) = со{(1,0), (- 1, 0)} Vte [0,1]. Траектория x*(t) = (x<n*(t), a(2,*(t))—особая. Вариация
§ 1. НЕГЛАДКИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ 367 траектории я* удовлетворяет системе А(1) (о = л(2) (о, Л(2)(/) = max (р, h(t))+ min (гр, fe(i)) = uea/(2)(t) wed/2)(t) = max [2Л(2) (/), — 2A(2) (Z)) -f- min (i), — fe(1) (t)} = = 2|Л(2>(0|-|Л(1)(/)1. Проверим необходимое условие (1.32). Найдем решение системы (1.45): й(1)(1)= i/(l-0)eM = ai (0)г/, fe(2) (1)= i/(2 — 0)е1-е = a2(0)i/, если у 0 и Л11’ (1) - (е'^-А-1» - е<-> - А.-») „ (0) Za у Za + (/2 + 1) «(-'S-A'-»)) _ а, (в)!/, если у < 0. Заметим, что<z$(0)2>O V0e[O, 1], V/gh1:4. Подстав- ляя выражение для А(1) в левую часть (1.32), получаем для у > 0 max (р, h (1)) = max (у (а iq\ + а (Q) р<2>) =. *= max{(flj (6) + а2 (0)) у, (— аг (0) + а2 (0)) у; й1 (0) - а2 (0)) у, (ах (0) - а2 (0)) у} = = (ах(0) + а2(0))у>О Vy е= [0,1], V0<=[O,1]. Аналогично при у < 0 max (р,А(1)) =— «/(а3(0) + а4(0))^О V0e[0,1]. иедФ(о) Таким образом, управление и* удовлетворяет необходимо- му условию (1.32). Ясно также, что это управление опти- мально.
368 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА § 2. Исследование одной модели обмена 1. Здесь предлагаются некоторые подходы к исследо- ванию методами негладкого анализа одной из основных моделей математической экономики — модели обмена. Дадим краткую формулировку изучаемого в данном па- раграфе варианта этой модели. Рассматривается экономическая система, в которой имеется тп участников и п видов продуктов. Участник с номером i характеризуется своей функцией полезности Ui и начальным запасом товаров wi = ^п)) е е К*. Здесь и ниже через О?J обозначается конус векторо! пространства с неотрицательными координатами. Функция полезности Ui задана па некотором множестве, содержащем IR", и описывает предпочтения участника i. Его цель заключается в максимизации этой функции при так называемом бюджетном ограничении, которое зада- ется с помощью вектора цен р. (Под вектором цен по- нимается произвольный вектор с положительными коор- динатами). Бюджетное ограничение Zt(p) i-ro участни- ка при ценах р представляет собой множество Zi(p) = {xsR+IGj.xXG?, Wi)}, (2.1) состоящее из всех векторов (наборов продуктов) х > О, стоимость которых по ценам р не превышает количества денег (р, Wi), которое Z-й участник выручит, продав свой начальный запас по этим ценам. Предполагается, что каждый участник, не заботясь о других, максимизирует свою полезность, т. е. стремит- ся к обладанию вектором xt, являющимся решением за- дачи Ui (х) -> шах при условии х е (р). Может случиться так, что 2Х< превышает вектор w, i где ir = 2^i — общее количество продуктов. В этом слу- чае цель хотя бы одного из участников недостижима. Если 2 С (неравенство, как обычно, понимается по- i координатно), то говорят, что система находится в полу- равновесии. Если же 2 xi = то система находится в равновесии. Приведенные рассуждения приводят к сле- дующим определениям. Набор векторов (р; х\, ..., хт) называется состоянием полу равновесия модели, если
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 369 1) вектор р имеет положительные координаты; 2) Xi <= Zi (р) и (р, = шах (р, Х|е2<(р) (2.2) 3) 2 xi (2.3) i Вектор р, входящий в этот набор, называется полу рав- новесными ценами. Если вместо неравенства (2.3) реализуется равенство 2 xi » w, (2.4) то набор (р, xi, ..хт) называется состоянием равно- весия, а вектор р — равновесными ценами. Можно показать (см., например, [99]), что при не- которых естественных предположениях состояние равно- весия существует. Как его отыскать? В математической экономике часто предполагают, что равновесные цены устанавливаются путем переговоров между участниками, которые тем или иным способом договариваются об этих ценах между собой, скажем, повышают цены на товар /, если этот товар дефицитен, т. е. 2х^ > и понижа- ют, если он избыточен, т. е. 2^ Эти действия, однако, не всегда приводят к равновесным ценам. Возможен и другой подход к проблеме отыскания равновесия. Предположим, что в рассматриваемой эконо- мической системе существует некоторый ценообразующий орган, который заинтересован в установлении равновес- ных цен или, по крайней мере, в приближении имею- щихся неравновесных цен к равновесным, которые неизвестны. С этой целью указанный орган должен опре- делить каким-то образом величину уклонения имеющих- ся цен от равновесных. Предположим, что у него имеют- ся некоторые представления о сравнительном вкладе каждого из участников во всю экономику в целом. Тог- да для всякого состояния (я?1, ..., Ят), где он сможет определить «суммарную полезность» Sprite) этого состояния, где веса р» как раз отра- г жают «сравнительную значимость» участников. С по- мощью «суммарной полезности» удается указать один из способов оценки уклонения имеющихся цен от рав- новесных. Опишем его. При этом, простоты ради, будем
370 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА говорить о полуравновесных ценах (в предположениях о строгой монотонности функций сделанных ниже, они совпадут с равновесными). В дальнейшем рассматривается множество 1Г = {х=(х1, т i=l J. I Элементы конуса (R+)m—декартовой степени конуса R+ — называются распределениями, а элементы множе- ства W-допустимыми распределениями. _ Рассмотрим многозначные отображения Z(p) и Z(p), определенные на конусе int О?™ всех векторов с поло- жительными координатами: Z (р) = (X = ...,хт)<= (^)m I (р, Xi) < (р, Wi) V i s 1: т}, Z(p) = Z(p)A Ж. (2.5) Пусть p=(pi, ..., pm)— вектор с положительными ко- ординатами. Для распределения Х=(х\, ..., хт) по- ложим Up(X) = ^piUi(xi). i (2.6) Введем в рассмотрение функции ф^(р)= max Up (X), фа (р) = max UP(X) VpeintR”, хей(р) xez(.p) (2.7) Ф₽ (P) = Ф? (P) — Фз (P) VpeintfR”. (2.8) Понятно, что множество Z(p) состоит из таких рас- пределений Х = (х\, ..., хт), что Xi^Zi(p) Viel: w Отсюда следует, что" Ф1(р) = max ^iPiUi(Xi) = rtiax Ui(xi), Viei:m i i x^eZ^Cp) т.е. <Pi(p) представляет собой максимальную суммарную полезность (при наличии весов pi, ..., pm), которую мо- жет достичь все общество, если участники связаны лишь бюджетными ограничениями и не заботятся о допусти- мости используемых распределений. Множество Z(p) состоит из допустимых распределений, входящих в Z(p).
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 371 Величина Фа (р) показывает максимальную суммарную полезность (с весами pi, . .pm), которую общество до- стигнет, если оно учитывает и бюджетные ограничения участников, и допустимость распределений. Так как Z(p)<=Z(p), то <Pi(p)> <Рг(р) и потому фр(р)> 0 при всех р. Лемма 2.1. Равенство фр(р)=0 выполняется тогда и только тогда, когда р — полу равновесные цены. Доказательство. Пусть <рр(р) = 0 и_распределе- ние X = (xi, ..., Z(p) таково, что Ф2 (р) = (^)- Тогда <Р? (р) = (?) = и“ (х) = 2 piUi (*i). i - m В то же время ф?(р)= 2 Pi max Ui(xi). Поскольку i=i Xi^Zi(p), то отсюда следует, что ^i(^i)= max Ui(Xi). (2.9) x^€Z^(p) Так как, кроме того, распределение (xi, ..., xm) допу- стимо, то набор (р; xi, ..., xm) является состоянием полуравновесия. Пусть, наоборот, (р; х\, ..., хт) — состояние полу- равновесия.- Тогда выполнено (2.9) и потому Ф? (р) = = 2Pi^iCri)*B то же время, поскольку распределение i _ _ (xt, ..хт) допустимо, тофг(р)^2р»^1(;Г<)- Таким _ _ i образом, Фг(р)^Ф1(р)‘ Обратное неравенство справед- ливо при всех р. Лемма 2.1 показывает, что полуравновесные цены р являются точками минимума функции фр при любых Р = (Pi, • • •, Pm) int 0?+. Число фр(р) можно рассмат- ривать как некоторую меру уклонения цен р от множе- ства равновесных цен. Если Фр(р)>0, то ценообразую- щий орган стремится изменить вектор цен р так, чтобы уменьшить значение функции фр. Направление убывания этой функции проще всего найти, используя ее произ- водную по направлениям. В связи со оказанным возни- кают вопросы о дифференцируемости по направлениям функции фр, об условиях, при которых она квазидиффе- ренцируема, и о вычислении ее квазидифференциала в
372 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА случае, если эти условия выполнены. Эти вопросы и ис- следуются ниже. 2. При исследовании модели обмена как правило предполагают, что функции Ui вогнуты или квазивог- нуты, а также в том или ином смысле монотонны. Мы будем считать, что эти функции вогнуты и сильно моно- тонны: покоординатное неравенство х > у влечет нера- венство U<(x)> Ui(y), причем, если х(к} > yw хоть при одном fe, то Ui(x)> Ut(y). Считаем также, что Ut опре- делены на некотором открытом множестве, содержащем В?+. Зафиксируем числа р» > 0 и обозначим функцию PiUi(x) черезЛ(я).ДляХ = (#1, ..., хт) положим F (X) = ^Fi(xi). В этом пункте для упрощения за- i писи индекс р у функций <р£, фр, фр будем опускать. Имеем Фх (р) = max F (X) = 2 Фн (р), (2.10) XeZ(p) 1=1 где Фи(р)= max Fi(x), (2.11) *ez{(p) Ф2(р)= max F(X); <p (p) = <px (p) — ф2 (p). (2.12) xez(p) Так как фи(р) и фг(р) представляют собой функции максимума при связанных ограничениях, то для вычис- ления их производных по направлениям можно приме- нить результаты § 1.6. Из предложения 1.5.6 следует, что многозначное отображение Zt(p) (соответственно, Z(p)) допускает аппроксимацию первого порядка в точ- ках р е int R”, у е Zj (р) (соответственно, Y Z(р)) от- носительно отображения Ag(y') = cl 7(х, у', g). Как от- мечено в этом предложении, cl 7 (я, у', £)=Г(я, у', g) и, тем самым cl 4 (я, I/', g)=sK(x, у, g); здесь множество ^(я, У> S) определено равенством £(#, У> y + av +o(a)^a(x + ag)}. (2.13) Обозначим через (соответственно, Kz) отображение, построенное по формуле (2.13) для отображения а = Zx Vie Г. jn (соответственно, отображения a = Z). Для р е int О?" положим Ri (р) = s (р) | Fi (yt) = Фи (р)} Vi €= 1: т, Rz (Р) = {У = (У1, .. •, Ут) s Z (р) | F (Y) = ф2 (р)}.
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 373 Из сказанного выше и теоремы 1.6.2 следует, что функ- ции фи и <рг дифференцируемы по направлениям в точ- ке int R* и фн(Р,йГ) = sup jsup~ Л(у{,р{), (2.14) VieZi(P) Фа (Р, g) = sup sup 2 F'i (Уь viY (2.15) у=(уг..Ут)& i GRZ(P) eKz(p,y,g) Преобразуем формулы (2.14) и (2.15). Остановимся сначала на производной Фн (р, g)- Чтобы упростить вы- ражение для нее, опишем множество Ri(p, у^ g). С этой целью введем некоторые обозначения. Для вектора у е е R+ положим Г(у)={к^1: п\ g(ft) > 0); /2(y)=ttel: n|yw = 0}. (2Л6) Пусть векторы ре intR*, ge Rn фиксированы. Для у е 0?+ положим Ci(y) = (g^’i — y), (2.17) Д4 (у) = {р е Rn | (p, v) < (y), vw >0 V* e P (y)}. (2.18) Лемма 2.2. Пусть y^Ri(p). Тогда Ki(p, у, g) = = Ь(У). Доказательство. 1) Пусть v Ri(p, у, g), т. e. у + av + o(a)e Zi(p + ag) при достаточно малых а. От- сюда следует, что при указанных а (р + ag, у + av + о (a) )^ (р + ag, ip<). (2.19) Строгая монотонность функции Ui (и, стало быть, функ- ции Fi) показывает, что в точках у множества Ri(p) выполняется равенство (р, i/) = (p, Wi). Поэтому, исполь- зуя (2.19), заключаем, что (Р, V) 4- (g, у) + a (g, v) + < (g, Wi). Переходя к пределу при a I 0, убедимся в справедливо- сти неравенства (р, p)^(g, — у)= Ci(y). Так как у + av + o(a)e Z(p + ag), то g + a^ + o(a)>0. Это со- отношение влечет неравенство p(ft) > 0 при к^12(у). 2) Пусть pE’Ai(y). Учитывая определение множе- ства At(g), равенство (р, р) = (р, iVi) и формулу (2.17),
374 ГЛ- VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА имеем (Р + ag, У + «у) (р + ag, Wi) + a2 (g, v). Выберем элемент v так, чтобы выполнялись неравен- ства (р, v) + (g, v)<0 и v(h) > 0 при к^72(у). Так как все координаты вектора р положительны и множество 71(у) непусто (это следует из монотонности функции Fi и включения y^Ri(p)), то такой вектор v существует. При достаточно малых а имеем (p + ag, у + av + a2v)^(p + ag, Wi) + + a2((g, v) + (p, v))+a?'(g, v)^(p + ag, u>i). В то же время при достаточно малых а у + av + a2v > 0. Таким образом, у + av + сс2г7 е Zt(p) и потому v ^Kt(p,y, g). Пусть, как и выше, фиксированы векторы р е int R" и ge R". Для векторов и </ей+ положим ;(fe) Si(p, 0 = с,(р) V/с «= Z1 (1/), /(ft) /(?) ec™—у ci(vX-(ijci(y) VkesPty), V/el:n(B pac- сматриваемом случае числа —щ Ci (у) совпадают при всех к<=7), Si(y, в противном случае. С помощью величины Si(y, I) выразим производную Ф1г (Р, g) функции <Р1г. Предложение 2.1. Справедливо равенство <₽ii (г. s) = _ sup mf_ Si (i/i, l), y^R^p) ^GdF^Vi) где dFi(yi)—супердифференциал функции Fi в точке уг. Доказательство. Используя формулу (2.14), лемму 2.2 и теорему о минимаксе (см. приложение I), получим Фн (Р, g) = sup sup_ inf (l, 1ц) = VifERitp) V^^yi) U=dF$i) = sup inf sup (Z, v^. (2.20) yi^Ri(p) lf=dF(yi) v^^yi) Величина sup (Z, v^) представляет собой решение *г^г&)
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 375 задачи линейного программирования (Z, Vi) max, (2.21) Ук^Г(уг). (2.22) Напишем двойственную задачу Ci(iZi) z->min, (2.23) z>0, p(ft)z>Z(ft) V^Z2fe), (2.24) pwz = lw Ук = Р&). (2.25) Пусть элемент l таков, что значение задачи (2.21) — (2.22) конечно. Тогда двойственная задача совместна и ее значение также конечно. Множество 11(у) непусто. Это следует из строгой монотонности функции Fi и вклю- чения y ^Ri(p). Поэтому соотношения (2.24) и (2.25) показывают, что существует такое число > 0, что для рассматриваемого I выполняется соотношение -^ = Zj V7c <= I1 (г/,); Z<A) ч <2-26> При этом значение двойственной задачи, а следователь- но и значение прямой задачи совпадает с числом Наоборот, если число при котором выполнено (2.26), существует, что значение задачи (2.23) —(2.25) конечно и совпадает с игсг(^г). Если же такого числа не существует, то двойственная задача не совместна и по- тому значение задачи (2.23) —(2.25) равно +«>. Из ска- занного и равенства (2.20) вытекает справедливость предложения. Замечание 2.1. Так как производная q)n(p,g) ко- нечна (это следует из теоремы 1.6.2), то для любого yt <= Ri(p) найдется элемент 1^дР{(у{), при котором Si(g,l)<+°°- Замечание 2.2. Как показано в доказательстве предложения 2.1, sup (Z, v). Перейдем к производной q>2(Pig)- Прежде всего нам понадобится следующее утверждение.
376 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА Лемма 2.3. Пусть Y = (yi, ..., ym)^Rz(p). Тогда = ю и (р, уг) = (р, Wi) Victim. Доказательство. Так как Уе2(р), то ^Pi^w и (Р, У г) ^(Р, wi) Vi 1: тп. Поскольку вектор р строго положителен, то неравенство 2 У t w влечет S (р, рО = (р. S р«) < (р> w) = 2 (р, Wi). Поэтому найдется индекс J, при котором (р, i/j) < (р, Wj). Из сказанного следует, что существует такой вектор У = = (Рь •••, Pm)^Z(p), что yi = yi при /=/=/, yj>yj. Так как функция Fj строго монотонна, то Fj(yj)> Fj{yJ), а потому Р(У)>F(У). Это, однако, противоречит тому обстоятельству, что Y^Rz(p). Тем самым равенство 2 У г = доказано. Из этого равенства следует, что (р, У г) = (р, Wi) V i g= 1 : тп. И Дадим описание множества Rz(p, У, g). При фикси- рованных р и g для Y = (ур ..ym) е (0?+)т положим дх(Л = {^=(^1, • (р,р4)<(yi), Vift)Z>0 V&<=Z2(i/t), Vielzzn). Лемма 2.4. Пусть pug фиксированы, У = (i/i, ... ymz^Rz(p). Тогда Rz(p, У, g)=Az(y). Доказательство. 1) Пусть У = (щ, ..., vm)^ ^Rz(p, У, g), т. e. Y + aV Z(p +ag). Это включение означает, что 2 (Pi + aPi) = 3 Pi + a 2 i>i C w, (2.27) г i i (p + ag, yi + aPi)< (p + ag, wt) Vi<=l:m, (2.28) ^i + aPj^O Visl:m. (2.29) Так как, в силу предыдущей леммы У yi = w, то из (2.27) вытекает, что У Pi 0. Поскольку, в силу той же леммы (р, Pi) = (р, iPi) Vi е 1: m, то соотношение (2.28) приводит к неравенству (g, Pi) + (Р, + a (g, р{) < (g, Wi) Vi 6= 1: m, из которого следует при a 10, что (p, Vi)^ct(y). Нако- нец, неравенства (2.29) имеют место при достаточно ма- лых а>0 лишь в случае, когдапри к^12(уг). Таким образом, V AZ(Y).
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 377 2) Пусть Y^Uz(p), V^AZ(Y). Положим V = — (г?1, ..., vm), где векторы выбрапы так, что Vi < о, (g, Vi) + (р, v{) < 0, p(ift) = 0 v/c <= 72 (у,), Vie 1: m. Так как множество I'(jji) непусто и все координаты век- тора р положительны, то такой выбор возможен. Исполь- зуя соотношения c,(j/,) = (g, wt — yt), (р, у,) = (р, ш,) и (р, vi)^ci(yi), имеем (p + ag, yt + aVi)^(p + ag, u?i)+a2(g, v{). Поэтому при достаточно малых a (р + ag, i/i + aVi + a2r<) <(p + ag, w,)+a2((p, vt) + (g, v<)) + + a3 (g, v{) (p + ag, w{). В то же время 2 (j/i + avt + a2pi) w, и при до- i i статочно малых a yi + av{ + а2г?< > 0. Мы показали, что Y + aV + a27 е Z (р + ag); отсюда вытекает включение V^Kz(p, У, g). Введем ряд обозначений. Для У = (j/i, ..ym)e Rz(p) и L == (Zi, ..., lm) положим sz(y,L)= sup 2Ui,4). .................”m)eAZ<Y) < Элементу У = (i/i, ..., ym) сопоставим множество aF(y)={Z = (Zh iM^dF^)}. Здесь dFi(yi)— супер дифференциал функции Fi в точ- ке уг. Легко показать, что dF(Y) совпадает с супер диф- ференциалом dF(Y) функции F в точке (У). Предложение 2.2. Справедливо равенство <P2(P,g)= SUP inf sz(Y,L). Y(=Rz(p) Lf=dF(Y) Доказательство. Используя формулу (2.15), лемму 2.4 и теорему о минимаксе (см. Приложение I), имеем Ф2 (Р,£) = = sup sup S (hl =* У==(У1.Vm)GRz(P) y=-(vr...,vw)eKz(p,Y,g) i
378 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА sup sup inf 2 Gb Pi) = Y=(V1...l/m)eKz(P) у=(р1.pm)eAZ<r) i = sup inf sz(Y, L). a Yenz(p) LeaF(Y) Для Y = (z/i, ym)^Rz(p) положим J (Y) = {к (= 1: n | у-ft) >0 VI <= 1: m}. z m Иными словами, J (Y) = Q Z1 (уг). Если индекс к вхо- i=l дит в /(У), то продукт с этим индексом в том или ином количестве потребляется любым участником. Наличие таких продуктов, т. е. непустота множества J(У) с эко- номической точки зрения представляется весьма есте- ственным. Предполагая, что J(У) непусто, вычислим ве- личину $2(У, i). Предл ожение 2.3. Пусть Y^Rz(p) и множество У (У) непусто. Тогда при каждом L = (Zi, ..., lm) выпол- няется одно из двух*, либо sz(Y, Z/)=+°o, либо sz(Y,L) = ^^Ci(yi)l?\ где к — произвольный индекс из множества J(Y). Доказательство. Предположим, что sz(Y, L)< .<+«» и рассмотрим число sz(Y, L) как значение за- дачи линейного программирования У. (Ц, Vi) max, i (2.30) 2ЛЧ k .Ci(yi) Vieltm, (2.31) i 0 Vfcel:», (2.32) 4ft)> 0 VAeZ2(yi), Viel:m. (2.33) Задача, двойственная к (2.30) —(2.33), имеет вид i=i (2.34) (2.35) + >. - й‘> V/tG/'fi/i), Viel:m, (2.36) Zi^O Vie 1: m, 0 V/te 1: n. (2.37)
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 379 Так как значение задачи (2.30) — (2.33) конечно, то за- дача (2.34) —(2.37) совместна и имеет решение. Пусть к — некоторый элемент множества /(У). Тогда, как сле- дует из (2.36), переменные Zi связаны с числом tk си- стемой уравнений pwzi + tk = Z(iA) Vie 1: m. Исключая из этой системы tk, получим, что Zi = Zx + -Ju (Zift) — zift)) Vi e= 1: m. Отсюда m m 2 Ci <У^ 2i = 2 Ci (Уд + i=l i=l ' P > Вспоминая определение величины Сг(г/») (см. формулу (2.17)), имеем 2 с» (г/*) = 2 te, «ч — Vi) = (g, 2 «>i) — 2 уЛ i=l i=l V i > V i ' Так как Уей2(р), то (см. лемму 2.3) 2i/i = 2wi- По- i i этому 2 сг (Уг) = 0 и, следовательно, i т т 2 Ci Zi = “$) 2 С< (Уд i=l Р г—1 т. е. линейная функция У-+ 2 (у{) z{ на множестве г=1 (2.35) — (2.37) постоянна. Применяя теорему двойствен- ности линейного программирования, приходим к ра- венству Sz(Y,L)= sup 2Gi>yi) = у=(С1,...,»т)ед2(У) i т --и-2'<(»<)«"• р i=l 3. Результаты предыдущего пункта позволяют опи- сать производную функции <рр, введенной в рассмотре- ние в п. 1. Зафиксируем векторы ge^n и
380 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА введем следующие обозначения dUi(yi') = (1<=д1Ц(уг)\ sup (I, v) < + оо _»еД{(Й0 уу{еВ{(р), Vtei:m dUp(Y) = {L = (l_1, <= dUi (yt): sup 2 Ui, Щ) < + V=(’i...»m)SAz<Y) i co Здесь множества и Az(У) определены формулами (2.18) и (2.26) соответственно Ri (Р) = (У ^Zi(p)\Ui (у) = *тах > U {(х)|, (2.38) /?z.p(p) = {reZ(p)|C7p(y) = max ^GZ(p) t7p(X)}. (2.39) Функция C7p определена формулой (2.6). Теорема 2.1. Пусть заданы векторы peinlER™ и g^ Rn, функции Ui и числа р{, причем 1) функции Ui вогнуты, строго монотонны и опре- делены на некотором открытом множестве, содержащем конус числа р< положительны; 2) точка peintJ?™ такова, что для любого У = = (z/i, .. Ут)*=Иг,р множество индексов J(Y) непусто. Тогда функция <рр, определенная формулой (2.8), дифференцируема в точке р по направлению g и (фр)' (р. g) = (фр)' (р, g) — (фр)' (р. г). где (ф?)' (P,g) = = 2 sup inf ^4-T-(g, — У») VfceP(yt), i=i»ieBi(p)zie«7{(vi) pv v (ф^)'(Р>?) = n.l.W = sup inf ^^^-(g,iVi — yi) YGRZ,p(P) L^(L.lm)f=dUP(Y) i=l P У/се=У(У). Здесь множества Ri(p) и Rz,P(p) определены формулами (2.38) и (2.39) соответственно. Доказательство вытекает непосредственно из предложений 2.1, 2.2 и 2.3.
§ 2. ИССЛЕДОВАНИЕ ОДНОЙ МОДЕЛИ ОБМЕНА 381 Укажем условия, при которых функция фр квазидиф- ференцируема. Следствие 2.1. Пусть в условиях теоремы функ- ции Ui дифференцируемы, т. е. супердифференциал dUi(y) состоит из одного вектора VUi(y) = | (ц\ \дх(1) dUt \ Тогда (<pp) (?> g) = 2 _ sup -(m ; cm ^Wi ~_ - sup (g, <IP* - У*)У (2-40) YeRZ,p(P) \ i=i P ’ dx / где ki — произвольный индекс из множества U(yi), k— произвольный индекс из множества J(Y). В рассматри- ваемом случае функция фр квазидифференцируема в точке р. Из (2.40) легко следует, что квазидифференци- ал функции фр имеет вид <£)фр = [дфр(р), дфр(р)], где дфр — выпуклая оболочка множества {2 ^у ^Wl ~ vi) I j/iе (р), ki <= 71 (у<)|, дфр — выпуклая оболочка множества {“ 2 <“’< - । Y = (Pl’ • • • > Pm) е <=RZM Следствие 2.2. Пусть в условиях теоремы 2Л функции Ui строго вогнуты. Тогда множество Ri(p] со^ стоит из одного элемента уi(p)Vi 1:т, а множество Rztf>(p) из одного элемента Y(р, p) = (i/1(p) р)\ ... • ••7 У™(р, р))* R рассматриваемом случае m f i(hi) \ W(p,g) = ^ in! 1- — inf 2 (g. —Pi(p,p)\ (2.41) ..гт)еаиР(У(р,р)) i=i \ P' /
382 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА где ki^ k^J{Y{p, р)).В данном случае функ- ция <рр также квазидифференцируема. Используя фор- мулу (2.41), легко выписать ее квазидифференциал. Следствие 2.3. Пусть в условиях теоремы функ- ции Ui строго вогнуты и дифференцируемы {имеют диф- ференциалы). Тогда функция срр дифференцируема в точ- ке р и ее градиент Vg>p имеет вид ?ФР(р) у Pi ^i (!/»(₽)) Wi — Уг (Р) V Pi dUi (^i (р> р)) (.Wi — yi (p, p)). Здесь векторы у{(р), Y(p, p) = (yi(p, p), ..ym(p, p)), индексы ki и k определяются так же, как и в след- ствии 2.2. Так как ydp)^ Rdp), то (р, р<(р)) = (р, u>i)- В то же время лемма 2.3 показывает, что (р, у<(р, р)) = (р, и\). Отсюда вытекает, что (v<pp(p), р •)= 0 при всех peintK+ § 3. Анализ кооперативных игр 1. В настоящем параграфе мы остановимся на неко- торых приложениях негладкого анализа. Точнее, мы по- кажем, как, на первый взгляд несколько неожиданно, субдифференциал Кларка и квазидифференциал позво- ляют взглянуть с единой точки зрения на некоторые проблемы теории кооперативных игр. Поскольку для нас основной интерес представляют методы негладкого ана- лиза, мы не будем подробно останавливаться на необ- ходимых определениях теории игр, а постараемся крат- ко сформулировать некоторые понятия и, по возможно- сти, прокомментировать их. Подробное изложение тех определений и результатов теории игр, которые будут использоваться, можно найти, например, в [15, 67, 103]. Итак, представим себе ситуацию, в которой несколь- ко участников некоторого процесса (это может быть про- цесс производства, обмена и т. д., наконец, просто игра) могут действовать как поодиночке, так и образовывать различные коалиции, получая при этом какие-то выиг- рыши. Эти выигрыши, вообще говоря, могут иметь со-
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 383 вершенно различную природу (в частности, могут быть векторными). Однако мы будем считать, что каждый участник может количественно оценить свой выигрыш, т. е. у каждого участника есть некоторая вещественная функция, называемая функцией полезности, ставящая в соответствие выигрышу его числовую оценку, которую будем называть далее полезностью. Предполагаем так- же, что полезности участников (игроков) обладают так называемым свойством трансферабельности, т. е. изме- ряются по одной шкале (например, речь может идти про- сто о деньгах) и могут передаваться друг другу (побоч- ные платежи) без потерь (подробнее см., напри- мер, [68]). Кооперативная игра (с побочными платежами), или классическая кооперативная игра — это пара [7, vj, со- стоящая из конечного множества 7, называемого множе- ством игроков, и вещественной функции v. 2I->R1, ста- вящей в соответствие каждому подмножеству 7с 7, на- зываемому коалицией, число v(J), интерпретируемое как тот максимальный выигрыш (максимальная полезность), который могут обеспечить себе игроки из J, действуя совместно. Один из центральных вопросов теории коопе- ративных игр — вопрос об определении решения игры — кратко можно сформулировать следующим образом. Как распределить между игроками выигрыш (полезность) р(7), чтобы считать это распределение (дележ) в некотором смысле справедливым, разумным, опти- мальным? Среди множества разнообразных подходов к решению этого вопроса мы выделим два, которые, с одной сторо- ны, относятся к числу наиболее существенных, при- влекательных и известных, а с другой стороны, позволят нам продемонстрировать возможность ис- пользования субдифференциала Кларка и квазидиффе- ренциала не только в приложениях, ставших уже тради- ционными Первый подход состоит в том, что каждой игре [7, v] (в дальнейшем мы будем говорить просто об игре о) ставится в соответствие некоторый вектор Ф (у) е R2, компоненты которого описывают выигрыши игроков в этой игре. Естественно, что такой вектор, чтобы считать- ся в каком-то смысле справедливым, должен удовлет- ворять некоторым требованиям. Впервые систему акси- ом, которым должна удовлетворять функция Ф, сформу-
384 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА лировал Л. Шепли [182]. Мы сформулируем эту систе- му в удобном для нас виде *). А1 (симметричность). Если л — такая перестановка множества Z, что для любой коалиции J v(itJ)=v(J), то для любого i е I Фж(у)= Ф<(у). А2 (Парето-оптимальность). 2<Di(v) = v(Z). iG I АЗ (несущественного игрока). Если в игре и иг- рок го таков, что для любой коалиции / y(/U{fo}) = = v(J), то Ф|о(у) = 0. А4 (линейность). Если для всех J: w(J)=u(J) + + p(J), то Ф(ш)= Ф(и) + Ф(и). Л. Шепли рассматривал Ф<(г) как априорную оценку игроком i выгодности для него игры v. Смысл этих ак- сиом вполне ясен. Так, первая утверждает, что оценка игроком игры не должна зависеть от того, каким ин- дексом он обозначен, вторая утверждает, что игроки должны распределить между собой всю полезность и(1). Третья аксиома утверждает, что игрок, никак не влия- ющий на выигрыш ни одной из коалиций, к которой он присоединяется, не должен получить ничего. Этим аксиомам удовлетворяет единственная функ- ция Ф, называемая функцией (значением) Шепли, а именно: Ф1 („)_2 („(/и{i))_„(/)); где 1/1 — число элементов множества J. Функцию Ф можно интерпретировать как функцию, задающую сред- ний выигрыш игроков при следующей вероятностной схеме. Равновероятно выбираем любого из игроков. Да- лее равновероятно присоединяем к нему любого из остав- шихся игроков и продолжаем этот процесс, пока не ис- черпаем все множество I. При этом, если игрок i вы- бирается после того, что образована коалиция J, то он получает величину v(J U {i}) — v(J). Вектор Ф(у) назы- вается вектором (значением) Шепли игры и. *) В этом параграфе координаты вектора помечаются нижним индексом без скобок: f-я координата вектора х обозначается че- рез Xi.
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 385 Замечание 3.1. Вектор Шепли является решени- ем задачи минимизации функции ^(x,p) = S(|J|-1)!(|7|-|J|-1)!(p(/)-x(J)) на множестве {хе CR*| rr (Z) = где x(J) = Ин- ieJ тересное семейство нелинейных аналогов функции Шеп- ли, в частности многозначных, можно получить, заменив в Q(x, v) выпуклую функцию (р(/) — (х(У))2 произволь- ной выпуклой функцией ф (v (/) — х (J)). Однако изло- жение оптимизационных аспектов не входит в нашу за- дачу, а подробно этот подход изложен в [68]. Второй подход к определению решения игры, кото- рому мы уделим внимание, состоит в том, что реше- нием игры и называется множество «недоминируемых дележей», т. е. множество с (у) = {х е R11 х (Z) = v(Z), x(J)> v (J) V J cz Z}, называемое с-ядром игры v. В отличие от вектора Шеп- ли, который всегда существует и единствен, с-ядро может быть пустым, однако также допускает ясную ин- терпретацию. А именно, пи одна коалиция не может получить суммарную полезность больше, чем ей дает произвольный элемент с-ядра. 2. Чрезвычайно интересным как с точки зрения при- ложений (например, при изучении экономического рав- новесия), так и с чисто технических соображений (хотя бы потому, что удается достаточно просто получить не- которые классические результаты, касающиеся, в ча- стности, непустоты с-ядра), оказалось изучение «нечет- ких кооперативных игр» [107], суть которых состоит в следующем. Если I — множество игроков, то каждая коалиция J <= I может быть отождествлена с ее харак- теристическим вектором eJ, ставящем в соответствие каж- дому игроку i I «интенсивность его участия» ^е{0,1} в этой коалиции: j fl, ieJ, “Io, i ф J. В этом случае множество всех коалиций есть {0, 1}п. Множество нечетких коалиций, по определению, есть [0, 1]л. Иными словами, нечеткая коалиция т [0, 1]п
386 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА ставит в соответствие каждому игроку i I интенсив- ность его участия Ti [О, 1]. Нечеткая кооперативная игра — положительно одно- родная функция на [О, 1]п. Таким образом, если клас- сическая кооперативная игра представляет собой функ- цию, определенную на вершинах единичного куба, то нечеткая игра — это уже функция на всем единичном кубе. Ясно, что в силу положительной однородности функцию у • [0, l]n-> R1 можно продолжить на R™, по- ложив Будем рассматривать пространство Rn как пространство полезностей. Вектор х = ..., представляет полезность игроков; полезность этого вектора для коа- п лиции т определяется величиной (т, х) = 2 Если i=l J <= 7, то эта полезность равна (eJ, х) = 2 3. Наша цель заключается в определении решения на некоторых классах нечетких игр. Под решением по- нимается отображение 5, сопоставляющее каждой игре v из данного класса множество S(v) и удовлетворяющее ряду свойств. Нам понадобятся определения, некоторые из них аналогичны приведенным выше. Пусть v — нечеткая игра, S(v)—множество векторов. 1. Говорят, что множество S(v) Парето-оптимально, если 2 я$=у(1) V^eS(v). i=l 2. Для произвольной перестановки л множества I = = 1 : п положим (Л*Р) (т) = V (тя_1(1), . . ., Тя-1(п)), W< = хп.. Множество S(v) называется симметричным, если для любой перестановки л выполняется' 5(л*р) = л(5(и)). 3. Пусть P=(5i, ..., Sm)—некоторое разбиение мно- жества I = 1 : п на m непустых коалиций. Обозначим через Р ® v игру ш лиц, определяемую формулой
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 387 (P®v)(0i, 0m)=y(Ti, ...» Тп), где тл = 0, при k^Sj Nj. Пусть, далее, Р ® х — вектор из опре- деляемый равенством (Р ® х^ = 2 хг- Говорят, что ieSj для игры и выполняется свойство разбиения, если S(P ® v) = P ® S(v) при всех разбиениях Р. 4. Говорят, что выполняется свойство несуществен- ного игрока, если равенства р(т)= р(тГХ{0) для любого т [0, 1]п влекут соотношение х^ = 0 Ух е S (и). Здесь и далее через хв(В<^1) обозначается проекция вектора т [0, 1]п на пространство 5й = [хе S11 = О Под решением на некотором классе игр естественно понимать отображение S, обладающее на этом классе указанными выше свойствами (или их модификациями); некоторые из этих свойств могут выполняться не на всем классе, а лишь на какой-нибудь его части. Рассмотрим прежде всего класс непрерывно диффе- ренцируемых нечетких игр. Обобщенным значением Шепли функции и из этого класса называется вектор 5(p)=Vp(l). Можно проверить, что этот вектор (или, точнее говоря, множество, состоящее из него) обладает свойствами Парето-оптимальности, симметричности, раз- биения и несущественного игрока. Кроме того, выпол- няется свойство аддитивности 5(щ + 0%)= S(v\) + S(р2)• Доказательство высказанного утверждения будет прове- дено ниже в более общей ситуации. Оказывается (см. [105]), что если отображение S сопоставляет непрерыв- но дифференцируемой игре и вектор S(v), обладающий свойствами Парето-оптимальности, симметричности и раз- биения, то 5(p)=Vp(l). Таким образом, обобщенное ре- шение Шепли претендует на роль решения в классе непрерывно дифференцируемых игр. Пусть и: {0,1)-> R1 —классическая кооперативная иг- ра. Можно показать, что существуют ее .расширения до нечеткой непрерывно дифференцируемой игры, обобщен- ное значение Шепли которой совпадает со значением Шепли исходной игры. Одно из таких расширений ши выглядит так: 1 WU(т) = S «в («)(П 181 , s ues 1 где аа(и) = S (— TcS
388 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА Обобщим на нечеткие игры понятия с-ядра. Пусть v — нечеткая кооперативная игра. Ее с-ядром называ- ется множество с (у) = Irre 2 хг = v I . i€=I (1), S Vts [0, l]n iei Очевидно, что x^c(y) тогда и только тогда, когда ди (1), где Ml) = (ZeiP7| p(1)-p(0)>(z, 1-0)1 суп ер дифференциал функции v в точке 1. с-ядро может быть и пустым, однако, если v — вог- нутая (и, тем самым, суперлинейная) функция, то с — ядро непусто. Можно показать (это следует из приведен- ных ниже результатов), что для вогнутых игр с-ядро Парето-оптимально, симметрично, обладает свойствами разбиения и несущественного игрока. Таким образом, в классе вогнутых игр на роль решения претендует с-ядро. Особый интерес представляет так называемая супер- аддитивная оболочка яи классической игры и: {0, 1}п-> -►В?1, определяемая формулой яи (т) = sup ^V-su{S). g£>0,S|l-geS=T s Функция яи'. [0, lp-^К1—наименьшая положительно однородная вогнутая функция, большая чем и. Игра и на- зывается сбалансированной, если ли(1)= и(1). Так как c{v)=dv(l), то справедлива следующая ' Теорема 3.1. Классическая коооперативная игра и имеет непустое с-ядро тогда и только тогда, когда она сбалансирована, В этом случае ее с-ядро совпадает с с-ядром нечеткой игры яи. Первая часть этой теоремы представляет собой один из классических результатов о непустоте с-ядра. 4. Представляет интерес рассмотреть указанные вы- ше решения (обобщенное значение Шепли для непре- рывно дифференцируемых игр и с-ядро для вогнутых игр) в рамках единого подхода. Один из таких подходов основан на использовании субдиффренциала Кларка. Рассмотрим класс всех локально липшицевых нечет- ких игр. Решением S(y) игры v из этого класса назы- вается субдифференциал Кларка 3Civ(l) функции v в точке 1. Понятно, что для непрерывно дифферепцируе-
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 389 мой игры так определенное решение совпадает с обоб- щенным значением Шепли, а для вогнутой игры — с с-ядром. Теорема 3.2. Множество решений S(v) локально липшицевой игры и непусто, компактно и выпукло. Оно обладает свойствами Парето-оптимальности, симметрич- ности и несущественного игрока. Кроме того, a) S (Ху) = 15 (у) VX>0, b) S(u +v)^ S(u)+ S(y), с) если v — монотонная функция (т. е. покоординат- ное неравенство х>у влечет и(х)> и(у)), то 5(y)czR”, d) еслиН*. R™—>Rn—линейное отображение и Я(1) = = 1п, то S(v ° Я)<= H*S(у). Если, кроме того, 77(Rm) = или функция v регулярна в точке х = 1, то S(v°H) = = H*S(v). (Напомним, см. п. 5 § II.1, что функция v называется регулярной в точке х, если существует производная по направлениям v' (х, g) в этой точке и v' (х, g) = vqi (х, g) для всех g.) е) если функция v регулярна, то S удовлетворяет условию разбиения. Доказательство. Свойство а) очевидно, Ь) сле- дует из предложения II.1.12, d) вытекает из предложе- ния II.1.13 и замечания II.1.1. Докажем свойство с). Пусть v возрастающая функция, g > 0. Тогда v(x' + + ag) — у (я') > 0 при а > 0, поэтому г>с1(1, ?)= Ит ~^-[v(x' + ag) — v(x')]^0. Напомним, что S(v) = dC\v(i) является супердифферен- циалом суперлинейной функции ^ci (1, g). Поэтому, если I <= S (v), g > 0, то (Z, g) Ус1 (1, g) 0. Отсюда следует включение I е IP*. Свойство е) легко вытекает из d). Покажем это. Пусть P=(Si, ..., Sm) — некоторое разбиение множества индексов I. Рассмотрим линейное отображение Н: ->Rn, определенное равенством Я(9) = (Т1, ..., тп), где е 0Л если k Sj. Пусть v — регулярная нечеткая иг- ра. Понятно, что (Р ® у) (0)= у (Я(0)), поэтому, как сле- дует из d): 5(Р®у)=Зи(Р®у)(1)=аДу(Я(1))) = = Я*5иу(1)=Я*5(у).
390 ГЛ. VII. ПРИМЕНЕНИЯ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА (Символ Р ® и, где и — игра, и Р * х, где х — вектор, введены при определении свойства разбиения.) Пусть Вычислим вектор Я*/. Для произвольного бе е Rm имеем (//*/, о) = (/, Я9) = 3 iiXi = 2 2 /«0^ = 1=1 J=iieSj = 2 0j 2 k = 2 ® Oj = (Q- p ® 0- 5=1 ieSj 5=1 Так как 0 — произвольный вектор, то Я*/ = Р ® I. Та- ким образом, S(P ® v) = Р ® S(и), и е) доказано. Свойства симметричности и несущественного игрока могут быть также доказаны с помощью свойства d). Их доказательство очевидно, и мы на нем не останав- ливаемся. Нам остается лишь проверить Парето-опти- мальность. Используя положительную однородность функции v имеем v (1) = г;(1 + а1) — ^С1) < < lim -±- [р (т + al) — v (т)] = 1^(1, 1). т->1 а а|о Пусть L — липшицева константа локально липши- цевой функции вблизи точки х = 1. Тогда р(т + а1)— v(l + al)^ Lilt— HI, v(l)— v(т)^ ЯИт — HL Поэтому р(т + а!)“ р(т)^ р(1 + а1) — р(1) + 2/(т — 1), откуда следуют соотношения УС1 (1» 1) = lim -2. [р (т + al) — v (т)] < + а1) —= р(4)- Таким образом, Vci (1, 1) = v(1) и, если x^S(v), то (1, x)Oci(l, 1) = р(1). Так как функция (—и) также положительно однородна и (см. предложение II.1.6), 5Ci(—v) (1)= — 3С1У(1), то
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 391 (1, —р(1) для x^S(v). Таким образом, (I, х) = = p(i). 5. Другой единый подход к решению, позволяющий с общей точки зрения рассматривать как непрерывно дифференцируемые, так и вогнутые игры, основан на понятии квазидифференциала. Под квазидифференцируе- мой нечеткой игрой будем понимать положительно од- нородную функцию, определенную на конусе и ква- зидифференцируемую в точке 1. Прежде чем обратиться к квазидифференцируемым нечетким играм, нам понадо- бятся некоторые дополнительные результаты, касающие- ся положительно однородных квазидифференцируемых функций. Пусть К — выпуклый конус в Rn с компактным ос- нованием и непустой внутренностью. (Под основанием конуса К понимается такое множество Т, что К = U №. Приведем пример. Пусть вектор I таков, что (Z, я)>0 для всех х <= Я, х =/= 0. Тогда множество Т = {х <= Я| (I, х) = = 1} является основанием К.) Предположим, что Т — основание конуса и dim Т <п, a ri Г обозначает отно- сительную внутренность множества Т, RT — аффинную оболочку множества Т. Функция /: называется квазидифференци- руемой в точке х если опа дифференцируема в этой точке в каждом направлении g RT ~ Rt — х и су- ществуют такие выпуклые компакты dTf(x), dTf(x)<= <= RT, что /' (ж; g) = max {у. g) + min (z, g) Vg <= RT. y(=dTfW z^dTf(x) Следующее предложение немедленно следует из опре- делений. Предложение 3.1. Пусть функция ft K-+Rx ква- зидифференцируема в точке х s int К. Тогда функция где Т(х, р)= {z<==K\(z — х, р)=0), квази- дифференцируема в х и ее квазидифференциал опреде- ляется парой [Л, 5], где А = Ргр(д/(я)), В = Ргр(д/(я))? a YvyC — ортогональная проекция множества С на ги- перплоскость (z, р) = 0}. Предположим, что функция f*K<- R1 является по- ложительно однородным продолжением функции /, оп-
392 ГЛ. VII. ПРИМЕНЕНИЕ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА ределеппой па множестве Т(х, х), x^intK. Пусть / — квадизифференцируема в х. Теорема 3.3. Функция f квазидифференцируема и 2)](х) = рр(я) + х д/(я) 1 г&е IIM2 = Gr»2:)- Доказательство см. [164]. 6. Как мы уже видели выше, особую роль при рас- смотрении нечетких игр играет коалиция всех игроков, т. е. точка 1. Поэтому в дальнейшем, говоря о квази- дифференцируемости, мы будем иметь в виду квазидиф- ференцируемость в точке 1. Рассмотрим квазидифферен- цируемую игру v. Пусть [dv (1), ди (1) ] — ее квазидиф- ференциал в 1. Из предложения (3.1) следует, что функ- ция = Ит(1Д) также квазидифференцируема и ее ква- зидифференциал определяется парой (1), Prj 5р(1)]ф Ясно, что положительно однородное продолжение v функции V\ па R* совпадает с р, а ее квазидифферен- циал можно определить также по теореме 3.3: Prjdp(l) + 1, Pri5y (1)]. Легко видеть, что эта пара обладает свойством Парето-оп- тимальности в том смысле, что для xePfj dp(i) + y^l и y(=Prtdv(i) имеет место равенство п £ (*< + J/i) - (* + у, 1) = 1, 1) = V (1) г=1 \ II1II / (т. к. Рг4 Зг(1), Рг1^р(1) cz Я1). Аналогично можно сфор- мулировать свойство несущественного игрока. Квазирешением игры v назовем квазидифференциал 0пи(1) функции v в точке 1, обладающий свойством Парето-оптимальности. Теорема 3.4. Пусть игра v квазидифференцируема. Тогда квазирешение обладает свойствами Парето-опти- мальности, симметричности и несущественного игрока. Кроме того, а) квазирешение линейно по v,
§ 3. АНАЛИЗ КООПЕРАТИВНЫХ ИГР 393 Ь) Если отображение Н: >Rn линейно и Я(1) = « In, ТО 3>n(v^H){i)^H^n(v(in)), с) Если v непрерывно дифференцируема в 1, то = [Vp(l), 0], и квазирешение можно отожде- ствить с обобщенным значением Шепли игры v. d) Если v вогнута (т. е. супераддитивна), то 0пи(1) = [О, 5р(1)], где dv{i) — супердифференциал вог- нутой функции и, следовательно, его можно отожде- ствить с с-ядром игры v. Доказательство. Все свойства, кроме симметрич- ности и несущественного игрока, следуют из определения и свойств квазидифференциала. Последние два следуют из Ь), однако эти свойства можно получить из доказа- тельства теоремы 3.5. Ясно также, что можно определить квазирешепие максимума и минимума нескольких квазидифференци- руемых игр. Заметим также, что величина v' (1, g) = lim-J- [У (1 + М — V (1)] Ио л интерпретируется как маргинальный выигрыш коали- ции 1, когда к ней присоединяется коалиция g. (Если какие-либо компоненты вектора g отрицательны, то мож- но считать, что соответствующие игроки уменьшают ин- тенсивности своего участия.) В заключение мы определим решение квазидиффе- ренцируемой игры, которое определяется однозначно (в отличие от квазирешения, определяемого с точностью до класса эквивалентности). Точкой Штейнера выпуклого компакта К в Rn на- зывается элемент s(K) = — f ap(#,a)dl, an J sn—1 где X — мера Лебега на единичной сфере Sn \ оп — объ- ем единичного шара в Rn, a — переменный вектор и р(К, •)—опорная функция множества К. Отметим, что отображение s линейно по К и s(K)^ е К. Пусть игра v квазидифференцируема и [др(1),
394 ГЛ. VII. ПРИМЕНЕНИЕ МЕТОДОВ НЕГЛАДКОГО АНАЛИЗА 5р(1)]—ее квазирешение, st-решением квазидифферен- цируемой игры v называется вектор st(p) = s(3i?(l)) + + s(dv(i)). Нетрудно проверить, что это определение корректно, т. е. не зависит от того, какая пара определяет квази- дифференциал 0nv(i) (в частности, она может даже не обладать свойством Парето-оптимальности). Теорема 3.5. Если игра v квазидифференцируема, то 1. Отображение st: v*-*st(v) линейно по и, п 2. st-решение Парето-оптимально, т. е. 2 (st V)i = V (1). i=l 3. Если v непрерывно дифференцируема, то st(p)== = Vp(l) и st-решение совпадает с обобщенным зна- чением Шепли игры и. 4. Если v вогнута (супераддитивна), то st (у) явля- ется точкой Штейнера с-ядра игры и. 5. st-решение симметрично. 6. st-решение обладает свойством несущественного игрока. Доказательство см. [164]. Отметим, что вектор st v можно интерпретировать как вектор средних маргинальных выигрышей игроков. Замечание 3.2. Приведенные результаты могут быть перенесены на е-квазидифференцируемые игры.
ПРИЛОЖЕНИЕ I ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА Здесь приводятся сведения из теории выпуклых функций и множеств, используемые в основном тексте. Множество Й cz называется выпуклым, если соотношения х, у е Й, а, 0^0, а + 0 = 1 влекут ах + 0у s Й. Элемент т т у = 2 где ai 0 Vi е 1: т, 2 а. = 1, называется выпук- i=l i=i лой комбинацией элементов х\, ..хт. Понятно, что выпуклое множество содержит любую выпуклую комбинацию своих элемен- тов. Пусть Й cz Rn. Пересечение всех выпуклых множеств, со- держащих Й, называется выпуклой оболочкой Й и обозначается символом со й. Легко показать, что со Й совпадает с совокуп- ностью всех выпуклых комбинаций элементов множества Й. Спра- ведлива следующая Теорема Каратеодори. Выпуклая оболочка со Й мно- жества Йс Rn состоит из выпуклых комбинаций не более, чем п + 1 элемента этого множества. Функция /, определенная на выпуклом множестве Й с: Кп, называется выпуклой, если / (ах + Ру) < а/ (х) + 0/ (у) Ух, у е й, Va, 0 > 0; а + 0 = 1. Справедливо неравенство Йенсена: (m \ m т 2,°Л Vz.e=Q, а{>0, 2 ai = l- i=l / г=1 i=l Функция / выпукла тогда и только тогда, когда ее надграфик epi / = {[х, X] | х е й, f(x)} — выпуклое множество. Если Й — открытое множество и выпуклая функция / ограничена сверху на каком-то открытом подмножестве множества Й, то она непрерыв- на на Й. Пусть й — выпуклое замкнутое подмножество пространст- ва Кп и рй (х) = min || х — у ||— расстояние от точки х до мно- уей жества й. Нетрудно проверить, что функция рд выпукла. Пусть х — внутренняя точка выпуклого множества Й, на ко- тором определена выпуклая функция /. Множество £/ (я) = {v I f (у) ~~ f (*) X», у — х) Уу с= й} называется субдифференциалом функции / в точке х. Субдиффе-
396 ПРИЛОЖЕНИЕ I ренциал df(x) является непустым выпуклым компактным мно- жеством. Он определяется лишь поведением функции вблизи точ- ки х. Иными словами, при произвольном б > 0 выполняется ра- венство £/ (*) = е Rn I / (у) — / (ж) Х»,у — х) Уу е= Я6 (х)}. Справедливо представление / (х) = max (/ (у) + (»(у), х — у)), уей где v(y)—произвольный элемент множества df(у). Выпуклая функция / имеет производную /'(х, g) в точке х по любому на- правлению g и справедливо равенство /' (х, g) — max (р, g). ves/(x) Многозначное отображение x^ df (x) полунепрерывно сверху. Пусть выпуклая функция / определена на Rn. Зафиксируем е > 0. Множество ttf (*) = {•’ *= I / (У) ~ / (*) X». У — «) — « Vy <= Rn} называется е - субдифференциалом этой функции в точке х. Мно- жество Je/(x) непусто выпукло и компактно. При 8 > 0 много- значное отображение x*-*dzf(x) непрерывно (в метрике Хаусдор- фа). Справедливо равенство max (»,g) = inf — (/ (х + ag) — / (я) 4- е). 1>еаеУ(х) а>о а Функция f называется вогнутой, если (—/) — выпуклая функция. Если / — вогнутая функция, то множество df (х) = {» е Rn | f (у) — f (х) <(о,у — х) Уу <= й} называется супердифференциалом функции f в точке х. Все свой- ства выпуклой функции и ее субдифференциала с естественными изменениями переносятся на вогнутую функцию и ее супердиф- ференциал. Имеет место следующее утверждение. Теорема о минимаксе. Пусть Йг cz Rn, Й2 cz Rm— выпуклые замкнутые множества и по крайней мере одно из них ограничено, функция f(x, у) определена на Qj X Й2 и выпукло-во- гнута, т. е. функция х*-+ f(x, у) выпукла при всех z/eQ2, функция y*-+f(x, у) вогнута при всех х е Йь Тогда sup inf f (х, у) = inf sup f (х, у). Важную роль в выпуклом анализе играет следующее утверждение. Теорема отделимости. 1) Пусть Й1 и Йг—выпуклые замкнутые множества в Rn и по крайней мере одно из них
ЭЛЕМЕНТЫ ВЫПУКЛОГО АНАЛИЗА 397 ограничено. Тогда найдется такой вектор I е Rn, что sup (Z, х) < inf (Z, у). 2) Пусть Q — выпуклое множество в Rn с непустой внутрен- ностью и х — граничная точка Q. Тогда найдется такой вектор I е Rn, что (I, х) = sup (Z, у). 1/ей Полярой множества Qc Кп называется множество Й° = {l е е Rn | (Z, х)< 1 Ух е Q}. Поляра Q° — выпуклое замкнутое множество, содержащее нуль. Множество Q00 = (Q0)0 совпадает с й в том и только том случае, когда Q выпукло, замкнуто и со- держит нуль. Если On е int Q, то поляра Q0 ограничена. В сово- купности выпуклых множеств вводятся операции сложения по Минковскому и умножения на число. По определению, Qi + Q2 = = {* + У I * е Qi, г/ е Рг}, W = {%х | х е Q}. Справедливы ра- венства (Й, + Q_)0 = U [ай, П (1 - а) Й_], где 0 • Q = П *Й; v 1 2/ ае[о,1] 1 2J Х>0 (W)°= 4'q0 v*>0- ’ Рассмотрим конус К, т. е. множество, содержащее с каждой своей точкой х весь луч {%ж|Х^0}. Поляра К° совпадает с мно- жеством —2С+, где К+ — сопряженный к К конус £+ = {i><=Rn| (у, х)>0 Ух<=К}. Вторая поляра к К совпадает со вторым сопряженным конусом К++ и является выпуклой замкнутой оболочкой К. Если К — вы- пуклый замкнутый конус, то он совпадает со своим вторым со- пряженным. Если Q — выпуклое множество, то символ cone Q обозначается коническая оболочка этого множества: cone Q = U XQ. Непрерывная функция р, определенная на выпуклом замкну- том конусе К, называется сублинейной, если она субаддитивна: Р (х + У) Р(х) + Р(У) Для х, у^К и положительно однородна первой степени: р(Кх) = Кр(х) при х К, X 0. Понятно, что сублинейная функция выпукла и р (0п) = 0. Выпуклая положи- тельно однородная функция сублинейна. Субдифференцииалом др сублинейной функции р называется ее субдифференциал в нуле: др = др (0п). Таким образом др = {и е Rn | (у, х)< р (х) Ух е к}. Если К = Rn (это наиболее интенсивный случай), то др — вы- пуклый компакт и функция р восстанавливается по своему
398 ПРИЛОЖЕНИЕ I субдифференциалу по формуле р (х) = max (у, х), v^dp Рассмотрим выпуклый компакт Q в Rn. Функция pQ (я) = max (v, х) Vx е Rn сублинейна и ее субдифференциал дра совпадает с множеством Q. Обычно pQ называется опорной функцией множества Q. Отображение <р, сопоставляющее каждой сублинейной функ- ции р ее субдифференциал др, называется двойственностью Мин- ковского, Это отображение осуществляет взаимно однозначное со- ответствие совокупности всех сублинейных функций на совокуп- ность всех выпуклых компактов. Отсюда следует, что равенства = Рй и Qi = Q2 равносильны. Основные свойства двойствен- 1 2 ности Минковского выражаются следующими соотношениями: 1) д (Р1 + р2) = дР1 + дРг; pQi+Qss = Рй1 + рЙ2; 2) д (Хр) = Хдр; р^й = Хрй VX > 0; 3) соотношения р\(х)^р2(х) Ух и др{ о др2 эквивалентны; т~~ 4) если р (х) = max р. (х), то др ~ со U др.. isi:m “ i=l" Справедливо следующее утверждение. • Предложение П.1.1. Пусть р— сублинейная функция, оп- ределенная на и конус К определен равенством К = {х е Rn | р (х) О}. Тогда К+ = —cl сопедр. Если, кроме того, 0п 9= др, то К+ = —сопе_др. Производная по направлениям g^ fx (g) выпуклой функции / в точке х является сублинейной функцией, субдифференциал dfx которой совпадает с субдифференциалом df(x) функции / в точке х. Субдифференциал др (х) сублинейной функции р, опре- деленной на Rn, в точке х вычисляется по формуле др(х) = = {у^др | (у, х) = р(х)}. Множество др(х) представляет собой грань компакта др, которая называется max-гранью, порожденной точкой х. Пусть К — выпуклый замкнутый конус в Rn, р — сублиней- ная функция, определенная на всем пространстве и рк — ее сужение на конус К, т. е. рк (х) = р(х) Ух^К. Рассмотрим суб- дифференциалы дрк = {и | (у, х)^ р (х) Ух е К}, др == {р | (и, х)^. р (х) Ух е Rn} функций рк и р соответственно. Эти суб дифференциалы связаны
ЭЛЕМЕНТЫ ТОПОЛОГИЧЕСКОЙ ТЕОРИИ 399 соотношением, др к = др — К+. При этом sup (», х) = И*)’ v<=dK 1+°°, х&К. Функция q называется супер линейной, если р = —q — субли- нейная функция. Супердифференциал dq суперлинейной функции <?. заданной на выпуклом конусе К cz IRn, определяется равенством dq ={i? е Кп | (v, х)^ q (х) Ух е К}. Все сказанное выше относительно сублинейных функций и их субдифференциалов с естественными изменениями переносится на суперлинейные функции и их супердифференциалы. Доказательство всех изложенных выше результатов можно найти, например, в [27, 42, 77, 82]. ПРИЛОЖЕНИЕ п ЭЛЕМЕНТЫ ТОПОЛОГИЧЕСКОЙ ТЕОРИИ МНОГОЗНАЧНЫХ ОТОБРАЖЕНИЙ Рассмотрим многозначное отображение а, определенное на пространстве Rn и принимающее значения в совокупности под- множеств пространства $<т. Множество dom а ={х е Rn| а (х) =# 0} называется эффективным множеством этого отображения. Понят- но, что если отображение а задано на некотором подмножестве Q пространства Кп, то можно рассматривать его и на всем Rn, счи- тая, что а(х) = 0 при х ф. Q. Отображение а называется полу- непрерывным сверху в точке х, если для любого 8 > О найдется такое 6 > 0, что а (х') cz а (х) + 38 е для всех х' <= (х). Здесь, как обычно, 38 ^(х)— шар радиуса 6 с центром в точке х, 38ъ = = 38Считаем, что 04- 38г = 0. Говорят, что а полунепре- рывно сверху на множестве Q, если оно полунепрерывно сверху в каждой точке х е Q. Отображение а называется замкнутым в точке х, если соотношения Xk-+x, уъ.-+У, yh^a(x^ У к влекут включение у^а(х). Если а замкнуто в каждой точке xeQ, то говорят, что оно замкнуто на множестве Q. Отображение а назы- вается ограниченным на Q, если образ а(£) каждого ограниченно- го подмножества £ множества Q ограничен. Пусть отображение а ограничено в некоторой окрестности точ- ки х. Тогда следующие утверждения эквивалентны'. (I) а замкнуто в точке х; (II) а полунепрерывно сверху в точке х. Так как в этой книге рассматриваются лишь ограниченные многозначные отображения, то мы не различаем полунепрерыв- ность сверху и замкнутость. Если отображение а полунепрерывно сверху на множестве Q и / — непрерывная функция, то функция q(x) = max{/(y) | у е ^а(х)} полунепрерывна сверху. Предположим, что образы а(х) при всех х ge Q выпуклы и компактны. Тогда полунепрерывность
400 ПРИЛОЖЕНИЕ III сверху отображения а в точке х эквивалентна полунепрерывно- сти сверху в этой точке каждой из функций qt (£ е Rm), где qt (х) = max {I, у) Ух е Q. (П.П.1) yGa(x) В совокупности непустых компактных подмножеств простран- ства IRn вводится метрика Хаусдорфа рн, определяемая равен- ством Рн (§1, = тах fmax min Их — у II» тах min Их — у 111- Отметим одно свойство этой метрики: если последовательность компактов такова, что и g = П то k по метрике рн. Отображение а, определенное на множестве Q и имеющее ком- пактные образы, называется непрерывным в точке zgQ, если для любого е > 0 найдется такое б > 0, что для х' е (х) вы- полняется неравенство рн(а(х), а(х')) < в. Пусть отображение а определено на компактном множестве Q, ограничено, имеет не- пустые выпуклые компактные образы и полунепрерывно сверху. Тогда для любых б, ц >• 0 найдется непрерывное отображение Ь, определенное на Q, также имеющее непустые выпуклые компакт- ные образы и обладающее тем свойством, что а(х) cz b(x) cz а(х + #в) + Если ц = б, _то последнее включение равносильно тому, что gr a cz gr b cz F6(gr а), где V«(gra) = {z = [х, у] | p(z, gra) <6} — замкнутая б — окрестность множества gr а. Приведем теорему Какутани о существовании неподвижной точки у многозначных отображений. Теорема Какутани. Пусть отображение а определено на компактном выпуклом множестве Q, принимает значения в со- вокупности выпуклых непустых подмножеств этого множества и полунепрерывно там сверху. Тогда существует точка х е Q, об- ладающая тем свойством, что х^а(х). (Такая точка называется неподвижной точкой отображения а на Q.) Все изложенные выше результаты можно найти, например в [10, 43, 92]. ПРИЛОЖЕНИЕ III КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ В БАНАХОВЫХ К-ПРОСТРАНСТВАХ 1. Данная книга посвящена методам негладкого анализа в ко- нечномерных пространствах. Многие из указанных методов могут использоваться в существенно более общей ситуации. Это отно- сится, в частности, к субдифференциалу Кларка (см., например, [186]) и квазидифференциальному исчислению. В настоящем при- ложении показывается, что методы квазидифференциального
БАНАХОВЫ ^-ПРОСТРАНСТВА 401 исчисления могут быть применены для отображений, определенных в банаховых пространствах и принимающих значения в банахо- вых /^-пространствах. Напомним, что К-пространством (или про- странством Канторовича) называется векторное упорядоченное про- странство, в котором любое ограниченное сверху множество име- ет точную верхнюю границу (супремум). Если ЛГ-пространство является одновременно банаховым пространством, причем норма в нем монотонна: неравенство |лг| |у| влечет ||х|| ||у||, то оно называется банаховым К-пространством. Ниже предполагается, что читатель знаком с основными фактами теории ^-пространств и ба- наховых ^-пространств. Все необходимые для дальнейшего све- дения об этих пространствах можно найти, например, в книге [43]. Условимся о следующих обозначениях. Пусть Q — подмножество /^-пространства У. Запись у = шах х означает, что у является xeQ наибольшим элементом множества Q. Подобным же образом запись у = min х означает, что у — наименьший элемент мно- хеп жества Q. Квазидифференциальное исчисление в интересующей нас си- туации опирается на свойства производной по направлениям ото- бражений, действующих в банаховых пространствах и на свойства так называемого пространства опорных множеств. К изложению этих свойств мы и переходим. 2. Пусть X — векторное пространство, У — /^-пространство. Оператор Р: Х->У называется сублинейным, если он субаддити- вен (Р(х + у) ^Р(х)+Р(у)) и положительно однороден первой степени (Р (Кх) = КР {х) VX>0). Линейный оператор A: X-+Y называется опорным к сублинейному оператору Р, если А (х) <Р (х) УхеХ. Множество дР всех опорных к Р операторов называется субдифференциалом Р. Из известной теоремы Хана — Банаха — Канторовича [1, 43, 83] следует, что для любого субли- нейного оператора Р субдифференциал дР непуст и Р(х) = тах{А(я) [ А е£Р). Справедливы следующие утверждения (см. [1, 83]): f(Pi + P2) = ^i + ^ (П.Ш.1) д(1Р) = \дР vx>o, (П.Ш.2) f(PiV^2) = o и (^ + (/у-а)£Р2). (П.Ш.З) 0-<a^ ly Поясним последнюю формулу. Оператор Pi V ?2 определяется ра- венством (Pi УР2)(х) = sup{Pi(x), Р2(х)}. Понятно, что этот оператор сублинеен. Символом IY обозначается тождественный оператор, действующий в пространстве У; если U — множество операторов А: Х->-У, a — оператор, действующий в У, то aU = {aA | А <= U}. Оператор Q: Х->У называется с упер линейным, если Р — = —Q — сублинейный оператор. Супердифференциал dQ суперли- нейного оператора Q состоит из таких линейных операторов
402 ПРИЛОЖЕНИЕ III A: X-+.Y, что А (я) Q(x) для всех х е X. Справедливо равенство Q(x) = min{A (х) | А е QQ}. В дальнейшем считаем, что X — банахово пространство, Y — банахово /^-пространство. Совокупность линейных непрерывных операторов А: Х->У обозначим через 2>(Х, У), сублинейных не- прерывных операторов Р: X-+Y через ^(Х, У), суперлинейных непрерывных операторов Р*: X -► У — через (X, У). Если Ре^(Х, У), то dPcz^X, У). Множество Uc^3?(X, У) называется опорным, если найдется такой оператор Ре^(Х, У), что U — дР. Справедливо следующее утверждение (см. [50, 51]): множество С7с^(Х, У) опорно в том и только том случае, когда оно 1) слабо ограничено, т. е. для лю- бого х е X множество {А (х) | А е U} ограничено в У; 2) опера- тор но выпукло’, если А, В ^U, aeS’fy, У), 0 а /у, то аА + + (Zy — а)5е U; 3) ограничено в пространстве 3?(Х, У) и, кроме того, 4) удовлетворяет некоторому топологическому условию, на- зываемому слабой (о)-замкнутостью. Совокупность опорных подмножеств пространства 3? (X, У) обозначим через М(Х, У). Заметим, что если U ^М(Х, У), то каж- дый оператор Xe^fX, У), не принадлежащий U, может быть отделен от U в следующем смысле: найдется такой элемент х е X, что неравенство А (х) sup В (х) не имеет места (подробнее см. в^и в [83]). Отсюда легко следует, что отображение <р: Р^дР, кото- рое, как и в случае У = R, назовем двойственностью Минковского, осуществляет взаимно однозначное соответствие между ^(Х, У) и М(Х, У). Введем в множествах ^(Х, У) и М(Х, У) естествен- ным образом операции сложения и умножения на неотрицатель- ное число. Эти операции обладают естественными свойствами и, кроме того, согласованы между собой, поэтому ^(Х, У) и М(Х, У) можно рассматривать как «полулинейные пространства» (см. [53]). Из формул (П.Ш.1) и (П.Ш.2) следует, что двойственность Мин- ковского является алгебраическим изоморфизмом между этими пространствами. Так как в ^(Х, У) возможно сокращение (т. е. равенство Pi + Рз = Р2 + Рз (Pi е ^(Х, У)) влечет Р\ = Р2), то и в М(Х, У) возможно сокращение: если UМ (X, У) Vist5l{:3 и Ui + U-з = U2-\- Уз, то U\ = U2. Упорядочим &(Х, У), положив если Рх (х> Р2 (х) Ух е X; в М(Х, У) введем отноше- ние порядка по включению. Понятно, что двойственность Минков- ского ср является изоморфизмом упорядоченных множеств ^(Х, У) и М(Х, У). Наличие сокращения в полулинейном пространстве М(Х, У) позволяет вложить его в линейное пространство М(Х, У). Чтобы построить это пространство, рассмотрим прямое произведение М(Х, У) X М(Х, У) и определим в нем алгебраические операции следующим образом: [U\, VJ + [U2, V2] = [Ui + U2, Vi + V2], [c£7, eV], если c^O, [c7, cU], если c<0. c [(7, V] =
Банаховы к-пространства 403 Введем в этом прямом произведении отношение эквивалентности «, положив [С7, У] « [Z7i, VJ <=> U-Vi = С/i - V. Через М(Х. Y) обозначим фактор-пространство пространства ЛГ(Х, У)ХМ(Х, У) по отношению эквивалентности «. Назовем М(Х, У) пространством опорных множеств. Элемент пространства Jf(X, У), содержащий пару [С7, V], обозначим символом [С7, V]. Введем в М(Х, Y) отношение порядка с помощью конуса положи- тельных элементов Х = {[£7, 7]еЖ У)\U - V}. Наряду с М(Х, У) рассмотрим пространство Л(Х, У), состоящее из отображений I: X -> У, представимых в виде суммы сублиней- ного непрерывного и суперлинейного непрерывного операторов. Упорядочим £(Х, У) с помощью конуса {I s L (X, У) | Z(ar)^O VzgA}. Определим отображение ф: М(Х, Y)-^S(X, У), положив Ф([77, V])=Z, где I (х) = шах А (х) 4- min В (х). (П.Ш.4) А<=и Bev Так как множества U, V спорны, то при любом х е X множества {Л (х) | А & U}, {В (х) | В е £7} имеют наибольший и наименьший элемент, поэтому использование символов max и min в (П.Ш.4) оправдано. Определение отображения ф корректно, так как ото- бражение Z, определенное формулой (П.Ш.4), совпадает для всех эквивалентных пар [С7, У]. Ясно, что ф является алгебраическим и порядковым изоморфизмом. Пространство £(Х, У) является ре- шеткой: Z1? Z2 е Л(Х, У), Zi = Р\ @1, Z2 = Р2 4“ (?2, то элементы 11 V \ =[(^ - <?2) V (Р2 - <?,)] + (<\ + Q2), = (Р! + Р2) + [(С2 - Р1) Л (<?! - Р2)1 являются соответственно супремом и инфимумом множества {Zi, 12}. Из сказанного следует, что пространство опорных множеств Л/(Х, У) является решеткой. 3. Пусть X, У — банаховы пространства, Q — открытое мно- жество в X. Отображение Н: Х-> У называется дифференцируемым по направлениям в точке х е Q, если для каждого g е Q сущест- вует предел lim — [Н (х 4- ag) — Н (х)]. Этот предел называется а|о а производной отображения Н в точке х по направлению g и обозна- чается символом Н'(х, g) или Нх (g). Говорят, что дифференци- руемое по направлениям в точке х отображение Н равномерно дифференцируемо по направлениям в этой точке, если для любых g е X и е > 0 найдутся такие числа 6 > 0 и Оо > 0, что для всех у е (х) и а е (0, Оо] выполняется неравенство IIН (х + ag') — Н (х) — аН’х (g') || < ae. В случае, когда X = Rn, У = R, это определение равносиль- но определению равномерной дифференцируемости, данному в § 1.3.
404 ПРИЛОЖЕНИЕ III Теорема П.Ш.1. Пусть отображение Н дифференцируемо по направлениям в точке х и производная Н х (g) непрерывна как функция g. Тогда следующие утверждения эквивалентны (а) отображение Н равномерно дифференцируемо, (б) производная Нх (g) совпадает с пределом lim -L[H(x + ag') — Н (г)]. (П.Ш.5) a|o,g'->g « Доказательство этой теоремы аналогично доказательству теоре- мы 1.3.2. Предел (П.Ш.5) называется производной Адамара отображе- ния Н в точке х. Нетрудно проверить, что если отображе- ние Н локально липшицево (т. е. для каждой точки zg Q най- дется такая ее окрестность, в которой Н удовлетворяет условию Липшица) и дифференцируемо по направлениям, то оно диффе- ренцируемо по Адамару. Справедлива следующая теорема о про- изводной сложной функции. Теорема П.111.2. Пусть X, Y, Z — банаховы пространства, открытые множества Qi и Q2 содержатся в X и Y соответственно, отображение Н: Qi -> Q2 дифференцируемо по направлениям в точ- ке х е Qi, отображение G: Q2-+Z дифференцируемо по Адамару в точке Н(х) и ^н(х) Тогда отображение GoH диффе- ренцируемо по направлениям в точке х и (£)=<?н(х) «(£)). Если, кроме того, отображение Н дифференцируемо по Адамару и Нх непрерывна, то и отображение GoH дифференцируемо по Адамару. Доказательство аналогично доказательству теоремы 1.3.3. 4. Пусть X — банахово пространство, Q — открытое множество в X, Y — банахово ^-пространство. Отображение Н: Q Y назы- вается квазидифференцируемым в точке х е Q, если оно диффе- ренцируемо по направлениям в этой точке и его производная по направлениям Нх входит в пространство ЦХ, У), определенное в п. 2; иными словами, отображение Нх представимо в виде сум- мы непрерывных сублинейного и суперлинейного операторов. Эле- мент пространства М(Х, У), соответствующий этой производной в силу изоморфизма Др, определенного в п. 2, называется квази- дифференциалом отображения Н в точке х и обозначается симво- лом 2)Н(х). Таким образом, квазидифференциал представляет со- бой класс эквивалентных пар [С7, 7] опорных множеств, облада- ющих тем свойством, что Нх (g) = max A (gf+ min В (g). [AeUj Каждую пару [С7, У] из этого класса будем также называть ква- зидифференциалом (это нигде не приведет к недоразумению). Понятно, что сумма квазидифференцируемых отображений Hi и Н2 также будет квазидифференцируема. При этом 0(Hi + Н2)Х X (х) = ФН1(х) + 0Н2(х). Отображение G(x) = f(x)H(x), где Н — квазидифференцируемое отображение, / — квазидифференци-
БАНАХОВЫ К-ПРОСТРАНСТВА 405 руемая функция, также квазидифференцируема. Нетрудно приве- сти формулу, выражающую квазидифференциал S)G(x) через ФН(х) и мы, однако, на этом не останавливаемся. Рассмотрим вопрос о квазидифференцируемости композиции. Из теоремы П.Ш.2 следует, что в случае дифференцируемости по Адамару этот вопрос сводится к следующему: когда композиция двух операторов, каждый из которых представим в виде разности двух сублинейных, также может быть представлен в таком виде. Чтобы ответить на этот вопрос, дадим следующее определение. Пусть У, Z — банаховы Л’-пространства. Оператор Р е е^(У, Z) назовем порядково ограниченным, если найдутся ре- гулярные операторы Ль Л2е5?(У, Z), обладающие тем свойством, что л^уХ-рс-уХР^ХД^у) vy>o. (П.ш.б) Напомним, что линейный оператор Л: Y-+Z называется регуляр- ным, если он представим в виде разности двух положительных. Поскольку — Р(—у) = min А (у), то соотношение (П.Ш.6) мож- АедР но переписать в виде Л, (у) < min А (у) < max А (у) < Л9 (у) Vу > 0. 1 АедР АедР А Отсюда следует, что оператор Р порядково ограничен в том и толь- ко в том случае, когда его субдифференциал состоит из регулярных операторов и представляет собой ограниченное множество в прост- ранстве регулярных операторов. Лемма П.Ш.1. Пусть X—банахово пространство, Y и Z — банаховы К-пространства-, S, Т ^Ф(Х, У); Р, Q^SP(Y, Z), при- чем операторы Р и Q порядково ограничены. Тогда оператор R = = (Р — Q)(S — Т) представим в виде разности двух сублинейных операторов. Доказательство. Рассмотрим декартово произведение У X Y, упорядоченное естественным образом, сублинейный опера- тор (5 X Г): XУ X Y и линейный оператор л: У X Y У, опре- деленные формулами (SX^H*) = [$(*), П*)]; a(yit у2) =У1 — у2. Справедливо равенство R = Pn(S X Т) —Qji(S'XT). Пусть регу- лярные операторы Ль Л2е5’(У, Z) таковы, что Vy>o, Л,у С-<?(-уХ<?(уХЛ2(у) Vy>0. Так как Р и Q сублинейны, то Р(у2) ^P(yi) + Р(у2 — У1), <?(Уг) > ><2(У1) +<?(У2 —У1). Поэтому для у\, у2>0 имеем Ря(— [уь у2]) < [Л., — л2](—[У1, у2]), <?л(—О, 0s]) С [Ai, — Л2] (—[yi, у2]). Эти соотношения показывают, что сублинейные операторы Р = = Рл — [Ai, — Л2] и Q = Qn — [Ai, Л2] изотонны. Для заверше- ния доказательства осталось заметить, что R = P(S%T)— -<№ХТ).
406 ПРИЛОЖЕНИЕ III Теорема П.Ш.З. Пусть X — банахово пространство, Y и Z — банаховы К-пространства, Qj — открытое множество в X, Q2—от- крытое множество в У, отображение Н: Q2 квазидифференци* руемо в точке х е Qi, отображение G: Q2-+Z дифференцируемо по Адамару и в то же время квазидифференцируемо в точке у = = Н(х). Предположим, что существует такой квазидифференциал 3)G(y) = [dG(y), dG(y)], что множества dG(y), dG(y) лежат в пространстве регулярных операторов и ограничены там. Тогда ото- бражение F — GoH квазидифференцируемо в точке х. Доказательство вытекает непосредственно из теоре- мы П.Ш.2 и леммы П.Ш.1. _ Пусть заданы квазидифференциалы ФН(х) = [дН(х), дН(х)] и S)G(y) = [dG(y), dG(y)], причем dG(y), dG(y) ограничены в пространстве регулярных операторов. Представляет интерес вычи- слить квазидифференциал отображения F. Из теоремы П.Ш.З вы- текает, что где S, Т^0>(Х, У), Р, Q(=P(Y, Z) и операторы Р, Q порядково ограничены. При этом dP = dG(y), dQ==-~dG(y), dS = дН(х), дТ == —дН(х). Воспользуемся приемом, примененным в доказательстве лем- мы П.Ш.1. Пусть Ai и А2 — соответственно общая нижняя и об- щая верхняя граница множеств дР и dG. Положим А = [Ai, -Л2], Р = Рл - A, Q = Qn — А, = Qi = Q(SXT). Здесь, как и в лемме П.Ш.1, л(у\, у2) = У1 — У2» (S X Т) (х) = = (5(я), Т(х)). Из леммы П.1П.1 следует, что S)F(x) = [dF(x), dF(a:)], где dF(x) = дР\, dF(x) =—dQi. Найдем dPi = = d(P(SXT)). Используя теорему Кутателадзе (см., например, [83J), имеем дР = U d(C(SXT)). 15= дР Из леммы Левина (см. [83]) следует, что дР =_д(Рл — А) = {С | С = Сл — А: С е=_дР}. Поэтому -Р1 = с^р-[(С-Л1)5 + (Л2“С)Г1 или, в других обозначениях, ^(ж)= J дРс, (П.Ш.7) cedG(y)“
О СИСТЕМАХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 407 где Рс (X) = (С - АА / max А (х)\ + (Л2 - С) / max В (,)\. / I АбОН(х) ) \ В(=(-дН(х)) ) (П.1П.8) Подобным же образом dF (х) = — U д_Ра (П.Ш.9) Се(-дС(у)) Итак, справедливо следующее утверждение. Предложение П.Ш.1. В_условиях теоремы П.Ш.З квази- дифференциал S)F(x) = [dF(x), dF(#)] может быть вычислен по формулам (П.Ш.7) — (П.Ш.9), где Ai— общая нижняя граница множеств dG(y) и —dG(y), Л2 — общая верхняя граница этих множеств. ПРИЛОЖЕНИЕ IV О СИСТЕМАХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ С КВАЗИ ДИФФЕРЕНЦИРУЕМЫМИ ПРАВЫМИ ЧАСТЯМИ Рассмотрим систему обыкновенных дифференциальных урав- нений * = /(*, 0 (П.1У.1) с начальным условием x(tQ) =х0. (П.1У.2) Здесь х = *(«)), / = (/(О. ../(n))? t е |70, Т], г > 0 фиксировано. Относительно вектор-функции / будем предполагать следующее: 1) f определена и непрерывна в некоторой области D cz 2) Каждая компонента вектор-функции / локально липшицева по х, т. е. существует постоянная L > 0 такая, что для любых (xi, t) и (х2, t) из D выполнено неравенство |Л(*1> 9-А(ж2’ v/el:n- Заметим, что при сделанных предположениях для системы (П.1У.1) — (П.1У.2) выполнены классические теоремы существова- ния, единственности и непрерывности зависимости решений от начальных данных и параметров. 3) Каждую компоненту вектор-функции / будем считать ква- зидифференцируемой по х при любом [£0, Г], т. е. для любого g е Rn dfi(*» 0 = 1;m A(* + «g, 0— fj(x, t) = dg а! о а = max (р, g) + min (^, g), (П.1У.З) ^n> — выпуклые компакты (см. гл. III).
408 ПРИЛОЖЕНИЕ IV Напомним, что для квазидифференцируемой функции справед- ливо разложение д/. (х, t) fi (х + ag, t) = /. (х, t) + а + Oj (a, t, g), (П.1У.4) 1 а а j о Введем несколько определений. Функцию /г(^, t) назовем равномерно квазидифференцируе- мой в точке х е Rn, если для любого ge Rn найдутся числа 6 > 0 и а0 > 0, что при ge^(g) = {g| llg —gll < 6}, а e (0, а0) выполнено неравенство |ог-(а, i, g) | < аб, ог(а, J, g) —из разложе- ния (H.IV.4). Если fi (ж, t) квазидифференцируема в точке х при любом t ее [*0, и удовлетворяет условию Липшица, то она рав- номерно квазидифференцируема. Если для равномерно квазидифференцируемой функции fi(x, t) в разложении (П.1У.4) оЛа, £, g)/a—>0 равномерно по а|о Je [io, Г], то такую функцию будем называть абсолютно равно- мерно квазидифференцируемой. Относительно правых частей системы (П.1У.1) предположим далее, что 4) Каждая компонента вектор-функции / абсолютно равномер- но квазидифференцируема (равномерная квазидифференцируе- мость очевидна), 5) Квазидифференциалы функций ft(x, t), iel: и, ограничены в совокупности, т. е. /?. = sup max ( max || v ||, max || w < + оо, (П.1У.5) *elVTl wed/iCx.o j 6) Считаем, что для любого направления g g Rn функция df* (х, t) F^(t,g) = г ’ — измерима в смысле Лебега по i е [£о, Т]. dg Рассмотрим вопрос о дифференциальной зависимости решений системы (П.ГУ.1) от начальных данных. Зафиксируем некоторое xQ е Rn такое, что x(to) — xo. Выберем направление р е и бу- дем изменять начальное значение хо вдоль этого направления, #оа = х0 +ар. Пусть х = x(t, t0, xo)t ха = x(t, to, xoa). Введем обо- 1 значение va = — (ха—х}, тогда ха = х + ava. Рассмотрим семей- ство систем дифференциальных уравнений '’а0 = 4° С- va)- 1 е 1 : п’ (П.1У.6) зависящее от параметра a > 0, где Отметим те свойства функции (t, va), i e 1: n, которые пона- добятся в дальнейшем.
О СИСТЕМАХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 409 I) Функции F^ (t, va), i e 1: n, непрерывны по совокупности переменных в некоторой области D± cz Rn+1, II) Функции F$ va), i el: n, удовлетворяют условию Лип- шица no va. Это следует из свойства 2). Тогда для каждого a > 0 существует единственное решение системы уравнений (П.1У.6) с начальным условием va(i0) = р, при- чем va = va(i, i0, a) — непрерывная функция своих аргументов, Введем дифференциальное уравнение Д(О = F^(t, h), i<=i:n, (П.1У.7) dfi (x, t) dh(t) где Fw (t,h) = .Правая часть (П.1У.6) обладает следую- щими свойствами: а) Функции /г), i е 1: тг, измеримы по t при каждом фиксированном h в силу предположения 6). б) Функции Г<г‘)(г, h), i е 1: п, непрерывна по h при любом фиксированном t. Это следует из представления (П.1У.З) и не- прерывности операций взятия максимума и минимума от линей- ных форм по компактным множествам dfi(x, t) и dfi(x, t). в) На любом компакте К cz Dx cz Rn+1 функции F^{t, h) ог- раничены. Действительно, л)1=| * max (у, h) + min (w, h) I j veo/^x.t) wea/iCx.t) | < max || v |11| h Ц + max Ц w |Ц| h J < 27?. || h || < 27? max Ц h || в силу предположения 5). Здесь7? = max 7?it Kx = {ft| (i, h) e K}. ier.n г) Функции F^(t, h), i e 1: n, удовлетворяют условию Лип- шица по Л, т. е. для любых (£, hi), (i, h2) ePi выполнено условие dfi(x,t) dfi(x,t) dh^ ~ dh2 max (у, Лг)| + I min (w, hA — vedfitx.t) | |we9/i(x.t) 17 - min (w, h2) I = I max (₽, h2 + (Лх - Л2)) - we3/j(x,t) j |v^d/i(x»O I +1 - t (w’ - h+(ft2 - hi)) + + max (ш,-Л2)|< max |(p,fex-MI + wed/j(x,t) I + max K^, -Л2||. wea/i(x,t) <1 max (v,hA —
410 ПРИЛОЖЕНИЕ IV Из свойств а)—г) функций F^(t, ft), вытекает сущест- вование и единственность решения системы (П.1У.7) с начальным условием h(t0) = hQ = р, причем функции h{t) = to, ho) не- прерывны по своим аргументам. Лемма ILIV.1. Пусть h= Д(п))—решение систе- мы уравнений (ILIV.7) с начальным условием h(to) = ho = р. Тог- да равномерно по t р0, Г] справедливо предельное соотно- шение limvo(t) = h(t), a >lo где va(£) есть решение системы (II.IV.6) с начальным условием va(to) = Р при любом фиксированном а > 0. Доказательство. Запишем уравнения (ILIV.6) и (II.IV.7) в интегральной форме: t = J“a" Ui и + aV“’ T) _ fi ('x> T)) dX + P = (0 С Г dfj (x, T) 0j (a, t, vB) J I <%(r) a ,f 5/j (x, r) % Оценим разность |v£> (0-»(i>(0|< (x, T) (t) dfi (X' T) L , f I °i T> V“) dh (r) rT + J I a «о По свойству г) функции (J, h) = справедливо нера- dh венство dfi (x, %) dfi (xf x) dva(0 ~ дД(т) t dr < J 2R || va (t) — h (T) || dx. *o Зафиксируем e< >0. В силу предположения 5) функции /i(x, t), ie 1: n, являются абсолютно равномерно квазидифферен- цируемыми в точке х. По выбранному ег- >> 0 найдутся 6» = = 6» (8г) >0 и а® = а®(8|)>0 такие, что | | < 8i Для всех a е= (О, a9), х е [*Q, Т], g е #6.(va), iel: и. Тогда для
О СИСТЕМАХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 411 ае (0, а?) справедливо неравенство t | v«) - (0 I С j 27?Ц va (т) - h (x) || dx + e{ | T - *01. *0 Положив 8= max a0 = min (a?), 6= min получим для iei:n 1 iei:nv v iei:n г всех те [i0, T], g e ^e(va), a e (0, a0) t I v“> (t) - fe«> (t)|< J 2R || Va (t) - h (t) || dx + в (T - t0). <o Тогда II va (0 - h (0 || < ~]/nmax^ | v<*> (0 — A(i) (0 | < t < 2R ДД j || va (t) - h (T) || dx + Vn e (Г - tQ). *0 Используя неравенство Гронуолла, имеем оценку Ц va (0 - h (01| = е 1/й (Т — <о) e2R/n(r-*«\ из которой следует утверждение леммы. Теорема П.1У.1. Решение системы дифференциальных урав- нений (П.1У.1) x(t, tQ, xq) в любой точке Xq является дифференци- руемой по любому направлению р^^п функцией, причем dx(t,t,x\ —1---2—S". == h (t) есть решение системы дифференциальных 0р уравнений ^(i) _. {Я'*}, — щах (у, h (0) + min (w> h (0) (П.1У.8) dh (0 we0/j(x,<) с начальным условием h№ (£0) = = p^\ iet-n, Доказательство. Зафиксируем p e Rn. Пусть x = = x(t, t0, xq), xa = x(t, tQ, xqo.) —решения системы (П.1У.1) такие, 1 что (х, 0 е D и (ха, 0 е D. Положим va =—(za — х), тогда ха = = х + ava. Производная по направлению р любой компоненты ре- шения системы дифференциальных уравнений (П.1У.1) имеет вид <0’ = lim — (х(,) It, t х + ар) — z(i) (t, t , x )) = dp ajo a v v ° ° ’ ' ° 0>' = Hm v (0. al о Используя интегральное представление решения системы (П.ГУ.8),
412 ПРИЛОЖЕНИЕ IV имеем fe(i) (0 = дх^ (t, tQ, t х0) = р + Um -L f (fi (xa, т) - fi (x, t)) dx = oc 10 J *0 t - - p + i‘“ ± J [“ jл- (IUV-9> *0 Переходя в (П.1У.9) к пределу и учитывая лемму П.1У.1, получим утверждение теоремы. Замечание П.1У.1. Если существует непрерывная частная производная —у’ то теорема П.1У.1 превращается в классиче- скую теорему о дифференцируемости решения системы (П.ГУ.1) по начальным данным. Система уравнений (П.1У.8) превращается в систему однородных линейных уравнений h = ОЦх, t) nZ Л (П.1У.10) с начальным условием h(t0) = р. Замечание П.1У.2. Отметим, что хотя исходные функции fi(x1 t) предполагались лишь локально липшицевыми по х, функ- ции Л), будут глобально липшицевыми по h с константой L{ = 2Ri. Зафиксируем точку я0 и будем рассматривать решения си- стемы (П.1У.1), проходящие через точки (t0, яо) и (t®, х0), = = + ag, g= + l. Обозначим их соответственно х = x(t, л?0) и xa — x^t4 t®, Рассмотрим lim-£(;$> (t)-x(i) (0) = aj.o a ' ' (t \ l(/i (xa> T) — h (x’ T)) dx — J Л(ха> x)dx +Z2- J J f % *0 / Вычислим t0+ag 1^4- f fi(X^X)dX = ОС 1 0 0“ J *0 = 4" Ia<7/i (X’ Zo) + ®i (“>] = (X’ %)• Ot | О Существование предела Ц доказывается аналогично лемме П.1У.1. Тогда справедлива Теорема П.1У.2. Решение x(t, xQ) системы уравнений (П.1У.1) в каждой точке to дифференцируемо по направлениям
О СИСТЕМАХ ДИФФЕРЕНЦИАЛЬНЫХ УРАВНЕНИЙ 413 ^(1) (*’ г0' жо) q = ±1, причем ------------- удовлетворяет системе уравнений (II.IV.8) с начальным условием = - gfi (V го). (n.IV.ll) Рассмотрим теперь систему дифференциальных уравнений х = f(x, a, t) (II.IV.12) с начальным условием (TI.IV.2). Здесь а е — вектор парамет- ров. Относительно вектор-функции /(ж, л, t) считаем, что она оп- ределена и непрерывна в некоторой области D2 cz {Rn+Tn+1. Каж- дая компонента вектор-функции f локально липшицева по х •== = [х, а]. Каждую компоненту вектор-функции f считаем квази- дифференцируемой в любой момент времени t е [*о, Г] по любому направлению g= [A, g]eRn+m, т. е. 5/i (я, a, t) 1 -----=----ss lim — (/{(х + аД, а + од, t) — /{(х, а, «)) = 9g аю а 1 = ««*1’ Д) + (%’ «')} + “in {(“’Г Д) + kWV *)}’ где g = [A, gj, v = [рь i>2], и> = |>i, 1^2]; A, i>r ^eflWg, i?2, e Rm, дЦ (ж, a, 0) (x, a, t) cz Rn — выпуклые компакты. Сохраним также для правой части системы (IT.IV.12) предпо- ложения 4) —6). Справедлива Теорема II.IV.3. Решение системы дифференциальных урав- нений (II.IV.12), (II.IV.2) х(л, t) дифференцируемо в любой точке а е Rm по любому направлению g^№\ причем ————= h (t) Og удовлетворяет системе дифференциальных уравнений fc(i) /А dh (х *)’ “> = се ““ а {(°v А (<)) + («2. £)} + min Л(0) +(”2, g)} (II.IV.13) с начальным условием =0, i е 1 .* п. Теорема доказывается аналогично теореме TI.IV.1. Замечание II.IV.3. Если существуют непрерывные част- ные производные и то теорема II.IV.3 превращается в дх да классическую теорему о дифференцируемости решения системы (II.IV.12) по параметру а. Уравнение (II.IV.13) превращается в линейное неоднородное уравнение вида ч.)=о.
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ Глава I К § 1. Локальная аппроксимация множеств с помощью кону- сов широко распространена (см., например, [7, 33, 77, 106, 108, 115, 136]. Понятие равномерной аппроксимации первого порядка, введен- ное в п. 3 § 1, прояснило значение конуса Булигана в тех случа- ях. когда множество допускает эту аппроксимацию. К § 2. Производные Дини (производные числа Дини) хорошо известны в классической теории функций вещественной перемен- ной (см. [86]). Производная Адамара использовалась различны- ми авторами (см., например, [174, 176, 207]). Связь производной Адамара с конусом Булигана для надгра- фика описана в работах [108, 109]. К § 3. Теорема о среднем, использующая производную по на- правлениям, содержится в [131]. При ее доказательстве использо- вался прием, изложенный в [11]. Этот же прием применен и для доказательства теоремы 3.1. Липшицевость квазидифференцируемой функции с ограничен- ной производной по направлениям отмечена в [20]. Теорема 3.4 содержится в монографии Б. Н. Пшеничного [78]. К § 4. Условия регулярности изучались Л. Н. Поляковой [74, 75, 169]. К § 5. Отображение 7 (ж, у, •) описано в [23, 196], отображе- ние Г(я, у, •) —в работе [108], а отображение К(х, у, •) — в ра- боте [5]. Последнее отображение существенно использовано в [9]. Результаты п. 2 представляют собой дополненное и исправ- ленное изложение результатов статьи [203]. Понятие аппроксима- ции первого порядка относительно множества с17(хг, у, g) введено в [196] (см. также [23]). Там же установлено предложение 5.6. Теорема 5.2 сформулирована в [203]. Аппроксимация первого порядка изучалась И. М. Лупиковым [57], Б. Н. Пшеничным и В. С. Кирилюком [80] и А. М. Кери- мовым [199] (см. также [126, 209]). К § 6. Различные аппроксимации маргинальной функции изу- чались многими авторами (см., например, [5, 9, 23, 139, 140, 175, 176, 196]). Настоящий параграф написан на основе статей [85, 203]. В теореме 6.1 обобщаются результаты [23], а в теореме 6.3 — результаты [9]. Пример 6.1 взят из статьи [132].
БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ 415 Глава II К § 1. Производные и субдифференциал Кларка введены в [117]. Их свойства подробно изложены в монографии Ф. Клар- ка [120] (см. также [174]). Предельные точки последовательно- сти градиентов, участвующие в описании субдифференциала Клар- ка, рассматривались ранее Н. 3. Шором [97, 98]. Связь между по- лунепрерывностью сверху производной по направлению как функ ции точки и ее сублинейностью как функции направления уста- новлена с помощью теоремы о среднем в [178] (см. также [131, 145]). На то обстоятельство, что этот факт легко вытекает из свойств производной Кларка, обратил внимание авторов Ж.-П. Обен. К § 2. Касательный конус Кларка изучается в [120, 174]. Связь этого конуса с конусом Булигана обсуждается в [108, 109]. Наше доказательство следует [108, 200]. К § 3. Изложение следует работе [178]. К § 4. Обобщенный якобиан введен в рассмотрение Ф. Клар- ком в [118] (см. также [120]). Понятие веера принадлежит А. Д. Иоффе (см. [148]). Глава III К § 1. Пространство выпуклых множеств ввел в рассмотре- ние Родстрем [172]. Абстрактная схема построения упорядоченных векторных пространств множеств изложена в [53]. Пространство функций, представимых в виде разности выпуклых, изучалась многими ав- торами (см., например, обзор [146], а также [181]). Операцию ч- рассматривал Л. С. Понтрягин [76], а операция — введена в ра- боте [24]. К § 2. Квазидифференцируемые функции введены в [32, 34]. Их свойства подробно изучались в [27, 31, 35, 72, 74, 75, 130, 131, 161] (см. также библиографию в [124]). Ряд иллюстративных примеров применения формул квазидиф- ференциального исчисления приведен в [27, 131]. К § 3. Условия регулярности квазидифференцируемых мно- жеств рассматривались в [35, 73]. К § 4. Связь квазидифферепциала с субдифференциалом Пено (введенным в [106]) отмечена Ж-Б. Ириартом-Уррути [147]. Результаты п. 3 представляют собой дополненное и исправлен- ное изложение статьи [24] (см. также [131, гл. 13]). К § 5. Понятие верхней выпуклой аппроксимации введено Б. Н. Пшеничным (см. [77]). Наше изложение следует гл. I ра- боты [63]. Конструкция, изложенная в п. 2, принадлежит Е. Ги- неру (что отмечено в [147]). К § 6. Понятие 8-квазидифференциала было введено В. В. Го- роховиком [21, 22, Д41]. Там же изучены основные свойства 8- квазидифференциала. Доказательство теоремы Стоуна — Вейерштрасса в используе- мой нами форме см. в [52]. К § 7. См. [179]. Дальнейшие результаты по квазидифференцируемым функци- ям см. в '[25, 26, 37, 87, 88, 94, 122, 123, 125, 129, 137, 150, 153, 155, 156, 161, 162, 170, 188, 191—194].
416 БИБЛИОГРАФИЧЕСКИЙ КОММЕНТАРИЙ Глава IV Кодифференцируемые функции введены в [198, 206, 197]. Глава V Познакомиться с основными проблемами теории оптимизации можно по монографиям и учебникам [2, 4, 14, 17, 18, 27, 33, 36, 38, 39, 40, 42, 44, 49, 56, 60, 71, 78, 101]. Вопросы негладкой оптимизации обсуждаются, в частности, в [4, 27, 62, 66, 81, 91, 98, 120, 131, 174]. К § 1, 2. Условия экстремума для различных классов неглад- ких функций можно найти в [6, 7, 18, 19, 27, 33, 42, 45, 48, 58, 62, 78, 91, 95, 96, 117, 131, 146, 149, 154, 180, 181, 190, 207]. В гладком и выпуклом случае весьма эффективным оказыва- ется подход, основанный на использовании функций Лагранжа (см. [42]). Аналогичные результаты можно ожидать и в невыпук- лом случае. Однако, в данной монографии соответствующие во- просы не обсуждаются (см. [155]). К § 3. Теорема 3.1 установлена Л. Н. Поляковой [72], теоре- ма 3.3 сформулирована А. Шапиро [181]. Результаты § 4 и § 5 принадлежат В. К. Шомесовой [205]. К § 8. Написан на основе работы [29]. Дифференцируемость по направлениям функции фг(я) впервые изучалась в [208]. Фор- мула (8.16) совпадает с полученным там выражением для произ- водной по направлениям. Глава VI Теоремы о неявной и обратной функциях в негладком случае привлекают большое внимание математиков и в настоящее время активно изучаются (см., например, [108, 109, 118, 120, 187, 202]. В [187], в частности, установлено при некоторых предположениях, что если вектор-функция F(x, у) квазидифференцируема по сово- купности [я, у], то неявная функция у (я), определяемая равенст- вом F(xt у) = 0, является тоже квазидифференцируемой (по х). Теорема 2.1 установлена Н. Э. Торгашовой [204]. В § 5 используется схема доказательства, предложенная Ф. Кларком [120], а в § 6 — привлекаются идеи Обена и Экланда [108]. Вариационный принцип Экланда [135], вариант которого изложен в § 6, активно используется исследователями. Глава VII § 1 написан на основе статей [28, 127]; § 2 — на основе статьи [203]; § 3 написан С. Л. Печерским на основе статей [107, 164]. К Приложению I. Понятие субдифференциала в выпуклом слу- чае было введено Моро и Рокафелларом [158, 82]. Обобщения это- го понятия см. в [3, 46, 54, 65, 114, 157, 158, 166, 168, 173, 177, 184, 185, 189]. Вопросы выпуклого анализа обсуждаются в [89, 111, 116, 121, 133, 144, 183]. К Приложению II. Многозначные отображения изучались в [84, 110, 143, 165]. Приложение III содержит результаты статьи [130]. Приложение IV написано И. Р. Шаблинской. Негладкие задачи оптимального управления рассматривались в [12, 16, 18, 30, 47, 55, 59, 64, 70, 93, 102, 113, 119, 134, 160]. Библиографию по негладкому анализу см. в [142, 159]. При- ложения к задачам механики обсуждаются в [163].
СПИСОК ЛИТЕРАТУРЫ 1. Акилов Г. IL, Кутателадзе С. С. Упорядоченные век- торные пространства.— Новосибирск: Наука, сиб. отд-ние, 1978.— 368 с. 2. Б а т у х т и н В. Д., МайбородаЛ. А. Оптимизация раз- рывных функций.— М.: Наука, 1984.— 208 с. 3. Бедельбаев А. А. Обобщенное субдифференцирование не- гладких функционалов Ц В кн.: Процессы упр. и обраб. инф.— Алма-Ата.— 1982.— С. 23—30. 4. Б е й к о И. В., Б у б л и к Б. II., 3 и н ь к о П. Н. Методы и алгоритмы решения задач оптимизации.— Киев: Высшая шко- ла — 1983.— 511 с. 5. Береснев В. В., Пшеничный Б. Н. Дифференциаль- ные свойства функций минимума Ц Журн. вычисл. мате- матики и мат. физики.— 1974.— Т. 14. № 3.— С. 101—ИЗ. 6. Благодатских В. И. Принцип максимума для диффе- ренциальных включений Ц В кн.: Тр. матем. ин-та АН СССР.— М.: 1984.-Т. 166.—С. 23—43. 7. Болтянский В. Г. Метод шатров в теории экстремальных задач Ц Успехи матем. наук.— 1975.—Т. 30, № 3.—С. 3—55. 8. Бондарева О. Н. Некоторые применения методов линей- ного программирования к теории кооперативных игр Ц Про- блемы кибернетики.—М.: 1963,—Вып. 10.—С. 113—140. 9. Борисенко О. Ф., Минченко Л. И. О дифференцируе- мости по направлениям функций максимума Ц Ж. Вычисл. матем. и матем. физ.— 1983.— Т. 23, № 3,— С. 567—575. О. Борисович Ю. Г., Гельман Б. Д., М ы ш к и с А. Д., Обуховский В. В. Многозначные отображения Ц В кн.: Математический анализ, т. 19. Итоги науки и техники. ВИНИТИ АН СССР.— М.: ВИНИТИ—1981.—С. 127—231. 1. Бурбаки Н. Функции действительного переменного.—М.: Наука, 1965.— 429 с. 2. Б ы т к а Л. Н. Необходимые условия оптимальности для задачи управления с квазидифференцируемым функциона- лом.—Л.: 1981.—10 с. Деп. в ВИНИТИ, № 1987.—81. 3. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями.— М.: Наука.— 1977.— 624 с. 4. В а с и л ь е в Ф. П. Численные методы решения экстремаль- ных задач.— М.: Наука, 1980.— 520 с. 5. В о р о б ь е в Н. Н. Теория игр для экономистов-кибернети- ков.— М.: Наука.— 1985.— 272 с. 6. Виноградова Т. К., Демьянов В. Ф. Принцип ми- нимакса в задачах оптимального управления Ц Докл. АН СССР.— 1973.—Т. 213, № З.-С. 512—514.
418 СПИСОК ЛИТЕРАТУРЫ 17. ГабасовР., Кириллова Ф. М. Математическая теория оптимального управления Ц В кн.: Матем. анализ, т. 16. Ито- ги науки и техники. ВИЙИТИ АН СССР.— М.: ВИНИТИ.— 1979.— С. 55-97. 18. Г а б а с о в Р., Кириллова Ф. М. Конструктивные мето- тоды оптимизации. Ч. 2. Задачи управления.— Минск: Универ- ситет.— 1984.— 207 с. 19. Г о л ь ш т е й н Е. Г., Т р е т ь я к о в Н. В. Модифицирован- ные функции Лагранжа и их применения Ц Экономика и ма- тем. методы.— 1983.— Т. 19, № 3.— С. 528—547. 20. Г н а т ю к В. А., Щ и р б а В. С. Некоторые критерии глобаль- ной липшицевости функции Ц Укр. матем. журнал.— 1987.— Т. 39, № 6 — С. 768—771. 21. Гороховик В. В. О квазидифференцируемости веществен- но-значных функций Ц Докл. АН СССР.— 1982.— Т. 266, № 6.—С. 1294—1298. 22. Г о р о х о в и к В. В. Квазидифференцируемость веществен- нозначных функций и условия локального экстремума Ц Сиб. матем. журнал.— 1984.— Т. 25, № 3.— С. 62—70. 23. Д е м ь я н о в В. Ф. Минимакс: дифференцируемость по на- правлениям.— Л.: Изд. Ленингр. ун-та.— 1974.— 112 с. 24. Д е м ь я н о в В. Ф. О связи субдифференциала Кларка с квазидифференциалом Ц Вести. Ленингр. ун-та.— 1980.— № 13.—С. 18—24. 25. Демьянов В. Ф. Седловые точки квазидифференцируемых функций Ц Вести. Ленингр. ун-та.— 1982.— № 1.— С. 33—38. 26. Демьянов В. Ф. Задачи негладкой оптимизации и квази- дифференциалы Ц Изв. АН СССР. Техн, кибернетика.— 1983.— № 1.— С. 9—19. 27. Д е м ь я н о в В. Ф., Васильев Л. В. Недифференцируе- мая оптимизация.— М.: Наука, 1981.— 384 с. 28. Д е м ь я н о в В. Ф., Никулина В. Н., Ш а б л и н- с к а я И. Р. Задача оптимального управления с негладкими дифференциальными связями Ц Дифференц. уравнения.— 1985.—Т. 21, № 8.-С. 1324—1330. 29. Д е м ь я н о в В. Ф., Лупиков И. М. Функции экстремума по е-субдифференциальному отображению Ц Вести. Ленинград, ун-та.— 1983.— № 1.— С. 27—32. 30. Д е м ь я н о в В. Ф., Никулина В. Н., Ш а б л и н- с к а я И. Р. Квазидифференциальные задачи оптимально- го управления Ц В кн.: VIII всес. совещание по пробле- мам управления: тез. докл. Кн. I.— М.; Таллин.—1980.— С. 89—90. 31. Д е м ь я н о в В. Ф., П о л я к о в а Л. Н. Условия минимума квазидифференцируемой функции на квазидифференцируемом множестве Ц Ж. вычисл. матем. и матем. физ.— 1980.— Т. 20, № 4.— С. 849—856. 32. Д е м ь я н о в В. Ф., Полякова Л. Н., Рубинов А. М. Об одном обобщении понятия субдифферепциала // В кн.: Тез. всес. конф, по динамическому управлению.— Свердловск: 1979.—С. 79—84. 33. Д е м ь я н о в В. Ф., Рубинов А. М. Приближенные мето- ды решения экстремальных задач.— Л.: Изд-во Ленинградско- го ун-та.— 1968.— 180 с. 34. Д е м ь я н о в В. Ф., Рубинов А. М. О квазидифференци-
СПИСОК ЛИТЕРАТУРЫ 419 руемых функционалах/ Докл. АН СССР.-— 1980.— Т. 250, № 1.— С. 21—25. 35. Д е м ь я н о в В. Ф., Р у б и н о в А. М. О некоторых подхо- дах к задаче негладкой оптимизации Ц Экономика и матем. методы.- 1981.-Т. 17.-№ 6.—С. 1153-1174. 36. Дубовицкий А. Я., Милютин А. А. Задачи на экстре- мум при наличии ограничений Ц Ж. Вычисл. матем. и ма- тем. физ.— 1965.— Т. 5, Яг 3.— С. 395—453. 37. Д у д о в С. И. Минимум функции разности аргументов. I // Сарат. ун-т.— Саратов, 1987.— 62 с.— Библиогр.: 15 назв.— Деп. в ВИНИТИ 20.04.87, Яг 2743— В-87. 38. Е в т у ш е н к о Ю. Г. Методы решения экстремальных задач и их применение в системах оптимизации.— М.: Наука, 1982.— 432 с. 39. Е р е м и н И. И., А с т а ф ь е в Н. Н. Введение в теорию ли- нейного и выпуклого программирования.— М.: Наука, 1976.— 192 с. 40. Е р м о л ь е в Ю. М. Методы стохастического программиро- вания.— М.: Наука, 1976.— 240 с. 41. Е р м о л ь е в Ю. М., Г у п а л А. М. Аналог метода линеари- зации в задачах минимизации недифференцируемых функ- ций Ц Кибернетика.— 1978.— Яг 1.— С. 65—68. 42. И о ф ф е А. Д., Т и х о м и р о в В. М. Теория экстремальных задач.—М.: Наука, 1974.—479 с. 43. К а н т о р о в и ч Л. В., А к и л о в Г. П. Функциональный ана- лиз.— М.: Наука, 1984.— 752 с. 44. К а р м а н о в В. Г. Математическое программирование.— М.: Наука, 1975.— 272 с. 45. К р у г е р А. Я. Обобщенные дифференциалы негладких функ- ций и необходимые условия экстремума Ц Сиб. матем. ж.— 1985.—Т. 26, Яг 3.—С. 78—90. 46. К р у г е р А. Я. О свойствах обобщенных дифференциалов Ц Сиб. матем. ж.— 1985.— Т. 26, Яг 6.— С. 54—66. 47. К у г у ш е в Е. И. Принцип максимума в задачах оптималь- ного управления с негладкой правой частью Ц Вести. Мос- ковского ун-та. Сер. Мат. Мех.— 1973.— Яг 3.— С. 107—113. 48. К у р б а н о в В. Г. Необходимые условия для седловых то- чек Ц Изв. АН АзССР, Сер. физ-техн, и мат. н.— 1981.— Яг 1.—С. 22—25. 49. Куржанский А. Б. Управление и наблюдение в условиях неопределенности.— М.: Наука, 1979.— 392 с. 50. К у с р а е в А. Г. Векторная двойственность и ее приложе- ния.— Новосибирск: Наука, 1985.— 256 с. 51. Кус ра ев А. Г., Кутателадзе С. С. Субдифференци- альное исчисление — Новосибирск: Наука.— 1987. 52. К у т а т е л а д з е С. С. Основы функционального анализа.— Новосибирск: Наука.— 1983.— 221 с. 53. К у т а т е л а д з е С. С., Рубинов А. М. Двойственность Минковского и ее приложения.— Новосибирск: Наука.— 1976.— 256 с. 54. Л е в и н В. Л. Выпуклый анализ в пространствах измеримых функций и его применение в математике и экономике.— М.: Наука, 1985.— 352 с. 55. Левитин Е. С., Милютин А. А., Осмоловский Н. П. Условия высших порядков локального минимума в задачах с
420 СПИСОК ЛИТЕРАТУРЫ ограничениями Ц Успехи матем. наук.— 1978.— Т. 33, № 6.— С. 85—148. 56. Макаров В. Л., Рубинов А. М. Математическая теория экономической динамики и равновесия.— М.: Наука, 1973.— 336 с. 57. Лупиков И. М. К условию дифференцируемости много- значного отображения с многогранными образами Ц Весты. Ленингр. ун-та.— 1985.— № 13.— С. 95—98. 58. М а л о з е м о в В. Н. О достаточных условиях локального ми- нимакса Ц Вести. Ленингр. ун-та,— 1976.— № 7.— С. 55—59. 59. М о и с е е в Н. Н. Элементы теории оптимальных систем.— М.: Наука, 1975.— 526 с. 60. М о и с е е в Н. Н., И в а н и л о в Ю. Г., С т о л я р о в а Е. М. Методы оптимизации.— М.: Наука, 1978.— 352 с. 61. Мордухович Б. Ш. Негладкий анализ с невыпуклы- ми обобщенными дифференциалами и сопряженными отоб- ражениями Ц Докл. АН БССР.— 1984 — Т. 28, № H.- С. 976—979. 62. Мордухович Б. Ш. Методы аппроксимации в задачах оп- тимизации и управления.— М.: Наука, 1988.— 359 с. 63. Демьянов В. Ф., Виноградова Т. К., Никули- на В. Н. и др./Под ред. В. Ф. Демьянова/Негладкие задачи теории оптимизации и управления.— Л.: Изд-во Ленингр. ун- та, 1982.— 324 с. 64. Н и к у л и н а В. Н., Ш а б л и н с к а я И. Р. Необходимые условия минимума в задаче оптимального управления с ква- зидифференцируемым функционалом Ц В кн.: Вопр. мех. и процессов упр.— Вып. 5.— Л.: Изд-во Ленингр. ун-та.— 1982.— С. 255—263. 65. Н о р к и н В. И. Обобщенно-дифференцируемые функции Ц Кибернетика.— 1980.— № 1.— С. 9—11. 66. Н у р м и н с к и й Е. А. Численные методы решения детерми- нированных и стохастических минимаксных задач.— Киев: Наук, думка, 1979.— 160 с. 67. Оуэн Г. Теория игр.— М.: Мир, 1971.— 230 с. 68. Печерский С. Л., Соболев А. И. Проблема оптимально- го распределения в социально-экономических задачах и коо- перативные игры.— Л.: Наука, 1983.— 176 с. 69. Печерский С. Л., Соболев А. И. Многозначные реше- ния кооперативных игр: аксиоматический подход Ц В кн.: Ма- тематические методы в социальных науках, Институт экономи- ки АН Лит. ССР.— Вильнюс.— Вып. 19.— 1986.— С. 72—86. 70. П л о т н и к о в В. И., С у м и н М. И. Необходимые условия в негладкой задаче оптимального управления Ц Матем. за- метки.— 1982.— Т. 32, № 2.— С. 187—197. 71. Поляк Б. Т. Введение в оптимизацию.— М.: Наука, 1983.— 384 с. 72. Полякова Л. Н. Необходимые условия экстремума квази- дифференцируемых функций Ц Вести. Ленингр. ун-та.— 1980.—№ 13.-С. 57—62. 73. Полякова Л. Н. Об одной задаче негладкой оптимиза- ции Ц Кибернетика.— 1982.—№ 2.—С. 119—122. 74. Полякова Л. Н. Необходимые условия экстремума квази- дифференцируемой функции при квазидифференцируемом ог- раничении Ц Вести. Ленингр. ун-та,— 1982.— Ks 7.— С. 75—80.
СПИСОК ЛИТЕРАТУРЫ 421 75. П о л я к о в а Л. Н. Достаточные условия локального экстре- мума квазидифференцируемой функции при квазидифферен- цируемом ограничении Ц Вести. Ленингр. ун-та.— 1985.— № 22.— С. 26—30. 76. Понтрягин Л. С. О линейных дифференциальных играх. II И Докл. АН СССР— 1967.—Т. 175, № 4 —С. 764—766. 77. Пшеничный Б. Н. Выпуклый анализ и экстремальные за- дачи.— М.: Наука, 1980.— 320 с. 78. Пшеничный Б. Н. Необходимые условия экстремума.— М.: Наука, 1982.— 144 с. 79. П ш е н и ч н ы й Б. Н. Метод линеаризации.— М.: Наука, 1983.— 136 с. 80. Пшеничный Б. Н., Кирилюк В. С. О дифференцируе- мости функции минимума со связанными ограничениями Ц Кибернетика.—1985.—№ 1.—С. 123—125. 81. П ш е н и ч н ы й Б. Н., Хачатрян Р. А. Необходимые ус- ловия экстремума в негладких задачах Ц Кибернетика.— 1983.—№ 3.—С. 111—115. 82. РокафелларР. Выпуклый анализ.— М.: Мир, 1973.— 472 с. 83. Р у б и н о в А. М. Сублинейные операторы и их приложе- ния Ц Успехи матем. наук.— 1977.—Т. 33, № 4.—С. 113—174. 84. Рубинов А. М. Суперлинейные многозначные отображения и их приложения к экономико-математическим задачам.— Л.: Наука, 1980.— 168 с. 85. Р у б и н о в А. М. Сопряженная производная многозначного отображения и дифференцируемость максимума при связан- ных ограничениях Ц Сиб. матем. ж.— 1985.— Т. 26, № 3.— С. 147—155. 86. С а к с С. Теория интеграла.— М.: ИЛ, 1949.— 494 с. 87. С и в е л и н а Т. И. Минимизация одного вида квазидиффе- ренцируемых функций Ц Вести. Ленингр. ун-та.— 1983.— № 7.— С. 103—105. 88. С и в е л и н а Т. И. Условия экстремума суперпозиции функ- ций максимума // Вестн. Ленингр. ун-та.— 1983.— № 13.— С. 106—108. 89. Тихомиров В. Н. Выпуклый анализ Ц Итоги науки и тех- ники. Современные проблемы математики. Фундамент, направ- ления.— М.: 1987.— Т. 14.— С. 5—101. 90. Ф е д о р е н к о Р. П. О минимизации негладких функций Ц Ж. вычисл. матем. и матем. физ.—1981.— Т. 21, № 3.— С. 572—584. 91. Ф е д о р о в В. В. Численные методы максимина.— М.: Нау- ка, 1979.—280 с. 92. X а д в и г е р Г. Лекции об объеме, площади поверхности и изопериметре.— М.: Наука, 1966.— 415 с. 93. X а н д ш у г X. Об одной негладкой задаче оптимального уп- равления Ц Вестн. Ленингр. ун-та.— 1989.—Вып. 2 (№ 8).— С. 31-36. 94. X а н д ш у г М. О классе эквивалентных квазидифференциа- лов Ц Вестн. Ленингр. ун-та.— 1989.—Вып. 2 (№ 8).—С. 28— 31. 95. X а ч а т р я н Р. А. О необходимых условиях экстремума в негладких задачах оптимального управления с дискретным временем Ц Кибернетика,— 1985.—Яг 3.—С. 66—71.
422 СПИСОК ЛИТЕРАТУРЫ 96. Ш а б л и н с к а я И. Р. Необходимые условия оптимальности в негладких задачах теории управления Ц Изв. АН СССР, Тех. кибернетика.— 1985.— № 3.— С. 207—212. 97. Шор Н. 3. О классе почти-дифференцируемых функций и одном методе минимизации функций этого класса Ц Кибер- нетика.— 1972.— № 4.— С. 65—70. 98. Шор Н. 3. Методы минимизации недифференцируемых функ- ций и их приложения.— Киев: Наук, думка, 1979.— 200 с. 99. Э к л а н д И. Элементы математической экономики.— М.: Мир, 1983.- 248 с. 100. Экланд И., Темам Р. Выпуклый анализ и вариационные проблемы.— М.: Мир, 1979.— 400 с. 101. Эльстер К.-Х., РейнгардтР., Шойбле М., Донат Г. Введение в нелинейное программирование.— М.: Наука, 1985.— 263 с. 102. Янг Л. Лекции по вариационному исчислению и теории оп- тимального управления.— М.: Мир, 1974.— 488 с. 103. Aubin J.-P. Mathematical methods of game and economic theory.— Amsterdam: North-Holland, 1979.— 619 p. 104. Aubin J.-P. Cooperative fuzzy games Ц Mathematics of ope- rations Research.— 1981.— Vol. 6.— P. 1—13. 105. Aubin J.-P. Locally Lipschitz cooperative games Ц J. of Ma- thematical Economics.— 1981.— Vol. 8.— P. 241—262. 106. Aubin J.-P. Contingent derivatives of set-valued maps and existence of solutions to nonlinear inclusions and differential inclusions Ц Advances in Math. Suppl. Studies.— N. Y.: Acade- mic Press, 1981.— P. 159—229. 107. Aubin J.-P. Cooperative fuzzy games: the static and dynamic points of view Ц Studies in the Management Sciences.— 1984.— Vol. 20.— P. 407-428. 108. Aubin J.-P., E k e 1 a n d I. Nonsmooth analysis Ц Working paper W—84—5—IIASA. Laxenburg, Austria, 1984.— 87 P. 109. Aubin J.-P., Ekeland I. Applied nonlinear analysis.— N. Y.: Wiley, 1984.— 584 p. 110. Banks H. T., Jacobs M. Q. A differential calculus for multifunctidns // J. Math. Anal, and Applications.— 1970.— Vol. 29.— P. 246—272. 111. Bazar a a M. S., Goode J. J., Na shed Z. Z. On the co- nes of tangents with applications to mathematical program- ming Ц J. Optimiz. Theory Appl.— 1974.— Vol. 13, N 4.— P. 389—426. 112. Ben-Tai A., Zowe J. Necessary and sufficient optimality conditions for a class of nonsmooth minimization problems Ц Math. Progr.— 1982.— Vol. 24, N. 1.— P. 70—91. 113. Berkovitz L. D. Variational Methods in problems of cont- rol and programming Ц J. Math. Anal. Appl.— 1976.—Vol. 3, N 1.— P. 145-169. 114. Bor we in J. M. Subgradients of convex operators // Math. Operationsforsch. Statist. Ser. Optimization.—1984.— Vol. 15.— P. 179—191. 115. Bouligand G. Introduction a’la geometric infinitesimale di- recte.—Paris: Gautier — Villars, 1932. 116. Castaing Ch., V a 1 a d i e r M. Convex analysis and measu- rable multifunctions.— N. Y., Berlin: Springer — Verlag, 1977.— 278 p.
СПИСОК ЛИТЕРАТУРЫ 423 117. Clarke F. Н. Generalized gradients and applications Ц Trans. Amer. Math. Soc.— 1975.— Vol. 205.— P. 247—262. 118. Clarke F. H. On the inverse function theorem Ц Pacific. J. Math.— 1976.— Vol. 64, N. 1.— P. 97—102. 119. Clarke F. H. The maximum principle under minimal hypo- thesis Ц SIAM J. Control Optirn.— 1976.— Vol. 14.— P. 1078— 1091. 120. Clarke F. H. Optimization and nonsmooth analysis.— N. Y.: Wiley, 1983.— 308 p. 121. Corley H. W. Duality theory for maximizations with res- pect to cones Ц J. Math. Anal. Appl.— 1981.— Vol. 84, N. 2,— P. 560—568. 122. Demidova V. A., Demyanov V. F. A directional impli- cit function theorem for quasidifferentiable functions Ц In. [124], P. 95—107. 123. Demyanov V. F. Quasidifferentiable functions: Necessary conditions and descent directions Ц In [124], P. 20—43. 124. Demyanov V. F., Dixon L. C. W. (Eds.) Quasidifferen- tial calculus Ц Mathematical Programming Study.— Vol. 29.— 221 p. 125. Demyanov V. F., Gamidov S., S i v e 1 i n a T. I. An al- gorithm for minimizing a certain class of quasidifferentiable functions Ц In [124], P. 74—85. 126. Demyanov V. F., Lemarechal C., Zowe J. Approxi- mation to a set-valued mapping. I.: A proposal Ц J. Appl. Math, and Optimiz.— 1986.— Vol. 14.— P. 203—214. 127. Demyanov V. F., Nikulina V. N., Shablin- s k а у a I. R. Quasidifferentiable functiona in optimal cont- rol Ц In [124]. P. 160—175. 128. Demyanov V. F., PallaschkeD. (Eds.) Nondifferenti- able Optimization: Motivations and applications Ц Lecture No- tes in Economics and mathematical systems.— Berlin: Sprin- ger — Verlag, 1985.— Vol. 255.— 349 p. 129. Demyanov V. F., Polyakova L. N., Rubinov A. M. Nonsmoothness and quasidifferentiability Ц In [124], P. 1— 19. 130. Demyanov V. N., Rubinov A. M. On quasidifferenti- able mappings Ц Math. Operationsforsch. Statist. Ser. Opti- mization.— 1983.— Vol. 14.— P. 3—21. 131. Demyanov V. F., Rubinov A. M. Quasidifferential Cal- cules.— N. Y.: Optimization Software, 1986.— 301 P. 132. Demyanov V. F., Zabrodin I. S. Directional differen- tiability of a continual maximum function of quasidifferentiable functions Ц In [124], P. 108—117. 133. Dolecki S. Tangency and differentiation: some applications of convergence theory Ц Ann. Math. Рига Appl.—1982.— Vol. 130.- P. 223-255. 134. D о 1 e z a 1 J. Nonsmooth and nonconvex problems in descrete optimal control Ц Int. J. Syst. Sci.—1982.— Vol. 13, N 9.— P. 969—978. 135. E k e 1 a n d I. On the variational principle Ц J. Math. Anal. Appl.— 1974.—Vol. 47, N 2.—P. 324—353. 136. Elster К.-H., Thierfelder J. The general concept of co- ne approximations in nondifferentiable optimization Ц In. [128], P. 170—189.
424 СПИСОК ЛИТЕРАТУРЫ 137. Eppler К., LudererB. The Lagrange principle and qua- sidifferential calculus J) Wiss. Zeitschrift der Technischen Uni- versitat Karl-Marx-Stadt.— 1987.— B. 17, H. 2.— S. 187—192. 138. Forler Cornelia. Nonlinear contact problems including friction Ц Abstract of Ph. D. Thesis, Universitat Karlsruhe, BRD.- 1987.— 6 p. 139. Gauvin J. The generalized gradient of a marginal function in mathematical programming Ц Math. Oper. Res.—1979.— Vol. 4.— P. 458—463. 140. Gauvin J., Dubeau F. Some examples and counterexamp- les for the stability analysis of nonlinear programming prob- lems Ц Math. Programming Study.— 1984.— Vol. 21,— P. 69—78. 141. Gorokhovik V. V. 8-quasidifferentiability of real-valued functions and optimality conditions in extremal problems. Ц In. 124, P. 203—218. 142. Gwinner J. Bibliography on nondifferentiable optimization and nonsmooth analysis Ц J. Comput. Appl. Math.—1981.— Vol. 7.— P. 277—85. 143. H a 1 k i n H. Interior mapping theorem with set-valued deriva- tive // J. Analyse Math.— 1976. Vol. 30.— P. 200—207. 144. H a 1 к i n H. Mathematical programming without differentiabi- lity Ц In. Calculus of variations and control theory.—N. Y., 1976.— P. 279—287. 145. Hiriart-Urruty J.-B. Mean-value theorems in nonsmooth analysis Ц Numer. Funct. Anal. Optim.— 1980.— Vol. 2.— P. 1— 30. 146. Hiriart-Urruty J.-B. New concepts in nondifferentiable programming Ц Bui Soc. Math. France.—1979.— Mem. 60.— P. 57—85. 147. Hiriart-Urruty J.-B. Miscellanies on nonsmooth analysis and optimization Ц In [128], P. 8—24. 148. Ioffe A. D. Nonsmooth analysis: differential calculus of non- differentiable mapping Ц Trans. Amer. Math. Soc.—1981.— Vol. 266, N 1.— P. 1—56. 149. Ioffe A. D. Necessary conditions in nonsmooth optimization Ц Mathematics of Oper. Res.— 1984.—Vol. 9, N 2.—P. 159— 189. 150. Jandl H., Wieder K. A continuous set covering problem as quasidifferentiable optimization problem Ц Preprint Uni- versitat Karlsruhe.— 1987.— 26 p. 151. Jeyakumar V. On optimality conditions in nonsmooth inequality constrained minimization Ц Numer, Funct. Anal. Op- timiz.— 1987.—Vol. 9, NN 5, 6.—P. 535—546. 152. Kakutani S. A generalization of Brower’s fixed point theo- rem Ц Duke Math. J.— 1941.—Vol. 8 —P. 457—459. 153. Kiwiel К. C. A linearization method for minimizing certain quasidifferentiable functions Ц In [124], P. 85—94. 154. Lemarechal C., Mifflin R. (Eds.) Nonsmooth Optimiza- tion.—N.Y.: Pergamon Press, 1978.— vii + 185 p. 155. Luderer B. On the quasidifferential of a continual maximum function Ц Math. Operationsforsch. Statist. Ser. Optimization.— 1986.— Vol. 17, N 4.— P. 447—452. 156. Melzer D. On the expressibility of piecewise-linear continuo- us functions as the difference or two piecewise-linear convex functions Ц In [124], P. 118—134.
СПИСОК ЛИТЕРАТУРЫ 425 157. М е г к о v s к у R. R., Ward D. Е. Upper DSL Approximates and Nonsmooth Optimization Ц Preprint, Miami University, Ox- ford, Ohio.— 1987.— 47 p. 158. Moreau J.-J. Fonctionelles sous-differentiables Ц C. R. Acad. Sci. Paris Ser. A — B.— 1963.—Vol. 257.—P. 4117-4119. 159. Nurminskij E. A. (Ed.) Progress in Nondifferentiable Op- timization.— Laxenburg, Austria: International Institute for Ap- plied Systems Analysis, 1982.— 257 p. 160. Outrata J. V., Schidler Z. On some nondifferentiable problems in optimal control Ц In [128], P. 118—128. 161. Pallaschke D., Recht P. On the steepest-descent method for a class of quasidifferentiable optimization problems Ц In ____________p 252____263. aschke D., Recht P., Urbanski R. On locally — Lipschitz quasidifferentiable functions in Banach spaces // Op- timization.— 1986. Vol. 17, N 3.— P. 287—295. 163. Panagiotopoulos P. D. Inequality problems in Mecha- nics.— Basel: Birkhauser, 1985.— 412 p. 164. Pechersky S. L. Positively homogeneous quasidifferentiab- le functions and their application in cooperative game theory Ц In [124],—P. 135—144. 165. Pecherskaya N. A. Quasidifferentiable mappings and the differentiability of maximum functions Ц In [124],—P. 145— 159. 166. P e n о t J.-P. Sous-differentiels de fonctions numeriques non convexes Ц C. R. Acad. Sci. Paris.—1974.— T. 278, Serie A.— P. 1553—1555. 167. P e n о t J.-P. Calcul sous-differentiel et optimization Ц J. Funct. Anal.— 1978.—Vol. 27, N 2.—P. 248—276. 168. Penot J.-P. Variations on the theme of nonsmooth analysis: Another subdifferential Ц In [128], P. 41—54. 169. Polyakova L. N. On the minimization of a quasidifferen- tiable function subject to equality-type quasidifferentiable const- raints Ц In [124], P. 44—55. 170. Polyakova L. N. On minimizing the sum of a convex and a concave function Ц In [124], P. 69—73. 171. Pourciau В. H. Analysis and optimization of Lipschitz con- tinuous mappings Ц J. Optimiz. Theory Appl.— 1977.— Vol. 22, N 3.- P. 433-452. 172. Radsrom H. An embedding theorem for spaces of convex sets Ц Proc. Amer. Math. Soc.—1952 — Vol. 3.— P. 165—169. 173. Rockafellar R. T. Directionally Lipschitzian functions and subdifferential calculus Ц Proc. London Math. Soc.—1979.— Vol. 39, N 2.— P. 331—355. 174. R о с к a f e 11 a r R. T. The theory of subgradients and its appli- cation to problems of optimization.— Berlin: Holdermann, 1981.— 107 p. 175. Rockafellar R. T. Lagrange multipliers and subderivatives of optimal value functions in nonlinear programming Ц Math. Progr. Study.— 1982. Vol. 17, N 1.— P. 22—66. 176. Rockafellar R. T. Directional differentiability of the opti- mal value function in a nonlinear programming problem Ц Math. Progr. Study.— 1984.— Vol. 21.— P. 213—226. 177. Rockafellar R. T. Lipschitzian stability in optimization: The role of nonsmooth analysis // In [128], P. 55—73.
426 СПИСОК ЛИТЕРАТУРЫ 178. Rubinov А. М. Upper-semicontinuously directionally differen- tiable functions Ц In [128], P. 74—86. 179. Rubinov A. M., Yagubov A. A. The space of star-shaped sets and its applications in nonsmooth optimization Ц In [124], P. 176—202. 180. Shapiro A. Quasidifferential calculus and first-order optima- lity conditions in nonsmooth optimization Ц In [124], P. 56—68. 181. Shapiro A. On optimality conditions in quasidifferentiable optimization Ц SIAM J. Control Optimiz.—1984.— Vol. 23, № 4.— P. 610—617. 182. Shapley L. S. A value for n-person games Ц Ann. Math. Studies.— Princeton.— 1953 — Vol. 28.— P. 307—317. 183. Shimuzu K., IshizukaY. Optimality conditions and al- gorithms for parameter design problems with two-level structu- re Ц IEEE Trans. Auto. Contr.— 1985. AC-30.—P. 986—993. 184. Thibault L. Subdifferentiability of compactly Lipschitzian Mappings Ц Oper. Res.— Verfahren.— 1978.— Vol. 31.— P. 637— 645. 185. T r e i m a n J. S. Clarke’s gradients and epsilon-subgradients in Banach spaces Ц Trans. Amer. Math. Soc.— 1986.—Vol. 294, N 1, P. 65—78. 186. Treiman J. S. A new approach to Clarke’s Gradients in infinite dimenstions Ц In [128], P. 87—96. 187. Vesely L., Zajicek L. Delta-convex mappings between Ba- nach spaces and applications Ц Preprint, Univ. Carolinae, Pra- ha.— 1987.— 61 p. 188. Voiton E. F. Quasidifferentiable functions in the optimal construction of electrical circuits Ц In [128], P. 332—349. 189. War g a J. Derivative containers, inverse functions and cont- rollaability Ц In: Symposium on calculus of variations and control theory (Ed. D. L. Russel). University of Wisconsin-Madi- son, Wise. USA, N. Y.: Academic Press, 1976.— P. 13—45. 190. Wolfe P., В a 1 i n s k i M. (Eds.) Nondifferentiable optimiza- tion. Math. Progr. Study.— Vol. 3.— 1975. 191. Xia Z. Q. A note on the ®-kernel for quasidifferentiable fun- ctions Ц Working paper WP—87—66.— 1987.— Laxenburg, Austria: Int. Inst, for Applied Systems Analysis.— 1987.— 6 p. 192. Xia Z. Q. Second-order expansions for a class of quasidiffe- rentiable functions. Ц Working Paper, WP—87—68.— Laxenburg, Austria: Int. Inst, for Applied Systems Analysis, 1987.— 21 p. 193. Xia Z. Q. The ® -kernel for a quasidifferentiable function Ц Working Paper WP—87—89.— Laxenburg, Austria: Int. Inst, for Applied Systems Analysis, 1987.—23 p. 194. Xia Z. Q. On mean value theorems in quasidifferential calcu- lus Ц J. Math. Res. and Exposition. Dalian, China, D. I. T.,— 1987.— N. 4.— P. 681-684. > ДОПОЛНИТЕЛЬНЫЙ СПИСОК ЛИТЕРАТУРЫ 195. Веллман Р., Калаба Р. Квазилинеаризация и нелиней- ные краевые задачи.— М.: Мир, 1968.— 183 с. 196. Демьянов В. Ф., П е в н ы й А. Б. Вычисление первых и вторых маргинальных значений в задачах математического программирования. // В кн.: Оптимизация.— Новосибирск: 1972.—вып. 5(22), С. 63—72.
СПИСОК ЛИТЕРАТУРЫ 427 197. Демьянов В. Ф. Аппроксимация второго порядка для не^- гладкой функции Ц Докл. АН СССР.— 1989,— Т. 309, № 3.— С. 529—532. 198. Демьянов В. Ф. О кодифференцируемых функциях Ц Вестн. Ленингр. ун-та.— 1988.—№ 2(8).—С. 22—26. 199. К е р и м о в А. М. Об аппроксимации первого порядка много- значных отображений Ц В кн.: Оптимизация.— Новосибирск: 1988.—Вып. 43(60), С. 119-127. 200. О б е н Ж.-П., Э к л а н д И. Прикладной нелинейный анализ.— М.: Мир, 1988.— 510 с. 201. Пайзерова Ф. А. Ускоренный метод для минимизации вы- пуклой функции на двумерной плоскости Ц В кн.: Оптимиза- ция.—Новосибирск: 1986.—Вып. 35(52).—С. 79—84. 202. П ш е н и ч и ый Б. Н. Теоремы о неявных функциях для многозначных отображений Ц Кибернетика.— 1986.— № 4.— С. 36—43. 203. Рубинов А. М. Аппроксимация многозначных отображений и дифференцируемость маргинальных функций Ц Докл. АН СССР.— 1987.— Т. 292, № 2.— С. 269—272. 204. Торгашова Н. Э. Модификация теоремы Какутани и ее приложение Ц Вестн. Ленингр. ун-та.— 1989.— №2(8).— С. 106—107. 205. Шомесова В. К. Минимизация одного класса субдиффе- ренцируемых функций Ц В кн. Проблемы теоретической ки- бернетики: Тезисы докладов VIII Всесоюзной конференции. Ч. II.—Горький.— 1988.—С. 167. 206. Demyanov V. F. Continuous generalized gradients for non- smooth functions. Lecture Notes in Economics and Mathemati- cal Systems.— Berlin: Springer — Verlag, 1988.— Vol. 304.— P. 24—27. 207. Gianessi F. Semidifferentiable functions and necessary op- timality conditions Ц J. Optimiz. Theory Appl.— 1989.— Vol. 60, № 2,— P. 191—241. 208. LemarechalC., Nurminskii E. A. Sur la differentiabi- lite de la fonction d’appui du sous-differentiel approache Ц Comptes-rendus Acad. Sc. Paris.— 1980.— 290 A.— P. 855—858. 209. Lemarechal C., Zowe J. Approximation to a multivalued mapping: existence, uniqueness, characterization / In Semi- naire d’analyse numerique. Universite Paul — Sabatier, Tou- louse III.— 1986—1987.— P. VI-1 — VI-61.
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ 0 — пустое множество, Е — единичная матрица, 3S — единичный шар с центром в нуле, — шар радиуса 8 с центром в нуле, &z(x) — шар радиуса е с центром в точке х, S — единичная сфера с центром в нуле, Sc — сфера радиуса 6 с центром в нуле, $ъ(х) — сфера радиуса б с центром в точке х, с! Й — замыкание множества Й, int Й — внутренность множества Й, со Л — выпуклая оболочка Л, сопеЛ — коническая оболочка Л, Rn — n-мерное координатное пространство, — конус векторов из Rn с неотрицательными коорди- натами, координата вектора х^ Rn, С2(Х) — множество дважды непрерывно дифференцируемых на X функций, а | 0 — означает а -> 0, а > О, 1Ы1 — норма вектора х (всюду, если не оговорено противное, (П \ 1/2 2 (^г>)2 j — евклидова норма), г=1 / х | а (х f Ъ) — означает х -> а, х > а (х-+ Ь, х <Ь), , df (х) f g) = fx (g) = ~~dg~ — производная функции f в точке x по направлению g, Vf(x) = f'(x) —градиент функции / в точке х, t ~— 1 /ci (х< s) = a|*i“_>3C — I/ (х’ + ag) — f (*')] — верхняя произ- водная Кларка, /ci (х» g) = 115? — I/ (х' + а#) ““ / (х')] ~ нижняя произ- оцо,х'->х а водная Кларка, /1 (х> g) = Ит — I/ (х' + а?) ~ / (*')] — верхняя произ- а|о а водная Рокафеллара,
СПИСОК ОСНОВНЫХ ОБОЗНАЧЕНИЙ И СОКРАЩЕНИЙ 429 ж -_4 /г> (*» S) = lim — [f (x + ag) — f (x)] — верхняя производная ajо a Дини, /п (x> #) = — — I/ (x + ОД) — / (*)] — нижняя производная a j, о a Дини, ж ___ 4 /н (x> S) = lim — [/ (x + ОД) — 7 (*)] — верхняя произ- aio,q->g a водная Адамара, । 1 /н (х» $ = — I/ (х + ОД) “ f (*)] ~ нижняя производ- aio,q->g a пая Адамара, &f(x) = [df(x), df(x)] —квазидифференциал функции / в точ- ке х (это пара множеств df(x) и df(x), называемых соответствен- но субдифференциалом и супердифференциалом) Df(x) = [df(x), df(x)] —ко дифференциал функции f в точке х (это пара множеств df(x) и df(x)t называемых соответственно гиподифференциалом и гипердифференциалом), — последовательность xit х^ х3, ..для краткости иног- да пишем {х,}, {х} — множество, состоящее из точки х, А+ — конус, сопряженный множеству А, о Ух — для почти всех х, 1: N — множество целых чисел от 1 до N, 0п = (0, ..0) — нуль n-мерного пространства (иногда 0 тоже есть нуль (Rn, если это ясно из контекста), lim = lim sup — верхний предел, lim = lim inf — нижний предел, [a, &] — элемент К2 с координатами а и Ь, иногда обозначает- ся и как (л, &), (а, Ъ) — скалярное произведение векторов а и &, иногда (ес- ли это очевидно из контекста) это элемент R2 с координатами а и &, как и [а, &], = — равно по определению, 2Л — множество всех подмножеств множества А, — конец доказательства, в. в. а.— верхняя выпуклая аппроксимация, н. в. а.— нижняя вогнутая аппроксимация, н. н. с.— направление наискорейшего спуска, н. н. п.— направление наискорейшего подъема.
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Аппроксимативная квазидифферен- цируемость 173 аппроксимация отображения 54 ----Кларка 98 аппроксимирующий конус 10 Банахово К-пространство 401 Вариационный принцип Экланда 344 вариация траектории 353 — управления 353 веер 108 верхний предел 73 верхняя выпуклая аппроксимация (в. в. а.) 166 — производная Адамара 19 ----Дини 17 ----Кларка 75 — регуляризация функции 72 вогнутая функция 396 возможное направление 9 второй гипердифференциал 214 — гиподифференциал 214 — кодифференциал 214 выпуклая комбинация 395 — оболочка 395 — функция 395 вычитание множеств 125 ----по Минковскому 114 ----по Понтрягину 124 Гипердифференциал 186 гипердифференцируемая функция 187, 215 гиподифференциал 186 гиподифференцируемая функция 186, 215 тах-грань 126, 148, 398 график функции 16 Дважды кодифференцируемая функ- ция 214 двойственность Минковского ИЗ, 398 Дини-т1-стационарная точка 237 Дини-зир-стационарная точка 238 дифференцируемая по Дини функ- ция 24 — по Фреше функция 31 допустимое направление 9 — управление 352 Задача условной минимизации 233 замкнутое отображение 399 звездное множество 180 Игольчатая вариация 353 исчерпывающее семейство в. в. а. и н. в. а. 170 Калибровочная функция Минков- ского 180 касательное направление 9 касательный конус 10 ---Кларка 98 квазидифференциал 130 — отображения 404 е-квазидифференциал 173 квазидифференцируемая по Адама- ру функция 130 — функция 129 квазидифференцируемое множество 250 ---отображение 404 е-квазидифференцируемость компо- зиции 175 кодифференциал 186 — многогранный 188 кодифференцируемая функция 186 конус 397 — Булигана 10 коэрцитивная функция 290, 296 крайняя точка множества 257 Локально липшицевая функция 73 Метрика Хаусдорфа 400 многоточечный пакет вариаций 357 множество бесконечно малых 10 — возможных направлений 291, 297, 298 Надграфик функции 16 наибольший элемент множества 401 наименьший элемент множества 401
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 431 направление наискорейшего подъ- ема 233, 235, 238 ---спуска 233, 235. 238 неподвижная точка 400 непрерывно кодифференцируемая функция 186 непрерывность отображения 400 неравенство Йенсена 395 нечетный веер 109 нижний предел 72 ---отображения 93 нижняя вогнутая аппроксимация (н. в. а.) 167 — производная Адамара 19 ---Дини 18 ---Кларка 75 — регуляризация функции 72 т-норма 241 нормальный конус 12 Обобщенный градиент 77 — якобиан 106 общее положение пары множеств 148 ограниченное отображение 399 операторно выпуклое множество 403 опорная функция веера 109 опорное множество 403 опорный конус 12 — оператор 401 оптимальная траектория 353 оптимальное управление 353 оптимальный процесс 353 Пакет вариаций 357 подграфик функции 16 по^жительно однородная функция 397 полунепрерывное сверху отображе* ние 399 — снизу отображение 97 поляра 185, 397 по^ядково ограниченный оператор 408 поточечный инфимум. супремум 116 предпроизводняя отображения 110 принципиальный (концептуальный) алгоритм 275 е-производная 290 производная Адамара 20 ----отображения 404 — Гато 30 — Дини 18, 20 ----отображения 32, 403. 404 — функции по направлениям (про- изводная Дини) 18 К-пространство 400 пространство выпуклых множеств 122 — опорных множеств 403 Равномерная аппроксимация мно- жества 13 — дифференцируемость (по Дини) 27, 34 равномерно дифференцируемое ото- бражение 403 регулярная функция 86 регулярный оператор 405 решетка 403 Седловая точка 304 (8, ц)-седловая точка 304 сечение множества операторов 108 слабо ограниченное множество 403 сложение множеств по Минковско- му 397 — пар множеств 119 сопряженная система 360 — функция 360 сопряженный веер 109 — конус 397 inf-стапионарная точка 280, 282. 233, 235 sup-стационарная точка 233. 235 строгая предпроизводная 110 строго дифференцируемая функция 81 субаддитивная функция 397 субаддитивнкй опсртготу401 субдифференциал 130, 395, 397 — выпуклой функции 289 — Кларка 77 — Пено 153 е-субдифференциал 399, 289 субдифференциальное отображение Кларка 98 субдифференцируемая функция 128 сублинейное отображение 108 сублинейный оператор 404 сумма множеств по Минковскому 113 супердифференциал 130, 396, 399 — Пено 153 ц-супердифференциал 296 супердифференцируемая функция 128—129 суперлинейная функция 399 суперлинейный оператор 401 Теорема Какутани (о неподвижной точке) 400 теорема Каратеодори 395 — о квазидифференцируемости су- перпозиции 136 — о недифференцируемости супер- позиции 205 — о минимаксе 396 — о среднем 89 — отделимости 396 точка глобального минимума 230 — локального минимума 230 — строгого локального минимума 230 Умножение пар множеств на чис- ло 119 — по Минковскому 397 условие нерегулярности 205 — регулярности 38, 43, 211, 250 — Слейтера 246 устойчивое вверх множество 16 — вниз множество 17 Функция Гамильтона 360 — максимума 33 ---при связанных ограничениях 55, 59 Четная функция 86 Эквивалентные пары множеств 119 эффективное множество 16, 399
Научное издание ДЕМЬЯНОВ Владимир Федорович РУБИНОВ Александр Моисеевич ОСНОВЫ НЕГЛАДКОГО АНАЛИЗА И КВАЗИДИФФЕРЕНЦИАЛЬНОЕ ИСЧИСЛЕНИЕ Серия «Оптимизация и исследование операций» Выпуск 23 Заведующий редакцией А. П. Баева Редактор В. В. Абгарян Художественный редактор Г. М. Коровина Технический редактор И. Ш. Аксельрод Корректоры Л. И. Назарова, И. Я. Кришталъ ИБ № 32863 Сдано в набор 07.06.89. Подписано к печати 23.10.90. Формат 84x108/32. Бумага кн.-жур- нальная. Гарнитура обыкновенная. Печать высо- кая. Усл. печ. л. 22,68. Усл. кр.-отт. 22,68. Уч.-изд. л. 24,94. Тираж 2850 экз. Заказ № 726. Це- на 5 р. 30 к. Издательско-производственное и книготорговое объединение «Наука» Главная редакция физико-математической литературы 117071 Москва В-71, Ленинский проспект, 15 4-я типография издательства «Наука» 630077 г. Новосибирск, 77, Станиславского, 25