Текст
                    ЗАДАЧИ
ПО ИССЛЕДОВАНИЮ
ОПЕРАЦИЙ
Издательство
Московского
университета
1 979


ПРЕДИСЛОВИЕ Настоящий сборник соответствует курсу «Исследование операций» на факультете вычислительной математики и ки- бернетики МГУ. Большое внимание уделено задачам, связанным с некон- тролируемыхми факторами операций, т. е. факторами, которые не находятся в распоряжении оперирующей стороны; рас- сматриваются задачи на построение моделей операций, вы- числение оценок эффективности конкурирующих способов действий оперирующей стороны — стратегий (гл. 1). Более традиционны задачи на отыскание оптимальных стратегий в операциях без неопределенностей (гл. 2) и раздел, посвя- щенный классической теории игр двух лиц (часть гл. 3). В задачах гл. 4 прослеживается роль информированности оперирующей стороны и исследователя операций о неконтро- лируемых факторах, на конкретных примерах изучается за- висимость от информированности поведения оперирующей стороны и получаемого ею результата. К задачам приводятся ответы, указания, а в необходимых случаях и подробные решения. Основная масса задач ориги- нальна, некоторые, относящиеся к классическим разделам исследования операций и теории игр, заимствованы из источ- ников, указанных в списке литературы. Ранее этот материал частично был опубликован в ротаг принтном издании: Задачник по исследованию операций. Ч. 1. М., 1975 (МГУ); Ч. 2. М., 1976 (МГУ). Авторы выражают благодарность сотрудникам факульте- та ВМиК МГУ и ВЦ АН СССР, предоставившим свой за- дачи, и будут признательны читателям за все замечания по содержанию книги.
Некоторые теоретические сведения и обозначения Под операцией понимают совокупность действий, направ- ленных на достижение определенной цели [6, 8]. Участников операции, стремящихся к достижению этой цели, называют оперирующей стороной. Факторы, которыми распоряжается оперирующая сторона для достижения цели операции, назы- ваются контролируемыми. Для их обозначения будем исполь- зовать букву ху а совокупность всех значений контролируе- мых факторов обозначим М0. Факторы операции, которые не контролируются оперирующей стороной, называются некон- тролируемыми. Среди участников, составляющих оперирую- щую сторону, можно выделить исследователя операции, ко- торый проводит исследование по отысканию наилучших для оперирующей стороны способов действий. Неконтролируемые факторы следующим образом группируются по информиро- ванности о них исследователя операции. Неопределенные факторы у: исследователю операции из- вестно лишь множество значений N факторов у. Случайные факторы z: исследователю операции известно множество зна- чений Z случайной величины г; кроме того, закон распреде- ления (т. е. функция распределения или вероятностная мера [25]) © этой случайной величины либо известен то^но, либо известно лишь, что coeQ, где Q — некоторое множество зако- нов распределения. В дальнейшем там, где это не вызовет неясностей, будем использовать одни и те же обозначения для случайной величины и ее реализации, для функции рас- пределения и соответствующей вероятностной меры. Стрем- ление оперирующей стороны к достижению цели описывает- ся стремлением к увеличению значения функции F(x, уу z)> называемой критерием эффективности. Иногда цель состоит в стремлении к уменьшению значения критерия эффектив- ности; в очевидных случаях не будем оговаривать это спе- циально. К моменту проведения операции оперирующая сторона может располагать большей информацией о неконтролируе- 4
-мых факторах, чем располагал исследователь операции во время проведения исследования. Информация, которой будет располагать оперирующая сторона к моменту проведения операции, фиксируется в модели операции информационной гипотезой. Стратегиями оперирующей стороны называют раз- решенные информационной гипотезой способы действий. Так, если оперирующая сторона не располагает дополнительной информацией о неконтролируемых факторах, то ее страте- гиями являются сами контролируемые факторы из М0. Стра- тегии из М0 называются стратегиями-константами. Если не- контролируемые факторы станут известными оперирующей стороне к моменту проведения операции, то ее стратегиями являются всевозможные отображения x:NxZ-+M0\ множе- ство всех таких отображений будем обозначать М. Информа- ционная гипотеза может быть задана с помощью информа- ционной функции R: NxZ-+Em, определенной на множестве NXZ: оперирующей стороне к м'оменту проведения операции станет известным значение R (у, z), где у, z — неконтролируе- мые факторы в рассматриваемой операции. Множеством стратегий оперирующей стороны служит в этом случае мно- жество MR = {xe=M\x(y1, 21)=x(f/2, za), если R(yl9 zx)^=R(y^ z2)}. Информационная гипотеза может быть задана и иными спо- собами. В любом случае множество стратегий М является подмножеством М. Мы будем, кроме того, рассматривать лишь такие множества стратегий М, что Mz^M0. Зачастую случайные факторы отсутствуют в операции или •случайные факторы имеются, но по информационной гипо- тезе оперирующая сторона информации о них не получит, т. е. стратегии не зависят от случайных факторов, а также допустимо осреднение критерия по случайностям. В таких случаях мы будем обозначать критерий через W(xy у), где TP(*i У)=[Р(х* У* z)d(u(z), если случайные факторы име- ются. При этом информационная функция, очевидно, не зави- сит от г; для множества всех стратегий x:N-+M0 мы сохра- ним обозначение М. Критерий эффективности, определенный на множестве MqXNXZ (M0xN), очевидным образом может быть доопре- делен на множестве MxNxZ (MxN): F& У, z) = F(x(y, z), у, z)(W(x, y)=W(x(y), у)), xe=M. Если допустимо применение оперирующей стороной смешан- ных стратегий <реФ (через <р мы обозначаем и саму случай- ную величину со значениями в М0 и ее функцию распределе- 5
ния и соответствующую вероятностную меру), то для оцен- ки эффективности таких стратегий используется критерий ^(Ф, У)=$ W(x, y)dtf(x). Вероятностные смеси стратегий из множеств МфМо в дан- ном сборнике не рассматриваются. Если в операции все неконтролируемые факторы являют- ся случайными и допустимо осреднение критерия, то оцен- кой эффективности стратегии х называют величину F(x9 (о)= ^F(x, z)d(o(z). Если же в операции отсутствуют случайные факторы или критерий, как было описано выше, уже осреднен по случай- ностям, то оценкой эффективности стратегии х называется величина W(x)= infW(x, у). Если в операции имеются различные типы неконтролируемых факторов, то оценка эффективности определяется в зависи- мости от дополнительных предположений об этих факторах. Пусть, например, в критерии F(дс, у, г), у = (у19 у2), yt^Nly у2€= Л'а, N = NtxN2f где у\ выбирается первым противником, знающим реализа- цию случайной величины г, а у2 выбирается вторым против- ником, не знающим реализацию г. Тогда, если интересы про- тивников неизвестны, а оперирующая сторона разрешает осреднение по случайностям, то оценка эффективности стра- тегии #"имеет вид W(x)=inl inf f ml F(x,ylfy2f г)d(u(z). — e>6Q y&N% J yxtNt Пусть W(x, у) — критерий эффективности оперирующей сто- роны, a Wn(x, У) — критерий эффективности противника^ Предположим, что противнику известна стратегия х опери- рующей стороны и что N&) = {yeN\WnG9 y) = maxWnfc У')}Ф0. y'SN Тогда оценка эффективности стратегии х принимает вид W(x)= inf W& у). »€N(7) 6
Если у— природная неопределенность или стратегия против- ника, имеющего противоположные интересы и не знающего реализацию смешанной стратегии <р, то оценкой эффектив- ности стратегии ср называют величину Щ<р)= inf !Г(ф, у). — уем Стратегия х0^М называется оптимальной в множестве М9 если W(x0) = maxW(x); стратегия хг^М называется е-оптимальной в М, если W(xe)>supW(x) — е. Величина W(M)= sup W(x) называется наилучшим гаран- тированным в множестве стратегий М результатом. Точно так же в случае, когда в операции неконтролируемые факто- ры случайны или имеются неконтролируемые факторы раз- ных типов, оптимальной называют стратегию с наибольшей оценкой эффективности. По аналогии с приведенными выше определениями определяются в этом случае понятия е-опти- мальной стратегии и наилучшего гарантированного резуль- тата. Наконец, величину Г(Ф)= sup inf W(% у) <р€Ф y€N называют наилучшим гарантированным результатом в сме- шанных стратегиях, а стратегию ф0еФ, для которой — оптимальной смешанной стратегией. Если цель операции состоит в уменьшении значения кри- терия эффективности, то во всех определениях верхние грани .нужно заменить на нижние и наоборот. В дальнейшем без дополнительных пояснений и ссылок используются приведенные определения и обозначения. Кро- ме того, в задачнике используются следующие обозначения: Еп — n-мерное евклидово пространство; £+ = {* = (*i> • • • » хп)е Еп\xt >0, i = 1, ... , п); п Sn = ix е Еп IV Х( = 1» х( > 0, i = 1, ... , п\ — симплекс; р (х9 у) — евклидово расстояние между векторами х, у е Еп;
р (*, А) = inf р (х, у) — расстояние от точки х е Еп до мно- У€А жества А с Еп; в(*> г) = {уеЕп|р(л:, у)<г} — шар радиуса г с центром в точке х; lU I ht>a; [t] — целая часть числа /; \А\—число элементов конечного множества А; 2А — множество всех подмножеств множества А; А — замыкание множества Л; int А — внутренность множества А; со Л —выпуклая оболочка множества А: Ытхп = *21 *« <hn \0>т\ Дт2 • • • 0>тп /W(l, 1) W{\9 2)...W(l, п)\ \W(m, 1) W(m92)...W(m9 n)j (W (x9 y)) = (atDmxn — означает, что W (i9 j) = aij9 i = 1, .. . ... , m, у = 1,... , n; x0 = xl9 ... , *.„ — в соответствующем контексте означает, что, существует т оптимальных стратегий х19 . . . 9 хт; к.э. — критерий эффективности; к. ф. — контролируемые факторы; н.ф.— неконтролируемые факторы; с. ф. — случайные факторы. Следующие задачи рекомендуется решать последователь- но, поскольку они посвящены исследованию «близких» моде- лей: 1.3—4.35, 1.5—3.36, 1.6—1.7—3.42, 1.8—1.9—4.18, 1.10— 3.35, 1.12—4.36—4.41, 1.14—4.42, 1.21—3.43, 1.23—4.46—4.47, 1.24—4.48—4.49—4.50, 1.32—1.36; 3.6 — 3.7 — 3.8, 3.9 — 3.10, 3.19 — 3.20; 4.11—4.12, 4.13—4.20 — 4.21—4.22 — 4.30 — 4.31, 4.14 — 4.23 — 4.32, 4.15 — 4.16, 4.24 — 4.25, 4.27 — 4.28 — 4.29^ 4.33—4.34.
ЗАДАЧИ ГЛАВА 1 Составление моделей операций и оценка эффективности стратегий В задачах этой главы требуется составить модель опера- ции, т. е. описать контролируемые и неконтролируемые фак- торы, критерий эффективности и множество стратегий опе- рирующей стороны, а также найти оценки эффективности стратегий. В конце главы предлагается несколько задач, в которых используются свертывание критериев, объединение операций и эффективные векторы [8, 9]. Начиная с задачи 1.31, до конца главы предполагается, что оперирующая сто- рона стремится к увеличению значения своего критерия. 1.1. В автомобильном туннеле скорость движения машин v не превосходит 50 км/ч и связана с плотностью потока (ко- личеством машин на километр дороги) Р следующим эмпи- рическим соотношением z где z — случайная величина, которая в любой момент опре- деляется соотношением легковых и грузовых машин, прохо- дящих через туннель. Известно, что величина z равномерно распределена на отрезке [72, 1]. Регулировка движения в туннеле производится путем выбора скорости движения о. Цель операции состоит в увеличении потока машин F, т. е. количества машин, выходящих из туннеля за час [17]. Составить модель операции. Найти оценку эффективности произвольной стратегии в каждом из следующих предполо- жений: а) оперирующая сторона разрешает осреднение критерия; б) оперирующая сторона не разрешает осреднение крите- рия. Найти скорость движения машин, при которой поток F будет максимальным. 1.2. Самолеты, пролетающие над наблюдательным пунк- том могут подавать сигналы двух видов: «свой» и «неприя- 9
тель». Предположим, что свои самолеты знают расположение своего наблюдательного пункта и всегда подают сигнал «свой». Неприятельские самолеты не знают о том, чьей сто- роне принадлежит наблюдательный пункт, но знают, как по- давать сигнал «свой». Поэтому неприятельские самолеты могут подавать любой сигнал; при этом отсутствие сигнала для наблюдателя равносильно подаче сигнала «неприятель»- Пусть для следующих событий ущерб1 для наблюдателя or осуществления этих событий равен: а — если свой самолет принимается за свой; b — если свой самолет принимается за неприятельский; с — если неприятельский самолет принимается за неприя- тельский; d — если неприятельский самолет принимается за свой. Пусть © — вероятность того, что приближающийся к на- блюдательному пункту самолет является своим. Относитель- но со лишь известно, что ю'^со^о/'. Предположим, что опе- рирующей стороной является наблюдатель, который прини- мает решение о том, чей самолет приближается к пункту: свой *или неприятельский. Целью наблюдателя является* уменьшение ущерба от осуществления перечисленных выше событий. Составить модель операции. Осреднить полученный кри- терий. Найти оценку эффективности произвольной страте- гии [15]. 1.3. Две страны обмениваются товарами. Пусть Л*, /=1,.... ..., т — количество товара j-го типа первой страны, предназ- наченное для обмена на товары второй страны, а В^ /=1, .... ..., п—количество товара /-го типа второй страны, предна- значенное для обмена на товары первой страны. Товары обе- их стран, вообще говоря, разные. Пусть аг-, а{ и Xi — стои- мость единицы товара f-ro типа первой страны соответствен- но на внутреннем рынке первой страны, на внутреннем рынке второй страны и на международном рынке. Аналогично пусть. bj, b/ и |Xj — стоимость единицы товара /-го типа второй, страны соответственно на внутреннем рынке второй страны,, на внутреннем рынке первой страны и на международном рынке. Стоимость в международных ценах обмениваемых то- варов должна быть одинаковой. Обмен товарами осуществляется следующим образом. Первая (соответственно вторая) страна выбирает количества Xij (соответственно уц) товара 1-го (/-го) типа, которое она желает обменять на соответствующее количество товара /-га (*-го) типа второй (первой) страны. Обмен товара 1-го типа первой страны на товар /-го типа второй страны произво- 1 Под ущербом можно понимать математическое ожидание стоимо- стных затрат, которые несет оперирующая сторона от осуществления ни- жеперечисляемых событий. 10
дится в количестве, максимально допустимом величинами хц « УЦу т. е. на сумму min(A^X4j, ЩУ%$)> выраженную в между- народных ценах. Будем считать первую страну оперирующей стороной, которая не знает выбор уц второй страной. Цель первой страны — так выбрать Хцу чтобы по возможности уве- личить прибыль, полученную в результате обмена и выражен- ную в ценах своего внутреннего рынка. Составить модель операции. Найти оценку эффективности произвольной страте- гии, если: а) интересы второй страны неизвестны, tyВу = Х,4, _L > JiL, t, / = 1, ... , т == п\ б) интересы второй страны известны и задаются крите- рием эффективности, аналогичным критерию первой страны; второй стране известна стратегия первой страны и -^->-^, t=l,...,m, / = 1,...,л. 1.4. Межотраслевое объединение ведет строительство ав- томобильного завода. Предстоит выполнить следующие основ- ные работы: A. строительство заводских корпусов; B. завершение разработки модели нового автомобиля; C. наем рабочей силы; D. монтаж оборудования; E. отладка модели автомо- биля. Очередность выполнения работ задана сетевым графиком (рис. 1). Пусть tA=2 и foel—вре- мя выполнения работ А и D, а для остальных работ времена их выполнения точно неизвест- ны и являются независимыми случайными величинами. При этом tB и tc принимают значения 2, 3, 4 с вероятностями 7з> a tE принимает значения 1, 2, 3 с вероятностями Уз. Ниже приведена зависимость дополнительной прибыли объедине- ния от времени выполнения всего комплекса работ: Время выполнения всего комп- лекса работ Дополнительная прибыль объединения (в тыс. руб.) 3 120 4 ПО 5 100 6 50 7 0 11
В распоряжении объединения имеется резерв, ввод кото- рого ускоряет все строительство, завода на одну единицу времени, но потребует дополнительных расходов в 20 тыс. р_ Следует ли использовать резерв, если целью объединения является увеличение по мере возможности чистой дополни- тельной прибыли (т. е. дополнительной прибыли за вычетом расходов в случае использования резерва)? Составить модель операции. Критерий эффективности записать с помощью» матрицы. Осреднить полученный критерий и ответить на во- прос о целесообразности ввода резерва [4]. 1.5. Склад имеет форму треугольника G с вершинами Aj,. /=1, 2, 3. Грабитель может проникнуть на склад только в- точках Aj с вероятностями coj, относительно которых лишь известно, что (о;- <j<dj<Cg>J , /=1, 2, 3. Цель операции — «наилучшим» образом установить сторожевую вышку на тер- ритории склада, чтобы обнаружить грабителя в момент про- никновения на склад. Известно, что вероятность необнаруже- ния грабителя пропорциональна квадрату расстояния до гра- бителя. Составить модель операции. Найти оценку эффек- тивности произвольной стратегии, если а) со/ = 0, ю/ = 1, / = 1, 2, 3; б) о>;=0, <о/=у> / = 1> 2, 3; В) CoJ = COj = Щ = СОз = , 0)2 = (Оз = 0. 1.6. В дуэли принимают участие два противника (первый и второй дуэлянты). В начальный момент времени они нахо- дятся друг от друга на расстоянии П. Затем противники на- чинают без остановок сближаться, но не ближе барьеров,, расстояние между которыми равно d, d<D. Каждый из про- тивников имеет в своем распоряжении по одному выстрелу и имеет право выстрелить в любой момент времени после на- чала сближения. Дуэль заканчивается либо когда оба про- тивника сделали по выстрелу, либо когда выстрелил один из. них и поразил другого. Пусть Pi(di)—вероятность пораже- ния 1-м дуэлянтом противника, если выстрел был произведен с расстояния dit i=l, 2. Предположим, что каждый дуэлянт слышит выстрел другого. Будем считать первого дуэлянта оперирующей стороной. Составить модель операции, предполагая, что критерий эффективности принимает значение 0 или 1 в зависимости от выполнения следующих целей оперирующей стороны: а) поражение противника; б) сохранение собственной жизни; в) сохранение собственной жизни и поражение против- ника. 12
Осреднить полученные критерии по случайностям. В слу- чаях а), б), в) найти оценку эффективности стратегии, кото- рая рекомендует первому дуэлянту стрелять с расстояния d, если противник выстрелил раньше него и промахнулся. 1.7. Пусть в условии задачи 1.6 первый дуэлянт имеет возможность произвести два выстрела в различные моменты времени, а второй дуэлянт имеет по-прежнему в своем рас- поряжении только один выстрел. Составить модель операции, предполагая выполненными условия а), б), в) задачи 1.6, и осреднить полученный кри- терий. 1.8. Имеется п пунктов возможного прорыва средств на- падения. Нападающая сторона распределяет общее количе- ство А средств1 по х\ на i-й пункт, * = 1, ..., п. Защищающая- ся сторона выделяет резерв С из общего количества В средств защиты и распределяет оставшееся количество В—С средств по щ на i-й пункт, не имея информации о распреде- лении средств нападения. Нападение знает распределение основных средств защиты щ. После того, как происходит на- падение, защита узнает распределение средств нападения лч и, в свою очередь, размещает резерв С по V{ на i-й пункт, 1=1, ..., п. Пусть pi — количество средств нападения, которое может уничтожить одна единица основных средств защиты на i-м пункте, a q\ — количество средств нападения, которое может уничтожить одна единица резерва защиты на i-м пункте. Бу- дем считать нападение оперирующей стороной. Целью напа- дения является стремление к увеличению суммарного коли- чества средств, прорвавшихся через все пункты. Составить модель операции. Показать, что для любой стратегии нападе- ния найдется стратегия, имеющая не меньшую оценку эффек- тивности и состоящая в нанесении «концентрированного уда- ра», т. е. в направлении всех средств нападения на один пункт. 1.9. Пусть в условии задачи 1.8 защита резерва не выде- ляет, а нападение перед началом операции производит раз- ведку расположения средств защиты. Поступающая инфор- мация и/ о расположении средств защиты, вообще говоря, не является точной: нападению известно лишь, что \Щ — щ\<г19 щ>0, i=l,...,n, где ег^О — точность разведки. Выполнить задание, сформу- лированное в условии задачи 1.8. 1.10. Город имеет форму круга G радиуса R. Будем пред- полагать, что из любой точки города можно проехать на ма- Средства предполагаются бесконечно делимыми.
шине в любую другую точку по прямой линии и что машины движутся по городу с постоянной скоростью. Решается вопрос о размещении в городе трех пожарных частей. Нужно так выбрать точки расположения пожарных частей, чтобы до возникшего в точке у пожара можно скорее всего добраться. Составить модель операции. Найти оценку эффективности произвольной стратегии. 1.11. Нефтеносный район имеет форму области G на пло- скости. Предположим, что форма залегания нефти имеет вид круга В (уу r)c=G известного радиуса г. Положение цен- тра круга у неизвестно.. Разведка нефти производится путем поочередного бурения скважин в точках области G до тех пор, пока не будет обнаружена нефть. Цель операции — об- наружить нефть и пробурить при этом как можно меньше скважин. Составить модель операции. Найти оценку эффек- тивности произвольной стратегии. 1.12. Две конкурирующие фирмы производят для рынка один вид продукции. Каждая фирма планирует выпуск про- дукции и назначает на нее цены; при этом первая фирма не знает планируемого выпуска и цены на продукцию второй фирмы. Пусть D — потребность рынка в продукции, а и и v — количества продукции, производимой соответственно пер- вой и второй фирмами; причем и, v^K, где константа К задает ограничения на производственные мощности обеих фирм. Пусть р и q — цены единицы продукции, назначаемые первой и второй фирмами и удовлетворяющие неравенствам: a^p^b, a^q^.bf где а — себестоимость (цена единицы) продукции. Предполагается, что вначале на рынке покупает- ся более дешевая продукция, а если цены равны, то поку- пается продукция второй фирмы. Будем считать первую фир- му оперирующей стороной. Цель оперирующей стороны со- стоит в получении как можно большей прибыли от продажи произведенной продукции. Составить модель операции. Найти оценку эффективности призвольной стратегии, если: а) интересы второй фирмы неизвестны; б) интересы второй фирмы известны и задаются крите- рием, аналогичным критерию первой фирмы; кроме того, второй фирме известна стратегия первой фирмы. 1.13. Две конкурирующие фирмы производят для рынка т видов продукции. Пусть щ, Vi — количества продукции 1-го вида, производимой соответственно первой и второй фир- мами, щ, Vi^Ku i=lf ..., m, а ри qt — цены единицы про- дукции f-ro вида, назначаемые первой и второй фирмами и удовлетворяющие неравенствам: а^р^Ьи di^qi^bi, где щ — себестоимость продукции 1-го вида. Предположим, что для производства вектора и= (щ> ..., Um) первой фирме не- обходимо затратить gj(u) единиц /-го вида производственных факторов, /=1, ..., п\ при этом первый вид производственных 14
факторов — деньги. Количество денег на рынке ограничено и равно С, а потребность рынка в продукции 1-го вида рав- на Dt. Целью 'первой фирмы (оперирующей стороны) являет- ся увеличение прибыли от продажи всех видов продукции. Записать критерий эффективности оперирующей стороны, если: а) сначала у второй фирмы покупается продукция тех видов, на которые она назначила цены не большие, чем опе- рирующая сторона. После окончания всех таких закупок продукция покупается у оперирующей стороны, если на рынке, конечно, остались деньги и имеется неудовлетворен- ный спрос; ~ б) сначала у второй фирмы покупается продукция тех ви- дов, на которые она назначила цены не большие, чем опери- рующая сторона, затем у оперирующей стороны закупается продукция тех видов, цены на которые не выше, чем у вто- рой фирмы, затем оставшаяся продукция закупается у второй фирмы, затем оставшаяся продукция закупается у оперирую- щей стороны. 1.14. Предприятие производит продукцию в течение Т от- резков времени. В начале /-го отрезка предприятие произво- дит продукцию в количестве xt. Спрос yt на продукцию в на- чале /-го отрезка неизвестен, но известно, что dt^yt^;Du где du Dt — фиксированные границы спроса. Предположим, что спрос yt на продукцию удовлетворяется в начале /-го от- резка, а вся произведенная нереализованная (в том числе и в предшествующие моменты времени) продукция хранится на складе в течение всего /-го отрезка времени. Пусть а — стоимость единицы произведенной продукции, р — стоимость хранения единицы продукции в течение одного отрезка вре- мени, у — плата за единицу недоданной продукции (неустой- ка) и t0 — начальный запас продукции на складе. Цель пред- приятия состоит в таком выпуске продукции Хи /=1, ..., Т9 чтобы суммарные издержки (производство, хранение и не- устойка) были по возможности меньшими. Составить модель операции. Найти 'оценку эффективности произвольной стра- тегии— константы [4]. 1.15. Турист заблудился в лесу; он знает, что лес имеет форму области G на плоскости, но не знает, в какой точке Р области G он находится. Цель туриста — выйти из леса как можно более коротким путем [28]. а) Пусть G — полуплоскость; турист знает, что он нахо- дится на расстоянии 1 от границы леса, но он не знает, в каком направлении от него находится граница леса. Дока- зать, что стратегия, состоящая в движении по кривой PQRHE, изображенной на рис. 2 (PQ, QR, НЕ — отрезки, RH—боль- шая дуга окружности длины 7я/6), является единственной оптимальной стратегией. 15
б) Пусть G — квадрат с длиной стороны, равной 1. Дока- зать, что ^стратегия, состоящая в движении ^доль отрезка длины "К 2, является единственной оптимальной стратегией. в) В условиях пункта б) найти оценку эффективности сле- дующей смешанной стратегии ср: сначала турист согласно равномерному закону выбирает случайное направление, за- тем движется прямолинейно вдоль выбранного направления вплоть до выхода из леса. 1.16. Первая страна плани- рует войну со второй страной в течение периода длины Г, начиная с-момента t=0 и за- канчивая моментом t=T. Пусть в момент времени t пер- вая и вторая страны имеют вооружение в количествах, соответственно равных p(t) и q(t), а скорости производства вооружения для первой и вто- рой страны равны соответст- венно Ш\ и т2 и не зависят от t. Предположим, что в момент t первая и вторая страны выделяют доли u(t) и v(t) вооруже- ния на уменьшение производства (изнурение) противника. При этом скорость производства вооружения противника уменьша- ется соответственно на величины C2u(t)p(t) и C\v(t)q(t)y гдес! и С2 — постоянные, не зависящие от t. Остальное вооружение в количествах (1—u(t))p(t) и (1—v(t))q(t) отправляется на поле боя, где единица вооружения одной страны уничтожает единицу вооружения другой страны. Превосходство одной страны над другой за всю войну выразим как разность меж- ду суммарными количествами вооружений сторон, участво- вавших в бою за весь период Т [1]. Будем считать первую страну оперирующей стороной, цель которой — выбрать u(t) таким образом, чтобы ее превосходство над второй страной было бы как можно большим. Пусть запасы вооружения в момент *=0 у первой и второй стран равны соответственно ро и <7о> причем po<fn\/c\—m{Ty q0<m2/C2—m2T. Найти оцен- ку эффективности стратегии их: Рис. 2 мо = 1, 0<*<т О, т<г<7\ где т<7 — — 1.17. Лесное хозяйство занимается посадкой и вырубкой леса на некотором участке земли. Если лес вырубить в нача- ле &-го года после посадки, то прибыль от продажи леса с 16
учетом коэффициента дисконтирования! а*_1 составит <хл_1(а—bk)y где a>b и 0<&<1. Коэффициенты дисконтиро- вания <ха точно неизвестны: ctft=zft, где z— случайная вели- чина, распределенная на отрезке [а, р], 0<а<р<1, с извест- ным математическим ожиданием z. Цель операции состоит в получении как можно большей дисконтированной прибыли путем выбора года вырубки леса. Составить модель опера- ции. Найти оценку эффективности произвольной стратегии. Найти оптимальную стратегию [4]. 1.18. Продавец газет покупает k газет для продажи и за каждую проданную газету получает прибыль, равную а. Не- проданные газеты он возвращает, но при этом терпит убы- ток, равный 6, на каждой непроданной газете. Спрос, т. е. количество z людей, покупающих газеты, является неконтро- лируемым фактором, принимающим значения на отрезке [а, р], где а, р — известные натуральные числа. Цель газет- чика — так выбрать число газет k для продажи, чтобы по мере возможности увеличить прибыль от продажи [2]. Со- ставить модель операции. Найти оценку эффективности про- извольной стратегии, если: а) спрос z является неопределенным фактором; б) спрос z является случайной величиной с известным ма- тематическим ожиданием z и дисперсией D>0. 1.19. Фотограф устраивает фотоохоту на лисьей тропе, имеющей форму отрезка длины 1. Точка z появления лисы на тропе является случайной величиной. Относительно функ- ции распределения со величины z известно лишь, что она принадлежит множеству функций распределения Q. Если засада производится в точке х> а лиса выйдет на тропу в точке z, то качество снимков определяется известной убы- вающей функцией f от расстояния \х—z\. Цель фотографа состоит в выборе такой точки засады, чтобы достигнуть наи- более качественной съемки. Составить модель операции. Найти оценку эффективности произвольной стратегии, если: 1 о 1* 6 1 в) f{t)=\-t\ Q= {cd|£z&d(2) = ^-J; 1 Коэффициент дисконтирования a^_i отражает падение денежного курса к началу &-го года. = 1,..., /п|; 17
1 г) /(f) = 1-/», Й= |J-i-<jzd(D(e)<-^, о О 1.20* Имеется два агрегата 1 и 2, для которых известны математические ожидания времени работы t\ и 72. Известно также, что с вероятностью 1 агрегаты' выходят из строя до- момента Т после их включения. Пусть в момент *=0 вклю- чается агрегат 1. В момент т, O^ir^r, если агрегат 1 еще работает, он заменяется агрегатом 2, а если агрегат 1 к моменту т вышел из строя, то указанная замена не произ- водится. Для каждого т оценить математическое ожидание времени работы описанного дублированного агрегата. Найти оптимальное время замены то и наилучший гарантированный результат. 1.21. На промышленное предприятие ежемесячно посту- пают детали, поставляемые смежными предприятиями. Пред- положим, что вероятность выполнения смежниками поста- вок в каждом месяце постоянна, равна р и неизвестна. Ста- тистик стремится оценить' вероятность р по результату вы- полнения поставок в прошлом месяце. .При этом если ста- тистик приходит к выводу, что вероятность выполнения по- ставок равна х, то величина потери для него составит (х—р)2. Цель статистика — так выбрать xt чтобы величина потери была как можно меньшей. Составить модель опера- ции. Найти оценку эффективности произвольной страте- гии [11]. В следующей задаче используются некоторые понятия и факты, взятые из теории массового обслуживания, с которы- ми можно познакомиться в [10]. 1.22. В новом микрорайоне города решили открыть па- рикмахерскую. После экспериментальных исследований было обнаружено, что моменты прихода посетителей можно охарак- теризовать с помощью простейшего потока с параметром к (т. е. функция распределения промежутка между двумя по- следовательными приходами посетителей равна 1—е~и). Относительно параметра Я, известно лишь, что 2^IA,s^2,2. Время обслуживания посетителей одним парикмахером яв- ляется случайной величиной, имеющей функцию распреде- ления 1—егх. Кроме того, парикмахерскую можно рассмат- ривать как систему массового обслуживания с потерями. Если в парикмахерской работает п мастеров, то вероятность того, что все мастера заняты, равна 18
а среднее число занятых мастеров равно ап=Х(\—Рп(к)). Требуется выбрать число п мастеров в парикмахерской, при котором ап^п/29 a Pn(h) было как можно меньшим. Составить модель операции. Найти оценку эффективности произвольной стратегии. 1,23. Пусть fe£/, где U — класс всех унимодальных функ- ций на [О, 1] (fet/ означает существование такой точки */, что / возрастает на [0, х/\ и убывает на (дг/, 1] или же воз- растает на [0, Xf) и убывает на [xfi 1]). Необходимо, вычис- лив значения функции f в п точках отрезка [0, 1], локализо- вать точку Xf в промежутке наименьшей длины. Если при выборе очередной точки Xi+X известны значения функции / в точках Хи ..., xi9 1=1, ..., п—1, т. е. точки выбираются по- следовательно, то говорит, что для поиска максимума функ- ции / применяются последовательные стратегии. Если же точки x\f ..., хп выбираются одновременно, то говорят, что применяются пассивные стратегии. Описать модель опера- ции. а) Найти оценку эффективности произвольной пассивной стратегии. б) Найти оценку эффективности последовательной страте- гии х: пусть б<1, положим а0 = О, Ь0 = 1, х2 = • 2 xi — ~—t *2ft-l — - 9 X2k — - где a*_i = *2*-3, ^ь-i = &л-2» еСЛИ / (Хм-*) < f (*2Л-2); Я*-1 = Я*-2. &Л-1 = *2Л-2, если ftok-z) > f (*2*-2)> k = 2,..., m; /i = 2m. Описанная стратегия называется дихотомией. в) Найти оценку эффективности последовательной стра- тегии х: положимт = (1 + К5)/2, хг = 1/т2, х2 = 1/т, каж- дую следующую точку надлежит выбирать в промежутке локализации максимума симметрично с уже имеющейся в этом промежутке точкой, т. е. и т. д. хл = 1--^Г. /&)</(*■) Описанная стратегия называется золотым сечением [б]. 19
1.24. Пусть f^L(K); где L(K) — класс всех функций,, удовлетворяющих на отрезке [0, 1] условию Липшица с кон- стантой /С. Для приближенного вычисления интеграла \f(t)dt используется квадратурная формула о 1 §f(t)dt^J(x, у), о где х=(хи ..., хп), У=(Уи ..., Уп), yi=f(Xi), t=l, ..., п. Функ- ция J(xf у) и узлы хи ..., хп выбираются так, чтобы вели- чина I \f(t)dt — J(x% у) I была как можно меньше. Число уз- 'о ' лов п фиксированно. Составить модель операции. Пусть п J(x> У) = У]^1У^ Найти оценки эффективности для квадра- турных формул а) прямоугольников: /i=l, #1 = 72, &i = l; б) трапеций: /г=2, #i = 0, #2=1, kx=k2=xl2\ в) Симпсона: /г=3, ati=0, *2=72, *з=1> *1 = ^з=7б, k2= = 2/з. 1.25. Указать какую-либо информационную функцию, со- ответствующую заданной ниже информации о неконтроли- руемых факторах, которой будет располагать оперирующая сторона к моменту проведения операции. а) Информация о неконтролируемых факторах отсутст- вует. б) Имеется полная информация, т. е. известны значения У И 2. в) Известны четные компоненты вектора y^N<=E2k в сумма всех его нечетных компонент. 1.26. Пусть Afo={l, ..., m}, N={1, ..., /г}, Z=0. Указать какую-либо информационную функцию R(y)f соответствую- щую заданной информационной гипотезе, и определить чис- ло стратегий в множестве MR, если: а) оперирующая сторона к моменту принятия решения знает, четным или нечетным числом является значение неоп- ределенного фактора у. б) оперирующая сторона знает, выполняется ли неравен- ство у^п—4. 1.27. Пусть множество R(NxZ) состоит из k различных элементов и ЛГа={1, ..., т}. Сколько имеется стратегий в множестве MR7 1.28. Как с точки зрения исследователя операций есте- ственно определить понятие эквивалентности информацион- ных функций? 20
1.29. Сколько различных классов эквивалентности инфор- мационных функций существует в случае N={1, ..., л}, Z=0? 1.30. Спелеолог продвигается из точки Сх в точку С2 по пещере, имеющей следующую форму (рис. 3). Здесь Си 1=1, 2, 3 — выходы из пещеры, D — точка раз- ветвления, CiD = 3 км, CiC2=8 км, DC3=2,5 км. В некоторый момент времени to спелеолог повредил себе ногу и, начиная с этого момента его цель сос- тоит в том, чтобы как можно быстрее выйти из пещеры, вы- бирая любой из ее выходов. Предполагается, что спелеолог при желании может измерять расстояние, пройденное по пе- щере. Положение спелеолога в р с з" момент t0 на отрезке [Сь С2] характеризуется расстоянием у, пройденным от Сх. Составить модель операции в следую- щих вариантах информированности спелеолога об у: а) известно, что 3,5^t/^6; б) известно, что 2^t/^4, но спелеолог не помнит, про- ходил ли он точку D. Найти оценку эффективности произвольной стратегии. В задачах 1.31, 1.35, 1.37, где множества М0 и N в опе- рации конечны, стратегия x:N->M0 будет задаваться векто- ром х=(х(\), ..., х(п)). 1.31. Пусть *е=ЛГ0={1, 2, 3, 4}, ye=N={l, 2, 3} и 3 7 —Г (Г(*Л)-| J»"* 4 3 -8, ^ Найти оценки эффективности стратегий хх = (1, 1, 1),. *2=(3, 2, 4) и смешанной стратегии ф= (У2, 7з> 0, 7е), если: а) у — неопределенный фактор; б) у — случайная величина с законом распределения <о = = (2/з, Va, V*). 1.32. F(x, у, z)=x(y+z), х^М0=[— 1, 1]; t/ —стратегия противника, имеющего интересы, противоположные интере- сам оперирующей стороны, y^N=[—1, 1]; z— случайная величина с плотностью распределения р(г) = 1—|г|, zeZ= = [—1, 1]. Найти оценки эффективности стратегий xi:xi(y,z)=yz, х2:х2(У,г)^1 1.*<0,1Г<0Н1Ш1>0.1Г>0, I —1, в других случаях, 2L
«ели: а) противник не знает реализации г; б) противник знает реализацию г. 1.33. F(x, у, z) = \x—у—г|, хеМ0=[0, 1]; # —стратегия противника, имеющего интересы, противоположные интере- сам оперирующей стороны, #eAf=[0, 7а]; z— случайная ве- личина, равномерно распределенная на отрезке Z=[0, 72]. Найти оценку эффективности смешанной стратегии — рав- номерного распределения на отрезке [0, 1], если: а) противник не знает реализации z и выбора х; б) противник знает реализацию zf но не знает выбора х\ в) противник не знает реализации г, но знает выбор х\ г) противник знает выбор х и реализацию z. 1.34. F(xv х2, ух;у2, гг, г2) = Ау1х1г1(у14- х\г§ 4- + 4*/2х2г2 (у2 + г\х% (xv х2) s М0 = [— 1, 1] х [— 1, 1J; Ми У2 — стратегии первого и второго противников, интересы которых неизвестны, — l^y^l, i=l, 2; zu z2 — две незави- симые случайные величины, равномерно распределенные на отрезке [—1, 1]. Найти оценку эффективности стратегии опе- рирующей стороны x:x(zu 22) = (zb 22), если: а) противники не знают реализаций Z\ и 22; б), второй противник знает реализацию z2, но не zu а пер- зый не знает реализаций Z\ и z2; в) второй противник знает реализацию zu но не z2, а пер- вый не знает реализаций Z\ и г2; г) второй противник знает реализации zx и z2, а первый эти реализации не знает; д) второй противник знает реализации zx и г2, а первый знает реализацию z2, но не z\\ е) второй противник знает реализации Z\ и z2, а первый .знает реализацию zif но не z2; ж) оба противника знают реализации zx и z2. 1.35. (1—23 О 0 2 2 7 0 3 2 1 1—12—1 7—205 я, — случайная величина с неопределенностью в законе рас- пределения ©: известно лишь, что: а) ©eQ = |(oeS4|(D3 = (04= —}» б) (oeQ={(D6SJ(o1 + (d2=©8 + ©J; *вЛ*0 = {1,2,3,4,5>, *e=Z = {l,2,3, 4}, 22
В) <D< Г) ©С (0( (01 S4K<-p ' 1,2,3,4 54| CD, + «>/ > —, *=?£/, f, / = 1 5 , 2,3,4), Найти оценки эффективности стратегий Х\ = (2, 5, 2, 5)„ jc2=(1, 2, 3, 1) и смешанной стратегии <р=(7з, 7з, 79, 7э, 7э)* 1.36. Решить задачу 1.32, предполагая, что z — случайная величина с неопределенностью в законе распределения: 1 2 1) со=PxZ-i/2 + Р2Л/2, — < Pi < —; 2) (o = -l/2l + -i-/28> -1<21<га<1; 3) плотность Р(2) = 1.37. 0»-^-<|2|<1'<'>1- Ч 2 (V(*. У)) = | 5 -1 ^5 —2 i М0 = {1, 2, 3}, # = {1,2,3,4,5,6}, 3 4 2 3\ 2 3 2 1 -2 3 4 —Ъ) у— стратегия противника, знающего стратегию оперирующей стороны. Найти оценки эффективности стратегий *i=(l, 2, 2,. 3, 3, 3), Х2=(2, 1, 2, 1, 3, 2), если: а) интересы противника заданы матрицей /2 3 3 4 2 3 (ИМ*. У)) = [ 4 1 2 3 2 3,5 \5 3 —5 2 —1 —2 б) интересы противника заданы матрицей с элементами; Wn(х,у), относительно которых известно лишь, что Wi(x,y)^ <№п(дг, #)<№2(х, у) при всех лгеМо, y<=N, где №i(x, у) — элементы матрицы из п. а), а Wz{x, У) —элементы матрицы- /3 4 4534 \ (WAx, У)) = 5 2 3 43 4,5 I \6 4 —4 3 0 1 / в) интересы противника заданы либо матрицей (Wi(x,y)y из п. а), либо матрицей /О 1 0 1 0 0\ (ИМ*, #)) = ( 1 0 0 0 10); VI 0 1 1 1 1/ 2£
г) интересы противника с вероятностью 7г описываются матрицей (W\(х, у)) и с вероятностью XU — матрицей №ъ(х9у)). 1.38. W(x,y)=-(x-y)\ *e=Af0=[0, 1], y<=N = [Ot 1], у — стратегия противника, знающего стратегию оперирующей стороны. Найти оценки эффективности стратегий Х\:Х\(у) = =У2, х2:х2(у)=тт(1—VУ, 'М, если: а) критерий противника Wn(x, t/)=min(jc, 1—2у)\ б) критерий противника Wn(x, у, a)=fa(\x—y\), где ( t, 0<*<а, fa(t)= I а> «<*<2а, ' ) — * + За, 2а<*<3а, ( 0, За<*<1, а параметр а является неопределенным фактором, относи- тельно которого известно лишь, что Ve^a^'A- 1.39. W(x,y)=x + y, лгеМ0 = [0, 1], t/€=tf = [0, 1], у — стратегия противника, знающего стратегию оперирующей стороны. Относительно критерия эффективности противника Wn(x9 у) известно лишь, что он непрерывен и что х+у^. ^Wu(xt у)^х+у+а при всех хеЛГ0, y^N, где параметр» а>0 известен. Найти оценку эффективности стратегии х в зависимости от а. 1.40. Министерство выпускает п видов продукции и реа- лизует единицу f-ro вида по цене с*, 1 = 1, ..., п. Имеется основ- ной план d0 по стоимости реализованной продукции, а также .договоры с организациями на поставку продукции 1-го вида в количестве du i = 1, ..., л. Министерство ежегодно выпол- няло основной план, но каждый раз недопоставляло продук- цию по договорам. Поэтому решено было относить основной план к разности между стоимостью всей реализованной продукции и стои- мостью всей недоданной продукции по договорам. Записать критерий эффективности. 1.41. Автомобиль собирается из пх деталей 1-го типа, ..., ns деталей 5-го типа. Пусть W{ — количество деталей t-го ти- па, i=l, ..., 5, выпускаемых автомобильной промышленностью. Цель состоит в увеличении производства автомобилей. Запи- сать критерий эффективности. 1.42. Объект состоит из четырех отдельных целей. Для по- ражения объекта необходимо поразить не менее двух целей, в том числе обязательно первую и третью. Пусть для 1=1, 2, 3, 4, 24
*- {S; «7 e ( 1, если /-я цель поражена, * \ 0, если 1-я цель не поражена, если объект поражен, если объект не поражен. Записать критерий W0 как функцию от критериев Wu Щ* Wz, W4, используя только операции взятия максимума и ми- нимума. Предположим, что в операции имеется векторный крите- рий (Wi> i = l, ..., 5), а оперирующая сторона стремится к увеличению значений каждого из частных критериев W{. Часто от векторного критерия переходят к скалярному путем формирования обобщенного (или единого) критерия. Обоб- щенный критерий представляет собой свертку векторного критерия и является функцией вида Wq(Wu ..., Ws). Конкрет- ный вид обобщенного критерия зависит от цели, которую преследует оперирующая сторона по отношению к вектор- ному критерию [8]. 1.43. Пусть *е=М0 = {1,2, 3}, */е# = {1, 2, 3}, /3 8 2\ /12 7^ 0М*,1/))= 8 4 8, ОМ*. У))- 77 7 \3 2 4/ \4 2 3> / 2 8 8N 0М*,#)) = 3 4 10 \10 10 0J Записать обобщенный критерий Wo, если: а) все частные критерии равноправны, а оперирующая сто- рона стремится к увеличению значения хотя бы одного част- ного критерия; б) все частные критерии равноправны, а оперирующая сторона стремится к одновременному увеличению значений всех частных критериев; в) оперирующая сторона стремите» к последовательному дос- тижению частных целей, т. е. для любых *eAf0, j/eJV h iM*. у) = £ 1М*. у). если Wi(x,y)= max Wi(x\y'), f=l,...,A — 1, Wk(x,y)< max Wk(x\ y'). (x\tT)£M.XN 25
1.44. Частный критерий W{> принимает значение 1, если выполнена 1-я частная цель, и значение 0 в противном случае, i=l, ..., s. Записать обобщенный критерий W0, пользуясь только операциями взятия максимума и минимума, если цель оперирующей стороны состоит в следующем: а) выполнена хотя бы одна пара целей с соседними но- мерами; б) для любой пары "целей с соседними номерами выпол- «ена хота бы одна цель из пары; в) выполнены не менее k целей, k^.s\ г) выполнено ровно k целей, k^.s\ д) из любых k целей выполнены не менее т целей, Для решения следующей задачи воспользоваться фактом: линейная функция на многограннике Л евклидова простран- ства Е* достигает своего минимума в некоторой вершине многогранника. Многогранник Л задан системой неравенств ранга s. Метод поиска всех вершин многогранника Л состоит в следующем [26, с. 183—185]: нужно перебрать все подси- стемы ранга 5, содержащие 5 неравенств, и решить соответ- ствующие им системы уравнений; если при этом решение си- стемы уравнений является решением исходной системы нера- венств (принадлежит Л), то это решение является вершиной многогранника Л. 1.45. Экспертная комиссия определяет «важность» крите- риев W\t ..., W8 с помощью неотрицательных весовых коэффи- s диентов Хи ...» ^, для которых V Xt = 1. При этом устанав- ливается, что вектор Х=(Х\, ..., Xs) «должен» принадлежать множеству Л. Предположим, что оперирующая сторона пору- чает исследователю операции выбор ЯеЛ с целью уточнения «критерия У]^И^. В этом случае исследователь операции приравнивает вектор X к неопределенному фактору и находит S обобщенный критерий W0 = inf \\Х^(. Найти вид крите- рия Wo для следующих множеств Л: а) A-ZXIJJ^-l, 0<|1<Х1<Х1<...<>Л, где ц—константа, ji< 1/s; б) A={X|V^=1, 0<Я,,<|1,<1, *=1 si, где \ii9 i = 1,... , s — константы, 26
2и,>1, 5>,<l, /-l,...,r. в) Л = (Х| j]*, = l, 0<Я1<Я2<... <X,<vl, где v — константа, 1/s < v < l/(s— 1); г) Л = {Я|£К, = 1, 0<ц<Я1<Ла — X,<...<\—^,}„ где ц — константа, ji < 2/(s + 1) s. 1.46. На обувной фабрике можно производить три вида обуви: мужскую, женскую и детскую. На каждую пару муж- ской, женской и детской обуви соответственно требуется клея — 20, 20 и 10 г, кожи — 4, 2 и 1 дм2. Стоимость муж- ской, женской и детской обуви с учетом всех работ соответ- ственно равна 20, 30 и 10 р. Запасы клея составляют 3 т, а кожи — 4000 м2. Рассмотреть следующие две операции. В первой операции все имеющиеся ресурсы используются полностью, а во второй последнее требование не является обязательным. В обеих операциях цель состоит в выборе такого производства обуви, при котором стоимость выпущен- ной продукции является максимальной. а) Найти оптимальные стратегии в обеих операциях и сравнить наилучшие результаты. б) Предположим, что детская обувь не выпускается сов- сем. Найти' необходимое и достаточное условие на количества ресурсов, при котором во второй операции оптимальное про- изводство не использует всех ресурсов. 1.47. Имеется п промышленных предприятий, производя* щих разные типы продукции, но использующих ресурс одно- го и того же вида. Если t-e предприятие выпускает продук- цию в количестве Хи то затрата ресурса составляет ]/ аьх{у а прибыль С(Х(— VdiXh где aiy с* dt — положительные константы. Пусть Лг- — количество ресурса, находящегося в- распоряжении t-ro предприятия, а В{ — план по производству продукции. Предположим, что все предприятия объединились с целью выполнения своих планов и получения положитель- ной прибыли путем перераспределения ресурсов1. Найти не- обходимое и достаточное условие, при котором эта цель будег достигнута. Ресурс предполагается бесконечно делимым. 27
1.48. Рассмотрим две операции, в которых критериями яв- ляются количества денег, полученных от производств, исполь- зующих один вид ресурса: т wi(x) = J] W, х = (xv ... ,xm) e=Mo = m = {дс | J] «Л < Л ^>0, *, >0, i = 1>... ,m), *=i я W2 (У) = J] d/У/, У = (У!,... , Уп) e Mo = /-1 я Рассматривается объединенная операция, цель которой состоит в получении возможно большей суммы денег от обо- их производств. При этом предполагается, что между произ- водствами разрешено перераспределение ресурсов, а после выбора х% у и получения W\(x), W2(y) возможна выплата побочного платежа1 при известных х, у, W\(x)9 Wa(y). Со- ставить модель объединенной операции. Найти необходимое и достаточное условие такое, что при оптимальном поведе- нии в объединенной операции сумма денег, полученных в обоих производствах, будет больше, чем аналогичная сумма, когда объединение частных операций не происходит, но х и у в них выбираются оптимальными. В следующих задачах предполагается, что М0 — компакт, W(x) = = (W\(*), /=1, ..., s), х&М0 — векторный критерий, в котором частные критерии Wi(x) непрерывны на М0. Стратегия *eAf0 называется эффек- тивной (или оптимальной по Парето) 2, если для всякой стратегии д/еМо из неравенств Wi(xf)^Wi(x)t i=l, ..., s следуют равенства Wi(xf)~Wt(x)t J—l, ..., s. Говорят, что стратегия хеМ0 доминирует стратегию х'еМ0, если Wi(x)>Wi(xf)t *=1, ..., s. Стратегия, которая не доминируется ни- какой другой стратегией, называется недоминируемой. Положим D = =. {«е£в| найдется *eAf0: W(x)=u) —образ М0 при отображении W:Mq-+E*. Вектор ueD называется эффективным, если найдется эффек- тивная стратегия *eAf0 такая, что W(x)=u. Аналогично определяется иедоминируемый вектор weD. 1 В соответствии с терминологией теории игр оперирующие стороны производств, можно считать игроками, а оперир^Кнцую сторону объеди- ненной операции — коалицией двух игроков. Пусть значения критериев W\(x) и W2(y) являются количествами бесконечно делимого и свободно передаваемого между игроками продукта (например, денег). Тогда под побочным платежом понимается передача части продукта одного игрока другому в количестве, не превышающем max(\Pi(*), W2(y)). 2 Выбор эффективной стратегии х^М0 является рациональным, по- скольку вектор w(x) не улучшаем ни по одной компоненте (при одно- временном неуменьшении других компонент). Аналогичен смысл и рас- сматриваемой ниже недоминируемой стратегии. 28
1.49. а) Всякий эффективный вектор является недомини- руемым. Верно ли обратное утверждение? б) Доказать, что множество эффективных векторов из компакта D не пусто. 1.50. Доказать, что множество всех недоминируемых век- торов из компакта D является компактом. Построить пример компакта D, в котором множество всех эффективных векто- ров не замкнуто. 1.51. Доказать, что множество всех эффективных векто- ров из выпуклого компакта Dei?2 является компактом. 1.52. Построить пример выпуклого компакта Dc:£3, для которого множество всех эффективных векторов не замкнуто. 1.53. В евклидовом пространстве задан целочисленный па- раллелепипед Q={ae£s|O^Wi^0i> щ — целые, i= 1, ..., s}9 где щ, t = l, ..., s — натуральные числа. а) Найти подмножество D множества Q, содержащее наи- большее число векторов, которые попарно не доминируют друг друга. б) Для 5 = 2 и 5=3 найти подмножество D множества Q, содержащее наибольшее число векторов таких, что для лю- бой пары и, u'^D из щ^щ\ i=l, ..., 5 следует щ—и{у t= = 1,...,5. Для вещественных р*>0, А,г^0, р*, t=l, ..., 5 положим Р=(рь ..., ре), *,= (*,!, ..., Я5), Р=(рь ..., ps). Определим для компакта D<^ES множества #i (Р> Р) = {и ^ D | min Pi (щ — pt) = max min p, (u\ — pt)}, KKs w'€D l<«s ^2(P,P)={weD1(p>p)|f;^= max Vd 8 S DS(X) = hie= D | £ %iUt =' max £ a,^;}. Обозначим через Рф) и N(D) множества всех эффектив- ных векторов и, соответственно, всех недоминируемых векто- ров компакта DczEs. 1.54. Показать, что для компакта DcEs найдется вектор ,P°e£s такой, что N(D) = U ' 0i(Р> Р°)> P(D) = (J D2(р, р°). p6int£S p61nt£S "Г Т 1.55. Показать, что для выпуклого компакта DczE3 #(D)= (J D3(X). 29
Будем говорить, что множество эффективных векторов P(D) удовлетворяет условию регулярности в точке u^P(D), есл* найдется константа с(и)>0 такая, что для всех u'^P(D) • S S min (и\ — щ) < — с(и){У и. — £ щ \. Будем говорить, что множество P(D) регулярно, если оно регулярно в каждой точке. Будем говорить, что множество P{D) равномерно регулярно, если константу с в определении регулярности в точке можно выбрать не зависящей от «^ €=Рф). 1.56. Показать, что для выпуклого компакта D условие регулярности в точке u^P(D) равносильно существованию вектора Xeint£+ такого, что weD3(Ji). 1.57. Показать для выпуклого компакта DaEs, что, если множество P(D) замкнуто и регулярно, то P(D) равномерно регулярно. Для s=2 привести пример невыпуклого компак- та D, для которого множество P{D) регулярно, но не равно* мерно регулярно. Возьмем вектор p0e£s такой, что P?<minwt, /=1, ..., s Для е>0 и peint Est определим множество s De (Р) = [и <= D | min р, (щ — $) -'- е V и, = s = max ; min р, (и. — р?) -.- 8V«()). 1.58. Пусть DczEs — компакт, для которого множество P(D) равномерно регулярно. Тогда найдется е>0 такое, что P(D)= (J D8(P). Доказать. P6int£«_ Для компакта DaEs величина ri(D)=maxul — ттщ i=l, ..., s называется i-м размахом множества D. 1.59. Показать, что для выпуклого компакта DczE2 при pi=l/ri(D), t = l, 2 для всякого вектора f$e£2 найдется век- тор weP(D) такой, что D\(p, Р) = {м}. ГЛАВА 2 Оптимальные стратегии в операциях без неопределенных факторов В соответствии с общей моделью операции поиск опти- мальных стратегий в операциях без неопределенных факто- ров сводится к решению экстремальных задач.
Задачи данного раздела иллюстрируют тот факт, что ис- следователь операции должен владеть основными методами решения задач математического программирования, динами- ческого программирования, вариационного исчисления, опти- мального управления и т. д. [3, б, 14—16, 18, 20, 23, 24]. При этом не ставилась цель познакомить читателя со всеми раз- делами и тонкостями соответствующих теорий, поскольку невозможно изложить столь обширный материал в рамках одного задачника. Следует отметить также, что в исследова- нии операций встречается большое число «неклассических» экстремальных задач, требующих от исследователя выдумки и изобретательности при разработке методов их решения. Предлагаемые задачи подбирались с учетом специфики и общей направленности задачника. Для репГения их достаточ- но знания основ теории и методов оптимизации. 2.1. Колхоз предполагает, засеять зерновыми культурами поле S, имеющее форму прямоугольника. В его распоряже- нии имеется X единиц удобрений. Из опыта известно, что внесение x(s) удобрений в точку s^S дает прибавку урожая .a (s) х (s), причем можно вносить не более b(s) единиц удоб- рений. Определить распределение удобрений по площади S,. обес- печивающее наибольший урожай, если урожайность в точке seS без внесения удобрения равна c(s). 2.2. Найти максимум функционала F (*()) = fminfl; a(s)x(s)]ds яри ограничениях x(s)^09 f *(s)ds= 1, где a(s)>0, seS. а) Дать содержательную интерпретацию задачи, анало- гичную задаче 2.1. б) Рассмотреть случай S — [—1, 1], a(s) = k + s2, где '0s$fc<l. 2.3. Доказать «лемму Гиббса». Пусть функции /*(*), хеЕх п Дифференцируемы и х° = (*J, ... , *°) максимизирует J] ft (xt) я яри ограничениях V ** = X, xt > 0. Тогда существует число Я такое, что ftwi w>o. 31
2.4. Пусть некоторый объект находится в одном из п ящи- ков с вероятностями рь ..., рп. Если оперирующая сторона затрачивает Х{ единиц времени на поиск объекта в i-u ящи- ке, то в этом случае вероятность обнаружения объекта равна 1 — е"*Л (если, конечно, объект находится в данном ящике). Время поиска ограничено величиной X. Определить времена поиска в каждом из ящиков, обеспечивающие наибольшую вероятность обнаружения объекта [12]. (Указание: исполь- зовать лемму Гиббса.) 2.5. Имеется технологический процесс, производящий не* который продукт. Функционирование процесса на отрезке времени [О, Т] описывается уравнением *(*) = [<ш(0-Р]*(0> *(0) = а, где x(t)—количество продукта в момент t\ а — начальный запас в момент *=0; u(t), 0^u(t)^l — часть продукта, вновь направляемая в производство в момент t\ а, р —про- изводственные коэффициенты. Целью оперирующей стороны является максимальное накопление продукта за период [О, Г]. Найти оптимальную стратегию. 2.6. Минимизировать F(x(.),u(.)) = $x4t)dt при ограничениях x(t) = u(t), х(0) = 1, \u(t) |< 1. 2.7. Решить задачу о быстрейшем попадании траектории системы ( Ht)=-y2(t)-t-u*(t), \y(t)=u(t) с управлением u(t), \u(t)\^.l из точки *=0, у=0 на мно- жество Q={(x, у) |*=1}. 2.8. Имеется начальное количество средств /Со, которое нужно распределять в течение m лет между двумя отраслями производства 1 и 2. Средства, вложенные в i'-ю отрасль при- носят доход fi(x), однако уменьшаются при этом до gi(x)<x. По истечении года оставшиеся от Ко средства заново распре- деляются между отраслями. Новых средств извне не посту- пает, и в производство вкладываются все оставшиеся^ на- личии средства; доход не вкладывается, а накапливается отдельно. Требуется найти способ управления ресурсами, при кото- ром суммарный доход от обеих отраслей за m лет будет мак- симальным. 32
Решить задачу в случаях: а) К0 = Ю; т = 5; /х (х) = х*; gl (х) = 0,75х; /2 (х) = 2л:2; ^2(х) = 0,3^; б) К0 = 2; т = 5; /х (дг) = 1—е-^; £!<*) = 0,75*; М*) = 2.9. Известно, что промышленность может выпускать п различных видов станков. Пусть bh, Л—1, ..., п — потребно- сти по каждому из этих видов. Станок типа k может выпол- нять работу станка типа k+l и всех последующих типов. Задана функция стоимости /л(т) изготовления т станков типа k. Требуется определить, какие типы станков и в каких ко- личествах необходимо выпускать, чтобы удовлетворить за- данные потребности при наименьшей сумме затрат на про- изводство. а) Решить задачу при я=4, bk=k9 М*) = Ял*0»85, ai = 1900, a2=1700, a3=1300, a4=1100. б) Каково решение задачи, когда функции стоимости fh(x) =анх линейны? 2.10. Предприятие выпускает консервы — овощной суп с цыплятами — в течение всего овощного сезона. Договор на поставку цыплят заключается перед началом сезона. Цена цып- ленка зависит от размера покупаемой партии, которая есть чи- сло, кратное 100. Если цыплята не используются в ту же не- делю, когда они доставлены, их следует хранить в холодиль- нике, который арендуется предприятием. Требуется опреде- лить количество цыплят, которое следует покупать каждую неделю, чтобы минимизировать суммарные затраты на цып- лят и хранение при условии, что недельная потребность в цыплятах составляет 300 штук, период работы длится 5 не- дель, а цены и затраты приведены ниже. (Замечание: в первую неделю предприятие закупает не менее 600 цыплят.) Количество цыплят (в сотнях шт) 1 2 3 4 5 6 7 8 9 Цена 150 280 410 540 660 780 890 1000 1100 Запас (в сотнях шт.) 1 2 3 4 5 6 Цена за хранение 10 20 30 50 70 100 2.11. Две фабрики производят продукцию из сырья трех типов. Запасы сырья для годового производства составляют 33
соответственно 11,7 и 10 единиц. Первая фабрика для изго- товления условной единицы продукции, цена которой равна 1„ потребляет сырья указанных типов 2,1 и 2 единицы соответ^ ственно. Для второй фабрики цена продукции равна 2, а удельные потребности в сырье составляют 4,3 и 1 единицы. В прошедшем году плановое задание первой фабрики рав- нялось 3, а второй — 1 единице продукции. Требуется опре- делить задание на предстоящий год, которое обеспечивало бы максимальную суммарную стоимость продукции фабрик и при этом требовало бы минимальных затрат на перестрой- л ку производства. Стоимость перестройки задается функцией F(*i, *) = 6К*х - З)2 + (*2 - I)2], где (х\, х%) —плановые задания фабрик. 2.12. Решить графически задачу линейного программиро- вания: г = 0,5*! + 2*2 -ыгах \ 2*х + *2 > 6, 0,5*! — *2 > — 4, *а > 1. 2.13. Переходя к двойственной задаче, найти минимум функции г = хг + х2 + 2х3 + 8*4 при ограничениях I Z*^ — *2 -\~ оХ$ — Z>X^ == О, | — хг + 3*2 — 4*3 + 4*4 = 1» l*t. >0, i=TJ. 2.14. Покупатель имеет бюджет / и может купить товары трех видов по цене ри р2, рг за единицу. Его функция полез- ности [22] есть где а, Ь, с>0; *ь *2, *з — количество товаров, которые он покупает. Определить, какое количество товара каждого вида при- обретает покупатель. 2.15. Рассмотреть возможность применения метода мно- жителей Лагранжа для решения задачи z=*1+*2-wnax при *2+*2=0. 2.16. Решить графически задачу нелинейного программи- рования с целевой функцией z = ю (Xl — 3,5)2 + 20 (*2 - 4)2 -*min и теми же ограничениями, что и в задаче 2.12. 34
2.17. Найти все локальные максимумы функции z = 25(*1 — 2)2 + (*2 — 2)а на множестве *1+*2^2, хг — Хъ^ — 2, *1 + *2 < 6, хг — Зх2< 2, *lf *а > 0. 2.18. Решить задачу z=0,25*1 ЧгДГг-нпах хх + 0,3х2< 1,5; хг, х2 >0 0,5*! + jc2 < 1,75; xlt х2 — целые. Решить ту же задачу как задачу линейного программи- рования с последующим округлением результатов до бли- жайших целых, удовлетворяющих ограничениям. 2.19. Найти а) min {г = 4 (хг — 6)а + 6 (ь — 2)*}, 0,5 хг + х2 < 4; Зхг + х2 < 15; *i + ъ> 1; xvx2^0\ б) max {г = 3*! + 2xt}9 (хг — 2)* + (х2— 1)а<9; дгх, л-2^0; в) max {г = 8л£ + 24}» Ы+4<9; ( #i<^2; х1э х2^\\ г) max {2 = 4хх + З^а}, | 2^— х2>0; 0,5^—а:2<0; 1 *i + х2 < 5; xt ^ 0, л;, ~ целые; 1=1,2; д) то же, что и в г), только хх — целое, #2 — действитель- ное. 2.20. Деталь машины производится на токарном станке в механической мастерской. Диаметр выпускаемой детали есть случайная величина х, распределенная по нормальному закону с дисперсией а2 и математическим ожиданием а1. Предполагается, что а не зависит от режима работы стан- ка, задаваемого величиной а. Диаметр детали х не должен выходить из допустимого интервала. Если х<Х\> деталь должна быть выброшена. Если х>х2, деталь может быть продана для вторичной обработки в другую мастерскую за 1 Вероятность событий {х^0} и {х^т} для некоторого известного т принимается равной нулю.
цену р\. Деталь, пропущенная контролером, продается по цене р>р\. Суммарная стоимость обработки каждой заго* товки равна k. Требуется определить значение а, при котором прибыли мастерской достигает максимума. 2.21. Информация о проекте задана перечнем работ, их! продолжительностями и последовательностью выполнения: Работа 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Каким работам предшествует 11, 15 1, 13 9, 14 10 — 3, 4 8, 2 11, 15 5 — 5 1, 13 9, 14 10 9, 14 Продолжительность 15 5 5 10 5 30 10 20 10 20 10 20 10 10 5 а) Построить сетевой график проекта и пронумеровать его. б) Использовать алгоритм Форда [18], определить мини- мальные времена наступления событий Tf\ T*)l) ; /=1, ..., 8 критическое время проекта Т и критический путь [18]. 2.22. Строительство гидроэнергетического комплекса со- стоит из следующих работ: а — строительство дорог; Ь — подготовка карьеров к эксплуатации, закладка фун- дамента; с — строительство поселка; d — заказ оборудования; е — строительство завода; f — строительство плотины, дамбы и водосброса; g — строительство галереи и подводящих трубопроводов; h — соединение завода и трубопроводов; i — предварительные испытания. Сетевой график проекта имеет следующий вид (рис. 4). Каждая работа может быть выполнена в нормальном ритме (нормальный план) и может быть ускорена до неко- торой минимальной продолжительности (срочный план), при этом ее стоимость, естественно, возрастает. Продолжитель- 36
ности и стоимости всех работ приведены ниже (единицы из-» мерения — месяц и млн. р.): Операции а Ь с d е f 1 i Нормальный план продолжи- тельность 4 6 4 12 10 24 1 7 10 3 стоимость 5 11 3 150 10 147 18 4 2 Срочный план продолжи- тельность 2 5 2 9 8 19 6 7 2 стоимость 15 30 11 180 20 212 30 25 5 • Стоимость ускорения ва месяц 5 19 4 10 5 13 12 7 3 Найти критическое время проекта и указать сповоб сокра- щения критического времени проекта на 9 месяцев при мини- мальном увеличении стоимости [18]. Рис. 4 2.23. В приемной в ожидании личной встречи с директо- ром собралось п посетителей. Предварительный опрос позво- лил выяснить, что рассмотрению вопроса i-го посетителя ди- ректор должен уделить время 7Y, t=l, ..., п. Директор, зная, что хотя общее (суммарное) время, которое он уделит всем п посетителям, одно и то же, Г= 2 Г< (независимо от очеред- 37
ности их приема), хотел бы так организовать прием, чтобы посетители находились в приемной в целом как можно меньт ше. Какова должна быть очередность приема? [27]. 2.24. Требуется за минимальное время закончить обработ- ку п деталей. Каждая деталь i обрабатывается сначала на первом станке (первая операция), длительность обработки a,iy затем на-втором станке (вторая операция), длительность, обработки Ь{. Вторая операция не может начать выполнять- ся, пока не закончилась предыдущая, а также пока станок еще занят выполнением предыдущей операции [27]. Решить задачу со следующими исходными данными: i at bi l 3 1 2 2 4 з 4 3 4 1 2 _i_ 4 2 в 2 5 2.25. На заводе предстоит решить, какое количество Х\ чистой стали и какое количество лг2 металлолома следует ис- пользовать для приготовления (из соответствующего сплава) литья для одного из своих заказчиков. Пусть производствен- ные затраты на 1 т стали составляют 3 условных единицыг а затраты на 1 т металлолома 5 условных единиц (последняя цифра больше предыдущей, так как использование металло- лома связано с его предварительной очисткой). Заказ преду- сматривает поставку не менее 5 т литья; при этом заказчик готов купить и болыцее количество литья, если завод поста- вит перед ним такие условия. Предположим, что предназна- ченные для литья запасы чистой стали составляют 4 т, а металлолома — 6 т. Отношение веса металлолома к весу чи- стой стали в сплаве не должно превышать 7/в. Производ- ственно-технологические условия таковы, что на процессы плавки и литья не может быть отведено более 18 ч, при этом н* 1 т стали уходит от 2,5 до 3 ч, а на 1 т металлолома — от 1,5 до 2 ч. Цель завода — выполнить зак.аз с минималь- ными производственными затратами, выраженными в услов- ных единицах. Составить модель операции, при этом считать, что критерий принимает значение —оо, если не выполнены ограничения задачи. Указать необходимые и достаточные условия на х\9 х2, при которых оперирующая сторона —за- вод— может быть уверена, что ограничения задачи будут выполнены [4]. 2.26. Полицейская служба имеет следующие минимальные потребности в количестве полицейских в различное время суток: 38
Время суток. часы 2- 6 6-10 10—14 14-18 18-22 22— 2 Порядковый номер периода 1 2 3 4 5 6 Минимальное число по- лицейских, требуемое в указанный период 20 50 80 100 40 30 При этом нужно иметь в виду, что период 1 следует сразу же за периодом 6. Каждый полицейский ежедневно приступает к работе в начале определенного периода и работает восемь часов без перерыва. Требуется составить служебное расписание на каждые сутки таким образом, чтобы обойтись минимальным числом полицейских, но не нарушая сформулированных выше требований [4]. 2.27. Фирма, занимающаяся обработкой древесины, еже- месячно перерабатывает 10 т имеющегося в наличии леса, производя пиломатериалы и фанеру. К концу месяца из 1 т леса производится 3 кубометра пиломатериалов или 5 тысяч листов фанеры. Один кубометр пиломатериалов дает суммар- ную прибыль с\9 а тысяча листов фанеры — с2\ кроме того, фирма получает прибыль с3=3 за каждую тонну реализован- ного на рынке неиспользованного леса. Величины^!, с2 явля- ются случайными с математическим ожиданием Ci = 10, с2= = 15. Обозначим через D\ максимальное количество пилома- териалов, а через D2— максимальное количество фанеры, которые фирма может продать к концу месяца. Случайные величины Du i=l, 2, имеют следующее распределение: Р[Д. = 1] = 0, 2; Р[Д = 3] = 0, 4; Р[Д = 8] = 0, 3; Р[Д = 10] = 0, 1; i= 1,2. Президент фирмы ставит условием, чтобы все выпускаемые фирмой продукты были полностью реализованы с вероятно- стью, не меньше 0,8. Определить количества леса, предназна- ченные для получения пиломатериалов и фанеры, которые максимизируют ожидаемую прибыль [4]. п 2.28. Доказать, что величина Х\ afif достигает макси- мума, если выбирать t=/, где последовательности {аг} и {Ь,} заданы и удовлетворяют условиям а\>а2>... >ап>0; Ь\>Ь2> ... >6П>0. (Замечание: в указанную сумму каждое значение из последовательностей {а*} и {bj} входит только один раз [24].) 39
2.29. Требуется проехать в автомобиле 1000 км по дороге в пустыне с минимальным расходом уоплива. Бак автомоби- ля может вместить самое большее 500 единиц топлива. Рас- ход топлива составляет одну единицу на километр. Автомо- билист должен сам постепенно устраивать промежуточные склады, используя топливо из собственного бака. Определить расположение складов на пути, при котором минимизируется расход топлива на все путешествие, число рейсов между каждой парой складов и минимальное количество топлива, которое ему надо взять со старта [24]. 2.30. Необходимое и достаточное условие того, что вектор с неотрицательными целочисленными компонентами х=(х\,.„ ..., хп) минимизирует выражение /=•1 где <pj — выпуклые функции, при ограничении п где /л>0 — целое число, состоит в том, что min [ф/(*, + 1) — ф. (*,)] > max [фу (*,) — ф, (*, — 1)], / = {1, ... ,/2}, /+(х)=={/е/| *,><)}. Доказать (критерий Гросса [24]). 2.31. Для уничтожения п вражеских целей имеется т еди- ниц оружия. Каждой /-й цели приписана стоимость Wjy а ве- роятность поражения цели при использовании одной единицы оружия равна q$\ /=1, ..., п. Вероятность выживания /-й цели в ходе атаки ее х^О единицами оружия равнар/> =(1 —Qj)x'. Распределить оружие по целям так, чтобы минимизировать стоимость сохранившихся целей. 2.32. Показать, что положительные целые числа хи ..., хп п п максимизируют J~{ х\ при ограничении V xt = С тогда и ы 1=1 только тогда, когда дг<=1, 2 или 3; i=l, п [24]. Здесь С — положительное целое число, а п не фиксировано. 2.33. а) Найти максимум z = 8xi + 5x2+xz при ограничении 3jci + 2jc2+a:3<13, х^0 — целые числа; /=1, 2, 3. б) Найти лексикографический максимум вектор-функции F(x) = (лгь лг2, Хг) при тех же ограничениях. 2.34. Найти максимум 2*i+7x2+3x3 + *4 ПРИ ограничении 6jci + Злг2+2лг3+лг4-^2, х^0 — целые. 40
ГЛАВА 3 Задачи на минимакс и седловые точки При решении задач этой главы окажутся полезными сле- дующие сведения. 1°. Функция f(x), х^Еп назвается дифференцируемой в точке х0 по направлению g^En, ||g|| = l, если существует ко- нечный предел lim f(xo + ag)-f(x0) а-»о+ а Этот предел называется, производной функции f(x) в точ- ке Хп по направлению g и обозначается —Li£2L# % dg Пусть задана функция F(x, у), х^Х, #еУ, где X — от- крытое множество в Еп9 а У — компакт. Если F(x, у), ——F(x9 у) непрерывны по совокупности переменных в XXY, то функция f(x) = minF(x,y) (3.1) имеет в каждой точке х^Х производную -по любому направ- лению ge£n, ||g|| = l, причем [12, 13]: -^г-= "й\ i^rFix']y)' g)> (3-2) Og У£Я(Х) \ OX J где R(x) = {yz=Y\F(x,y)=f(x)}. 2°. Чтобы функция (3.1) достигала максимального на Еп значения в точке х° необходимо, а в случае вогнутости f(x) на Еп и достаточно, чтобы max WL<0, или, что то же самое max min (-2--F(jfl9 у), g) <0. (3.3) Точки, удовлетворяющие необходимым условиям максимина (3.3), называются стационарными. 3°. Функция f(x), определенная на множестве X метриче- ского пространства, называется полунепрерывной снизу в точке Хо^Х, если для любой последовательности точек хп^Х9 сходящейся к лсо, выполнено неравенство /(*•) < Не /(*л). 41
f(x) называется полунепрерывной сверху, если функция —f(x) полунепрерывна снизу. Если f(x) в точке х0^Х полу- непрерывна сверху и снизу, то f(x) непрерывна в х0. 4°. Пусть F: X-+2Y — многозначное отображение, ставя- щее в соответствие каждому jce! некоторое подмножество F(x) компакта У метрического пространства. Отображение F(x) называется полунепрерывным сверху в точке х0^Х, если из того, что хп-+х0, хп^Х, уп-+Уо> Уп^ ^F(xn) следует, что y0^F(x0). F(x) называется полунепрерывным снизу, если из того, что хп-+х0, yo^F(xo), вытекает существование последователь- ности yn^F(xn) такой, что уп-*Уо- Полунепрерывное сверху и снизу в точке х0^Х отображе- ние F(x) называется непрерывным. Задачи 3.1—3.30 посвящены изучению свойств операций взятия максимума и минимума. 3.1. Пусть F{(x), F2(x) непрерывные на компакте X функ- ции. Доказать неравенства: а) max [F1 (х) — F2 (*)] ^ max ^i (*) т max ^2 (*)> xsx xsx хех min [Fx (a:) -f F2 (*)] ^ ™n F1 (x) 4- min F2 (x); xex • ixex x^x б) max \F1 (x) + F2 (x)] > max Fx (x) - max F2 (дс), JCgX X£X X£N где N = {x<=X\Fi (x) = max Fx (2)}; Z£X min [Fx (x) + F2 (x)] < min Fx (x) ' min F2(a:), x^x xex x^M где M = {x ^ X I Fx (x) = min Fj (г)}; 26 x в) | max Fj (jc) — max F2 (x) | < max | Fj (a*) — F2 (x) |, x^X x£X x^X I min F2 (jc) — min F2 (x) | < max | Fx (x) — F2 (x) |. xex xex' xex 3.2. Для произвольных функций F;(x), Фг(х), l^i^m доказать неравенство | inf max Ft (x) — inf max Ф, (л:) | < sup max (F{ (x) — Ф< (л) |. xeX l<t<m [x£X l<t<m x£X l^t<m 3.3. Доказать, что при X = \J Xa sup F(x) =sup sup F(,v); inf F(x) = inf inf F(x). x£X <*£AxeXa x£X <x£A x£Xa 42
3.4. Доказать, что если F(x> у) непрерывная на произве- дении компактов X, Y функция, то функция минимума /(*) — s= minF(x, у) также непрерывна на X. 3.5. Пусть F(x, у) непрерывна на произведении XxY и при любом JceX существует лишь одна реализация у(х) максимума maxf(x, y)=F(x, д(х)). Доказать непрерывность у(х). 3.6. EijiCTb g(xy у) непрерывна на произведении компак- тов X, У. Доказать, что отображение N(x)-{yeY-\g(x,y)>0}9 (3.4) которое непусто для всех х^Х, будет полунепрерывным свер- ху на X. 3.7. В условиях задачи 3.6 доказать, что функция /(*)= inf Р(х9у) (3.5) полунепрерывна снизу на X, если F непрерывна на XxY. 3.8. Пусть для функции (3.5) из задачи 3.7 существует точка Хо&Х, такая, что f(x0) = supf(x). Доказать непрерывность f(x) в точке х0. 3.9. Пусть функция g(x, у) непрерывна на произведении метрических компактов X, Y\ множества №(x)={y<=Y\g(x,y)>0} не пусты при всех х^Х и замыкание №(х) совпадает с мно- жеством (3.4). а) Показать, что многозначное отображение (3.4) полу- непрерывно снизу на X. б) Показать, что N(x) непрерывно на X в метрике Хаус- дорфа р(Л, В) = max {sup inf р(дс, у); sup inf р(х, у)}, Х£А у£В уев х£А где Л, В — множества метрического пространства с метри- кой р. Когда из р(Л, В)=0 следует А = 5? в) Совпадает ли №(х) с внутренностью intN(x) множе- ства (3.4) в условиях задачи? Верно ли равенство N°(x)=intN(x) в общем случае? 3.10. Доказать, что в условиях задачи 3.9 функция (3.5) непрерывна, если ^(а:, у) непрерывна на XxY. 43
Построить пример разрывной функции (3.5) при непре- рывных F, g. 3.11. Пусть /<*(*)» аеЛ — выпуклые на выпуклом множе- стве X функции. Доказать, что ф(я)= sup/a(x)— выпуклая <А£А функция. 3.12. Доказать, что максимум выпуклой функции на мно- гограннике достигается в одной из крайних точек. 3.13. Если f(t)—вогнутая функция и У— выпуклое мно- жество, то ср(х) = sup/(x+yj также вогнута. Доказать. 3.14. Пусть функции F(xt у), g(xy у) вогнуты по совокуп- ности переменных на XXY; X, У— выпуклые множества. До- казать, что функция ср(*)= sup F(x, у), где N(x) определяется формулой (3.4), вогнута. 3.15. Пусть F(x, у), F(x, у) непрерывны на EnxYt ох где У— компакт, и g, gu g2 — направления в Еп, для кото* рых g-=ag-i + p^2; a, р>0. Доказать, что производные по направлениям функции ми- нимума (3.1) обладают свойством: rdf(x) >а df(x) р df(x) dg dgx dg2 3.16. Пусть F(x, у)<=С2, -^-F{x,y)^a>0 на En x E1. dy2 Доказать, что функция f(x) = inf F(xt у) непрерывно дифферен- yeE1 цируема и где f(x) = F(x,y(x)). 3.17. Пусть F(x, у) достаточно гладкая на EnxY функ- ция, У —компакт. а) Будет ли функция (3.1) дифференцируемой? б) Будет ли функция (3.1) дифференцируемой, ^сли ми- нимум m'mF(x, у) достигается в единственной точке при yeY любом х? 3.18. Вычислить производную функции f(x) в точке х0 па направлению g, если: а) f(x) = max (дс, 1 — х)\ х0 = у; g = 1; б) /(х) = min(л:2, х + 1, 1 — х); — оо< *<оо; л = 1; ^2 = —1; 44
где в) /(*) = min(*8, <р(*)), х0 = 0, g = 1, е~1"\ хфЪ, 10, х = 0; г) /(*) = min min(x — \x\y, —ху); ж0==0; g = — 1); д) /(*) = min min (|лс|-*j/, — 2*#2); ж0 = 0; £=1; —к»<1 е) /(*1. **) = min (Xlsinyj+д^siny2), x° = (-±-, -Ц, УьУг>0 \ 2 2 / »«+й=.Я/2 ft-(1.0),ft-(0fl).'ft-(^i7^); ж) /(*i> х2) = тт(\пхг — х2, tg*x*2), jc° = (1, 1), «-(-1.2); з) / (xl9 *2> *з) = min (x? + 4 + *з; 2jc? — 3x2; e~** + 2*8; cos nx\ + x2 + 10x1), x° = (2, — 2,1), g = (-3,2,-l). 3.19. Пусть F(xfy), F(x,y) непрерывны на прямом дх произведении Еп и компакта У, причем max min F(x, у) = min F(x°, у). lxeEn vgy yeY Доказать эквивалентность (3.3) и следующего необходи- мого условия для точки х°: 0б1(Д (3.6) где 1(д^-со {z--^-F(^fy)|ye!?(*•)}. 3.20. Сформулировать необходимые условия для точки х°, реализующей max mmF(x, #) = minF(*°, у) на выпуклом замкнутом множестве Хс£п, где F удовлетворяет условиям задачи 3.19. ч 3.21. Доказать неравенство sup inf F(x, у) < inf sup F(x, у). xex yev yeYxex 3.22. Пусть *(*.*)-ф(*) + *00; Y(x) = {y\g(*>y)>o}> X = {x\Y(x)^0}t X{y) = {x\g(x9y)^0}t У = {у\Х{у)Ф0). 45
Доказать неравенство: sup inf F(x, (/) > inf sup F(xy y). xGX */€>(*) y£Y x£X(y) 3.23. Доказать следующие утверждения о перестановоч- ности операций взятия максимума, минимума и предельного перехода. а) Если последовательность {fn(x)} сходится на X к функ- ции /о(#), монотонно неубывая, то lim sup/„(*) = sup/0(*). л-»оо х£Х х£Х б) Если дополнительно X — компакт, а fn(x) полунепре- рывны снизу на X, то lim min fn(x) = min/0(jc). n-*oo x£X x£X Показать, что одной монотонности здесь недостаточно. 3.24. Доказать, что класс функций на метрическом ком- пакте X, определяемый по формулам (3.4), (3.5) всевозмож- ными непрерывными функциями F, g, совпадает с классом ограниченных полунепрерывных снизу функций. 3.25. Пусть А={х<=Х\<р(х)^0}, B={ye=Y\^(y)^0}. Доказать, что sup inf F(x, у) = sup inf inf sup^f(jc, у, ц, X), x£A y£B x^X y£Y pQ?0 X<0 inf sup F(x, y) = inf sup sup inf <£ (x> y, ц, K) y£B x£A y£Y x£X КО Ц^О для любых функций F, ф, г|э, если Л, В не пусты. Здесь X (х, у, Ц Д) = F (*, у) -f ЦФ (х) + Ц (у). 3.26. Доказать, что если sup inf .#(*, у, ц, X) = inf sup «#(*, t/, |i, X), *€* ySY y£Y XGX h<0 jli^O H>0 A<0 TO и sup inf F{x, y) = inf sup F(x, y). x£A \y£B yeB x£A 3.27. Пусть F(x, y), i|?(f/), непрерывны на произведении метрических компактов X, Y. Показать, что max min F (х, у) = Jim max min {F{x, у) -V С [min (0, ty(y))]2} х£Х уев с-*» xex ye\ (метод штрафных функций). 3.28. Пусть г|)(у) — вогнутая дифференцируемая функция на выпуклом множестве Y. а) Доказать выпуклость штрафной функции /,(*/)= min(0; i|>(y))|« 46
при q^\ и ее дифференцируемость при q>\. б) Вычислить производную Jq (у). 3.29. Обосновать метод «невязок». Пусть F (х, у) непрерыв- на на прямом произведении компакта X и куба У евклидова пространства. Введем функцию J (х, и) = j [min (0; F (х, у) — и)]2 dy. у Тогда максимальное значение и=й, для которого min/(jc, и) = 0, дгбХ равно величине максимина max min F(x, у). При этом точ- *ех уеу ка х°, реализующая min 7(дс, й), является оптимальной стра- хе х тегией в задаче поиска максимина max min F (дс, у) [91. 3.30. Доказать, что любая предельная точка последова- тельности {х0(Сп) |Сп->оо}, реализующей тах{М*)+С,Л(*)} х£Х при непрерывных на компакте X функциях /i, /г является точкой лексикографического максимума вектор-функции F(x) = (fi(x)> Ы*))> т. е. реализует максимум /i(a:) на мно- жестве, где достигается максимум по х^Х функции Ы*)- В следующих задачах требуется каким-либо способом найти макси- мины, минимаксы, седловые точки и оптимальные стратегии. 3.31. Вычислить max min F(x, у) и min max F(x9 у), если: * у у х щ а) F(x9 у)=(х—у)\ 0<х,у<\\ б) F(x, у) = (х-у)2~0,5х2, — 1<х<1, -0,5<#<0,5; в) F(x9 у) = -[х-у(1-у2)]\ — К*, у<1; г) F(x9 y)=xcosy — sin*, я<дс<2я, у<#<-£-- 3.32. Пусть F(x, у) = (1+^)(1+^, а, Ь, с>0. (1 + сху)* Указать условия на коэффициенты а, 6, с, при которых стационарные точки максимина max min F(x, у) лежат х 0<У<1 в интервале (0, 1). 3.33. Найти значение дсе[я/4, я/2], реализующее min max [у* — 2y2sin2x — 2(1+ cosх)*]. «/4<х<я/2 M<l+cos* 47
3.34. Оперирующая сторона производит стрельбу по цели, находящейся на отрезке [0, 1]. Если х — координата точки прицеливания, у—координата цели, то вероятность ее пора- жения равна е-Кх-у)гл в распоряжении оперирующей стороны имеется два выстрела, причем результат первого выстрела не становится известным перед вторым. Цель неподвижна, а ее положение — неопределенный фактор. Определить оптимальную стратегию стрельбы в том слу- чае, когда критерием эффективности служит математическое ожидание числа попаданий в цель. 3.35. В условиях задачи 1.10 найти оптимальную страте- гию расположения пожарных частей и наилучший гаранти- рованный результат. 3.36. Найти оптимальную стратегию размещения сторо- жевой вышки в предположениях а), б), в) задачи 1.5. 3.37. Пусть в кооперативной игре N лиц [22] характери- стическая функция v супер аддитивна, т. е. для любых коали- ций Sb S2 игроков, таких, что Sb S2cz/={1, ..., N}, SiOS2= = 0, справедливо неравенство t4Si) + 0(S2)<t4SiUS2). Введем функцию e(S, z)=c;(S)— 2 z* — эксцесс коалиции 5, которая служит мерой того, насколько дележ z из множе- ства дележей n Z = [г = (гг, ...9zN)\zt>v({0), £ zt = v(I)) выгоден коалиции 5. Игрокам сообщается, что дележ z будет назначаться так, чтобы минимизировать максимальный эксцесс max e(S, z). sczi Показать, что при таком принципе «справедливого» деле- жа игроки образуют коалиции с одинаковым эксцессом. 3.38. Найти min max F(x(*)9 #(•)) функционала F(X(.),y{.))=^min[l,^)]ds; b, c>0 s при ограничениях tx(s)ds = fy(s)ds= 1; x(s), y(s) > 0; s s se=S. 3.39. Пусть x(s) и у(s), seS — плотности распределения ресурсов нападения и защиты в области S; w — эффектив- ность воздействия защиты на нападение; р — эффективность воздействия нападения на защищаемую область. Цель обо- роны: найти распределение средств защиты, реализующее 48
mhi max f f(x(s), y{s))dst где f(x, t/)=min[l; pmax(0; x—wy)] — плотность ущерба, причиняемого нападением защищаемой области; w, р — кон- станты; Jx(s)ds = §y(s)ds = 1, • *(s), y(s)^Q, s^S. 3.40. Пусть функции fi(t) непрерывны и возрастают на отрезке [0, В], В>0, fn(0) =М0), 1<*<w— 1. Рассмотрим множество п М0 = {х = (хг,..., xn)\J^gt(xi)^A>09 0<*,<Я, * = 1,л}, задаваемое непрерывными возрастающими на [0, В] функ- циями gi(t), такими, что £л(0)<Д ft(B)>4 *• = !,..., п. Доказать, что в операции с критерием W (х) = min ft (хс), х<=М0 оптимальная стратегия х° удовлетворяет системе уравнений fn (хп) = ft (*?)> 1 < i < п — 1 (принцип уравнивания). 3.41. Пусть С — конфигурация из пяти точек Ри 1=1» ...,5, расположенных в замкнутой области D. Показать, что 2-1/2, если D — единичный квадрат; —, если D — единичный равносторонний треугольник; 2sin—, если D — единичный круг; 5 —, если D — поверхность единичной сферы, где р(Р{, Pj) —расстояние от Р{ до Pj [24]. 3.42. Пусть в условиях задач 1.6, 1.7 функции меткости дуэлянтов одинаковы и заданы непрерывной возрастающей функцией Р(-), причем P(d) = l, P(D)=0. Найти наилуч- шие гарантированные результаты для первого дуэлянта в за- дачах 1.6, 1.7. 3.43. В'условии задачи 1.21 найти оптимальную страте- гию статистика и наилучший гарантированный результат. 49 max minp(Pt-, Pi) = с т
Тройку <ро» <7о» и> назовем решением матричной игры с матрицей Л= (ац)тхп, если р0» Qo — оптимальные стратегии соответственно перво- го и второго игроков, V — значение игры [8, 15, 19, 22]. 3.44. Показать, что матричная игра с матрицей А =• = (tffj)-mxn имеет решение в чистых стратегиях и найти та* кое решение, если а) ац = { — п б) au = f(i) + g{J)\ /а Ь, в) А = I с ~ J; а, Ъ, с, d — произвольные числа; \с Ь/ (а е а е а е а е\ Ь f b f f b f b }; Д> b,c,e,f,g — произвольные числа; cggccggcj д) at/ = a* ; , аг, by — произвольные числа; ct + df Ci, dj — положительные числа; е) m = n и для любых i, j, k: 1 < t\ /, Л < n имеет места тождество at7 -j- aM + % = 0. 3.45. Показать, что если каждая подматрица размером 2Х-2 матрицы А имеет седловую точку, то матрица А также имеет седловую точку. 3.46. Найти вероятность того, что игра с матрицей (ciij)mxn имеет седловую точку, если а^ — независимые слу- чайные величины, имеющие одну и ту же плотность распре- деления. 3.47. Найти хотя бы одно решение матричной игры с мат- рицей А=(а{])тхп, если: 1 0, i = /; б) т = п, каждая строка и каждый столбец матрицы А содержат все целые числа от /г+1 до k+m\ 1 4 в) А-. д) А 4 2 3—1 — 4 0—2 2 (0 0 0 0 0 0 4 2 0 2 11 4 3 1 3 2 2 4 3 7—512 4 3 4—122 [433—222 г) А = i 50
/- 0 1 —2\ е) А = -1 о з ; \ 2 — 3 О/ /3 6 144 /12 34 /11Ю0\ 3.48. Найти все решения в матричной игре с матрицей: /_1 з —3\ /4 3 3 2 2 6 \ а) I 2 0, З); б) 604 262 L \ 21 0/ \0 73622/ 3.49. Два игрока одновременно и независимо друг от дру- га показывают один, два или три пальца. Пусть k — общее число показанных пальцев. Если k четно, то первый платит второму k рублей. Если k нечетно, то второй платит k руб- лей первому. Найти оптимальные смешанные стратегии игро- ков и значение игры. 3.50. Каждый из двух игроков записывает одно из чисел 0, 1, 2, не показывая написанного противнику. Затем первый игрок называет предполагаемую сумму записанных чисел, после чего второй игрок называет предполагаемую сумму, причем ему не разрешается называть ту сумму, которую на- звал первый игрок. Угадавший игрок получает от против-, ника единицу. Если же не угадал ни один, то выигрыш каж- дого равен нулю. Определить число чистых стратегий у каж- дого из игроков. Найти оптимальные смешанные стратегии и значение игры. 3.51. Нападающая сторона, располагающая k войсковыми частями, должна осуществить прорыв через п возможных пунктов, обороняемых противником, который располагает 5 войсковыми частями. Нападение и ^оборона распределяют свои силы по п пунктам, не располагая информацией о реше- нии противники, причем в один пункт можно направлять не- сколько войсковых частей. Каждая часть обороны, располо- женная на любом из пунктов, уничтожает одну часть напа- дения, направленную в этот пункт. Не уничтоженная войско- вая часть нападения прорывается через оборону. Составить и решить матричную игру* считая выигрышем нападения (и проигрышем обороны) число прорвавшихся через оборону войсковых частей. В задачах 3.52—3.54 и далее использованы следующие обозначения: т п А (п, I) = V ацрь A (ti <?) = £ a44t* • = 1 /=i 51
т п А(Р> Я) = J] £ а</Р#/э где i4 = (aij)mxn — матрица игры, ре Sm, 3.52. Пусть Л(р, 1) = А(р, 2)=... =Л(р, л) для p<=Sm. Можно ли утверждать, что р— оптимальная стратегия пер- вого игрока? 3.53. Пусть А(р, 1)=Л(р, 2)=... =Л(р, п), для p<=Sm; Л(1, <7)=Л(2, <7)=.... =Л(т, ?) для <?^Sn. Можно ли утвер- ждать, что р, q оптимальны? 3.54. Пусть A(pf q)=v, где v — значение игры, p^Smt q^Sn. Можно ли утверждать, что -р, q оптимальны? В задачах 3.55—3.59 через v(A) обозначается значение игры с мат- рицей Л. 3.55. Показать, что v(cA)=cv(A)t а множества оптималь- ных стратегий в играх с матрицами Л и сА совпадают, если 00, сА=(сац)тХп. 3.56. Показать, что v(—Л)=—v(Л*), где Л* — матрица, транспонированная к Л. 3.57. Показать, что v(A+B)=v(A)+b, а множества опти- мальных стратегий в играх с матрицами Л и А+В совпада- ют, если все элементы матрицы В равны Ь. 3.58. Привести примеры таких матриц Л и В, что a) v{A + B)>v(A)+v(B); б) v{A+B)<v(A)+v(B); в) v(A+B)=v(A)+v(B). 3.59. Пусть A=(aij)mxm* аи=—ai*- Показать, что v(A) = = 0, а множества оптимальных стратегий игроков совпадают, 3.60. Показать, что множество оптимальных стратегий лю- бого из игроков в матричной игре являются выпуклым огра- ниченным многогранником. 3.61. Показать, что значение игры, матрица которой со- стоит из рациональных чисел, рационально. 3.62. Показать, что значение матричной игры есть неубы- вающая непрерывная функция элементов матрицы. 3.63. Может ли строка матрицы игры, в которой все эле- менты не превосходят значения игры, а некоторые меньше значения игры, входить с ненулевой вероятностью в: а) некоторую оптимальную стратегию первого игрока? б) любую оптимальную стратегию первого игрока? 3.64. а) Может ли строка матрицы игры, строго домини- руемая некоторой выпуклой комбинацией других строк, вхо- дить с ненулевой вероятностью в некоторую оптимальную стратегию первого игрока? 52
б) Можес ли строка матрицы игры, доминируемая неко- торой выпуклой комбинацией других строк, входить с нену- левой вероятностью в любую оптимальную стратегию перво- го игрока? 3.65. Следует ли из того, что 1-я компонента любой опти- мальной стратегии первого игрока равна нулю, доминировав ние i'-й строки матрицы игры некоторой выпуклой комбина- цией других строк? 3.66. Все элементы матрицы А неотрицательны, причем каждый столбец содержит по крайней мере один положи- тельный элемент. Показать, что значение игры с матрицей А положительно. Верно ли утверждение, если вместо предпо- ложения о столбцах считать, что каждая строка содержит по крайней мере один положительный элемент. 3.67. &) Показать, что если а<_и—2ац + а*+и ^ 0, t = = 2,m—1, /= 1,лг, то в игре с матрицей А=(а^)тХп каждый игрок имеет оптимальную стратегию, в которой использует- ся не более двух чистых стратегий. б) Показать, что если а*_1,,-—2ац+а{+1,^0, i=2^m—1, /=l,Ai, jo в игре с матрицей А=(ац)тХп первый игрок име- ет оптимальную стратегию р9 для которой pi = О, i = 2, ... ..., m-—l. 3.68. Определим точечно-множественные отображения /: Етп-+2Ет, g\Emn-+2En следующим образом. Отождествим матрицы размером тХп с точками евклидова пространства Етп и положим f(A)=*P0f g(A)=Q0f где Р0, Qo — множества оптимальных стратегий в игре с матрицей А=(а^)тХп пер- вого и второго игроков соответственно. а) Показать, что отображения fug полунепрерывны сверху. б) Являются ли отображения fug полунепрерывными снизу? 3.69. Найти значение игры с матрицей 2 13 по методу \3 2 \) Брауна [8] с точностью до двух десятичных знаков. 3.70. Даны s матриц Ak = (a))mkxnk ; k=l, ..., s. Прямой суммой матриц Ак называется матрица А = (а^ t. /, / )тхл, где S Qii <s;'i U = £aW*' **= !» ' • • » ть> 1ь = ^ • • • ' п*> S S h = 1, ... , s, т = W Щ> п = П nk* Доказать, что если (pkt qk> vk) — решение игры с матрицей Afct 6S
то \Р> Я> У\ vk) —решение игры с матрицей А, где 4S S л <s= П рЪ> in и = П <?/*• Пусть A = (aij){tfe\ — бесконечная матрица, о* S={* = (xi, x*> ...)l ]£*<=1, Xi>0; /=1,2,...}, O* 00 eo A(P> i) = J] a4Pi> A(*» Я)= J] atflh A(P> * = £ a4Piqi- Будем говорить, что игра с матрицей А имеет решение <р°, ^°, и>, если для любых р, q&S ряд Л(/?, ?) сходится абсолютно и А(р, ^°)<(i^ 3.71. Показать, что игра с матрицей i4=(a*j)i,j>i не име- ет решения, если a) af/ = sign(f — /); 6)a,/ = (i-/)//l+(t-/)2. 3.72. Найти все решения игры с матрицей Ив (а 2а 1/2 2а 1/4 2а 1/6...\ \а 1 2а 1/3 2а 1/5 2а .../ 3.73. В биматричной игре с матрицами Л=(а^)тХт и B=(bij)mxn найти хотя бы одну ситуацию равновесия в чи- стых или смешанных стратегиях, если ,/ 0 — 4 2\ /44 4N а) Л = В; б) Ьц = 1; в) А = ( з —5 о1^=( —2 4 1 \-1 4 7/ \ 3-1 1, г) m=n; ац = Ьц = 09 1ф}\ ац>0, bu<0\ if / = 1,...,т. 3.74. В биматричной игре с матрицами ^6 0 2\ /6 0 7> 0 4 3), 1040 ^7 0 0/ \2 3 0) найти все ситуации равновесия. 3.75. Две конкурирующие фирмы ведут борьбу за п рын- ков путем затрат денежных средств на рекламу. Фонды рек- ламных расходов первой и второй фирм составляют суммы а и b соответственно. Прибыль, которую можно получить от i-ro рынка, равна сг->0 и распределяется между фирмами пропорционально суммам, затраченным фирмами на рекла- 54
му на этом рынке. Описать бескоалиционную, игру двух лиц, считая выигрышем каждой фирмы суммарную прибыль, по- лученную от всех рынков. Найти все ситуации равновесия. 3.76. Каждое из трех предприятий, пользующихся для тех- нических целей водой из природного водоема, располагает двумя стратегиями: строить очистные сооружения для отра-^ ботанной воды (стратегия 1) или же сбрасывать ее без очи- стки (стратегия 2). Предполагается, что особенности водо- ема и технологических процессов таковы, что в случае, когда неочищенную воду сбрасывает не более одного предприятия, то вода в водоеме остается пригодной для использования и предприятия убытка не несут. Если же очищенную воду сбрасывают не менее двух предприятий, то каждый пользо- ватель воды несет убытки в размере трех единиц. Стоимость строительства очистных сооружений для каждого из пред- приятий составляет единицу. Найти все ситуации равновесия в чистых и смешанных стратегиях в опиеанной бескоалици- онной игре трех лиц [7]. Функция / называется квазивыпуклой (квазивогнутой) на выпуклом множестве X, если множество {x^X\f(x)^f(x0)} ({x^X\f(x)^f(x0)}) выпукло при любом х0^Х. 3.77. Доказать, что f квазивогнута тогда" й только тогда, когда f(ax\+(l—a)x2)^min{f(xi)) f(x2)} при любых хи *2е еХ9 ае=[0, 1]. 3.78. Пусть X, У — выпуклые компакты. Доказать, что функция F(xy у)у определенная и непрерывная на XxY, ква- зивогнутая по х на X и квазивыпуклая по у на У, имеет на XxY седловую точку. 3.79. Пусть Ху Y — выпуклые компакты, функции f и g определены и непрерывны на XxYf f вогнута по х, выпукла по у, a g выпукла по х, вогнута по у и положительна. До- казать, что функция F(x, у) = —' , у'— имеет на XxY ё (*. у). седловую точку. 3.80. Показать, что функция Fix, у) = g(*' + (У) имее1 c(x) + d(y) на XxY седловую точку, если функции а и с непрерывны на компакте Ху функции Ь и d непрерывны на компакте У и, кроме того, end положительны. 3.81. Доказать, что в игре на единичном квадрате с функ- т п цией выигрыша Ж*. У) = £ J] в*/Л (*)?/&)» где функции *=i /«1 ft, gj непрерывны на [0, 1], существует оптимальная смешан- ная стратегия первого игрока, сосредоточенная не более, чем Br т точках, и оптимальная смешанная стратегия второго игрока, сосредоточенная не более, чем в п точках. 55
Тройку «ро, фо. »> назовем решением антагонистической игры на единичном квадрате с функцией выигрыша К(х, у), если фо, фо— опти- мальные стратегии соответственно первого и второго игроков, v — значе- ние игры. 3.82. Найти хотя бы одно решение игры на единичном квадрате с функцией выигрыша: а) К (х, у) = 3 cos 7х cos 8у -f- 5 cos 7х sin 8у + 2 sin 7х сое 8у + + sin7jtsin8«/; б) К(х, у)-в1п[я(* + у)/2]; в) К(х, y)=\6yt-3xy + xi; т)К(х „) = | -(*+1)2+</2 + 4*/ + 2, х<у, У,Ю \ -(х-2)*±у*-2у + 5, х>у; д)/С(,,,) = {-(— 1/3)- + 2(*-5/12)\ ж<„. Г - (л:- 1/2)» +(у- 1 _ (ж — 1/3)» + (у — 1/3)», х>у; е) К(х, у) -(х-2/зу + 2(у-7!\2)\ х>у, — (лг — 1/2)2 + (^ — 1/2)а, х<у, ж) Kix, й-{ -^J1 + * + *-*+1. ,<„. I — х2 + у2 —ху + х+ 1, *>#. 3.83. Смешанные стратегии фо(х)=х, tyo(#)=*/ оптималь- ны в игре с функцией выигрыша К(х, у). Показать, что стра- тегии у\(х)=х2, ty\(y)=y2 оптимальны в игре с функцией выигрыша К\(х, у)=К(х2, у2). 3.84. Пусть <фо(*), i\>o(y), v> .— решение игры на еди- ничном квадрате с функцией выигрыша К(х, у). Доказать, п что<J| ф0(xi), %(#)> ш>>— решение игры на (я+1)-мерном п единичном кубе с функцией выигрыша V K(xt9 у). * 3.85. Пусть множество значений непрерывной функции К(ху у), хе[0, 1], #е[0, 1] принадлежит отрезку [а, р], на котором определена непрерывная возрастающая выпуклая функция /. Обозначим через v и V\ — значения игр на еди- ничном квадрате с функциями выигрыша К и /(/С) соответ* ственно. а) Показать, что V\^f(v). б) Показать, что vx=f(v)t если К выпукла по у. 3.86. Решить игру на единичном квадрате с функцией выигрыша 66
| 0, тах[х — у, h(y—x)]<v', где 0<а^1, 0<о'<1. 3.87. Решить в смешанных стратегиях игру на единичном квадрате с функцией выигрыша К(х, у), о которой предпо- лагается, что функции К(х> 0), К(х> 1) выпуклы на [0, 1]; функции К(О, у), /С(1, у) вогнуты на [0, 1]. 3.88. Доказать, что игра на единичном квадрате с функ- цией выигрыша (-1, х<у<х+1/2, 0, х = у или у = х + 1/2, I 1 в остальных случаях К(х9 у) = \ не имеет решения. ГЛАВА 4 Оптимальные решения при различных вариантах информированности В этой главе содержатся задачи на отыскание и свойства оптимальных и абсолютно оптимальных стратегий при раз- личных предположениях об информированности оперирую- щей стороны о неконтролируемых факторах, в том числе в случае постепенного поступления информации, а также в случае,'когда неконтролируемые факторы — стратегия про- тивника, интересы которого непротивоположны интересам оперирующей стороны [8, 9]. Стратегия ха^Муназывается абсолютно оптимальной в М, если при всех xeAf, y^N WCxa(y), y)>W(x(y)t у). Стратегия ^еМ называется г-абсолютно оптимальной в Му если при всех x^Mt y^N WQcKy), y)>W(x(y)9 у)-г. 4.1. Построить пример операции, в которой ни при каком ее[0, 1] у оперирующей стороны в М0 нет е-абсолютно опти- мальной стратегии. . 4.2. Построить пример операции с седловой точкой в MoXN, чтобы при этом в М0 не имелось абсолютно оптималь- ной стратегии. 4.3. В операции множества М0у N — компакты, критерий W(xf у)—непрерывная функция. Построить абсолютно опти- мальную в ЛГ стратегию ха и найти выражение для гаранти- рованного ею результата W(M). 57
4.4. а) Доказать, что Ха абсолютно оптимальна в М тогда и только тогда, когда W(xa> у) = max W (х, у). х£М0 б) Чтобы во множестве смешанных стратегий Ф сущест- вовала абсолютно оптимальная стратегия, необходимо и до- статочно, чтобы абсолютно оптимальная стратегия существо- вала в М0. Доказать. 4.5. Всякая ли оптимальная в М стратегия абсолютно оп- тимальна, в М? 4.6. Для операции с критерием (Г*Й)-(НЩ «. = ('• 2, 3,4. 5), \ 1 0 2 1 / ЛГ = {1, 2, 3, 4} \0 2 2 3/ а) найти оптимальную в М0 стратегию, W(Mq); устано- вить, имеются ли в M0XN седловые точки, в Мо— абсолют- но оптимальные стратегии; б) найти W(M)f оптимальные и абсолютно оптимальные стратегии в М, указать число седловых точек в MXN; в) найти W(0) и оптимальную смешанную стратегию; г) найти W(MR)f оптимальные в MR стратегии, абсолютно оптимальные стратегии и седловые точки в MRXN, если они есть. Информационная функция R задана следующим образом: #(1)=Д(3) = 1,ед=Д(4)=2. 4.7. Пусть операция с критерием W(xf у) имеет на MQXN седловую точку (х0, */о). Доказать, что (х0у у0) является так- же седловой точкой операции на MXN* (как обычно, предпо- лагается, что стратегии из М принимают значения лишь из Мо). 4.8. В операции множества M0f N — компакты, критерий W(x, у) и информационная функция R(y) непрерывны. По- строить оптимальную в MR стратегию х0 и найти выражение для гарантированного ею результата W(MR). 4.9. В операции множества М0у N — компакты, W(x, у) — непрерывная функция, множество стратегий М таково, что оптимальная в М стратегия х0 существует. Доказать, что ра- венство W(M) = W(M) дает необходимое и достаточное усло- вие существования в MXN седловой точки. Построить сед- ловую точку в MXN. Обязательно ли М содержит абсолютно оптимальную стратегию? /—12 4 6 0 3 4.10. a) (W (х, у))=1 6 1-344 1 V—3 5 3 0 1—2 58
/?(12=JR(2)=JR(5)=0,/?(3)=l,/?(4)=/?(6)=2. Найти W(M0)f №(Л1), W(Mr); оптимальные, абсолютно оптимальные в MR стратегии и седловые точки в MRxN, если таковые сущест- вуют. б) Проделать то же, что в п. а), заменив в матрице (W(x,y)) W(2,2) = l на W(2, 2)=3. в) Найти такую информационную функцию /?, принимаю- щую три различных значения, что множество MR содержит абсолютно оптимальную стратегию; матрица (W(xf у)) та же, что в п. а). г) Найти все неэквивалентные информационные функции /?, принимающие два различных значения, такие, что MRXN содержит седловую точку; матрица (W(xf у)) та же, что в п. б). 4.11. Подразделение должно форсировать реку в одной из точек прямолинейного участка длиной 1 км. На участке рас- положена одна огневая точка противника, причем вероят- ность выполнения задания прямо пропорциональна расстоя- нию от точки форсирования до огневой точки противника. Необходимо выбрать место форсирования реки. а) Построить модель операции. Найти наилучшие гаран- тированные результаты W(M0) (местоположение огневой точки неизвестно), W(Q>) (в смешанных стратегиях), W(M) (местоположение огневой точки станет известно, благодаря разведке, к моменту проведения операции), найти соответ- ствующие оптимальные стратегии. б) К моменту проведения операции разведка установит, лежит ли огневая точка правее середины участка или нет. Построить информационную функцию R, найти наилучший гарантированный в MR результат и оптимальную страте- гию ДСо. в) Разведка установив, лежит ли огневая точка на отрез- ке [74, 1] или нет. Проделать то же, что и в п. б). г) Разведка установит местоположение огневой точки на отрезке [V4, 1] или отсутствие ее на этом отрезке. Проделать то же, что и в п. б). д) Оперирующая сторона, кроме местоположения точки форсирования реки, выбирает местоположение отрезка за- данной длины а<1, на котором будет проведена разведка. Точнее, выбирается Р^[0, 1—а], и к моменту проведения операции разведка установит местоположение огневой точки на отрезке [р, р + а] или отсутствие ее на этом отрезке. Най- ти наилучший гарантированный результат. 4.12. а) Пусть множество значений критерия W принадле- жит отрезку [а, р], на котором определена непрерывная воз- растающая функция /. Определим новый критерий W\=f(W). Доказать, что Wi(M)=f(W(M)) для произвольного множе- 59
ства стратегий М. Более того, всякая стратегия х0у оптималь* ная по критерию W> оптимальна по критерию Wx и обратно. б) В условиях задачи 4.11 вероятность выполнения зада- ния прямо пропорциональна квадрату расстояния от точки форсирования до огневой точки противника задания п. а)-д). 4.13. Пусть a) Щх9 у)=р(х9 у)у б) W(x, у) = р2(*, у); M0=N=K, где К — выпуклый компакт в Ет. Найти наилуч- ший гарантированный результат W(M) во множестве стра- тегий М — множестве всех непрерывных отображений ~х:К-+К. 4.14. В операции с критерием W(x, уи У2)=У2(х+У\)> *^ ^[—1, 1] — контролируемый фактор, (уи у2)^[— 1, 1] X Х[—1, 1] — неопределенные факторы. Найти наилучшие га- рантированные результаты: a) W(M0); б) W(M); в) W(MR), если информационная функция R(y\, уъ)=У\\ г) W(MR)fR(yu У2)=У2\ Д) W(MR)yR(yu у2)=У1 + У2\ е) W(MR)fR(yuy2)=yi—У2\ ж) W(MR)yR(ylyy2)=yiy2. 4.15. Оперирующая сторона ведет стрельбу т снарядами по неподвижной цели, представляющей собой отрезок длины 2е с центром в точке #е[0, 1]. Предполагается, что техни- ческое рассеивание снарядов отсутствует и местоположение центра цели на [0, 1] неизвестно. Определить стратегию стрельбы (т. е. координаты точек прицеливания), обеспечи- вающую наибольшее гарантированное число попаданий в цель, а также наилучший гарантированный результат при следующих дополнительных предположениях: а) стрельба ведется залпом; б) стрельба ведется одиночными выстрелами, перед оче- редным выстрелом поступает информация о результатах пре- дыдущего. 4.16. В задаче 4.15, а) найти оптимальную смешанную стратегию оперирующей стороны и наилучший гарантирован- ный результат. 4.17. т боевых единиц оперирующей стороны прорывают- ся через линию обороны противника, представляющую собой прямолинейный отрезок длины 1, на котором расположено п боевых укреплений. Боевая единица прорвется через обо- рону в том и только в том случае, если ее расстояние л& ближайшего укрепления больше е, е<1/2п. Оперирующая;* сторона выбирает места прорыва (в одной точке могут осу- ществлять прорыв несколько боевых единиц), имея целью максимизировать количество боевых средств, прорвавшихся через оборону. Найти оптимальную стратегию и наилучший гарантированный результат в случае, если: во
а)" прорыв осуществляется всеми боевыми единицами од- новременно, информация о местонахождении укреплений от- сутствует; б) соблюдены условия а), допустимо применение смешан- ных стратегий; в) прорыв осуществляется одновременно, и к началу опе- рации станет известным местонахождение П\ укреплений, г) вначале информация об укреплениях отсутствует, бое- вые единицы осуществляют прорыв одна за другой, причем перед осуществлением прорыва очередной единицей посту- пает информация об успехе или неуспехе предыдущей. 4.18. В условиях задач 1.8 и 1.9 найти наилучшие гаран- тированные результаты для нападения. /^1 2 4 6 0 3\ 4.19. (F(x, z))=( б 1 —3 4 4 1 ]> 2 —случайный фак- \_3 5 3 0 1 -2/ тор с распределением о^ R(l)j= R(2)_=R(5) =0, #(3) = 1, R(4) =#(6) =2. Найти F(M0), F(M), F(Mr) и соответствую- щие оптимальные стратегии, если: ■»-(i-i-±--bi-iH-K^-54 Сравнить полученные результаты с результатами задачи 4.10. 4.20. В операции с критерием F(xf z) = \x—z\ (см. зада- чу 4.11), Af0=Z=[0, 1], х^М0— контролируемый, z— некон- тролируемый случайный фактор, равномерно распределен- ный в Z. _а) Найти наилучшие гарантированные результаты F(M0) и F(M), а также соответствующие оптимальные стратегии, б) Найти F(MR) и оптимальную стратегию, если инфор- мационная функция ' La R(z) = [■ь ']■ 0.»е[0,-|-). в) Проделать то же, что и в п. б) при - *(*) = 0, zt №)■ 4.21. Проделать то же, . что в задаче 4.20, положив F{xyz) = (x-z)\ 61
4.22. Пусть a) F(x, z) = \x—z\\ 6) F(x, z) = (x—z)2; x, 2e[0, 1], x — неконтролируемый фактор, z — случайный фактор, функция распределения которого со известна иссле* дователю операций. Найти наилучший гарантированный ре- зультат во множестве стратегий М (М — множество всех не- прерывных отображений [0, 1] в [0, 1]). Сравнить результат с результатом задачи 4.13. 4.23. В операции с критерием F(x, zu z2) = z2(x + Zi) (см. задачу 4.14) xg[—1, 1] — контролируемый фактор, Z\ е е[—I» 1] — случайный фактор с плотностью распределения p,(f)= { г2£ -1, 11 — случайный 1 -/-f 1, 0<f<l, L J фактор с плотностью распределения р2 (t) = { Случайные факторы — независимые случайные величины. Найти наилучшие гарантированные результаты и оптималь- ные стратегии в следующих множествах стратегий: а) М0; б) М\ в) MRy R(zu г2)=гх\ г) MR, R(zu z2)=z2. 4.24. В операции с критерием F(x, у, г)=Л(х, y+z), где (А(ху и)) = I _. ~c]f *е Af0 = {1, 2}— контролируемый фактор, y^N={l, 2}—неопределенный фактор, zeZ={0, 1}—слу- чайный фактор, принимающий значения 0, 1 с вероятностью 7г. Найти наилучший гарантированный в М результат W(M) и оптимальную стратегию, если а) М=М0\ б) М=М; в) М= = MR, R = z\ г) M=MR, R(y,z)=y, д) M=MR, R(y,z)=y+z; считая при этом у природной неопределенностью. 4.25. Выполнить задания задачи 4.24, считая у стратегией противника, который к моменту принятия им решения знает реализацию случайной величины г. Оперирующей стороне интересы противника неизвестны. 4.26. Контролируемый фактор — номер xeAf0={l, ..., т) строки матрицы {А(х, y))mx2k- Случайный механизм выби- рает четность столбца у: нечетный с вероятностью pi, чет- ный с вероятностью р2. Противник, интересы которого проти- воположны интересам оперирующей стороны, выбирает по- рядковый номер у столбца среди k возможных четных или нечетных номеров. Построить модель операции, выписать выражение для наилучшего гарантированного результата, найти наилучший гарантированный результат для случая '1 2 3 0\ . 23241 1 2 (А(х,у)) = \ 3 1 2 0 , ft = 4"' Л = 4- 10 11/ 3 3 \0 2 2 3; если: 62
а) противник не знает реализации четности; оперирующая сторона не имеет информации о неконтролируемых факторах; б) противник не знает реализации четности; оперирующая сторона к моменту проведения операции будет располагать' полной информацией о неконтролируемых факторах; в) противник не знает реализации четности; оперирующая сторона к моменту проведения операции будет знать страте- гию противника; г) противник знает реализацию четности; оперирующая сторона не имеет информации о неконтролируемых факто- рах; д) противник знает реализацию четности, оперирующая сторона к моменту проведения операции будет располагать полной информацией о неконтролируемых факторах; е) противник знает реализацию четности, оперирующая сторона к моменту проведения операции будет также знать реализацию четности. 4.27. В операции с критерием /3 0 2 К «■«"■«в-4, т) \2 —1 4 7/ неконтролируемый фактор z — случайная величина с неопре- деленностью в законе распределения o)=(o)f, 0)2, 0)3,0)4). Най- ти наилучший гарантированный результат W, если о некон- тролируемых факторах дополнительно известно следующее: а) со неизвестен исследователю операции и не станет из- вестным оперирующей стороне; б) со неизвестен исследователю операции, но станет изве- стным оперирующей стороне к моменту проведения операции; в) исследователю операции известно, что ©4=74, допол-- нительной информации о с» оперирующая сторона не полу- чит; г) исследователю операции известно, что он=74, о) ста- нет известным оперирующей стороне к моменту проведения операции; д) исследователю операции известно, что о)з = о)4=1/4, до- полнительной информации о .о) оперирующая сторона не по- лучит; е) исследователю операции известно, что о)з=о)4=1/4, <о станет известным оперирующей стороне к моменту прове- дения операции; ж) исследователю операции известно, что 0)1 + 02=0)3+0)4, Дополнительной информации о со оперирующая сторона не получит; . * 63
з) исследователю операции известно, что соi + С02 == 03+о>4^ со станет известным оперирующей стороне к моменту провес дения операции. 4.28. Выполнить задания задачи 4.27, предполагая допол- нительно, что оперирующая сторона к моменту проведения операции будет знать реализацию случайной величины z. 4.29. Выполнить задания задачи 4.27, предполагая, что оперирующая сторона к моменту проведения операции бу- дет знать четность реализации случайной величины z. 4.30. В операции с критерием F(x, z) = (х—z)2 (см. зада- чи 4.13, 4.21, 4.22) M0=Z=[0, 1], хеМ0 — контролируемый фактор, z^Z — неконтролируемый фактор, являющийся слу- чайной величиной с неопределенностью в законе распределе- ния о. Найти наилучший гарантированный результат W^ если о неконтролируемых факторах дополнительно известно' следующее: а) со неизвестен исследователю операции и не станет из- вестным оперирующей стороне; б) со неизвестен исследователю операции, но станет изве^ стным оперирующей стороне к моменту проведения опера- ции; в) исследователю операции известно, что плотность рас- пределения co'(z) существует и имеет вид o^-i - *е [0,1/2] »'(*) = {/' I 2 — у, ге(1/2, 1]' параметр #е[0, 2] неизвестен исследователю операции и щ станет известным оперирующей стороне; г) исследователю операции известно, что плотность рас- пределения со' (z) существует и имеет вид [0, 1/2] в, j у. ^[0, 1/2] 1 2-у, *е= (1/2, 1]' параметр </е[0, 2] станет известным оперирующей стороне к моменту проведения операции; д) исследователю операции известно, что zda(z) = 1/4, о дополнительной информации не предполагается; е) исследователю операции известно, что [ zdco(z) > 1/4, о дополнительной информации не предполагается; ж) исследователю операции известно, что f 2dco(z) < 1/4, о дополнительной информации не предполагается. 64
4.31. Выполнить задания задачи 4.30, предполагая допол- нительно, что оперирующая сторона к моменту проведения операции будет знать реализацию случайной величины z. 4.32. В операции с критерием F(xt yt z)=z(x+y) (см. за- дачи 4.14, 4.23) дсеЛГ0=[—1, 1]; #е[—1, 1] — неопределен- ный фактор, ге[—1, П — неконтролируемый фактор, явля- ющийся случайной величиной. Найти наилучший гарантиро- ванный результат W и оптимальную стратегию, если о не- контролируемых факторах дополнительно известно следую- щее: а) у — природная неопределенность, случайный фактор z равномерно распределен на [—1, 1], значения у и z не станут известными оперирующей стороне; б) у — природная неопределенность, р, _1<2<0,_ 1-р, 0<z<l плотность распределения z, параметр р, а также конкретные значения */, z не станут известными оперирующей стороне; в) у — природная неопределенность, />(*) = { ИУ) s 1-р, 0<z<l »(*) = { плотность распределения z, параметр р станет известным оперирующей стороне к моменту проведения операции; г) дополнительно к предположениям п. в) предполагается, что значение у станет известным оперирующей стороне к мо- менту проведения операции; д) дополнительно к предположениям п. в) предполагает- ся, что значения yt z станут известными оперирующей сто- роне к моменту проведения операции. 4.33. В операции х^М0={1, 2, 3} — контролируемый фак- тор, t/eAf={l, 2, 3} — неконтролируемый фактор, являющий- ся стратегией противника. Интересы оперирующей стороны и противника описываются, соответственно, матрицами / 5 —3 0\ /—1 —1 1\ (W(x,y))= -2 4 1 , (Wn(x,y))=[ 2 23. V—1 — 2 з; V 5 4 4/ Заданы три информационные функции 1, У = 2,3, 2, у=\. а) Найти F(M0,), W(M), W(MRi) i=\, 2, 3, если Wn не- известна исследователю операции; 65
б) найти наилучшие гарантированные результаты W* (М0), W*(М),Wm (MRi), i=l, 2, 3 и соответствующие оптимальные* стратегии, если исследователь операции знает Wu, а опери- рующая сторона сообщает противнику выбранную стратегию; в) найти наилучший гарантированный результат УР*(М0) и оптимальную стратегию, если исследователь операции знает, что Wn(l, 2)=—1, Wu(lt 3)=1, а оперирующая сторона со- общает противнику выбранную в М0 стратегию; г)^найти наилучшие гарантированные результаты №*(М0), Wit(M)i W#(Mr.), /=1, 2, 3, и соответствующие оптимальные стратегии, если исследователь операции знает, что №п(1,1) = =—1, №п0. 3) = 1, Wu(2, 2)—2, №п(2, 3)=3, а оперирую- щая сторона сообщает противнику выбранную стратегию. 4.34. Найти наилучшие гарантированные результаты W*(M0), WJM), W,{MR.), t=l, 2, 3, и соответствующие оп- тимальные стратегии, если оперирующая сторона сообщает противнику выбранную стратегию, матрица, описывающая интересы оперирующей стороны, и информационные функции R\> #2, #з те же, что в задаче 4.33, а исследователю операции дополнительно предполагается известным следующее: а) интересы противника описываются одной из двух мат- риц /_1 _1 к /2 —3 2\ ОМ*. У)) = 2 2 3 или {Wln(x, У)) = 3 10; V 5 4 4/ \5 4 4/ б) элементы матрицы Wn, описывающей истинные инте- ресы противника, удовлетворяют условию Wn(x, y)-s<W°n(x, y)<Wn(x, у) + е, 1<*<3, 1<{/<3, е>0. В задачах 4.33, 4.34 затронуты некоторые аспекты теории игр двух лиц с непротивоположными интересами и возможным обменом информа- цией между игроками. Множества стратегий в обеих задачах предпола- гались конечными. В общем случае обозначим через Г = <F, G, М, N> игру двух лиц, в которой первый игрок с функцией выигрыша F(xt у) и множеством стратегий М (М — подмножество множества М всех отобра- жений из ^ в фиксированное множество Af0; в частности, может быть М=М0 или М = М) сообщает свой ход х^М второму игроку, имеющему функцию выигрыша G(xy у) и множество стратегий N. Если M—M0t то полученную игру Г обозначают через Г1, если М—м, то через Г2 [9]. 4.35. Пусть в условии задачи 1.3 б) дополнительно выпол- нено: т=п, \xjBj = 'kiAiy t=l, ..., m, /=1, ..., т. Найти наилуч- шие гарантированные результаты для первой страны в играх Г1 и Г2. 66
4.36. В условии задачи 1.12 найти наилучший гарантиро- ванный результат для первой фирмы в предположениях а) и б). 4.37. Определить наилучший гарантированный результат первого игрока в игре Г1, если: а) Л*0 = [0,оо), N = {\,2}, F(x,y) = {8iaX> , У=1' \6x-x*-7,y~2, б) М0, N те же, что ива),' — х + 9, у = 1, G(x, у) = -f + 2,,= l. log2 х, У = 2Г F(x, у) = 2x — 5, y=2, G(x,y) = Vx, y= 1, 4.38. Определить наилучший гарантированный результат W первого игрока в игре Г2, если: а) Мо = [0, 1], N = [0, l],F(x,y)=x±y, G{x,y)=x-2yy б) №„ = {1,2,3,4}, N'= {1,2,3,4}, I—3 2 7 4\ /2 —1 —2 —3n -3 10 4/ \—1 5 4 — 4J (F(x,y)) = \ 4.39. Пусть первый игрок (Центр) заинтересован в уве- личении выпуска сверхплановой продукции вторым игроком (Производителем). а) Центр производит управление назначением цены дс.на сверхплановую продукцию у Производителя. Критерий Про- изводителя— прибыль, есть G(j^ у)=ху—Ып(а/(а—у)), где 0<Q/<a; a, b>0; аС^Ь\ b In (a/ (a—y)) — функция затрат. Критерий Центра F(xy у)=су—ху — прибыль от продажи продукции у на внешний рынок по цене с. Определить опти- мальную стратегию Центра. б) Центр стимулирует увеличение объема продукции пу- тем выплаты премии. Обозначим через х размер премии, тогда критерий Центра есть F(x, у)=су—х, а критерий Про- изводителя G(x, у)=х—Ь\п(а/(а—у)). Найти оптимальное премирование в предположении ас>Ь. 4.40. Пусть М0={1, ..., т}, ЛГ={1, ..., п}9 W — критерий эффективности оперирующей стороны, критерий эффективно- сти противника совпадает с одним из критериев Wk, &eS = =={1, ..., s}. Информационная функция R:SxN-+El такова, что для любых k и у R(k, y)^Rk, где Rhl f\Rkt =0, k^k2. Найти наилучший гарантированный результат, считая, что противник знает стратегию оперирующей стороны. 67
4.41. В отличие от задачи 1.12 предположим, что возмож- ности рынка ограничены не потребностью в производимой продукции, а суммой денег С на рынке. Предположим также, что а^с/к^&. а) Записать критерий эффективности операции, считая оперирующей стороной первую фирму. б) Найти оценку эффективности стратегии (х, р). в) Найти оптимальную стратегию и наилучший гаранти- рованный результат в случае отсутствия информации о не- контролируемых факторах (у, q). г) Найти е-оптимальную стратегию и наилучший гаран- тированный результат в случае полной информированности. д) Проследить зависимость наилучшего гарантированного результата и оптимальной стратегии от информированности на следующем числовом примере: С= 100 млн. р., /С=9 млн. бутылок коньяка, а = 4 р., 6 = 20 р. 4.42. Пусть в условии задачи 1.14 дополнительно выпол- нены неравенства: i0<dly Dt-dt<dt+u t=\.... ,7-1. Найти оптимальную стратегию и наилучший гарантиро- ванный результат в случаях: а) а^у\ б) 7>а>Р- Следующие задачи посвящены многошаговым операциям (в том чис- ле многошаговым играм с полной информацией), отысканию наилучших гарантированных результатов в них, свойствам последовательного макси- мина и минимакса. 4.43. В операции М0={1, 2, 3, 4, 5}, N={1, 2, 3, 4, 5, 6} критерий задан матрицей (4 3 3 4 3 0\ 5 5 2 4 2 0 \ 3 3 3 12 4- 0 2 2 3 3 5/ 5 2 15 2 2/ Вычислить наилучший гарантированный результат W(M), если операция происходит следующим образом (тем самым определяется и множество стратегий М): а) оперирующая сторона выбирает четность х, затем уз- нает значение природной неопределенности у и, наконец, вы- бирает х в соответствии с ранее выбранной четностью; б) оперирующая сторона выбирает четность х, затем уз- нает четность природной неопределенности у и, наконец, выбирает х в соответствии с ранее выбранной четностью; в) случайный механизм выбирает четность х, приписы- вая равные вероятности {/2 множествам четных и нечетных значений ху затем противник выбирает четность у, оперирую- щая сторона выбирает х той четности, которая выбрана слу- чайным механизмом, и, наконец, случайный механизм выби- рает с вероятностями )/$ одно из значений у из множества 68
{1, 3, 5} или {2, 4, 6} в зависимости от выбора четности у противником. 4.44. Задана матрица А=(а^)тХп- Игра происходит сле- дующим образом. На первом шаге первый игрок выбирает непустое собственное подмножество М\ множества Л!={1, ... ..., т}, затем второй игрок, зная выбор первого, выбирает непустое собственное подмножество N{ множества #={1, ... ..., п}. На втором шаге первый игрок, зная выборы на первом шаге, выбирает непустое собственное подмножество М2 мно- жества Ми затем второй игрок, зная все предшествующие выборы, выбирает непустое собственное подмножество N2 множества N\ и т. д. Как только один из игроков выбирает на очередном шаге одноэлементное множество, сразу же вслед за этим другой игрок также должен выбрать одно- элементное множество, и на этом игра кончается. Если по- следнее множество, выбранное первым игроком, состоит из isAf, вторым из /еЛГ, то выигрыш первого игрока составляет величина а^у а выигрыш второго — величина —ац. Найти значение игры v и оптимальные стратегии игроков. 4.45. Пусть функция F(x\, *2, У и У 2, *и *ъ) определена при x^Mi, y^Nif Zh^Zk'y t, /, &=1, 2. Обозначим через Si опе- рацию взятия верхней грани по х^Ми через /j — операцию взятия нижней грани по y^N^ через Ek операцию взятия математического ожидания по г&, при этом zk— случайная величина с заданным распределением, принимающая значе- ния из Zft. а) Можно ли при произвольных Miy Nj, Zk, F утверждать, что S1S2/i/2/;,<S1/1S2/2/r<|/iS1/2S2JF</i/2SiS2JF? б) Можно ли связать определенным знаком неравенства величины S1/i/2S2F и J1S1S2J2F при произвольных М^ Njt гк, F? в) Доказать следующую цепочку неравенств: S \S2E 1E2J \J 2F ^E\S 1E2J \S2J2F^^,E \J2S \J\E2S2F^: J 2E\J\S\E2S2F. 4.46. а) Найти в задаче 1.23 оптимальную или е-оптималь-. ную пассивную стратегию; б) найти s-оптимальные после- довательные стратегии при п= 2, 3, 4. 4.47. Пусть L(K) — класс всех функций, удовлетворяю- щих на [0, 1] условию Липшица с заданной константой /С. Пусть х=(х\, ...» хп) —пассивная стратегия (см. задачу 1.23) поиска максимума функции f^L(K)\ f(Xi)=yi\ *=1> •••» п\ У={уи ...» #п). Критерием эффективности является W(xf /) = max f(t) — max yt. а) Найти оптимальную пассивную стратегию х° и наилуч- ший гарантированый результат. б) Доказать, что х° оптимальна во множестве последова- тельных стратегий. 69
4.48. Найти оптимальную на классе L(K) квадратурную» формулу и наилучший гарантированный результат (к задаче- 1.24). 4.49. Найти оптимальную пассивную стратегию* х° = (л^, ... , х°) поиска максимума функции из класса: £'={fll/('i)-W2)|<*|*i-*2|, М2е[0,Ч], ]I(t%)-f(U)\^ ^l\h—U\t h, /4e[V2, 1]} и наилучший гарантированный ре- зультат. 4.50. Доказать, что алгоритм деления пополам интервала, локализации корня является оптимальным последовательным алгоритмом поиска корня функции, непрерывной на отрезке* и принимающей в концах отрезка значения разных знаков,, если критерием эффективности является длина интервала локализации. 4.51. п школьников, среди которых установлена опреде- ленная очередность, решили разделить круглый торт. Вначале в порядке установленной очередности школьники делают по одному разрезу вдоль радиусов торта, а затем в том же порядке забирают образовавшиеся доли торта. а) Описать игру п лиц, считая выигрышем школьника ве- личину полученной им доли торта. Указать какую-либо си- туацию равновесия. б) Найти все ситуации равновесия при п=3. в) Найти наилучший гарантированный результат каждого школьника. 4.52. Доказать, что в игре Г1 с функциями выигрыша игро- ков Fy G, непрерывными на прямом произведении компак- тов М0 и Nt существует ситуация равновесия. 4.53. При п = 2, 3, 4, 5 найти значение vn следующей ^ша- говой антагонистической игры. На первом шаге минимизирующий игрок выбирает точку *ie(0, 1), разбивая тем самым отрезок [0, 1] на отрезки [0, *i], [х\, 1], а максимизирующий игрок, зная хи припи- сывает этим отрезкам неотрицательные числа /ь 1г соответ- ственно, при этом число, приписываемое отрезку, не должно» превосходить era длины и /i + /2=/, где /е[0, 1]—заранее фиксированное число, известное обоим игрокаАм. На втором шаге минимизирующий игрок выбирает точку* л'2е(0, х\) U (хи 1), разбивая тем самым один из отрезков, первого шага на два, а максимизирующий игрок, зная хи х* приписывает этим двум отрезкам неотрицательные числа* каждое из которых не превосходит длины своего отрезка* а сумма равна числу, приписанному объединению этих от- резков на первом шаге, и т. д. После того как все п шагов сделаны, максимизирующий игрок получает от минимизирующего максимальную из вели- чин, приписанных к /2+1 отрезкам, на которые разбит отре- зок [0, 1].
ОТВЕТЫ И РЕШЕНИЯ ГЛАВА 1 1.1. Контролируемый фактор (к.ф.) оеА1о={о|0<у<50}, z — случайный фактор (с. ф.) с известным законом распреде- ления, критерии эффективности (к.э.) — поток машин через туннель F(vf z)=vP=v(6Q—v)/z. Множество стратегий—М0. Оценка эффективности: 1 *)W{v)= [v(60 — v) — dz = v(60 — v)2\n2; 1/2 б) W (v) = min (v (60 — v)/z) = v (60 - v). — 1/2<*<1 Поток максимален при v = 30 км/ч. 1.2. Пусть х=1 или х=0 обозначает решение наблюда- теля принять самолет соответсхвенно за свой или неприятеле ский; {/=1 или #=0 обозначает решение пилота самолета подать сигнал соответственно «свой» или «неприятель», а 2=1 или 2=0 обозначает, что приближающийся самолет яв- ляется соответственно своим или неприятельским. Здесь к. ф. *<=ЛГо={0, 1), н.ф. */е#={0, 1}, с.ф. 2eZ={0, 1} имеет неопределенность в законе распределения, к. э. F(x, у, z) = \ v " V ' \dx + c(l-x), 2 = 0, осредненный к. э. F(x, у, со) = (ах+ 6(1-x))(*+(dx + c(l —.л:))(1 — со), множество стратегий М состоит из четырех стратегий 1с: N-+M0 х1:х1(1)=х1{0) = 1; х2 :х2(1) = *2(0) = 0; *8:*з0) = 1, *3(0) = 0; ^4:х4(1)= 0, *4(0)=1, 71
оценки эффективности: Wfy = max (а©' + d(1 — ©'), а©* + d (1 — ©")), F(x2) = max(6©' + c(l —о'); too» + c(l — ©")), JF(jt8)=max(a©' + c(l — ©'), a©' +d(l — ©'), a©*-f-c(l — со"), aw" + d(l — ©")). f(*4)=max(&©' + c(l —©'), too' +d(l — ©'), W+c(l—©*), 6o»"+d(l —©")). 1.3. Положим x = (jc(/, i = l, ... ,tn, j=\,... ,n), y = — (%/» i = 1,... ,m, / = 1 n). К. ф. n jceA^jxIxj/^O, J] л<;<Д-, i=l,...,m, m £Ц<11/в/. / = i л), н. ф. m л f = 1, ... , m, / = 1, ... , n\. Если первая и вторая страна выбрали х и у, то обмен товара 1-го типа первой страны на товар /-го типа второй страны по условию произойдет на сумму Кц = min ()нхц> (Xjt/ij), выраженную в международных ценах. При этом стои- мость обмененного товара /-го типа второй страны на внутрен- нем рынке первой страны равна Kijbf/[ijy а стоимость обме- ненного товара t-ro типа первой страны на ее внутреннем рынке равна KtjOilU. Таким образом, в результате обмена товара i-го типа первой страны на товар /-го типа второй страны прибыль первой страны, выраженная в ценах ее внутреннего рынка, составит Кц {b/liij—ai/ki). Отсюда к.э. первой страны имеет вид т п * Wi (*. v\ = 2 2 ™п (*л/, wi) (7: ~ f) • Множество стратегий — Mo. а) Найдем все крайние точки множества N. Заметим, что 72
система неравенств, определяющая N, имеет ранг, равный т2, а система неравенств т т имеет ранг 2m—1. Пусть у* — произвольная крайняя точка множества N. Если для всякого / найдутся iu fe, такие, что y*t/>0, y*t/>0, ti^i2, то не найдется подсистемы системы неравенств, определяющей N, ранга т2, которой */* удовле- творяет как системе уравнений. Поэтому найдутся iu /1 та- кие, что y*f^ = Bjit у*д = 0, i^iV Отсюда и из того, что И/А*1 = К\> следует: у^ = 0, \ф\\. Вычеркнем *гю строку и /рй столбец матрицы (у^). Останется матрица размера (т—1)Х(т—1), и предыдущее рассуждение можно повто- рить. Таким образом, у* имеет вид: у\) = ^'п 4^/ = 0» *=£*/, t, /=1, ..., m, где ii, ..., im — некоторая перестановка индек- сов 1, ..., т. Отсюда и из вогнутости критерия W\(x, у) по у Wx(х) = minWx(х,у)<= min YХ,хи l-± ^-), где минимум берется по всем перестановкам 1\9 ..., im. б) К. э. второй страны равен т п , w* (*, у) = V V min <W *w/) (т— -^-) • Вторая страна при известной стратегии xeAf0, максимизи- руя свой критерий, выберет y^N таким, что Уц=*кгХц1\Х5 при всех i, /. Отсюда т п * 1.4. Пусть х=0 обозначает, что принято решение не ис- пользовать резерв, а х=1 обозначает решение использовать резерв. К. ф. дсеМо={0, 1}, с. ф. z — время выполнения-всего комплекса работ без использования резерва, zeZ={4, 5, 6, 7}. Пусть Р(Н) — вероятность осуществления некоторого со- бытия Я. По сетевому графику нетрудно подсчитать, что М<*-4>)--£-."*«■ = Б>)--£_ Р({г = 6})=-%-, Р({г=7})= 3 27 ^ "27 73
(F(,,Z))=(110 10° * 0< " V 100 90 80 30 Осредненный к.э. ?(0) = JZ?L, F(i)= «» 27 w 27 * Отсюда видно, что резерв следует использовать. 1.5. Пусть точка xeG характеризует положение вышки внутри склада; к. ф. х^М0=6=М, с. ф. / имеет неопределен- ность в законе распределения, к.э. F(xf j)=p2(xt Aj) —квад- рат расстояния между точками х и А;. а) W(x) = max р2(лг, Л,), — к/<з з б) W(x)= ± max YW, А), — 2 к/<з ^J fef в) "^(*) = ±- max (р2(*, Ах) + р2 fr, Aj)). — 2 /=2,3 1.6. К.ф. di€=Af0=[d, D]9 н.ф. d2<ZzN=[d, D]. Для t=l, 2 рассмотрим функции 1, если f-й дуэлянт поразил противника, стреляя с расстояния diy { 0, в противном случае. Здесь U(di) при фиксированных diy *=1, 2, можно рассмат- ривать как случайные факторы с известным законом распре- деления. Ь№) = a) F(rflf d8, Ь №), Ь(40> = (1—g2№))gl(dl), ^1<^2. б)-^={ btt) + (l-b(*))(i-b(4)Mi>4 1—Ь№0» dv^d2. ъ) F = l b№)« . ^i>di. i (1-Ь(4))Ь№). &<d2. Стратегия оперирующей стороны (первого дуэлянта) ха- рактеризуется константой аеМ0 и функцией Ь: N-kM0. Пер- вый дуэлянт решает выстрелить с расстояния а при условии, что до этого момента не поступит информация о выстреле противника. Если такая информация поступит (т. е. d?>a)t 74
~ fa, di(4)=UA)> то первый дуэлянт стреляет с расстояния b(d2). Таким обра- зом, стратегия оперирующей стороны d\&M имеет вид: а, йг < а, d2 >а. Осредненный критерий в случае а) имеет вид: — \ Pi(di)f d1^d2f f(d"*,ftW' А(40)"1(1-а№)>Ма). A<A. Пусть dia — стратегия, описанная в условии; для нее Ь (А) з= —| d. а)НЧА«) = p^D), a = D, min (рх (a), (1 — p2 (a)) px (d)), - a < D. 6)f(4) = 1—Pi{d), a — d, min(l—ft(a), Pi(a) + (1—p1(a))(l—p2(d))), a>d. B)W(dla)=p1(a)(l-pAa)). ■I a) № = 6) № = в) № = 1.7. Обозначим через d\ расстояние, с которого первый дуэ- лянт производит второй выстрел, d[ <^. К. ф. (di djеМ0 ='{(d[, dj\d<d\<dx<D}, н. ф. «A e JV = [d, D]. Осредненный к. э. l_(l_pl(dl))(l_pi(d;))> dl>d[^dt, Pi(A) + (1 — Pi(a))0 -ft(A))A(<tf). A ^ A >di', (1-Att))(l - (l-Pi(di))0-^Pi(<fl)). A>A- Pi(A)4-(l-A(A))(Pi(4) + + (1 - Pi (<Q) (1 - A (A))). A > < > A, A (A) + (1 -A(A)) (1 - A (A)). A > A >d[, 1 — Дг(А). A^A.» A (A) + (1 -Pi (A)) Pi Wi).- A > rfJ > A. A (A) t- (1 - A (A)) (1 - A (A)) A (rfi), A > A^ *', (1 - A (A)) (P (A) + (1 -Pt (A)) A №'))• A > A• Стратегия оперирующей стороны характеризуется двумя константами: a, fe [rf, D] и тремя функциями: 6 (А), Л (а, А). 75
e(d2), принимающими значения из отрезка [rf, D]. Первый, дуэлянт намечает произвести первый и второй выстрелы на; расстояниях а и f, a>f, и он эти выстрелы производит, если d2^f. Если f<d2^af то первый дуэлянт производит первый выстрел с расстояния а, а второй выстрел — с расстояния* A (a, d2), учитывая поступившую информацию о выстреле второго дуэлянта. Аналогично, если d2>a, то первый дуэлянт производит первый и второй выстрелы соответственно с рас- стояний b(d2) и e(d2), b(d2)>e(d2). Окончательно^стратегию первого дуэлянта можно записать в виде d\ = (dlt d\), где d\ (а9 d2) = d2<Ca, d2>a, /, d2<f, K(a>d*)> f<d2<at e(d2), d2>a, a>/, b{d2)<d2, h(at d2)<[4» e(d2)<d2, b(d2)>e(d2). 1.8. Положим x = {xl9 ... , xn), и = (иг, ... , un), v = = (*i. • • • . vn)> # = (C, u, v), U(C) = {u\ £ щ =B —С, щ ^0, i = l,...,/i}> HO = (»| £ *>t = C, ti«>0f * = 1, ... , л}. *«1 К.ф. н. ф. Ift 3. *= Af0 = {* | £ *t= Л, jc, ^ 0, 1 = 1,..., nj; r<=tf = {#|0<C<B, иб(/(С), osV(C)}, /i W (*> У) = J] max (*« — РЛ — <?Л> 0), i=i M— множество стратегий x, таких, что x(u,C)^M0 при лю- бых Се[0, В] и ие= (/(С). Пусть дс —произвольная стратегия нападения. Если най- дутся С и u^U(C) такие, что Xi—piiii^Q, 1=1, ..., л, та W(x)=0 и утверждение очевидно. Допустим, что для любых Се=[0, В] и u<=U(C) /= {f|*i— ЛгИг> О}=5*=0. Зафиксируем' Се=[0, В], iu=U(C) и найдем min №(*, С, и, v). Пусть t»6V(C) 76
/={tb ..., ik} и без ограничения общности ftt^9<a> ... >^ * k ~ . Если У x4~plluti <с, то min W(x, С, и, v)=0, W(x) = =0 и утверждение доказано. Пусть далее, найдется номер fat Тогда min Г (*, С, и, е) = V &.— Pi щ) — Но для xlke[M0 : л£* = 0, 1=И=*А, *^ = Л нетрудно проверить^ что min W(Д С и, о) = А — pib щТ'— qibС ^ min W(х, С, и, о). Поэтому для стратегии хг: хг (С, и) = xik (где ik определяется,, как и выше, по С и и) №(хг) ^ №(х). 1.9. Положим и'=(и'ь ... , и'п), у = (и, и'). Тогда к. ф. *& еЛ40 (М0 см. в решении задачи 1.8), н. ф. yt=N=iy\ J] Щ=В, щ >0, \щ — fif|<8|9 и, >0, i = 1, ... , л}, к. э. п W(x,y)= 2]max(x, —йй, 0). *=i Утверждение о целесообразности осуществления нападением- «концентрированного удара» доказывается аналогично тако- му же утверждению задачи 1.8. 1.10. Пусть j^eG, t=l, 2, 3 — точки города, в которых располагаются пожарные части. К. ф. #= (х1, х2, х3)еЛ40= = {xj^eG, х1фхК 1ф\}, н.ф. y<=N=G, к.э. №(*, t/) = = min р(х*/у). Возьмем произвольную стратегию ^еМ0. Если при некотором I точка х1 совпадает с центром круга G, 7Т
то W(x)=R. Пусть каждая точка х* не совпадает с центром круга G. Положим Gi=B(u{t р(и\ **)), где точка uleG такова, что р(и*, х1) = max р(и, х*). Если для некоторого I x*£=int Gu ]ф1> то №(х)=р(х*9 и1). Пусть, далее, для любого г найдется номер / такой, что \Ф1 и x'eintGt. В этом слу- чае для каждой из трех пар х{, х*9 хФ\, t, /=1, 2, 3, через и** и v*' обозначим точки пересечения прямой, проходящей че- рез середину отрезка [х\ х*] перпендикулярно к нему, с ок- ружностью круга G. Нетрудно проверить, что тогда W (х) = max max (р(х, и'/), р (х9t#)). 1.11. Пусть xi — точка области G, в которой бурится 1-я -скважина, t=l, 2, .... Будем предполагать, что к. ф. х=(х1, х2, ...) всегда удовлетворяет условию: для всякого i ххФх\ j = l, ..., I— 1, если х*-х0В(у% г) и формально х*—**-1, если хг-*^В(у% г). Пусть Gi=£2\G — дополнение к области G. Тогда н.ф. t/eW={t/eG|p({/, Gx)^r}, к.э. №(*,</) = min{t|^eB(y, г)}, .если И {х'}(\В(у, г)Ф0, оо, в противном случае. Рассмотрим функции X1: х1(х{, ..., х*-1, у) eG, xt(xl9 ... -• я'""1, #)¥=*j, /-1, ..., i— 1, если х*-1<£В(у, г)^, ?(х|, .„, х'-1, >y)=jci"1, если хиеВ(у, г). Для стратегии * = (х1, х2, ...) оценка эффективности равна ич*) = min{*| (J B(xl,r)Z3N}, если #<= И В&.г), оо, если N ф [} В(х', г). /=1 1.12. К. ф. х = (и, p)e=Me={x|0<«</C, а</><6}=Л4, я. ф. y=(v, 9)eAf = {y|0<o</C, а<^<6}, к. э. i pmin(u,D) — au, P <% а) Если D</C, то W^ix) = —au, a если D>/C, то U7j (*) = p min (u, D—K) - au. б) К. э. второй фирмы w ix )= Umin[o, max(0, D —ы)Е—со, q>p, \ qmin(v,D) — av, o<p. 78
Если D— р а min(/C,D)<a или р = 6, то W^(х) = — аи, а если u<D £^z£Lmin(/C, D) и р<6, то b — а Wt (х) = р min (и, D) — ш/. 1.13. Введем следующие функции: Л(а) = (1' а>°; s(a) = f1' в>°« И, о<0, 10, а<0. Положим « = («!,... , ат), о = (oj, .... oj, р = (pj, ... , р„.), <7 = fai <7m). х = (и,р), y = (v,jq). т _ а) V (*, #) = min { J] р, min (ы<, Д — о<), m _ max (С— £ ft»,, О)}—&(«), где о, =пнп(Д, hipt—qJVi), i= I, ... , m. m 6) C'=min{£ Pih(qi — p£)min(ub D — o£)," t=i max(C- J] ?i^0)) *=i — количество денег, полученных оперирующей стороной при первой закупке. т __ C1 = max{0,C— £ <?<flt — С — т — J] fc^fa —Pi) min fa, max (Д — щ, 0)] \ — количество денег, оставшихся на рынке после первой закупки у второй фирмы, первой закупки у оперирующей стороны и второй закупки у второй фирмы, к. э. оперирующей стороны W(x, у)=С + minlCx, £ PiS{Pi — ft) min fa, max (D,— uif0)]\ 79
1.14. Пусть it — количество хранимой на складе продук- ции в начале t-го отрезка времени после удовлетворения спроса yt. Тогда it=max(it-\+xt—уи 0), *=1, ..., Т. Положим x=(*b ..., *т), у=(уи ..., Ут)\ к.ф: хе=Л1о ={*|**>0, t=l, ... ..., Т}> н.ф. ys=N={y\dt^yt^Dtf *-1, ..., Г), к.э. r r г IP(*></)=<* £ */ + Р £ *<+Y J max (у,-*V-i-*,,())> *=i *=i *=i стратегия предприятия jc = (хг, ... , хг) е М: дг1=х1>0, ^(xlf ... ,л*-ь #i */,_i)>0, * = 2, ...,7\ г г W^(jc) = a J xt + J] тах{р max (i*_i + ** — <**> 0) + + утах(^— х,— 1,-ь 0), pmax(//_i+х, —D,, 0) + + у max (Dt — xt — i*_i, 0)} (воспользоваться тем, что критерий эффективности W(xf у) является выпуклым по у). 1.15. Стратегия туриста — движение вдоль спрямляемой кривой, один из концов которой совпадает с Р. В пунктах а) и б) будем считать, что две конгруэнтные кривые задают одну и ту же стратегию. Кривую и соответ- ствующую ей стратегию будем обозначать одной буквой. Для произвольной стратегии L через d(L) обозначим длину кри- вой L. ^ а) Указание (решение см. в [28]). Вначале показать, что стратегия L тогда- и только тогда гарантирует выход из леса, когда CoLzd£(P, 1). Затем для произвольной стратегии Ly гарантирующей выход из леса, построить кривую L(a) дли- ны d(L(a))^d(L) такого же вида, как кривая, изображен- ная на рис. 2 с а, необязательно равным я/6, 0^а<я/2. На- конец, показать, что я/6 — единственная точка минимума функции d(L(a)) на [0, я/2). _ б) Допустим, что найдется кривая_£ длины d(L)^V2, не совпадающая с отрезком длины V 2 и такая, что страте- гия L гарантирует выход из леса. На кривой L возьмем две точки Д иВ, максимально удаленные друг от друга. Тогда р(Л, B)<V2. Нетрудно показать, что квадрат G можно рас- положить так, чтобы точки А и В лежали на его диагонали и, кроме того, нашлись две точки С и D кривой L, лежащие на противоположных сторонах квадрата или их продолже- ниях (см. рис. 5). Тогда минимальная по длине ломаная Lb соединяющая точки Л, В, С и D, имеет длину d(L\) ^ 80
^d(1)^1/2. Покажем, что d(L{)>V 2 и тем самым придем к противоречию. Положим р(А, F)=x, р(£, Н)=у (см. рис. 5). Поскольку р(С, В)^р(А9 В), то р(Л, С)>х и, аналогично, р(Я, D)>y. Если LX = CABD, то d^) = р(С, Л) + р(Л, В) + р(5, D) >X + V2- — *-y+y = Vz. Далее, заметим, что p(A,C) + p(C,B)>x+Vx* + (V2 -x-yf = = min (р(Л,С') + р(С',В)). Если Lx = ACBDy то <*(!*) = р (Л, С) + р(С, В) + р(В, D) > >x+Vx* + (V2 -х-У? +У>У*. Пусть, наконец, Lx = ACDB иф=^DCK. Заметим, что -у-<Ф<я, р(С,Д) = -^-и:р(Л,С)+Р(Д 4 sinq> Отсюда d(Lt) = р(А, С) + рф, В) + р(С, D) > sin(q>—2.) БШф в1Пф 1 хТ Б1Пф >1/5\ B)fw=-iln(_^±iL). f Указание: выбрать на плос- кости прямоугольную систему | координат и расположить квад- | рат G таким образом, чтобы на- j чало координат совпало с од- ной из вершин квадрата, а две / стороны квадрата лежали на координатных осях. Для произ- вольной точки (a,b)^G, О^а^. ^1, 0^6^1 показать, что мате- матическое ожидание расстоя- Т ния, пройденного туристом перед выходом из леса, равно Рис. 5 81
f=0 /«о -ln(/3fi^-4/)) + 4i(ln(l/? + 7"-bb)-- - In (/?+?"-Ь))]. где b = w4-(l-Q(l_a), t = 0, 1; П/=*/* + (!-У) (1-6), / = 0,1. Функция rf(a, Ь) вогнута по (а, Ь) и Отсюда if (ф) = max d(c, 6) = rf (—, —"l = —In (^2 +1). —VY' (в,»)еб ' V 2 ' 2 У я 1/2"-1/ 1.16. Пусть Li — множество функций, интегрируемых на отрезке [0, Т]. К.ф. «eAf0=Li, н.ф. v&N=Lu к.э. W (и, v) = J((l —и(/))р(0 —(1 -о(0) «(0) А. о где p(t) и 9(0 удовлетворяют ограничениям: Jp£L=mi-cMt)q(t), Ji^ = nb-c%v(t)p(t)9 at at P(0)=P0> 9(0) = flo- Докажем, что при u=ux и любой функции i;eAf решение (р, ^) последней системы удовлетворяет условию: p(t)>0t q(t)>0 при O^f^T. Действительно, определим минималь- ное /о>0, такое, что p(t)>0, q(t)>0 при 0^t<t0 и либа тп\—C\v(t0)q(t0)=0, либо m2—с2их (to)p(t0) = 0.' При Q^t<t& dp(t)/dt<m{, dq(t)/dt<m2, так как p(t)>0, q(t)>0. Следо- вательно, p(t)<mit+p0, q(t)<m2t + q0, 0^t<t0. Определим tl = -± a-. /2 = -—-*-. Из последних неравенств и из условия задачи следует, что* 7<min (tu t2)<t0. Отсюда p(t)>0, q(t)>0 при 0</<7\ Запишем гамильтониан и сопряженную систему: Н = 1|>0(1 — и^р — г|>0(1 — у)^ -f ^1 (/я, — c,tifl) -г +а(/я, —с2ихр), 82
Согласно принципу максимума Л. С. Понтрягина [23J стратегия противника v0^N, реализующая минимум крите- рия W по v^N при заданном и%% удовлетворяет следующе- му необходимому условию: существует константа фо=—1 » решение сопряженной системы (фь *Ы, такие, что t|)i(r) = =1|)2(Г) =0 (условие трансверсальности на правом свобод- ном конце) и v ш==1 1. - »-*k*i(0>о, Отсюда следует, что в некоторой левой полуокрестности U точ'ки Г t>o(0=0. Из уравнений сопряженной системы имеем ty\(t)<0, iMO>0 при /е£/. Отсюда и из вида правых частей уравнений сопряженной системы вытекает, что и на всем от- резке [0, Т] ty\(t)<0, *Ы0>0> причем t|>i возрастает, а ф* убывает. Следовательно, найдется константа а, удовлетво- ряющая условию: —1—Cit|?i (а) =0, откуда о=Т—1/с\ в v0(t) = l, 0^/^kx, v0{t)=0f a<t^T. Таким образом, стра- тегия противника ^о» удовлетворяющая необходимому усло- вию, единственна и- поэтому минимизирует критерий W при заданной стратегии и%. Оценка эффективности Щъ) = - ± схщ (о* -т») + -L [mi + (щ x-q (т)) сг] (о*-т')Ч- + \р (*) —Г —j- <V«2 т8 + (mx + (m2t — 9 (t)) q) т])(а — t) + + ±(mi_/na)(rj-a») + [p(a)-9(a)-or(ml-m2)](r--a)> где РИ = —£-<уя« (<т* — т') + [mx + (m21 — f (t))cj(a—т) +р(т), ?И = /па(а-т) + ^(т), #p(t) = aVrq ^^^X+M—/^T)^^77'1^ — q(x) == а/ёГ<r~ i^5* + p KiJT*1'*7'* + -^4
1.17. К. ф. &eAf0={l, 2, ...}=Af, с. ф. z имеет неопределен-, ность в законе распределения, к.э. F(k, z)=zft-1(a—bh). Пусть со — функция распределения случайной величины z на отрезке [а, р]. Относительно со известно лишь, что (оеЙ=|(о| Г г d со (г) = 21. а Тогда оценка эффективности W(k) = (а — bk) min \zkda(z) = ~zk(a — bk). Последнее равенство следует из выпуклости функции zk и неравенства Иенсена [25, с. 193]. Оптимальная стратегия k0: l — ь5 1.18. К.ф. /к=ЛГ0= {0, 1, 2, ...} =М9 к.э. №(£, 2) = — a min (Л, z)+b min (0, г—Л). а) Н.ф. ге=ЛГ=[а, р], [ аА, А -< а, №(£)==] min(aa + 6(a —А), afc), а<Л<р, ( аа + 6(а —А), А^р. б) Пусть спрос принимает значение z с вероятностью oz и (о=((оа, (Оа+ь ..., сор). Относительно © известно лишь, что coeQ = {(De^-a+1 J] (о2 = 1, со2>0, £ z(o2 = i, £ z2(o2 = z2 + D}. Осредненный критерий эффективности имеет вид *-i l Э J ((a + b)z-kb)(oz+ £ аАюг, а<А<р, z(a + b) — bk, £>р, аА, А < a. W{k,(o) W(k) = l*(a + by-bk> i*>P> — { a* A<a. Пусть теперь a<A<p. Перечислим все крайние точки множества Я. Возьмем пару (г\9 z2), такую, что a<2!<5<z2<p, D + z2 + z1z2 — z{z1+z2) = 0. 84
Тогда z2 — zx z2 —- z4 является крайней точкой множества Q. Множество всех та- ких крайних точек обозначим через Qi. Возьмем тройку (ги z2, 23) такую, что a^Zi<z2<z3<P, D+z2+z2zs—z(z2+zz) >0, Тогда 0 + * + гггш — г(гг+гг) < О, D + 22 + 2,2, —2(2! +22)>0. 2* (*k—*i)(*i —ъ) (М,/)=0> 2,3), (2,3, 1), (3,1,2), ©, = О, 2=^2Л, А =1,2,3 является крайней точкой множества Q. Множество всех та- ких крайних точек обозначим через Q2. Теперь Qi и % — множество всех крайних точек множества Q, поскольку лю- бая крайняя точка множества Q имеет не более трех поло- жительных компонент [8, с. 111]. Из линейности критерия W(k, о) по о следует, что W(k)= min J у ((a + b)z — Ьк)аг+ Y аЫг\ I 1.19. a) W(x) = min \* 1- Жо(г) = ' — ' <o€Q J 1+(« —г)1 О —Lf—!— + ! V 2 \ 1+ха 1+(1— *)а/ Указание: согласно [8, с. 112] минимум по со достигается на функциях распределения вида (0 = Р1/г1+р2Аг8^й, Pi >0, *= 1, 2, 0<2г<22< 1, Pi + p2= 1, Pi21 + p222 = у. Отсюда следует, что гг < 1/2 <22, а при 22 < 22 1 1 п * 2 п 2 * z2 — гх г2 — гх 85
Итак, W(x) = min g(zlt z2), где — (г,.г,)6<? g(Z1,Zi) = *-т + ■ Т"*1 Q= {(Z1,Z2)|0<21<^-<22<1}. Проверить, что не существует (г?, г§) е int Q : fo (z?, 4) = 0, fo fei. 4) = О и исследовать на минимум функцию g на границе множества Q. б) Ответ такой же, как и в п. а)< в) W(x)=\/2 — х2 + х. г) Положим 2= f zd(s>(z). При фиксированном г 1 _ 1 _ max [гЧ(и(г) —г, где й1 = (©| [zd(o(z) =г \. Отсюда Г (х) = min f (1 — (*— 2)2) dco (г) = min (1 — ** + 2xz — г2) = r 1-х2, 2 1^..^3 8 <X<T' 1.20. Согласно [8, с. 209] выражение для'математиче- ского ожидания времени работы дублированного агрегата имеет вид W{x, p1)=jp1(t)dt+pl(x)t2f о где р\ — функция надежности агрегата 1 ОМО.— вероят- ность невыхода из строя агрегата 1 до момента /), pi^Q = = {Pi|Pi(0) = 1» Р\ монотонно не возрастает, непрерывна сле- ва при *>0, pi(0=0, t>T, fp!(0* = <i}.
W(x) = iniW(x, рг) = ~ P.€Q т,п(Г„ -Sfi±5L) . T>*>t, 0<т<11, { U, х = 0. Оптимальная стратегия: то=0, если ti^t2, а если t{>t2, то то — любая стратегия, удовлетворяющая условию Т>т0>тах(71, T—tt). 1.21. Пусть 2=1 или 2=2 обозначает, что в прошлом ме- сяце смежники справились или соответственно не справились с выполнением поставок. К. ф. хе.Мо=[0, 1], н. ф. peJV= = [0,_1], с.ф. 2<=Z={1, 2}, к.э. W(xLp, z) = (x—p)2, страте^ гия x-.Z-^-Mq, х^М. Положим Xi=x(i), i=l, 2 для JeeAf. Тогда wCx, p) = (p-x1)*P. + (p-Xz)*(l-p) = = (1 + 2хг — 2^)ра + (jff — х\ — 2xjp + 4, f(*) = max(4,(l-*i)2), если 1 + 2x2 — 2*i > 0. Пусть 1 4- 2*а — 2jcx < 0; тогда &{х) = (4. 2jCg + 4 — *!>0, (1-х,)8, (l-x2)2f 1<(лг1-2)а, (2ха-4+-»|)' , ( 2лг2 -h jc| — JCj < 0. + **' 1 (1_;С2)г+1>(л:1_.9Ч2 4(1+2(жа-Х,)) 1.22. К. ф. П(=М0 = {1, 2,...} = М, н. ф. = {Я,12<Я<2,2>, к. э. 2)2 XeJV = W{«, Я.) = р„(Х), Mi-pn(b))>iL оо, X(l-PnW)<-7' 121 m /0v 1741 ^(i) = iL, E(2) = i^-' Z(3) = ^r- Щп) = оо!П>4. 87
a) W(x) = \ 1.23. Положим х={хи ..., хп), х0=0, xn+i = l и будем без потери общности считать, что лг^лсг^ — ^'Хп- К. ф- х&Мо={х\0-^.х1<хг<£ ...<хп<1), н. ф. /е N = U, 'к. э. W(x, /) = ( *»' ^е[0' ^' I *,+i — xf, *f € (хг> X(+i], i = 2, ... , п. ( дсж — *,_,, /(jc,>>/(x/), / = 1, ... , i— 1, '+ 1 ". хж — x,, /fo+i) = /(xt) > / (*,), у = 1,... , i— 1, i +2, .... я; <*>*$-£ +(!—£-)«; B)fW = "^r- 1.24. К.ф. JceAfo={Jc|0<A:1^A:2^...<JCn<^}, /еЯ1, н.ф. f^N=L(K), стратегия lc:x(f) = (x, J(x, {/)), к.э.^ WCx,f) = \int)dt-J(x, y)\. a), 6) JP(x)-«/4,b) JP(x)-«/e. 1.25. a) #(t/, 2)= const, 6) #(t/, z) = (t/, 2), ft-i в) Л (*Л 2) = (#2, */4,. .. , y2k, £ йг+i). i=-0 1.26. a) #(1)=#(3) = ... =1, Я(2)=Я(4)=..'=2. Множе- ство MR состоит из m2 стратегий. б) /?(1)=/?(2)=...=/?(ai-5) = 1, R(n-4)=R(n-3) = =R(n—2)=R(n—l)=R(n)=2. Множество MR состоит из т2 стратегий. 1.27. Множество MR содержит mk стратегий. 1.28. Информационные функции R{ и R2 называются экви- валентными, если для любых у\> y2^N, z\> z2^Z R\(yu £i) = = Я\(У2у z2) тогда и только тогда, когда R2(yu *\) =#2(#2,22). 1.29. Надо подсчитать число различных разбиений мно- жества N={1, ..., п} на подмножества. Обозначим это число через Ln. Разбиений, в которых элемент п составляет отдель- ное множество (множество, состоящее из одного элемента), Ln_i; разбиений, в которых элемент п входит в множества, состоящие из двух элементов, Сл-1 Ln-2 и т. д. Имеем Ln = Ln-\ -t- Cn-\Ln-2 + ... ...+C^L1+1. Например, Li = l, L2=U, £з=5, L4=15, Ls=52. 88
1.30. а) К. ф. — номер I выхода С< из пещеры, tsiW0= -{1, 2, 3}, н.ф. */<=#= [3,5; Б], к.э. Г У, i=K Wx(i, у) = \ 8-у, i = 2, W(1) = 5, f (2)=f(3)=4.5. I у — 0,5, * = 3, б) Пусть |=1 или |=2 обозначает решение спелеолога двигаться вдоль отрезка [Си С2] по направлению к С\ или по направлению С2. Выбор |е{1, 2} позволяет спелеологу к мо- менту U установить выполнение одного из неравенств: y^Z или у>3 (для этого ему достаточно измерять пройденное расстояние). В момент t\ спелеолог выбирает ie{l, 2, 3}. Здесь к.ф. х=(1, 1)еМ0={1, 2}Х{1, 2, 3}, н. ф. y<=N=[2,4], к. э. W(x, у) = З-У + W^i, 3), | = 2, у<3, 1 -t- W7! (£, y-l), |=1, y<3,' 1 + ИМ*, У+1). 1 = 2, t/>3, ^-3 + ^(1, 3), 1 = 1, </>3, где Wi (t, #) — естественным образом доопределенный крите- рий из п. а). Возьмем информационную функцию 1, У<3, . "*:*W-{ I' У \ 2, у >3. Тогда;стратегия *=;(£, i) : (»(ОД)<={1,2,3},1€={1^2}. Функ- цию T:R(N)-*~{1, 2, 3} будем задавать вектором (Г(1), 7(2)). Теперь №(2,(1, 1)) = Г(2, (3, 1)) = Щ2, (2, l)) = W(2, (2, 2)) = = W (2, (2, 3)) = Г(1, (1, 2)) = Щ1, (3, 2)) = 6, f (1, (2, 1)) = Щ\, (2, 2)) = Г(1, (2,3)) = 7, W (2, (1, 3)) = Г(2, (3, 3)) = 5,5; JF(1, (1, 3)) = 3,5; V(l, (3, 1)) = Г(1, (3, 3)) = 4,5; Щ2, (1, 2)) = W(2, (3, 2))=5» W(l, (1,1))= 4. .1.31. а) Wjxt) = - б)^^)-3, 1, Щх2) = -8, №(<р) = —!L; 1.32. a) W fc) -~. Wfo) L; 8S
б) r&) = —|L, jfo) = _-L. 1.33. a) JL; 6) 4-; в) ^; r) -±-. ,.34. a) --£; б)-^-; в)-^; г) -^; ' , 46 . 14 . 16 Д) —. ; e) ; ж) . ' ' 875 ' ' 315 ' 75 1.35. a) W{x\) = 4' ^&) = !' ^(Ф) - "Г* — 4 — — 4 6)ffc) = o, f&) = ^-, f^) = ii"; в) №&) = (), $ffo) = l. #(<p) = -£-; r) ?&) = -£-, f&)=l, ^<Ф) = -Ц-- 1.36. 1) a) f &) = - -A-, f (*,) = —|-; 6)f(x1) = --|-, f&) = _-L; 2) a) f fc) =Jf 05) = - 2; 6) "f; fo) = f (*8) = - 2;| 3) a) #(*,) =--i-, f&) = -i-; 6)f(^)=-^-; fW^-lj 1.37. a) У &) = ]?(£) = 1;- ъ)Щх1) = -3, Щх~*) = 2; ^&) = -i--4+-i-.2 = 3. 1.38. а) Г (ж,) = — 34 + 24 ]/2", У fo) = L; — — 4 6) №&) = -! Г(£) = _ » — ID — 4
1.39. Для любого критерия противника Wn(x, у), удовле- творяющего условиям задачи, имеем max Wn(x, y)>Wn(x, 1)>х+ 1. 0€[O.l] Поэтому, если у0 таково, что max Wn(x, y)=Wn(x, у0)> ^€[0,1] то x+yo+a^Wn(xt уо)^х+\ и, значит, Уо^1— а; отсюда №(*)=*+max(l—а, 0). 1.40. Пусть Хг — количество произведенной продукции 1-го вида. Критерий эффективности ( п п 1, J] CiXi — £ с, max (dt- — *„ 0) > d0, «=1 <=! W(jclt.... *„) = 0, V с.лг,- — V c,max(d£ — *b 0)< rf0. i=l <=l 1.41. «7= min №1. кг<$ L щ J 1.42. Г0 = тах[тт(^, max(W2, №3, 1P4)), min(№3, тах(Г„ W2, Wt))]. / 3 8 8> 1.43. a) W0= max IP,, (Г0(*, </)) = ( 8 7 10 \10 10 4J /1 2 2\ 6) We=m\nW(, (W0(x, */)) = з 4 7 ; . \4 2 0/ / 3 10 2N b)0M*. y))=(l8 4 25 \3 2 4> 1.44. a) W0= max min (W,, №,+,); б) W0= min max(№„ Wi+i). l<f<s—1 Положим / = {1, . . . ,' s}. в) W0 = max min Wt; r) W0 = min (max min W{, max min Wt); U\=fc \J\=n-k 91
д) W0 = min max minH^. \j\=k \Jt\=--s 1.45. а) Множество Л определяется s неравенствами и одним S уравнением V А* = Ь Перечислим все подсистемы из s неравенств ранга s: \i <; Xlt Хг < Я2, ..., X/—1 -с Я/, Я/+1 <; Х/+2» • • • » ^s—1 ^Ч> J> = i> /= 1 s-i. Система, соответствующая номеру /, имеет единственное ре- шение VeA:»{ = Ц, *=1, .... /, X{=±zi!L * = /+l,...f 5. '•-A('(Sr')+J^-(S^))- б) Крайними точками множества Л являются в) Крайними точками множества Л являются М:Х{=* i-fr-Ov ^ £ = 1^ — , /, ^ = v, * = / + !,...,s; / '-' *• *.-га(2(-1=|7=а^)''^2,г')- г) -Л(2^+2('-Ег^-)0тйг)Ч KKs—\ \ 1.46. Пусть Хи *2, *з— количества произведенных пар со- ответственно мужской, женской и детской обуви, а х= (хи х2, дез). В первой операции к.ф. 92
x e Mi = {х 12хг + 2х2 + х3 = 300000, 4хг + 2х2 + хв = 400 000, xt > 0}, во второй —к. ф. хеЕМо = {х\2хх + 2*2 + хв < 300000, 4jq + 2х2 +■ х3 < 400 000, х, > 0}, к. э. W (х) = 20хх + 30х2 + 10х3. а) Крайними точками множества М\ являются (50 000, 0, 200 000), (50 000, 100 000, 0). Оптимальное производство соответствует вектору (50000, 100000, 0) = х* и W(x*) = = 4 000 000. Крайними точками множества Ml являются (0, 0, 300 000), (0, 150 000, 0), (100000, 0, 0), (50 000, 0, 200 000), (50 000, 100 000, 0). Оптимальное производство во второй операции соответ- ствует вектору jc°= (0, 150 000, 0) и Щ*0) =4500000. Во вто- рой операции оптимальное производство дает большую стои- мость выпущенной продукций, чем в первой. б) Ограничения на ресурсы во второй операции можно записать в виде Х\+х2^аи 2*i+#2^a2. Нетрудно проверить, что при ai<a2 производство х*= (—ах + а2% —a2+2ai), исполь- зующее все ресурсы, дает меньше, чем производство х° = = (0, min(ai, a2)), не использующее всех ресурсов, т. е. W(x*)<W(x°). При ai^a2 оптимальное производство соот- ветствует вектору дс* и использует все ресурсы. Ответ: ai<a2. 1.47. Положим 6t = max (dt/c?, Bt). Если найдется номер i п л такой, что Bi<£di/c2i9 то искомое условие: V Vafit < V А%. Если же для всех i Bt > d*/c?, то искомое условие 1.48. Пусть g— количество ресурса у первой оперирующей стороны после перераспределения ресурсов. Тогда Л+В—% — количество ресурса у второй оперирующей стороны после пе- рераспределения ресурсов. Очевидно, что 0^£^Л + £. По- ложим т л«о(6) = {*|£ял<6. *>о, i=l,..., ml, п 93
Пусть a(xf у, I)— побочный платеж, осуществляемый после того, как стали известны g, xeAfJ(g), у^ Mq(Q. Если v(x> У у £)<0> то первая оперирующая сторона выплачивает второй величину | а(лг, у> %)\у а если а(х, */,J)>0, то вторая оперирующая сторона выплачивает первой а(х, у, £). Нако- нец, в случае а(х, у\ 1)=0 выплата побочного платежа не производится. Из этих рассуждений следует, что должно вы- полняться неравенство — Wi(x)^a(xf у, Q^W2(y). Опишем модель объединенной операции. К. ф. (1,х,у, а) :£е[0,Л + В], хе=М(Ъ), уеАЙ(Б), ae=[—Wi(x), W2(y)]. Неконтролируе- мые факторы отсутствуют. К.э. W(x, у) = W\ (х) + W2 (у), стратегия — (g, х, у, о): *(g)eMo(0, У(1)^ *й(Б),а(*, t/ ,g)<= ^[-ПЗД, IP, (у)]. Пусть а — максимальная сумма денег, которую можно получить в объединенной операции. Имеем и= max max (Wx {х) + W2 (у)) =* = (Л + В) max ( max —, max —£- ]. Положим Yx = max —, Y2 = max -J-. Если Yi Ф Y2. то (Л + fi) max (ylf Y2) > Луг + Бу«- Последнее неравенство означает, что сумма денег, получен- ных при оптимальном поведении в объединенной операции, больше, чем сумма денег, полученных при оптимальном по- ведении в частных операциях. Таким образом, Yi^Ys—иско- мое условие. 1.49. а) Обратное утверждение неверно. Пример: Mq= = {*=(*ь х2)||*<К1, *=1. 2Ь w(x) = (™М*Ь W2(x)) - = (*i, *2). Вектор (0, 1) е£> является недоминируемым, но не яв- ляется эффективным. S S б) Возьмем стратегию л;0 е М0: max V №* (*) = V Wt* (*°); тогда вектор (ИМ*0), i = 1, ... , s) эффективен. 1.50. Докажем замкнутость множества недоминируемых векторов. Возьмем последовательность недоминируемых век- торов wftsD и пусть иЬ-иг0. Если вектор и0, принадлежащий D, доминируем, то* найдется u'eD : u'i>tfiif i=l,..., s. Тогда найдется &0, такой, что для всех k^k0, u'i>uki, i=l,..., s, что противоречит тому, что uh недоминируем, 94
Пример: Мо = [0, 1], W(x) = (W1(x), W2(jc)), При jc*<1, jcfe—>-l последовательность эффективных векто- ров (xh, l—xk)^D стремится к вектору (1,0), не являющему- ся эффективным. 1.51. Докажем замкнутость множества всех эффективных векторов из D. Возьмем последовательность эффективных векторов uk^D, такую, что а*-*ы° = (w?, tf°)eD. Допустим, что вектор и9 не является эффективным. Тогда найдется век- тор w'eD, такой, что без потери общности и\ > #ь и{>щ. Если щ > и§, то вектор и0 доминируем, что противоречит замкнутости множества недоминируемых векторов (см. за-' дачу 1.50). Следовательно, щ = и°. Теперь найдется номер k0f для которого и\ > а*0 и, поскольку вектор uk* эффекти- вен, И2°>Ы2 = И2. Далее найдется Я, близкое к 1 и 0<А,<1 такое, что Ам'+О—h)uko^D (из выпуклости D) hW*+(1— — К)а ° >, t = 1, 2. Таким образом, вектор и0 доминируем (противоречие). 1.52. Введем следующие множества: T={ae£3|„f + „2=1> „3 = 0}, R= /иб^^и.^-^, 0<Hs<ll и положим D = co(7'U#). Последовательность эф- фективных векторов а* = (со8^, shitk9 0)eD, tk-+n/4, сходит- ся к вектору а0 = (1/1/2, 1/1/2, 0), который не является эффек- тивным. 1.53. a) D = {и € Q | найдется t: ut- = at}, им где / = {1,... , s}. Пусть Dx cz Q — произвольное множество, состоящее из векторов, которые попарно не доминируют друг друга. Определим отображение г: Dr+D; для всякого u^Dt положим г(и)=и+те, где е=(1,..., l)e£s и -т=1вдх{£|и+ +AeeQ}. Если иу u'^Diy ифи', то г(и)Фг(и'). Отсюда сле- дует, что |Di|<|D|. б) Пусть без потери общности а1<а2<аз« Определим мно- жества D* = {(t, fc —t)e£2|niax(0, k — ОгХ t<min(a1, Л)}, 4 = 0,..., ах + ag. Для s = 2 при аг < А «С а2 D = D*. Возьмем 95
s = 3 и Dk = DkХ{ях -Ь ch — k) cz. £3, & = 0,.. . , аг + a2. Если Дз > ах -f а2, то D = у D*; если а3<аг + а2 и ах+ а2— а3 =, *=0 at+a2—m , = 2m, то D = (J Dk\ если а3 < at + а2 и ах + а2 — а3 == fc-=m Oi-H*2—m— 1 = 2m -f 1, то D = [J D*. fc=m 1.54. Возьмем вектор Р° е £s таким, что р° < min wf,' i = 1, ... , s. Еслире int£+ и i/eDjfp, p°j, то u^N(D), В самом деле, если u£N(D), то найдется вектор и' е D такой, что и* > wt-, t = 1, ... , s. Отсюда min рх (щ « р?) > min pt (щ--р?), что противоречит тому, что «gD^p, р°). Пусть u^N(D), тогда для р; = \!{щ~ р?), t = 1, ... , s, «gD^p, р°). Итак, доказано, что N (D) = |J £>х(р, Р°). Аналогично доказывает- ся второе равенство. 1.55. Указание: воспользоваться теоремой об отделяющей гиперплоскости [21, с. 47]. 1.56. Пусть множество P(D) регулярно в точке u^P(D). Множество D не имеет общих внутренних точек с множест- вом S S В (и) -={w'<= Es\tii >щ—с(и) (У щ — V щ\ 1=1, ... , sL i=i i=i Поэтому по теорегле об отделяющей гиперплоскости найдется s s _ вектор Ае£5, КфО, такой, что V^>VMi для всех и'^В (и) и ueD. Возьмем и" е В(и):щ = uit i=£j, щ = И/ +е„ S S е>0 и й=и\ тогда из неравенства V ^и* > V Jitwt- t*=i t=i следует, что Jtje^O и Jl^O. Итак, Х^О, *=1,..., 5. Предполо- жим, что найдется номер /, при котором A,j=0. Возьмем но- мер /i, такой, что A,ji>0, и рассмотрим вектор и":щ= щу i ф /, jv и] = Uj -г a, tij> = Uj\ — b, а > Ь. Тогда при фиксиро- S ванном b и достаточно большом а вектор и"е£, но У%и*< i=i s < V A/«i (противоречие). Итак, Яг>0, /=1,..., 5. Если для i=i 96
точки u^P(D) найдется вектор Я е int£+ такой, что» 8 S V \щ > У А* и* Для всех u'^P(D)f то в качестве констан- ты с (и) в определении регулярности можно взять любую» константу, удовлетворяющую условию miir К{ Q<c(u)< 1<1<S . max Ki 1.57. Указания. Без потери общности можно считать /> выпуклым телом, т. е. выпуклым множеством, содержащим, хотя бы одну внутреннюю точку (покажите!). Пусть D\ — граница тела D. Показать, что множество точек из Du к ко- торым существует единственная опорная гиперплоскость мнск жества Ь, всюду плотно в Dit Взять произвольную точку weP(D), имеющую единственную опорную гиперплоскость к множеству D с вектором коэффициентов А, е Ы£+. По- казать, что в некоторой окрестности U точки и любая точка u'^UQP(D) имеет опорную гиперплоскость к D с вектором коэффициентов А/ Т^ > ht > 0, 1= 1,..., s, где константы h; завися? только от и. Завершить доказательство, пользуясь компактностью P(D)t. Пример. £>=Q\#, где Q={we£2|0<a^l, t=l, 2}„ R={u<=E*\(Ui—1)2+(и2—1)2<1/4}. Здесь множество P(D) регулярно, но для любой последовательности uh:tik^P(D)t ы*-*и°'=(1, 1/2) последовательность с(uh)->0. 1.58. Пусть с — константа, фигурирующая в определении: равномерной регулярности. Возьмем е, удовлетворяющее ус- ловию: 0<г<с min ( 1—ыт) l<*<s I max«/— pf J Ясно, что (J De(p)cP(D). Докажем обратное включение*. Для данного вектора aeP(D) возьмем в качестве коэффициен- тов pi = 1/{щ — р?), 2=1,..., s. Тогда для всякого и' еР(D> min Ми'< —р?) — min р^щ — P?) = = min pt(w< — P?) — 1 = min Pi(Ui — щ)<ь s s <T,2!S(";-"l)<-e(S";-S"')- Полученное неравенство означает, что weDe(p), 9Г
1.59. Возьмем произвольный вектор Ре Е2. Покажем, что! для всякого asD^p, р) ai~Р* = "2 —Р2 > в самом деле> пусть, например, "1'""1 < "a~P2 . Возьмем вектор w'eD. * / rx(D) ^ r2(D) F at — pi такой, что = 1. При X : 0 < А, < 1 и достаточно близ* ком к 1 вектор и = А,и + (1 — Я) и! таков, что \ rx(D) r2(D) / ^ rx(D) \ rx(D) r2(D) ) (противоречие). Итак, для «eD^p, p) ^"""P* =v "2 —Pa . отсюда следует, что множество Dx(pt Р) состоит из единственного эффективного вектора. ГЛАВА 2 2.1. Критерий эффективности F (х (•)) = J a (s) х (s) ds + М, s - где Л1 = J с (s) ds; ограничения на стратегию х (•): 0 < лг (s) < b (s) при seS и J x(s)ds<X. 5 Рассмотрим следующие два случая. 1) [b(s)ds<X. При этом F0=maxF(jc(.))==f^(s)6(s)tfs+M л оптимальна стратегия x°(s) = 6(s), seS. 2) J 6 (s) ds > X. Определим a, 0, 0 < 0 < 1 так, чтобы j 6(s)ds + 0 j 6(s)ds = X, Si(a) S2(a) где Si(a) = {s€=S|a(s)>a}, 52(a) = {se;S|ti(s) = a}. Тогда F0= j 6(s)a(s)ds>0 J 6(s)a(s)ds+Af; Si(a") ' Si(e) 98
x*(s) r° (c\ = оптимальна стратегия b(s)t s^S1(a); при s^S2(a) произвольно из [0, b(s)] и таково, что j* *°(s)ds = X; { 0, se{seS|a(s) < a}. 2.2. Если Jds/a(s)< 1, тоF0 = maxF(jc(•)) = \dsи оптймаль- на любая стратегая x°(s) > 1 /a (s), удовлетворяющая ограниче- ниям. Если же J ds;a(s) > 1, то задачу можно записать в виде: s найти max Г a (s) х (s) ds при ограничениях 0 < х (s)< ] 1 /a (s), s е S; jc(s)ds= 1. Решение ее найдено в 2.1 при b(s)= l/a(s). Для варианта б) задачи отсюда следует i 1 1) * = 0. f-^- = oo, F0 = 2/3; *°(s) = —l l ^'">-г о, |e|<Y- 2) jfe > О, Г-^- = -^=- afctg —)=■. Определим k из уравнения J a(s) у ft yk —— arctg —— = 1. Тогда, если k< k, то F0 = 2(4 —J); КГ Ki *°(*) = l -» \s\ >s; (fc + s8) ' ' ' [0, |e|<ii где = K|-(i-Vlte-!^)/(VT+tgif). При k^k имеем. F0 = 2 и оптимальна любая допустимая страте* rmx°(s)^l/(k + s2). 2.3. Пусть *£>0 и 0<е<*£. Введем функщш ф(е)=/,(л?-е)+//(^ + е)+ £ fk(x»), где /=£*. Вектор (*°,... ,*° — е,... ,*9 + е,... ,х*) удовлетво- ряет ограничениям. Так как ср(е) имеет максимум при е = 0, то 99
Ф' (0) < 0 или // (*/) < ft (x°t). Если одновременно х) > 0, то спра- ведливо и обратное неравенство \\(*?)<//(*/), т. е. fi(x°t) = k при л^>0. п 2.4. Задача состоит в максимизации V р;(1 — ё~ь***) при ус- /I ловии V xi = X, jct- > 0. По лемме Гиббса <Я, х, = 0. Если р£6£ < К то *t= 0. Если же pfii > Я, то xt = — In -^-^ Обозначим h(k) = V —In -^-. Легко проверить, что h(k) непрерывна и строго убывает при 0 < X < \х = тахрД. При этом h(k) >Х для достаточно малого X. Таким образом, вытекающее из ограничений уравнение h (X) = X имеет единственный корень X, представляющий искомое значение параметра А,. 2.5. Критерий эффективности F(*(0>"(0) = ]ll-u(t)]x(t)dt. о При а < Р оптимальна стратегия и0 (0 = 0 и F0= max F(x(-),u(.)) = -±ll-e-V]. *(•).«<•> Р Пусть а>р. Применим принцип максимума Л. С. Понтряги- на [23]. Сопряженная система имеет вид *(0 = -И(0-РЖ0-П-"(')]■ *(Т) = 0; а гамильтониан Я = [сш-р]^(0*(*) + (1—")^(0 = = Кг(0^(0 — ^(0]"-Р^(0^(0 +^СО- Производная — [аде (0 i|> (0 — х (0] в силу системы отрицатель- dt на, следовательно иЦ (1, o</<v. w- lo, fe<«T. 100
'.= Соответствующая траектория x,M=l^e-w'. o<t<t0, значение функционала F0 есть функция /Co) = "f- в**"»**П -e-^-wj. Оптимальное значение *0 находится дифференцированием: |'+ita(,-i)-'>'lTta('-f)|' [ 0, в противном случае. 2.6. Если 7*^1, то и°(0=—1# При Т>\ оптимально уп- равление м°(0 = | ! х 'На отрезке [1,Г] оптималь- ное управление не определяется из принципа максимума, так как гамильтониан тождественно равен нулю («особое» опти- мальное управление). 2.7. Любая последовательность {un(t)} управлений, для которой |ип(t) | is 1, \уп(t) \^1/п является максимизирую- щей. Например, ип(./) = (— l)h при— </<-*+!-, k= п п = 1,..., п—1. При этом соответствующие траектории равно- мерно по t сходятся: хп(t)-+xfi(t)=f, yn(t)-+}/>(t)maQ. Однако *°(*)э y°(t) не являются решением системы. Таким образом, в данной задаче не существует оптимальное управление. Су- ществует лишь е-оптимальная последовательность управле- ний, для которой соответствующая последовательность фазо- вых траекторий сходится равномерно (так называемый «скользящий режим» [ 14]). 2.8. Пусть К — количество средств, сохранившееся после (/— 1)-го года; хи Ух — вложения в отрасли 1- и 2- в 1-м го- ду; Wi(K) —максимальный суммарный доход, который мож- но получить за /, /+1,...,m годы. Уравнение Беллмана [3,6] имеет вид «7,(70= max r/i(*i)+/tW-*i) + ^i+i(eri!te) + ft(iC-Jr,))J. Здесь yi=K—хи TPm+i(/C)=0. Максимальный доход за тлет равен Wi(/Со). а) Оптимальные вложения средств в отрасли: Год 1 2 1 10,0 0 2 7,5 0 3 5,6 0 4 1 0 4,2 5 0 1,3 101
При таком распределении средств остаток в конре пятой* года будет равен «0,4 и за пятилетку будет получен макси- мальный доход, равный И?°«22,7. б) Оптимальное распределение средств: Год 1 2 1 1,60 0,40 2 1,02 0,30 3 0,62 0,24 4 0,30 0,24 5 0 0,30 При таком планировании будет получен максимальный до- ход за 5 лет, равный №°«4,35; остаток средств в конце пе- риода «0,09. 2.9. Задача состоит в нахождении хи..., хп, минимизирую- п щих V fk(Xk) ПРИ ограничениях i i где Xi — количество станков i'-го типа. Обозначим через Wi(\) значение минимума функции Т\ fAxk) с ограничениями г хг ^ Ll9 Ui+.'.". +xt>i S где LS = X] Ьк; s= \9п. Тогда для Wt(Q справедливо следую- щее уравнение Беллмана: IF, (6) = min {/,(*,) + Ун (max[L,_b £-*,])}, А{ (|) = max [0; \ - U-i], U < \ < 1Я. а) Пользуясь полученным уравнением, находим, что опти- мальная стратегия есть *J = 3, л£ = 0, х% = 7, х° = 0. б) Оптимальная стратегия, очевидно, находится следующим образом. * Занумеруем все ak9 k = 1, /г в порядке неубывания: а^, а*2,... ...,я*я, гдеа^<ал<+1; i ='1, ... ,/i — 1. Оптимальный выпуск станков типа &4 равен сумме потреб- ностей в тех станках, которые могут быть заменены станками типа ki. Оптимальное количество станков типа k2 равно сум- 102
ме потребностей в станках, которые заменяются станкам» типа Лг, но не заменяются станками типа k\ и т. д. В том случае, когда ai>a2> ... >an (т. е. более совер- шенный станок является более дорогим) решение задачи единственно х°= (Ьи Ь2,..., Ьп). 2.10. Обозначим цену партии цыплят в х штук через с(х); затраты на хранение в неделю — г (х); Xi — количество цыплят,, купленное предприятием в i-ю неделю, l^t^5. Тогда задача отыскания оптимального плана закупок сво- дится к минимизации £'(*0+ £'(£*/-зо(«) при ограничениях i *i>600; J]^/>300i; 2</<5. /=i Пусть за i недель уже закуплено g цыплят. Обозначим чере* Wi(l) минимальные суммарные затраты на покупку (1500—g) цыплят и хранение в течение i+l,...,5 недель. Для Wi(l) справедливо рекуррентное соотношение Wt (1) = min {с (*Ж) + г (БЧ- *ц - 300 (i + 1));+ WW (I + *,+,)}. Здесь 300 t^g^ 1500, так как потребности в цыплятах долж- ны удовлетворяться и max [0; 300 (i + 1) _ g] < Xi+l < 1500 - g; H74 (g) = с (1500 -£). Искомые затраты есть W0(0). Поскольку Xt^600, то решение полученного уравнения Беллмана не выводит нас за пределы таблицы, приведенной в условии задачи. Ответ: W0 (0) = 2030, оптимальна стратегия *° = 600, 4=0> 4 = 300, 4 = 600, 4 = 0. 2.11. Выпуск продукции максимальной суммарной стои- мости находится из решения задачи линейного программиро- вания: *i + 2jc2«>niax (2A:1 + 4jt2<llt *i + 3x2< 7, [2х1+ х2 < 10, х19 х2 > 0. 103
.Множество решений этой задачи есть отрезок, соединяющий точки (5/2, 3/2) и (29/6, 1/3). Оптимальной стратегией яв- ляется х°=(3,1; 1,2) —точка на отрезке, ближайшая к точке (3,1). При этом стоимость выпущенной продукции равна 11/2, а стоимость перестройки 0,3. 2.12. max г =10; л:0 = (—, —] . 2.13. Двойственная задача 3#i + #2-* max 2#i - Уг < 1; — Ух + Ъуг < 1; 3#i — 4#2<2; — 2*/г+4*/а<8; yvy2>0, -может быть решена графически. На основании теоремы двой- ственности [5,14—16]minz=3. Этому условию и ограниче- ниям прямой задачи удовлетворяет единственная точка (2, 1, О, 0), которая и будет решением. 2.14. тгхи(х) = .... „ h _ находится с исполь- х W (а+Ь + с)а+ь+ср°рь2рсг зованием правила множителей Лагранжа [14] и дости- гается при i = J!^L = J^fL= _5jL. а+b + с a b с 2.15. Метод множителей Лагранжа неприменим. 2.16. minz=15; *°=(2,5; 3,5). 2.17. Локальные максимумы — в вершинах многогранника условий. 2.18. Ответ: для задачи линейного программирования х°=- = (0; 1,75); с округлением л?=(0, 1); для целочисленной за- дачи х°=(1; 1). а %л in • 708 0 /33 б\ 2.19. 1) mm* = —;*<>==(—, т). 2) тахг = 8 4 3 КТЗ; л;0 = (2 + -±^9 1 + JL-). 3) max* = 45 + 3l/t7;jc0=(^9Y^|/9^7)> 4), 5) maxz= 18; *° = (3, 2). 2.20. Плотность случайной величины х есть с/ \ 1 Л 2а« 104
Вероятность того, что деталь будет выброшена, равна f f(x, a)dx, а вероятность того, что деталь передадут длядо- о т работки — f f(xf a) dx. хг Таким образом, критерий эффективности (средний доход) есть xt т F(a) = (p-k)-[pp(xt a)dx + (р-рг)^(х, afdx]. Ясно, что абсолютный максимум F(a) не будет достигаться на границе при а=0 или а=т. Следовательно, оптимальное значение а должно быть решением уравнения xt т ^ = _Pf^/(^a)dX~(P~Pl)l^/(^a)^=0- О хг С учетом сноски к 2.20 можно считать 0 —ов m оо (*а—а)1 J да /v ' /2яа J /2яа где Таким образом, уравнение dF/da = 0 принимает вид или 2<т* In f —^—) = (^ - af - (х2 - а)\ v р —Pi / Отсюда получается единственное решение ао __ *1 + *8 + —^— in (—£— )> -*+*- *а —*i V р —Pi / 2 105
2.21. а) См. рис. 6. б) 710) = 10, 7f> = 30, Tf) = 20, П0) = 35, 7f = 40, 7l0) - -50, 7? = 50, Tf-lH} = 709 Тф =50, Тф =65, 7?> =40 7<4!) = 35, 71° = 20, 71° = 35, 7l°=15. Рис. 6 Критическое время проект* Г=70, критический путь РоРзРкРьр7Р8. 2.22. Порядок сокращения времени выполнения отдельны* работ, критические времена и стоимости получающихся, проектов представлены ниже: Продолжи- тельность плана 37 36 35 34 33 32 31 30 29 28 Стои- мость 350 353 358 363 376 389 402 415 433 452 Продолжительность работ 1 а 4 4 3 2 2 2 2 2 2 2 1 * 6 6 6 6 6 6 6 6 6 5 1 с 4 4 4 4 4 4 4 4 4 4 d 12 12 12 12 12 12 12 12 12 12 е 10 10 10 10 10 10 10 10 9 9 f 24 24 24 24 23 22 21 20 19 19 m * 7 7 7 7 7 7 7 7 7 7 10 10 10 10 10 10 10 10 10 10 i 3 2 2 2 2 2 2 2 2 2 2.23. Решением задачи директора, очевидно, будет неко- торая п — перестановка чисел а = (11э t2, • • • > */г> • • • > *л)> 106
соответствующая очередности приема посетителей. Обозна* чим через U (а) — время начала приема t-ro посетителя. Тогда суммарное время равно Предположим, что о*= <11э..., i, /,..., in> — оптимальная стратегия, реализующая минимум F(a). Применим переста- новочный прием [27]. Поменяем порядок приема каких-то двух посетителей, принимаемых в о1 один непосредственно за другим: Тогда Р(*) = А+Ь(*) + Ы*)9 (2231> где А — общая неизменная часть F(o)t так как времена ожидания в приемной посетителей, имеющих номер, отличный от i, /, не изменились в о2 по сравнению с о1. Так как а1 — оптимальная стратегия, то ff^XfM. (2.23.2) Пусть т — момент окончания приема предыдущего посетителя для 1-го в а1, /-го в а2. Тогда ^•(<г1)=т; ^•(a1)=t+7,f; tj(o2) = =т; ь(&)=т+Т}. Согласно (2.23.1,2) Т^Т5. Последнее означает, что / оптимальна очередность, соот- ветствующая порядку возрастания Т%, г=1,..., п. 2.24. Можно считать, что в оптимальном решении поря- док обработки деталей на первом станке и на втором один и тот же и задается перестановкой ian=<*i, h* •••»iu>. * Рассмотрим фрагмент графика Ok=<iu k, ...» к>, k<n. Введем обозначения: А(ок)—время окончания выполнения обработки деталей графика ок первым станком, В(он) —вто- рым станком. Очевидно, что A(ok+x) = A(ogi) + at9 B(ok+\) = тах[Л(о*+1), B(ak)] + biy где огЛ+1=<аЛ, />. Критерий оптимальности B(an). Пусть а\ = {ily..., tk, t, /,..., in) — некоторое решение. По- строим a;* = (t\, ... , ikt /, it ... , in). Обозначим A (ok) ■= т„ В (ok) = т + Д. Тогда в a*: ^(°t+i) = T+ а» B K+1) = max (x + aitx + Д) + bh 107
далее B(oxk+2) = max(t + a, 4- af; max(t + a,, x + A) + ft,) + ft/, или 5K+2) = T + */ + ma*(a< + af9 ai + ft,, A + ft,). Аналогично для a2n: A(<%tf) = * + (h + *fi Д (°2+e) = * + ft* + max (a/ + 4, a, + ft,, A + ft,). Легко видеть, что если В (о£+2) < В (of+2), то первое решение* не хуже второго, так как второй станок высвобождаете^ раньше. Это неравенство эквивалентно следующему: max (— ft,, — djt А — а, — aj) <; max (— ft/, — a,, A — a, — aj). (2.24.1)1 Неравенство (2.24.1) выполняется, если max (— ft,, — aj) < max (— ft/, — a,), что равносильно min (a,, bj) < min(ay, ft,). (2.24.2) Итак, если соотношение (2.24.2), имеет место, то i предшест- вует / в <тп. Нетрудно обнаружить, что (2.24.2) выполняется,, если а) a, < ft,, а б) а, < ft,, а в) а, ^ 6,, а ^ ft/, ft* > ft/. Это мбжно сформулировать в виде решающего правила [27], Пусть имеется k таких i, что a,^ft,. Тогда, если а^<6^ для l^k и, кроме того, ai{ < a,/+i 'при /<&; at, > bi{ при />£ и, кроме того, bi{ >Ь1+1 при />&, то an=1(hy • • • >h'> '*+ь • • • у in) оптимально. Согласно решающему правилу сначала выби- раются детали t, у которых первая операция а* короче вто- рой операции Ь%. Эти детали обрабатываются в порядке воз- растания а*. Остальные детали обрабатываются в порядке убывания fti. Оптимальное решение примера: <4, 2, 6, 3, 5, 1>. 2.25. Пусть | и т) — время, необходимое на процесс плав- ки и литья для 1 т стали и металлолома соответственно. По- 108
ложим х=(хи х2)у У=(1> л). Контролируемый фактор — хеМ0={*|0^*1^;4, О^дс^б}, неопределенный фактор */е=#={*/|2, 5<£<^3; 1,5^т,<2}. Критерий эффективности: W(x,y)=\ 3Xl — Зхг —5х2, (*, y)eQ, где Q={(x,y)\ ч X-i О х2>5; &! + *&< 18l. Стратегия х=х^М=М0. Необходимые и достаточные усло- вия гарантированного выполнения условий задачи ^<у.'0<*1<4, 0<jc2<6; хх + . >5; Зх1+2л:2<18. "(2.25.1) Оптимальная стратегия х° определяется из решения задачи линейного программирования —3*i—5дс2-ипах при ограниче- ниях (2.25.1) и равна дс°=(4, 1). 2.26. Обозначим через xt число полицейских, ежедневно приступающих к работе в период /, 1^^6. Тогда задача б *=1 составления расписания сводится к минимизации г = при ограничениях: [*i + *e> 20, хг 4- хх > 50, х3+ х2> 80, { xt -I- *3 > 100, х9 + хь > 30, xt >0 — целые; * = 1, ... , 6. Двойственная задача линейного программирования [16] w = 20& + 50г/2 + 80$/, + 100& + 40уБ + ЗОу, -*- max М 10 0 0 0) 0 1 10 0 0 0 0 110 0 0 0 0 1 10 0 0 0 0 1 1 [I 0 0 0 0 1 j . <У^ Уг Уз У* Уь УУ«) < 1 П. 1 1 1 1 1 iW */t >0, i = 1, 6, имеет решение */°= (0, 1,0, 1,0, 1); max ш=180. Отсюда, ис- пользуя теорему двойственности [16], находим решение пря- мой задачи линейного программирования я°= (0, 50, 60, 40, 109
10, 20), min г=180, которое оказывается целочисленным и, следовательно, дает оптимальное расписание. 2.27. Пусть Х\ — количество леса в тоннах, предназначен- ное для получения пиломатериалов; х2 — для изготовления фанеры; х$ — количество леса в тоннах, не подвергающееся переработке. Тогда подлежащая максимизации целевая функ- ция (средняя прибыль) имеет вид z = 10*! + 15*2 + 3*3. (2.27.1) Ограничения на объем имеющегося в наличии леса: хг + х2+х3--= 10, лг/^0, / = 1, 2, 3. (2.27.2) Условия на реализацию продукции: P[3jc1<D1]>0, 8; P[5*2<D2]>0. 8. (2.27.3); От вероятностных ограничений (2.27.3) перейдем к эквива-' лентрым детерминированным [4]: 3xx<3, 5*2.<3. (2.27.4) Решение задачи линейного программирования (2.27.1,2,4) определяет оптимальную стратегию лс°=(1, 3/5, 42/5) if дает максимальную среднюю прибыль 44,2. 2.28. Проведем доказательство по индукции [24]. При я=1 очевидно, что утверждение справедливо. При п=2 по- лучаем (яА + <*А) ~ (яА + a2&i) = (fli — *2) (6i — h) > 0, т. е. ai&i+a2&2>0i&2+fl2&i. Предположим, что утверждение справедливо при 1=1,..., ky /=1,...,k\ покажем, что оно верно и при k+l. Можно записать щ=аш+р{; bi=bh+i+qurjie ри ?г>0,рл+1=^+1 = =0. Подстановка дает k+i ft+i k+i k+\ £ afij = ak+lbk+i + J] bk+iPi + J] ak+xqj + £ Piqf. Первые три выражения в правой части не зависят от того, равны i и / или нет, следовательно являются константами. По предположению a/t+i+Pi=ai>ai+1 и, таким образом, k+i pi>pi+t. Аналогично qi>qi+i. Теперь, если £ ptqf со- k+\ к держит член pft+1^+1=0, то ]£ ptf/ = £ р#/ достигает максимума при t=/. но
Рассмотрим теперь случай, когда появляются два члена, равных нулю: Pfe+i?s> qh+ipt, 1^5, t^.Jt. Тогда сумму можно переписать следующим образом Л-Н к £/V?/= £ PiQi-PtQs- По индукционному предположению сумма в правой части достигает максимума, если i=/\ и так как ptqs>0, то k+l k k л-М Таким образом, сумма становится максимальной, если *=/, что и завершает доказательство. 2.29. Пусть Si — количество топлива, заготовленного на х-м складе (х=0, 1,..., я), d* — расстояние между (х—1)-м и /-м складами и k\ — число рейсов между этими двумя точка- ми. Тогда *_i = Si -f 2ktdi + dt\ i = 1, ... , п. ' (2.29.1) Нетрудно видеть, что используется минимальное количество топлива, если перед каждым рейсом автомобиль полностью загружает свой бак. Кроме того, чтобы в конце пути топли- во не оставалось, необходимо, чтобы автомобилист забрал 500 единиц топлива на 500-километровой отметке. Из этих двух условий следует, что *"-й склад надо располагать таким образом, чтобы автомобиль делал ki+\ рейсов между i и (х+1)-м складами в обе стороны и один рейс вперед пол- ностью загруженным и не оставлял после себя топливо на х-м складе. Однако автомобиль сделает последний рейс между исходной точкой i'=0 и первым складом с загрузкой £^500. Таким образом, получаем st = ki(500 — 2dt) + 500 — dt\ i = ~2~n\ sx = kx (500 — ay +c — d1. (2.29.2) Требуется минимизировать VSOO^ + c. (2.29.3) Так как sn=500, то, чтобы минимизировать s0, достаточно разместить склады вдоль 500-километрового пути: £ dt = 500. *=i Ш
Из (2.29.2) получим dt ~ 5Ш'+ 500 ~* , i = 2, п. Заменив в формуле (2.29.1) i на t+1 и подставив полученный резуль- тат вместо Si в выражение для diy получим А 500Ац + 500 — si+1 — 2ki+1di+l — di+l . ~— , _ п at = , i = z, п> яп.г\ — и. 2ki + l Наконец, заменив 52+i по формуле (2), получаем а л бОО^ —£2) + с —500 Аналогично ах = ^ — . 2^+1 Так как di>0, то &*>&г+1. Таким образом, нужно мини- мизировать (2.29.3) при ограничении У dt = 500 V *=&*■ + -±=2L = 500. Его можно переписать в виде с 1 У*«-*^ *°°- = 1, *л+1 - 0. ^ 2ft,-+1 2ftj+l + Поскольку fei>'fe> ... >£п, то fr-*<+i > ! , t = 2, п. 2*< + 1 2ft,+ 1 Л Это соотношение определяет выбор kiy таких, что V—* *** превосходит единицу и k\ принимает минимальное зна- чение. Покажем, что минимальное значение ki получается, если ki—ki+i=l9 *'=1,..., п и kn=l. Предположим, что для i=i0 kio — A/e+1 = т > 1, тогда 2*4+1 2(^,o+1+m) + l Теперь, приняв А,0 — Ato+i = 1, этот скачок можно заменить на сумму членов 2(Ч+1 + 1>+1 2(^+1+2) + 1 +-'--^ 2(^+1+т) + 1- 112
Эта сумма больше, чем предыдущее выражение. Следова- тельно, минимум ki достигается при k\—fe*+i=l, ЛЛ=1. Ввиду монотонности k{ число п выбирается таким, что kn=l, kn-t=2t..., и в конце концов получаем <fe2 из условия п п 2А, + 1 ^J 2^ + 1 ' f=2 *-=1 В нашем случае &2=6, я=8. Затем вычисляются du начиная с 500-километровой отметки: d*=500/(17—2i)t i=2,..., 7. Оставшееся расстояние 500/15 принимается за d4. Значения At=8—i; *=1,...,7; s0=38336,45. 2.30. 1) Достаточность. Пусть х — допустимый век- тор, который удовлетворяет сформулированному условию, а л х? — другой допустимый вектор. Покажем, что V фу (*/) > > £ <М*/)- ПУСТЬ Я=т!п[<и(*гН)— фП*;)]. Тогда * < Ф/ (*/ + 1) — Ф/ (*/) Для всех / е I (2.30.1) и *>Ф/(*/) — Ф/(*/ — !) Для всех /«=/+(*). (2.30.2) Из выпуклости ф,- следует, что [ф>(£+1)—ф>(£)]—неубы- вающая функция на целых числах. Таким образом, если k^X}, неравенство (2.30.1), дает *<Ф/(£+1)-ф/(А); (2.30;3) если 0<k^Xj, то /е/+(д:) и неравенство (2.30.2) дает Я ^ Ф/ (Л) — Ф/ (k — 1). (2.30.4) Просуммируем (2.30.3) по-всем А, таким, что *,<£<*}— 1 при */>*/, и неравенство (2.30.4) по всем А, таким, что */ + 1 < Л < xf при */ < */. Получим Ф/ (*/)—Ф/ (*/) ^ * (*/—*/)> */ > */; ф/ (*/) — Ф/ (*/) < * (*/—*/)> */ < */• В обоих случаях и, очевидно, даже при #/ = х\ Ф/ (*/) > Ф/ (*/) + Ллу — hXj для всех / е /. п п Суммируя по /=1,..., я и учитывая, что J] */ = V *7 = т, /-1 /-1 мы доказываем достаточность. из
2) Необходимость. Пусть х — решение задачи. Предположим, что 'знак неравенства min [фД*, + 1) — ФУ (*,)] > max [ф; (*,) — <р, (х} — 1)] (2.30.5) изменен на обратный. Так как /л>0, то 1+(х)Ф0 и макси- мум в правой части (2.30.5) реализуется при некотором / = а, а минимум в левой части — при /=р. Тогда, по пред- положению, Фе(*Э+ О — ФрЫ<Фа(*а)— фа(*а— 1). (2.30.6) Так как ф;- — выпуклые функции, то аф§. Рассмотрим ха = = *а— 1, х$ = *р + 1 и jc/ = л:/ для остальных /. Очевидно, а:' = (х\9 ... , х'п) — допустимый вектор. Кроме того [п п J] Ф/ (*/) — £ Ф/ (*/) = Фа (Ха — 1) — фа (*а) + /-1 /-1 + фэ(*р-г 1) —Фе(*е). Это выражение меньше нуля ввиду неравенства (2.30.6), что противоречит оптимальности х., 2.31. Задача состоит в минимизации п £ WfPp /=1 п при ограничениях V х^т» х,^Х) — целые. Так как /-1 Ф7- (x) = Wjp* — выпуклые функции, то для решения можно использовать критерий Гросса (см. 2.30). Положим х(р = 0, у =-- 1, /г. Пусть при k^0 номер j(k) таков, что min [Ф/ (4*> + 1) - Ф/ (xf)] = Ф|(« Л + 1) - ф/(*, (д$>). /6/ Тогда положим xf(k)l) == х% + 1; j#+1) = jcf} при /V=y(A). Век- тор jc<m) = (jcim), ... , jckm)) удовлетворяет ограничениям и мини- мизирует целевую функцию. Таким образом, решение полу- чается путем распределения т единиц среди ф;-, причем на каждом шаге одна единица придается аргументу той функ- ции ф;, которая имеет наименьшее приращение. 2.32. Если *г=4, то 4fe можно заменить на k-й позиции на 2*, а другой множитель 2Л+1 поставить на (k+l)-n позиции; тогда получим 4*<2fe-2ft+1. Если #г>4, то дсг = 3+(л:г—3) и Хг<3(дСг—3). Этот процесс можно продолжить, переходя к 114
(Xi—3). Тогда х{—3=3+[(х{—3)— 3], Xi—6=3+[(x{—6)— —3] и т. д. Заметим также, что x\<3i(xi— 3)' и т д., т. е. раз- биение Xi>4 на слагаемые меньше 4, увеличивает значение целевой функции. 2.33. а) х°= (3,2,0), max2=34; б) *°=(4,0, l),z=33. 2.34. *°=(0,6,1,0). ГЛАВА 3 3.2. К функциям f(x) = max Fi (х), ф (х) = max Ф, (х) применить неравенство, аналогичное 3.1, в): |inf/(^-i^(*)|<supl/(x)-?(*)|. х£Х х£Х х£Х 3.4. В силу равномерной непрерывности F на XXY для любого е>0 найдется б>0, такое, что \F(x, у) — F(xot у)\<г при р(*0, *)< 8, j/eF, Отсюда следует, что | f (а:) —/ (jc0) | ^е при р(х, х0)<6. 3.6. Пусть хп-*~хо^Х и N(Xn)^yn-+yo- Тогда из непрерыв- ности g следует, что g{x0f yo)=\img(xn, Уп)^0, т. е. Я-»оо y0(=N{k0). ' , 3.7. Из полунепрерывности сверху отображения N выте- кает, что для любой окрестности U множества М(хо), Хо^Х, найдется окрестность V точки хо такая, что N(x)<^U при x^V. Далее, для любого е>0 найдется такая окрестность^ (а следовательно, и V), что при x^V, y^UF(x, y)^F(x0, у)—е, где у — ближайшая к у точка Af(jco). Следовательно, для всех x^Vf y^N(x) справедливо неравенство F(x,y)^ min F(x0, #) —е=-/(*0) — е и f(x)^f(xo)—е. Требуемое утверждение доказано, посколь- ку е — произвольно. 3.8. Если хп-+х0, то в силу результата задачи 3.71imf(xn) ^ а-» оо ^f(xo). С другой стороны, по определению х0 Н™ f(*n)<f(x0). хп-*Хо 3.9. а) Допустим противное: 3 Ро > 0, V е*>0 3 **> Ук: р(хк, Хо)^8А, yke=N(x0), но yk<£ V6o(N(xk))y где Уб0(А) — 8- окрестность множества А. Пусть е*-Я). Учитывая компакт- 115
ность К, можно считать, что Уы+Уо. Так как g(x0, Ук)^0, g(Xk, Ун)<0 и Xft-^xo, то £(*о, уо)=0. Для достаточно боль- ших k уо & Ve0/2 (N(xk)). В самом деле, 3 *i такое, что \fk > >ifeit/0eVe0/2(t/fe). Так как #ft 0 V^ {N(xk))> то и t/0 £ £ У«./2 (#(**))• По условиюЗ*/е=1/бо/2 (Уь)П^°(хо). Из не- прерывности g получаем, что #(*&, У)>0^ при достаточно больших k, т. е. y^N(Xk). Но #0е 1/в0/2 ({/), поэтому #0е е^б0/2 (N(Xk)). Противоречие. б) Следует из а) и задачи 3.6. Если Л, В компакты, то из р(Л, £)=0 следует А=В. В противном случае может быть А(]В=0. Например: А — множество рациональных чисел, В — множество иррацио- нальных чисел. в) В условиях задачи №(x)=int(N(x)). В общем случае N*(x)=£int(N(x)). Пример: Х=У=[0,3]; У, 0<у<±\ g(x,y)= | Х~У> Y<y<l> О, 1<{/<2; i 2—г/, 2<у<3. 3.10. Непрерывность f(x) вытекает из непрерывности ото- бражения (3.4) в метрике Хаусдорфа (задача 3.9, б). При- мер разрывной в точке дс=0 функции (3.4) дают F(x, {/) = - -У, Si*. У)=х-У> X=[-U 1]; Г=[0,1]. 3.13. Частный случай задачи 3.14. 3.14. Зафиксируем любые хи х2<=Х; y\^N(xx), У2^М(х2). Тогда af(*i, */i),+ (l—a)F(*2, y2)<:F(aXt + (1— a)x2, cu/i+ + (1—a)t/2) при 0<a^l. В силу вогнутости g g{ax1 + (\—a)x2f ay\+(l — a)y2)^ >ug{xlt */х)4 (1— a)g(*2>#2)>0, т. e. a#i+(l—а)#2еЛГ(алч+(1—a)#2). Отсюда следует не- равенство dF{xvy1)+(l—a)F(x29y2)<(p(ax1+(l — a)x2)t из которого ввиду произвольности у и У2 вытекает вогну- тость ф (х). 3.15. Воспользоваться формулой (3.2). 3.16. Для всех х функция F(x> у) сильно выпукла по у л следовательно, у {х) —однозначная функция. Для у(х) справедливо равенство F(x, у(х)) = 0. По теореме о не- ду явной функции у(х)еСК Отсюда следует, что /(х)еС1 и Ив
/'(*) =-|Г Р(х,у)\у^х) +-j!-F(x9y(x)).y'\Je) 3.17. а) Вообще говоря, нет. Пример: f (х) = — | х | = min (х, — х) = min (ухх — угх). Vt+y%=l б) Будет. Это следует из формулы (3.2) и установленной в задаче 3.5 непрерывности функции у(х), реализующей minF(x, y) = F(x, у(х)). yev 3.18. а) 1; б) df(x) _ 1, — oo<x<±Il£L. 2 ! -\,jHfA<x<oo- df(x) _ «ft -1; -oo<*<-L=^i; 2; 1. /5 -1 <*<°o; д) -2; e) 0; 0; -^; ж) -3; з) -28, 3.19. Доказательство эквивалентности см. в [13, гл. 4, § 3, теорема 3.1]. 3.20. Необходимое условие для точки х°: sup min (— F<x°, у), x—x°) = 0 *€X ikHM\ dx } эквивалентно условию: — L(x°)(\K*(x°)^0. Здесь K*(x) — конус, сопряженный конусу возможных направлений мно- жества X в точке х°еХ, a L(x°) определено в задаче 3.19. Доказательство см. в [13, гл. 6, § 2, теорема 2.2]. 3.22. Очевидно, Х-=уК(у), YzzY(x) при хеХ, #еУ. Поэтому sup inf F (х, у) = sup [<р (х) + inf \|> (у)] > *ех »evw *£Х »€У(«) > sup ф (х) + inf i|> (у) > inf [Ц (у) + sup ф (х)] = -6Х 4Г6У |/€V Г*6Л(к) = inf sup F(x, у). V£Y *6Xfo) 117
Пример строгого неравенства дают F(x, у)=х—у, g(x> у) = = 1—х—у. 3.23. б) Так как fn, f0 — полунепрерывные снизу функции, то достигаются их нижние грани на X. Пусть /п(л:Л) = =min fn(x) и хп-+х*. Тогда для \/е >03 тп : fa(x*)— fm(x*)< <е/2. Кроме того, по е, т найдется номер N=N(s,m) такой, что при n^N верно неравенство , fm(x*)<fm(xn)+e/2. Сле- довательно, fm(x*)—fn(Xn)^fm(X*)--*fm(Xn)<e,l2 И /о(**) — —fn(xn)<e при Агатах(т, N). Отсюда по определению хп получаем О < min /0 (х) — min fn (х) < /0 (х*) — min fn (*)< е. х$х хех хех В силу монотонности и ограниченности сверху последователь- ности {min fn (х)} существует предел lim min/n(jt), совпадаю- щих п-*оо х£Х щий, как показано выше, с min fn(x) =fo(x*). х£Х Следующий пример показывает, что оДной монотонности для сходимости минимумов недостаточно. Пусть Х=[0,1],- О, х= ■ ! * ' ( 1, в остальных точках. Здесь \imfn(x) = /0 (*) = 1, но lim min /„(*) = 0. 3.24. В силу задачи 3.7 достаточно показать, что любая полунепрерывная снизу на компакте X функция /(•) пред- ставляется в виде (3. 4, 5). Пусть Q={(x, у)\х^Х, у^ ^f(x)}—надграфик функции /(•). Положим g(x, у) = = —р( (*,"#), Q), где р((х, у), Q) —расстояние отточки (х,у) до множества Q. Очевидно, g — непрерывная функция и f(x)=miny, поскольку надграфик Q замкнут. 3.26. В силу результатов задач 3.21, 3.25 sup inf F(x, у) = sup inf inf sup J£ (дг, у, ц, %) > x$A у£В x£X y£Y ц>0 Ь>0 > sup inf У(х9у, \i, I) xeX y£Y и, аналогично, inf sup F(x, y) < inf sup <£ (*, {/, \i, Ji), y£B x€A y£Y x£X откуда и следует доказываемое равенство. 3.27. Поскольку ( F(x, у), i/gB, lim {F (х, у) + С [min (0, ф (у))]1} = ( + ^ ^ ^ в> 118
то для завершения доказательства остается дважды приме- нить результат задачи 3.23. 3.28. а) Для доказательства выпуклости Jq(y) достаточно установить, что суперпозиция F(y)—f(ty(y)) выпуклой моно- тонно убывающей функции f(x) = |min (0, х) |2 и вогнутой tp(y) будет выпукла. б) /; (У) = ЯI min (0, ф (у)) \«-\ у' (у) при q > 1. 3.29. Доказательство ^см. в [9, гл. II, § 8, лемма 2.1]. 3.30. Отыскание лексикографического максимума F(x) равносильно решению задачи /i(jir)-HTiax при ограничении h(x) ^niax/г(*). Методом штрафных функций ее можно свести к поиску lim max {fx (х) + С J (/2 (*) — max f% (х))}9 (3.30.1) cn-»oo хех х$х где /(0— min(0, t) — функция штрафа. Требуемое утверждение теперь вытекает из теоремы о сходимости метода штрафов [5, 16], поскольку J (/2 (х) — тах/2 (л:)) = /2 (*) — тах/2 (х) х£Х х$Х и константа тах/2(*) не влияет на реализацию х0(Сп) мак- х£Х симума в (3.30.1). 3.31. a) Of -J-; б) 0; 0,5; в) - JL; 0; г) _ ^L; -^L. 3.32. Необходимое условие максимина (3.3), как показано в задаче 3.19, эквивалентно условию (3.6) и записывается в случае х^Е1 следующим образом: 3f/oe/?(^):-£-F(x°,r/e) = 0, ЛИ0О 3ft, У% €= R(х°) : F{x\ уг) = F{x\ у2) = min W, у). Чтобы воспользоваться этими условиями, опишем мно- жество R (х). При хе (0, 1] производная F(xf у) — 0 в точке у = = —~~ сх . В этой точке F(x,yY<0> следовательно, мно- гое ду2 жество /?(дс)с{0, 1}. Легко проверить, что F(xf 0)=^0 при дх у всех #е[0, 1]. Таким образом, необходимые условия максимина определяют точку дс0= , в которой F(x> 1) =-- 0, и ас дх 119
y^i + Ь — 1 точку *о = ——— , которая находится из равенства F(x% l) = F{xf 0). Стационарные точки лежат в интервале (0, 1), если либо* 0<-*=*-<1, 1+6<4[1-АГ. ас I a J либо l+6 = 4[l--^]a, 1+6<(1+с)2. 3.33. х° = я/3. 3.34. Из физических соображений ясно, что оптимальные точки прицеливания (л:? (Я), jc§ (Я)) симметричны относитель- но 1/2: Xi((X)=x(X), х2(Я) = 1—а:(Я), 0^х(Л)<1/2. Крите- рий эффективности WUx, у) = егЧх-у)* + ^-Mi-*-y)«. Для нахождения оптимальной стратегии используем необхо- димые условия максимина в той же форме, что и в зада- че 3.32. Легко проверить, что /?(дс)с:{0, 1/2, 1}. Рассмотрим два случая. 1) Для достаточно малых X: R(x) = {0,1}. В этом случае необходимые условия максимина приводят к уравнению х ■ = «М2»-1>. (3.34.1) 1-* ' Если Я^2, то это уравнение имеет лишь один корень х(Х) = .= 1/2. В противном случае существует еще один корень в интервале (0,1/2). Легко установить, что стратегия х(К) = = 1/2 при Я>2 не оптимальна. 2) Если /?(дс) = {0, 1/2,1}, то условие равенства W% (х, 0),= ИРх (х9 1/2) определяет стационарную точку *(*,)== J. + JL in (1 — J/i_<r-V2)# (3.34.2) 4 л Данная точка является решением задачи при Л^Аю, где Ко — значение параметра Я, при котором (3.34.2) удовлетворяет уравнению (3.34.1), т. е. 3^0 + 41n(i-l/l-e-^2) ^ eUI2 (j _ yx_^KI2y X0-41n(i-Kl-e-^2) Итак, оптимальная стратегия: Y> 0<Я<2; корень уравнения (3.34.1), если 2< К < А,0^ 3,235; величина (3.34.2), если Я0<Х. *•(*) = 12*
3.35. Пусть jc° —стратегия, состоящая в том, что пожар- ные части располагаются на 'серединах трех радиусов, углы между которыми равны 120°. Докажем, что стратегия х° яв- ляется оптимальной. Заметим, что W(xP)[=1/3/2 R (см. ре- шение задачи 1.10). Предположим, что найдется стратегия х= (jc1, jc2, х3), для которой Щх) < 1^3/2 R. Рассмотрим окружность радиуса R с центром в точке О. Пусть радиус ОТ содержит точку дс1, точки Л, Я, D и S лежат на окруж- ности и ZAOT= ZHOT= ZSOC= ZDOC=60° (рис. 7). Из неравенства W(x) <1/3/2 7? следует, что круг В(xl, W(x)) не содержит Л и Я. Следовательно, точки х2, х3 не содержат- ся в секторе DOSC. Тогда С не будет лежать в объединении з кругов N В(х'к W(x))> что противоречит определению W(x). Рис. 7 Рис. 8 3.36. а) Как следует из решения задачи 1.5, нужно найти minmaxp2(x, Л;), где Аи Л2, Л3— вершины треугольника. Пусть сначала ААхАгАз остроугольный. Разобьем его сере- динными перпендикулярами на три части Si, S2, S3 (рис. 8). Очевидно, если точка х лежит в области Sj> то точка Л;- яв- ляется от нее наиболее удаленной (/=1, 2, 3). Отсюда сле- дует, что искомая точка х установки вышки есть центр О вписанного fcpyra. Если ДЛ1Л2Л3 тупоугольный, то аналогичное построение разбивает его на две части Si, S3 (рис. 9), причем для точек xeSi наиболее удаленной является точка Л* t=l, 3. Следо- вательно, оптимальной точкой будет середина наибольшей стороны AiAz. б) Задача сводится к отысканию min max У. р2(*, Л.-). х 1<*<3 £5 (3.36.1) 121
Пусть треугольник ДА1А2А3 остроугольный. Разобьем его серединными перпендикулярами на три части Dit £2, D& (рис. 10). Рис. 9 Рис. 10 Так как при x^Di Р(х, i4|)<minp(jffi4/), то £ р2(х, Ak) = max £ р2(*, Л;), t = 1, 2, 3. Следовательно, отыскание минимакса (3.36.1) в области Df сводится к нахождению min У р2(х, Aft). Рассмотрим эту задачу, например, для D3. Проведем в треугольнике Л AtA2x высоту хН. Тогда р2 (х, А,) + р2 (*, Л) = 2Р2 (х. Н) + р2 (Я, Аг) + р2 (Я, Л2) = = 2[р2(*, А)-р2(Я, А)] + [y^,, А2)-р(Я, Л)]' + + [ yp (4lJ Л) + р:(Я' ^]2 = 2р2(*' Л) + Т рЧА1> Л) и, следовательно, минимизация по xeD3 суммы р2(Х Ai) + +р2(х, А2) равносильна минимизации расстояния р(#, А). Искомой, очевидно, будет точка О. Повторяя рассуждения для областей D\, ^2» окончательно получаем, что оптимальной стратегией является точка О — центр описанного круга. Для тупоугольного треугольника A AiA2A3 аналогичные построения (рис. 11) и доказательства показывают, что оп- 122
тимальной точкой является середина О наибольшей стороны, в) Как показано в задаче 1.5 нужно найти min max[p2(*. Аг)+р*(х, А); Р2(*. А) 4~Р2(*, Аг)]. Пусть в AAXA2AZ Р, Q, R — середины сторон и QL±.A2A% (рис. 12). Как показано в п. б) решение нашей задачи сво- дится к двум задачам минимизации и р(х, Р)-+ min xeQLAt р(дс, /?)->. min x£AtAtQL Возможными решениями первой будут точки L, Q или основание перпендикуляра из Р на LQ; возможными реше- ниями второй — основание перпендикуляра, опущенного из/? на QL. 3.37. «Справедливый» дележ 2°eZ реализует min max е (5, z) = maxe(S, 2°). zez sai sc/ Запишем для z° необходимое, а в силу линейности e(S, z) по z на выпуклом компакте Z и достаточное, условие (см. решение задачи 3.20): min max Г—e(S, z°), г — z° 1 =0, zeZSGRiz*) L dz J где /?(z°) —множество коалиций Si,..., S&, на которых дости- гается maxe(S, z°)=e(Siy 2°),1<;Д<6. Очевидно, ~e(S, z) = Sal dz = (0,... , — 1, ... , — 1,... , 0). Здесь на r-м месте стоит 123
— 1, если i'-й игрок входит в коалицию S. Тогда условие оп- тимальности 2° записывается в виде min max Г УЧг° — *;)> .... У (г? —2£)1 =0. (3.37.1) 2€Z Ms, itsk J Если теперь /-й игрок не входит ни в одну из коалиций Si,..., Sfce/?(z°), то минимакс (3.37.1) достигается при z/ = v ({/}) — ' минимально допустимом значении Zj. Коалиция SiU{/} также не входит в /?(z°). Следовательно, e(SiU{/}, z°)<e(Si, £°) или f(SiU{/})- J]2?-2?<0(S1)- J2?. Из последнего неравенства вытекает 0 («Sill {/})<*> (Si)+% +'°({/}) —противоречие с супераддитивностью характеристи- ческой функции. Таким образом, каждый- игрок входит хотя бы в одну коалицию из /?(z°). 3.38. Из решения задачи 2.2 при a(s) = получаем, b+cg(s) что [ |*ds, если (*[b + су(s)]ds<^ 1, s s f ds + 6 f ds, если (3.38.1) St(a) slid) + cy(s)]ds>l, maxF(*(.), у(-У) = \ Ц[6 где S1(a) = {s^S\b + cy(s)<a}, S2(a) = {se5|6 +ct/(s)=a}; a, ве[0, 1] определяются из условия J (b + cy(s))ds + Q j (b + cy(s))ds=l. St(a) s2(7) Далее найдем min maxF(jt(-), y()) = F0. Если l>&fds+"c, то в (3.38.1) независимо от y(s) реализуется первый случай; поэтому F0= Г ds и оптимальна любая допустимая функция y(s). s Если Ъ f ds + c> 1» то в (3.38.1) реализуется второй случай. Представим величину (3.38.1) в виде max F (*(•), ry(-))= [ dst где множество Т определяется из условий f (6 4- cy(s))ds = 1; inf y(s)>supy(s). J .s€S\r. S£T 124
Ясно, что выделение Т из S в общем случае производится не- однозначно. Для любой допустимой функции y(s) значение maxF(x(*), {/(•)) не изменится, если заменить ее функцией s£T ГДе Л' & —константы, |/1<г/2 #х f ds= f |/(s)ds, */& j* ds = J {/(s)ds. Таким образом, при отыскании минимакса Fq можно рас- сматривать лишь функции y(s) указанного вида, принимаю- щие два значения. Обозначим R = f ds. Тогда, с учетом г сделанных замечаний, поиск Fq сводится к минимизации R по у и У2у R при ограничениях R(b+cyi)=*l9 Уг<У2> yi\ds + y2 j ds=l. т з\т Ясно, что решение данной задачи достигается при #i=#2 и равно F0= 6 Н—р— . Оптимальная стратегия есть #°(s)=l/ fds. s 3.39. Обозначим F (*(•)> */(•)) = f /ОФ). y(s))ds. При фик- ,(,)=|, сированном #(s) рассмотрим задачу max F (*(•), #(•)) и задачу maxF(x(.), #(•))» где ?(*(•)> ^()) = j№(s), y(s))dst 7=min{l, ах}, s п 1 h 1 а = : , о = —. Ь + су р Так как f>/, то и ?(*(•)> </(•)) >^И)> #(•))> тах?(*(.), </(•)) >maxF(*(.), #(•))• Задача maxF решена в задаче 2.2. Среди ее решений всегда имеются такие, для которых F=F: в случае \ —-< 125
< 1—это все решения; в случае \ >1—те, которые при .) a(s) s <s&S2(a) принимают значения 0 или l/a(s) (см. решение задач 2.1, 2.2). Таким образом, maxF(x(-)t #(•)) =maxf,(jc(-),#(•)• Сле- довательно, задачи нахождения minmaxF(A:(-), #(•)) и min max/7(*(•)> */(•)) эквивалентны. Последняя из них рас- МО *<•) смотрена в 3.38. 3.40. Пусть х°^М0 — оптимальная стратегия. Обозначим через /' множество реализаций минимума min А(д$) и предположим, что 1ф1= {1,..., п). Тогда Д (дс?) > /, (дс/) при всех fe/\/, /е/. Докажем, что найдется i1^I\J, такое, что a£>0. Если бы дс? = 0 для всех * е /\/, то jc/t > 0 для некоторого j\ е /. Тогда ft (x°i) = fi (0) > fjt (x°j.) > fix (0), что противоречит условию А(0) = /л(0). Далеех/<В для всех /е/. Действительно, если Д$, = В для некоторого /»€/, то g/t(*/t) >Л. Отсюда и из доказанного выше получаем V g; (*?) > А — противоречие. i=\ ^ Построим теперь вектор х с координатами *; = xl — etl, xl 1<=(1\^\{1г}, Ar? + 6t-, tE/, где 8г>0 достаточно малы и выбраны так, что V £<(**) = Л» О^Хг^В. Из непрерывности, монотонности функций gi(t) и доказанного выше следует, что такие е* всегда найдутся. Из непрерывности и монотонности fi(t), определения век- тора хеМ0 вытекает неравенство min Д(дс1)> min Д(д#), которое противоречит оптимальности вектора ;с°еМ0. Тем самым принцип уравнивания доказан. 3.41. а) Разделим единичный квадрат на четыре квадрата со стороной 1/2. По крайней мере один из них содержит две из пяти точек. В нем максимальное расстояние 2~1/2 наблю- дается между двумя точками, расположенными на противо- 126
положных концах диагоналей.. Такая же величина получается для единичного квадрата в случае, когда пять точек пред- ставляют собой вершины и центр квадрата. б) Разделим треугольник на четыре равносторонних треугольника со стороной. 1/2 и расположим точки в пяти из шести вершин треугольников со стороной 1/2. в) Разделим круг на пять конгруэнтных секторов и рас- положим точки по окружности на равном расстоянии одна от другой. Если две точки попадают в сектор с дугой а^[2я/5, то наибольшее расстояние между ними будет max [l,2sin-^-]< < 2sin я/5. г) Помещаем точку Рх на северный полюс, а другие на экватор со сдвигом 90° одна от другой. Если четыре точки удалены более чем на я/2 от Pif то они будут лежать в юж- ном полушарии; если поверхность сферы разделить на четы-, ре конгруэнтных области, то максимин для этих четырех то- чек был бы меньше, чем я/2. 3.42. 1.6 а), б), -L; в) -Ь Ь7 а), б), в) (3~/5) . 3.43. ?>:*?=—, *2=—; В?(М) = —. 4 4 ' 16 3.44. a) v = атпУ i0 = m, /0 = п. б) /(*„) = max /(0, g(j0)= min g(j), v=f{i0)+g(j0). в) При любом соотношении между величинами а, 6, с, d найдется строка, доминирующая все остальные; k — номер этой строки. г) При любом соотношении между величинами а, 6, с, е> /, g найдется столбец, доминируемый всеми остальными; /о — номер этого столбца. д) Рассмотрим функции /(/)= max (а( — с^) и g(t)l= l<s<m = max (d,t — bj). Функция / непрерывна и убывает от -f оо до 1</<л — оо, а функция g непрерывна и возрастает от —оо до +оо. Поэтому f(t0) = g(t0) для некоторого t0. Для соответствующих индексов t0, /0 имеем aio — ciot0 = dfot0 — b'j0, откуда t0 = = —-—т^2-- По определению / имеем at — с^0 < aio — ciot0 = С, + О; t0 ' /О п I А =*dij0 — bj9 и, следовательно — — <*0* Аналогично полу- * + */. a, +bf чаем, *0<—2 • Последние два неравенства означают, что Cio+di (*о> /о> ^о> — Решение игры. 127
е) При / = k = i уравнение, связьгоающее at/, maik и айГ, принин мает вид Ъаи = 0; таким образом, аи = 0, i = 1,... , п. Пусть A =s = \Ф1\ тогда af/ + a/7 t afi = 0 и a/£ = — ajif t, / = 1,..., n. n n n Наконец, 0 = J] (a,/ + a/Jk + afe/) = /ю,, + J] a,* — £ a^ Обоз* начив f, = — ^ ад i = 1, ... , n, получим aif = f, — tt ш <*o» 'o> 0)—решение игры, где Uu = max ^. /» - h v -^ /Л _ яу = C<V* a<',/* v/ л A v/ Рис. 13 3.45. Предположим, что A = (аи)тХп не имеет седловой точ-. ки. Пусть ai0ix = min а*о/- == max minat/. Поскольку (t0, Д) не является седловой точкой, (к1!1>(кши Для некоторого 1г. Пусть щх]г = min о*,/. Очевидно, что /2=£/i- Имеем а^ > ai$it > a^/t, *«/<<<**•/.• Если бы alVl < а1о/г, то a*0/t>a,l/t и матрица ( '*!? /о2) не имела бы седловой точки. Поэтому aioft = ai9it wit аЧг' (рис. 13). Поскольку (i0, /2) не является седловой точкой, a/2/t > > aioit для некоторого t2, причем i2¥*h. Пусть a*,/, = min a/l/a. Оче- видно, что /з т^=/2. Кроме того, }3ф]\. Действительно, если бы 128
aitjt= min aiih то (рис. 13) ai%h >aiifl, aioit>a{tfl и матрица не имела бы седловой точки. Теперь так же, как и выше, показывается, что aioJ9 = ato/f Проводя те же рассуждения в третий раз, получим, что а,0/4 = а*0/„ /4=£/i, /2, /V Проводя их в Aj-й раз, придем к противоречию; й<п. 3.46. Искомая вероятность равна\\P{(i, ])— седловая i.i точка} (Р означает вероятность указанного события), по- скольку вероятность пересечения любых двух таких различ- ных событий равна нулю. Введем обозначения: ai/ — ^i» • • • » a*-i./ = ^-ь я*+1,/ = biy ... , amj = 6m-i, an = bm> йц = 6m+i, 7. . , а*,/_1 = &m+/-b ty,/+i = *m+/i • • • » я*л = 0m+/i-i* Обозначим через {it,..., *Vn-n-i} событие, состоящее в том, 4To6tl < b(t < ... < Ь(т+п_г. Заметим, что любые два таких различных события равновероятны, а вероятность их пересе- чения равна нулю, наконец, объединение всех таких событий достоверно. Отсюда следует, что вероятность любого равна . Теперь заметим, что событие {(t, /) —седло- (т + я— 1)! вая точка} равно объединению событий {1и ..., im-i, m, im+i,..., *m+n-i}, где ti,..., im-i — произвольная перестановка чисел 1,..., т—1, a tm+i,..., tm+n-i — произвольная перестановка чи- сел т+1,..., т+п—1. Нетрудно видеть, что таких событий (т— 1)! (п— 1)!. Таким образом, P{(lt /)—седловая точ- (т —1)!(п —1)! . ка} = — — —, а вероятность искомого события рав- (m + л — 1)! на „ (т — 1)!(я—1)1 тЫ (m + /i — 1)! (т + д — 1)1 3.47. а) Если л>т, то /(—,... , —V ( —,..., —, \\ т т ) \ т т О О), -^——) решение: если п < т, то ((0,..., 0, 1) qf 1)— / т ' решение, где стратегия q е Sn произвольна; Д) ((О, 0, ±, J-, О, 0), (0, 0, ± J-, О, 0), -|-);
^((т'Т'т)' (if* if* т* °),_г); ' \\ 20 ' 10 ' 20 /' I 20 ' 20 '• 20 )' 20 Г + (1_а)(о,-|-, -±-)> !)' °<а<1' + Мт'7'0/0'1°) + + «,(-1,0,0. -L,0. -f) + _, „5 (о, JL.; о. о. -1-. JL) + + *(°.Т'Т»°'°'т) + + „7 (о,о, ±, ±,о,±) + + а8(0, О, О, -L -L, Л), _^>(ai,...,a8)<=S8 3.49. /—2 3 — 4\ 3—4 5 )— матрица игры, 1_4 5 —6/ игры. 3.50. У первого игрока 15 чистых стратегий (a, Р), а=0/ 1, 2 — записанное число, [3=0, 1, 2, 3, 4 — названное число. У второго игрока 3-45=3072 чистых стратегий (у; бь, 6i, бг, бз, 64), Y=0» 1» 2 — записанное число, б^е{0, 1, 2, 3, 4}\ 130
\{&}—названная сумма при условии, что первый назвал ky k=0, 1, 2, 3, 4. Значение игры равно нулю. Первый игрок гарантирует себе нуль, например, стратегией: выбирать с ве- роятностью 7з чистые стратегии (0,2), (1,2), (2,2). Второй игрок гарантирует себе нуль, например, стратегией: выбирать с вероятностью 7з чистые стратегии (0; 2,2, 1,2, 2), (1;2, 2, 1,2,2), (2; 2, 2, 4,2, 2). п 3.61. X = 1х = (jCj, ... , хп) IV Xi = kt xt — целое, xt > 0; i = 1, ... , n\ — множество чистых стратегий нападения, п ^ = {# = (#i> ... , Уп)\^ У** = * 1/t —Целое, ^ >0; i=l я} *=i — множество чистых стратегий обороны, W(xt у) = Vmax(jct — — Уь 0) —функция выигрыша. Введем обозначения: / / i , (*> / = *; X — \Хи • • • » #п)> #/ — Jq « / ;. ^ = Q/i й); у/ = ( J 'I*/ I 0, ]фг. Произвольная стратегия х^Х доминируется следующей сме- шанной стратегией рх: с вероятностью Xi/k выбирать страте- гию х{. Действительно, для любого уеУ п п W(px, y) = J^-2-max{k — yh 0)>£max(jct-#;, 0)=W(x, у). Аналогично показывается, что любая стратегия j/еУ домини- рует некоторую вероятностную смесь стратегий у*,..., уп. Таким образом, достаточно решить матричную игру с мат- рицей (aij)nxn, где max (A — s, 0), * = /; k, 1Фи Нетрудно видеть, что //J_ ( J_\ /J_ J\ k(n — l) + tnax(fe— s, Q) t решение этой игры. 3.52. Нет. Рассмотреть случай А = [ ], р = (—, —]. 131 ac} = W(xt, *//)={
3.53. Да. Положим А(р, /)=а, A(i,q)=b,rorAaA(p,q)-=s =a=b и эта величина является значением игры. 3.54. Нет. '2 ЗУ 3.59. v= max min У al7ptf/ = max min У (—a,i)p$.= m = — min max V a/l^/pl = —а, следовательно, a = 0. Если p° — оптимальная стратегия, например, первого игрока, то м т £ CLufPi > 0, у = 1, ... , т, откуда £ аАр?< 0, что озна- чает оптимальность р° для второго игрока. 3.60. Каждый из игроков имеет конечное число крайних оптимальных стратегий (не превосходящее числа квадратных подматриц, матрицы игры). Далее, легко показать, что мно- жества оптимальных стратегий выпуклы, замкнуты и огра- ничены. Отсюда, как известно, следует, что каждое из мно- жеств оптимальных стратегий натянуто на свои крайние точки, т. е. является выпуклым ограниченным многогранни- ком. /2 0 4\ 3.63. а) Да. Например, Л = | о 2 5 1» я = 1> Р° = \1 1 0/ (—, —, —| —оптимальна. \ 3 • 3 з / б) Нет. Если в *0-й строке все элементы не превосходят v и некоторые меньше v, а стратегия р оптимальна, р1о^=0, тор1о=^1 и стратегия р° = (р?, ... , рт)> где pi = pki (£ рф k ф t0, Р?0 = 0, также оптимальна. 3.64. а) Нет. б)' Нет. 3.65. Нет; рассмотреть, например, матричную игру из за- дачи 3.48, а). 3.66. Стратегия (1//п,..., 1/т) гарантирует первому игроку положительный результат, следовательно, v>0. Матрица 132
С»0) удовлетворяет второму варианту условий, но v=0. 3.67. а) Пусть т=3, (рь рг, рз) —оптимальная стратегия первого игрока, р{фО, i=l, 2, 3. Нетрудно убедиться, что тогда, если Рз^г-Pi, то (0, рг+2рь рз—pi) оптимальна, а если Р1^Рз, то (pi—рз, рг+2рз, 0) оптимальна, т. е. первый игрок, а 'следовательно, и второй всегда имеют оптимальные страте- гии, использующие не более двух чистых. Предположим, что утверждение справедливо при т=k—1, и докажем его при m=k. Сложив при фиксированном /дан- ные k—2 неравенства, получим Oij+Oftj^02j+Oft_i,j. Отсюда тем же рассуждением, что и выше, выводится существование у первого игрока оптимальной стратегии, использующей пер- вую или А-ю чистую стратегию с нулевой вероятностью, от- куда в силу индукционного предположения получаем доказы- ваемое утверждение. б) Положив а{ = (aily ... , ain)y имеем последовательно о2< 1/20!+ 1/2а8; Дз< 1/2о2+ 1/2а4< 1/2(1/2а1+ 1/20,) + + 1/2о4; о3< 1/Зох + 2/3о4; о4<1/2о3 4- 1/2о6< 1/2о6+ 1/2 X X (1/3ох + 2/3ад); о4< 1/4ох + 3/4об и т. д., т. е. строки 02, Яз> аь • • • 9 ат-\ можно последовательно вычеркнуть из мат- рицы игры. 3.68. а) Пусть Ak-*A, pkef(Ak), q*^g(Ak), pk-+p0, qk + -+q0. Достаточно показать, что р0е/(Л), q0^g(A). Имеем аЛр> q*)<Aq(Pk> qk)<A(Pk> q)> p^sm* q^sn. переходя к пределу, получаем Л(р, q0)<A(p0, q0)<£A(p0, q), что и требо- валось доказать. б) Нет. Положим А = I ], Ав= I г Имеем /H) = S2, /(Лв) = {(1, 0)} при е>0, /(Ле) = {(0, 1)} при е<0. 3.71. а) Пусть p(=S и е>0. -Выберем п так, чтобы Л—1 00 Л—1 £ Pt > 1 — е. Тогда А(ру п)= £ sign (I — п) pt = — £ Pi + oo + V pi < — 1 + 2e, т. e. sup inf A (p, n) = — 1. Аналогично можно показать, что inf supA(n, q)=l. б) Можно проверить, что sup inf A (p, n) = — 1, inf sup A x X(n,<7)= 1. 3.72. Игра имеет единственное решение ((1/2, 1/2), (1, О, О, ...)> о). 3.73. а), б) (t0, /0) —ситуация равновесия в чистых стратегиях, если о,о/о= max aif; в) ((0, 2/5, 3/5), (9/13, 4/13, 0)) —ситуа- ция равновесия; г) (р°, q°) — ситуация равновесия, если 133
т «! = — (S— )"*: '"' m- 3.74. Отыскиваем сначала такие ситуации равновесия (р, q)9 что pif 9/>0; I, /= 1, 2, 3; затем такие, что рх = 0 и т. 'д„ Ответ: ((О, 1, 0), (0, 1, 0)); ((f 0,-L), (f 0,-i-)); /7_L JL _i_\ (± Л JL\\ \ \ 23 ' 23 ' 23 /' \ 23 ' 23 ' 23 / / ' n 3.75. X = jx = (д^, ... , *я) | £ *j = a, x, > 0; 1 < t < nl; n У = {У=(У1> ... , УЛ)Ц] tt=&, У1>0, 1 <*</*} — множества стратегий, а если Xi = t/t- = 0, то полагаем —^— = —^— = 0 | функ- Ч + У1 н + yt I ции выигрыша первой и второй фирм соответственно. Все ситуа- ции равновесия (х°, у0), по определению, являются решениям» системы F (а-0, у0) = max F(х, #°); G (л:0, у0) = maxG (*°, у)« хех y^Y Заметим, что для любой ситуации равновесия xt, у} > (V i = 1, .... , п. Действительно, если х° = у\ = 0, то каждой из фирм при неизменной стратегии другой выгодно при достаточно малом е > 0 затратить на i-м рынке сумму е, уменьшив на в затраты на любом другом рынке. Если же, скажем, jc? > 0> #? = 0, то первая фирма увеличит свою прибыль, переведя сумму е, 0<e<x? с 1-го рынка на любой другой. В силу отмеченно- го обстоятельства все ситуации равновесия находятся из системы 134
Получив из уравнений с производными следствие #°— #?, далее И* «легко находим Полученное решение действительно является ситуацией рав- новесия, поскольку функция F(xy у) вогнута по х на Xt а G(*, У) — по у на У. 3.76. Пусть рге[0,1], i=l, 2, 3 — вероятность, с которой i-e предприятие выбирает стратегию 1. Всевозможные ситуа- ции в игре составляют множество Р={р=(ри р2, Рз) \pi^ ^[0, 1]; г'=1,2,3}. Функция выигрыша первого предприятия Wx (Р) = Рх [— Р2Рз — Р2 (1 — Рз) — (1 —Р2) РЗ — -4(1 - р2)(1 -рз)] + (1 -Л) [-Зр2(1 -рз) - -3(1-р2)Рз-3(1-р2)(1-рз)]=(-6р2р3 + Зр2 + + Зр3 — 1) Pi 4 Зр2р3 — 3 = kx (р2, Рз) Рг + 1г (р2, Рз). Аналогично W2 (р) = k2 (pv р3) р2 + /2 (р19 р3), IF3 (р) =* *s (Pi> Ре) Рз + 'з (Pit Рг), где *х (р2> р3) = — 6р2р3 4- Зр2 + Зр3 — 1; *2 (Pi, Рз) =: — 6р!р3 + Зрх + Зр3 — 1; k3 (рх, р2) = — 6р!р2 + Ч-Зр^Зр, —1. Пусть р° = (р°, pg, pg) — произвольная ситуация равновесия. Положим Щ = kx (р°, р°), £° = k2 (р°, pg), Л° = А3 (Р?> PS). Заме- тив, что если А$>0, то jfit = 1, а если ^<0, то р^ = 0, рас- смотрим все возможные случаи. . Пусть Щ > 0, i = 1, 2, 3; тогда р° = 1 и Щ = — 1 — проти- воречие. Пусть k°v k% > О, й§ < 0. Получаем тогда ситуацию равнове- сия (1, 1, 0). Аналргично (1, 0, 1); (0, 1, 1)—ситуации равно- весия. Пусть £°>0, Щу Щ<0, тогда р?=1,р° = р3, = 0 и А° = = — 1 —противоречие. Аналогично нет и других ситуаций равновесия, соответст- вующих случаю одной положительной и двух отрицательных величин А#. Пусть &°< 0, i = 1, 2, 3. Получаем тогда ситуацию равно- весия (0, 0, 0). 135
Пусть Щ = О, 1=1,2, 3. Решая полученную систему, на- ходим две ситуации равновесия / 3 — /3 3 — /1 з-/з V / з + /з з+/"з з + /з\ I—б g 6—г \—5 e 6 ;• Пусть k\ = й° = О, А§ > 0, тогда р° = 1. Решая соответст- вующую систему, получаем р° = р£ = 2/3, £° = 1/3, т. е. (2/3, 2/3, 1) — ситуация равновесия. Если Щ = Щ = О, #J < 0, то ро = о, рО = рО = 1/3, Л§ = 1/3 — противоречие. Аналогично (2/3, 1, 2/3), (1~ 2/3, 2УЗ) — ситуации равновесия. Наконец, теми же рассуждениями убеждаемся, что нет ситуаций равновесия, соответствующих одной из величин $9 равной нулю, а двум, отличным от нуля. Итак, в игре 9 ситуаций равновесия. 3.78. Определим точечно-множественное отображение g:Xx X К-ь2ХхУ следующим образом: g(x,y) = {xu&X\F(x0% у) = maxF(uty)}x X{y0e=Y\F(х, у0) = min F(х, о)}. Очевидно, что множество g(x, у) выпукло. Воспользовав- шись непрерывностью функций maxF(w, у), minF(xt v) (см. задачу 3.4), нетрудно проверить, что отображение g(x, у) полунепрерывно сверху. По теореме Какутани [21, с. 97], отображение g имеет неподвижную точку. Эта точка, очевид- но, является седловой точкой функции F на XxY. 3.79. Пусть xl9 Jc2eX, j/еУ, ае[0, 1], тогда F(ax1+(l-a)Xi,y)= i^^'T^l > g(a*i+(l—<*)*2»l/) ^ vg(xlt y) + (1 —a)g(x2, y) ^ [ g (xlt y) ' g(x2, y) J ч = min[F(A:1, y), F{x2t y)]f т. e. F квазивогнута по x (см. задачу 3.77). Аналогично по- казывается, что F квазивыпукла по у. Следовательно, F имеет седловую точку (см. задачу 3.78). 3.80. Решение аналогично решению задачи 3.44, д. 3.81. Положим /(*)=(M*)...../m(*)). g(y) = (gl(y)>-*gn(y))> J/(*)*P(*) = ($h(x)d<p(x)9 ... , рт(*)Лр(*)), 0 0 о 136
J *(»)<*♦ to) = (JftW^to). • • • *$ga(y)**(y))i 0 0 0 Q — множество всех функций распределения на [0, 1], F = {r-=(rl9 ... ,г|П)|г= J/(x)d^ W^sfl), о K-<r = (r1,...,rm)|r = /(x), *s[0, 1J}, 1 G = js = («1э... ,s„)|s = J«r(y)A|>(0), ^Й). 0 5 = {5=(s!,... ,sn)\s = g{y)f ye[Q, 1]}. Используя определение интеграла, устанавливаем, что F=co/?, G=coS. Затем в игре с функцией выигрыша т п находим седловую точку (r°, s°)^FxG. Поскольку г°есо/?, s°eco «S, существуют такие xi9..., xm; t/i,..., t/ne [0, 1], что (Pi»".»Pm)€5m, (<7i, ...,?n)eSn (cm. [15, с 783,784]). Нетруд- но показать, наконец, что смешанные стратегии т п оптимальны в исходной игре. 3.82. а) (-1 /вЧ -L /я/7, J-/, + -L /я/8, 0); 211 , . 32 . . 16 ч / 211 . . Ы , , 16 \. Д) (-^Л/3-Ь^-/2/3,Л/2. ^-). 137
e) (/5/I2, J-/I/3 + -i-/I/2,--i^; «)(/./», -f Л/4+ -J-^ir)- 3.85. а) Пусть фо — оптимальная смешанная стратегия первого игрока в игре с функцией выигрыша /С. Тогда 1 1 vx > min U(K(xt y))d%(x) > min f([K(x, y)d%(x)\ = У6Е0.П J у№П * J / l = /(min f/CCv, y)d%(x)) = f(v). б) Функции /С и /(/С) выпуклы по у; поэтому 0= min max К(х,у)9 vx= min max f(K(x,y)) У6[0Л] *6[<U] *€[<U] *€[0,1] и vx = f(v) (cm. [15, c. 486] и задачу 4.12, a). 3.86. Пусть — — | —-1, jij таково, что 1 — v' < \i l 0 + b) v J i/n i/n < £±im< 1. Тогда (V-f-V 2-7^-/*,. 1-T^-)- 1=0 i=0 решение игры. 3.87. Если ((a, 1—a), (p, 1 — P), i>) —решение матричной игры с матрицей //((0,0) JC(0, 1)\ U(1.0) K(H)J то (al0 + (l — a)llt р/0 + (1 — Р)I19 v) — решение исходной игры. 3.88. Сначала показываем, что для любой стратегии ср перво* го игрока существует такое #е [0, 1], что f /((*, у) dq(x) < 1/3 о (рассмотреть два случая ср(1/2)< 1/3, ф(1/2) > 1/3). Затем убеж- даемся, что для любой стратегии г|> второго игрока существует 1 такое хе[0, 1], что f К(х, y)d^(y) >3/7 (рассмотреть три слу- о чая: а) ч>(1) >±, б) i|)(l)<-5-, ^(l~) <Т' »)*(1><Т'+(т)>т)- 138
ГЛАВА 4 4.1. *€5/й0 = {1,2}, {/eJV = {l,2}, (W(xty)) = (2 0j 4.2. /1 2 2\ xeM6 = {*> 2, 3}, ye N = <1, 2, 3}, (№ (jc, y))= 0 13. Vo 1 iy 4.3. xa — любая такая функция, что № (£ (У). I/) = max W (x, y), yt=N;W(M) = mm max W (x, y). x€M0 y€N хеМ0% 4.5. Нет; стратегия *о:*о(1)=2, *o(2)=3, например, оп- тимальна, но не абсолютно оптимальна в операции с крите- рием №(х,у)) = и~з\ 4.6. а) *о=2, W(M0)=2\ седловых точек и абсолютно оптимальных стратегий нет. б) W(M)=3; оптимальные стратегии—(x0(i), /=1,..., 4) = (3, 2, 1, 2),, (3, 2, 3, 2), (3, 2, 1, 5), (3, 2, 3, 5); абсолют- но оптимальные стратегии— (3, 2, 1,2), (3, 2, 3, 2); 12 седло- вых точек. B)H?((D)=-L, <Po=(o,-f, -f> °> О). г) W(MR) =3, оптимальная стратегия— (3, 2, 3, 2), абсо- лютно оптимальная стратегия— (3, 2, 3, 2), седловые точ- ки- ((3, 2, 3, 2), 1), ((3, 2, 3, 2), 2), ((3, 2, 3, 2), 3). 4.8. #0— любая такая функция, что min W (х0 (у), г) = max min W (х, z), у е N; z€{z€N\R{z)^R(y)} х£М0 ze{z£N\R{z)=rR(y)} W (Mr) =- min max min W (x9 y). r£R(N) x£M0 y€{yeN\R(y)=r} 4.9. (x0, y0) — седловая точка в MxN для y0 такой, что max W(x, y0) = min maxW(jir, у); множество M может не содер- хем9 yGN хем0 жать абсолютно оптимальных стратегий (см. 4.2) _ 4.10. a) W(M0) = — l W(M) = 3, W(MR) = l, х0(у) = 29 у = 1, 2, 5, х0 (3) = 1, 3, х0 (у) = 1,2, у = 4, 6; седловых точек и абсолютно оптимальных стратегий нет. 139
б) W (Mo) = - 1. W (М) = W (Мп) = 3, х0 (у) = 2,у=1,2/5, дс0'(3) = 1, 3, х0(4) =*о(6) = J; абсолютно оптимальных 'страте- гий нет; седловые точки — (х0, 6). в) tf(l) = tf(5), R(3) = R(4) = R(6). г) R(l) = R(2)=R(4) = R(5), Я(3) = #(6); Я(1) = £(2) = = R{5),R(3) = R(4) = R(6). 4.11. a) W(x,y) = \x-y\, M0 = N = [0, 1]; W(M0) = 0, все стратегии оптимальны в М0; W(M) = ± х0(у) 1, .«<^- 2 0.*>f. В силу выпуклости W(x, у) по у имеем W(0) = W(M) = l{2. Смешанная стратегия <р0=1/2/о+1/2 А оптимальна, так как W(<po,y) = \/2,yes[0,\]. б) /?(*) = W(MH) = -L,x0(y) = 1 ^ (1, #е=Ц-,11 *)R(y)=\ J;U7(M«)=-i-, o.^[o,-L) l.*<f. О, У> г)/?(</) = О, *о (#) = ["И 0,»e[i-,l]. ••'-[°-т)- ; W7(Af«)=-^-, *в(У)=| 1-^<-г o.^>f. д)ЗД) = (?'уеГМ + а] Г(МЛр) = ( min (а, —), Р = 0, 1 —а -, 0<р<1-а. 140
Наилучший гарантированный результат max W(Mr*) = = min(a, 1/2). 4.12. а) Пусть стратегия х0 е М оптимальна по критерию W. Тогда для любой стратегии х е М inf №(#(#), w) < inf W(x0 (y)9 y). y£N y£N По определению нижней грани для всякого е > 0 найдется уг е N: W(x{y1)9y1)<inlW{x0(y),y) + e. Отсюда inf/(№(*(*/), у) < < /(№ (*(»i), Уг)) < / (inf Г (лГ0 (у), у) + е). Устремляя в послед- уем нем неравенстве е к нулю, получим МПКСх(у)> У))< f(inW(x0(y), у)) = f(Wm))< y€N y£N % < inf / (Г (х0 (#),</)). y£N Следовательно, стратегия Хо оптимальна по критерию Wi. Пусть, наоборот, Xq оптимальна по критерию Wi\ тогда, ловторяя рассуждение с функцией f-1 (обратной к /), дока- жем, что стратегия оптимальна по критерию f-i(Wi) = W. Подставив в последнее неравенство х=Хо, получим fl?i(Af)^ .^f(W(M))^Wi(M), т. е. f(W(M)) = Wi(M). Если во мно- жестве стратегий М нет оптимальных стратегий, то приведен- ное доказательство можно изменить с использованием е-опти- мальных стратегий. б) Из п. а) и равенства W (Ф) = min max W(x, у) = W(M) y$N хем0 получим, что оптимальные стратегии здесь те же, что в за.- даче 4.11, а наилучшие гарантированные результаты полу- чаются из соответствующих результатов задачи 4.11 возведе- нием в квадрат. 4.13. а), б) Г(М) = 0. Действительно, W(M)>0. С "другой •стороны, для произвольной стратегии 1с е М, по теореме Брауэ- ра [21, с. 91 ], найдется у0^К:х(у0) = у0. Поэтому minW(х,у)< У€К <W(x(t/0),у0) = W(y0, у%) = 0, откуда W(М)< 0. 4.14.J0 W (М0) = - 1, х0 = 0; б) W (М) = 0, ха (у19 у2) = 1, i/2 >0, xa(ylt у2) = — 1, у2 < 0; в) W(MR) = 0, х0(уг> у2) = —уг\ г) W(MR) = 0tx0(ylty2) =j J' Vt>^ д) W(MR) = -l, \ — 1, y2<0; jc0 = 0. Действительно, пусть x^Mr и х(у1У—#i) = *. Тогда min W(x, yv y2)< min W(x, yi9 y2) = min (y1(x — y1)) = <yi.y*)eN (У1,у2)ем —\<yt<i = -1-|jc|<-1. 141
e) W(MR) = 09xo(yvy2) = Действительно, (У2 — У1* ]и% — Уг\]< К — 1. Уг- Уг> 1, I 1, Уг — У2< — 1. 4& |Л — й|<1 W(*o» Л. 4fc)> j Уз(— 1 ^ Л), Л —и > 1 > о. й(1-гй), Уг — У2< — 1 ж) Г(ЛГ*) = -1,*0 = 0. 4.15. Критерий эффективности где I 0, \t — у\>г а) Если е > 1/2, то х0 = (1/2, ... , 1/2), №(/VI0) = m. Если s< 1/(2т), то любая стратегия оптимальна, так как га- рантирует 0 попаданий. Пусть — < е < -, где / — целое, 2 < / < т. Опти- мальна стрельба на прицелах 1'(2/), 3,(2/),..., (21 — 1)/(2/) по [т/1] выстрелов на каждом, остальные т — [mil] I выстрелов не уве- личивают эффективность стрельбы. Наилучший гарантированный результат равен [mil]. Оптимальная стратегия не единственна, если < 8 < . 2/ 2(1 — 1) б) Если — < е < , I — целое, 2 < / < т, то наи- лучший гарантированный результат равен т — / — 1. 4.16. —- < 8 < /= 1, 2,.... Обозначим через- 2/ 2(1 — 1) г сро смешанную стратегию оперирующей стороны (соответст- вующую функцию распределения), состоящую в том, что с равными вероятностями 1/1 производится по т выстрелов на прицелах , -—, ... , ———. Через г|?о обозначим функ- цию распределения неконтролируемого фактора у, соответ- ствующую нахождению у с вероятностью 1/1 в точке i/(l—1)* i=0, 1,..., /—1. Нетрудно убедиться, что W (х, ф0) < у- < W (Ф0, У), х е= М0, У ^ N. 142
Отсюда следует, что <ро — оптимальная стратегия, а т/1— наилучший гарантированный результат. 4.17. Пусть 2e=d, l/U^d<l/(l— 1), / — целое, непремен- но Ж/, a=[m/l]f b=m—al. а) Оптимальна следующая стратегия: в точки 0, 1/(1—1), 2/(1—1),..., (Ь—1)/(/— 1) направляется по а+1 боевых еди- ниц, в точки Ь/(1— 1),..., (/—1)1(1—1) = 1 — по а боевых единиц. Наилучший гарантированный результат равен т—k, где k=na+min (/г, Ь). Действительно, если применяется описанная стратегия, то одно укрепление может уничтожить боевые единицы, сосредо- точенные лишь в одной точке, поэтому общее число уничто- женных боевых единиц не превосходит k. С другой стороны, обозначим через т19 щ,... ,m/_i, mt ко- личества для произвольной фиксированной стратегии боевых еди- ниц, сосредоточенных на промежутках [0,1//), [1//, 2//), ... ...,[(/—1)//, 1]. Имеем Vmj = m, и пусть (без ограничения общности) щ >/Я2 > ... >/Я/. Тогда противник, разместив ук- репления в точках 1/(2/), 3/(2/),..., (2л— 1)/(2/), уничтожит не ме- П f п нее V т( боевых единиц. Осталось доказать, что V т^>А. *=1 1=1 п п Пусть 2 mi < *> Т0ГДа V я*; < я (а + 1)я» следовательно, тл < < (а + 1), откуда а > mrt+i ^... > mz и V mt- < (/ — п) а. I Имеем V /я, < Л + (/ — п) а < la +■ 6 = m — противоречие. *=i б) Обозначим через ф0 смешанную стратегию оперирую-* щей стороны (срответствующую функцию распределения), состоящую в том, что все т боевых единиц направляются в точку il(l—\) с вероятностью 1//, t=0,1,...,/— 1. Через лрь обозначим функцию распределения неконтролируемых фак- торов, соответствующую нахождению укреплений в точках одного из / наборов / J 3_ 2/1 —1 \ / з 5 2/1+1 \ \Ш9 21 •••••—И-J4 2/ ' 2/ "•" 2/ J"" • / 2Г--1 1 2Л--3 \ причем каждый из наборов может встретиться с вероят- ностью 1/1. Пусть, как обычно, х= (хи..., Хщ) еЛ10 — контро- 143
лируемые факторы, у= (уи ..., уп) е# — неконтролируемые факторы, W(x, у) — критерий эффективности (число прорвав- шихся боевых единиц). Нетрудно убедиться, что тогда W(x,%)<m--^<W(%iy)t хееМ,9 y<=N. Это значит, что фо — оптимальная стратегия, а т—mail — наилучший гарантированный результат. в) Пусть оперирующей стороне стало известно, что боевые укрепления находятся в точках ylt ... , уПх. Пусть множества [О, 1J\ U [yi — в, У; + в] состоит из р промежутков (ah pt) (мо- жет быть, [аь р,) или (а,, pj); s< = р; — о, > 0; -^ < d < —&- /> — целое; б,- = s ^ [ГХ)—; х(1 = щ + 6„ хй = а,- f 26t- -f d,... ...,^/, = «£ + /^,+ (4— l)rf=P< —«Ь '= 1..-..P, / = /! + ... ...+/p; a = [tn/l], b = m — al, k = (n — n^)a-\-mm(n — nx, b)* Оптимальная стратегия состоит в том, чтобы в & из точек хць l^j^lu l^t^p, направить по а+1 боевых единиц, в остав- шиеся /—b — по а единиц. Наилучший гарантированный ре- зультат равен т—fe, где / минимально, т. е. соответствует, на- пример, такому расположению известных укреплений: t/i=e„ #2=3е, ...,i/rt| = (2rti—1)е, т. е. * ""* <d< 1^^ • г) Наилучший гарантированный результат равен max(w— -/2,0). 4.18. Согласно результатам задач 1.8 и 1.9 необходима найти Wx (М) = min min max max (Л — /?,ы, — qfi9 0) 0<С<В u£U(C) \<t<n И W2 (M) = min max max (A — p4- min (S, a) 4- e,), 0)> где £/' = {и'<£"! £«£==« + J>, 4>°> 1= 1,...,я}. Если W1 (M) > 0, то Ц7 (M) = min min max (А — р^щ — q(C). 0<C<B nGtf(C) l<f<n Без потери общности будем считать, что qi^qz^ — <^.9п- При фиксированном С согласно принципу уравнивания [8,. с. 267] для минимизирующего ueU(C) найдется номер К 144
такой, что 1<Л^л, A—piUi—qiC=A—piUt—qiC, fe2,...,ft, щ=09 i=k+l,...9n. Отсюда нетрудно вывести, что •+«(£*-') Wx (М) = min max | max I л <-i Si Если T!iL>l, k=l п, Wt (М) = max (А — ргВ, 0); к если V —< 1, k= 1,... ,я, то Гх(Л1)=/гаах Л -—, 0\; S* если найдется номер £0 такой, что 2<£0<л — 1, S-<1'SiL>1''ro^^)= *«i *=i = max / A - — ^ , 0 Em*' Пусть теперь без ограничения общности р1е1<р2е2< ... <рЛеп и Ph<Pi.< .•. <Л„- Если Р1ХВ^ ~^-<2 Se" то Wa (М) в == max (A — ptlB, 0), а если ^-2 "Ч *>Bt-t>2Tei' f=2 7 *=1 145
то И72(М) = тах| max I Л Ц t=k+1 \, 0 |. i<*<n i Y— *=■! 4.19. a) F(M0) = -£-, *0 = 1; F(M) =-^-, *eO) = *a(5) = 2, 7e(2) = 3, жл(3) = ?в(4) = ^(6)=1; F(M«) = 4, "£ (1) = x0 (2) = *0 (5) = 2, *o(3)=*o(4) = *o(6) = l. 6)] F(M0) = -^, jc0 = 3; F (M) = -^-, £ та ж€, что в а), _ Q7 ~ ~ ^Шл) = —-. х0 (г) = 3, г = 1, 2, 5, *0(z) = 1, z = 3, 4, 6. i 4.20. а) F(M0)= max fl* — z|dz= max (— + ^-^) = —, jr0 = 0, 1 — оптимальные стратегам в M0, х0(г) = '■*<i. 0,*>f -оптимальная стратегия в М, F(M) = (\max|x — z\dz = —. о 6) F(MR) = max Г |x — z\dz+max [\x — z\dz = ^rw (Xjc<1J 0<*<1 J 16 0 1/4 0. *s[^-, l]. X0 (2) = в) F(Ai*)=-*-, %(*) = 1. *<f' o. «>f. 146
4.21. a) F(M0) = —, аг0 = 0; 1 — оптимальные стратегии; з F(M) = -1-, *0(z) = 1. *<f. о. *>4-. <5) ^(М*) = -|-, *„(*) = в) *М»)=™. *0(z) = j 0, ««fr1]' 1. .<-f. 4;22. а), б) F{M)=F(M), стратегия 1, 0<2<а, *(*) = -f^. а<2<р, р—а 0, p<z<l является е-оптимальной при достаточно близких к 1/2 над- лежащим образом выбранных а, р. 4.23. a) F(M0) = ±, *0=1; б) F(M)=-1, *(*!.%)«{ _|' 2г>0* z2<0; в) F(M*) = -к Ч = 1: 4 г)/ЧЛОД=4'^(г1' / 1, *>0, I 4.24. a) W*(M0)= max min -t-VAix, у + г) = — x0 = 2; дс=1,2 y=l,2 2 ^J 2 1 tf) Г(М) = min-Lyi niax^(jc, y+2) = 4"^ y=l,2 2 ^J *=!,2 2 *o0.0)=*0(2, 1) = 2, *(2,0)=*(1. 1)=1; 147
1 в)Г(М*)= max min ±.Ул(х,(г), y + z) = ±, С 0>i^ *i-^ut\ .. i о 2 ^* 2 £6{£iZ-»M>) V=1.2 2 2=i0 *.o(0) =*.o(l) = 2; l r) W{MR) = min max —YA(x,y + z) = 2, V-1.2 *=1.2 2 AJ *o(L 0) = £(1,1) = 1, *0(2,0) =*0(2, 1) = 2; д) Г(Л1«) = -?-, *0(1,0) = ж0(2, 1) = 2, *0(1, 1) = *,(2,0)=1. i 4.25. a) W(M0)=]max±YminA(x,y + z)=-±,x0=li *=1,2 2 ^y=l,2 2 z=0 1 6)fp(M)=— У min max4(*,*/ + z) = 3, 2 -£J ^=1,2 *=1.2 г=0 *(1.0)=£(2. 1) = 2,~*00, 1)=^0(2,0)=1; l в) Г(М*) = — V max Mn A(x, y + z) = 0, 2 AJ ^=it2 y=1.2 2=0 *o(l,0)=:*0(2,0) = l, *0(1, l)=x0(2, 1) = 2; 1 г) Г(МЛ)= max ±Y minA (x,(y), y + z)=l, *.o0) = l, *.o(2) = 2; д) W(MR)=3,x0(l,0)=x0{2, 1) = 2,*0(1, 1) = *0(2,0) = 1 4.26. a) -L; 6) 3; в) ±; г) ±; д) 3; e) A. 4 4.27. a) W= max min V* co2F(x, z) = *=1 4 ©€S4 ^J = max min F (x9 z) = 1; Х-Л.....4 2=1.....4 148
б) W =[min max V<d,F(*, z) = — (необходимо решить ©6S4 Гх=1 4 ^ 9 2=1 матричную игру F). в) W = max min f — F(*, г) +l— F (x, 4)) = -Ь *=1 4 2=1,2,3 \ 4 4 /2 3 r)r=min max f— Y4f(jc, z) + -f F(*, 4)) = ©6S, *=1 4 \ 4 ^J 4 У 3 = min max V<d2 f — F (*, z) + —F(*, z)") = -?"Г (необхо- ©€$• *=1 4^ \4 4 / 36 \ димо решить матричную игру (— F (x9 z) + — F (x, 4) j ); V 4 4 'feS* / д) И7= ma* min (±F(x9z) + ±F(x93)+-Lf(xA))=-±; *=1 4 [2=1,2 V 2 4 4/4 2 e»=min max (±Y(*f(x,z) + ±F(xf3)+±F(xA))= ©65, *=1,...,4 \ 2 AJ 4 4 ; 2=1 2 = min max Vсо, (±F(x9z) +-i-F(*,3) + ~r(F(x> 4») = ©€Stx=l 4 AJ \ 2 4 4 / 2=1 = -ii- (необходимо решить матричную игру (т F{x>г)+TF(X>3) 4 TF(*' 4))а^); ж) W = max (— min F(xt z) + -J- min F(x, z)) = 2; *=1 4 \ 2 2=1,2 2 [2=3,4 / 4 з)1Р = min max V©2F(jir, z) = ®654 *=1 4 — (й1+0)1=(0$-}Ч04 2=1 = min max (©, F (*, 1) + (4" — ©Л F (*,2) + «<i),<i/2 *=i > \ \ 2 / «0),<l/2 + ©3^(*. 3) + (-±- -ю8) ^(*. 4)) = (1 7 Зо^+ЮзН , — 3(o3+ —, 5a)! —(o3 + 2, 2 2 (X0)^l/2 149
3©x —3©8-f З] = Lin max [—3©3-f—, 5©х — ©3 + 2, 3©2 — 3©3 ч-3| = = min { min (— 3©3 4 ), min (5©x — <d3 + 2), [(Ul*X* \ 2 / (ot>tt,)6B min (3©! —3©3 + 3)l =2, t.(0s)6C J min 0«Dt<l/2 0<©,<1/2 (0); где ^-{(®1.^)|0<©1<-j-» °<(°3<y> 1(4 + 4©8<з), в = (к, ©3) | 0 <©1 < у, ©3 < у, 10©х + 4©3 >3, 2©1 + 2©3>lj> C={(©lf ©8)|©! >у, Щ>09 2©1 + 2©3<l) (таким образом, вычисление W свелось к решению трех прос- тых задач линейного программирования). 4.28. а), б) W = min V ©, max F(x, г) = 4; в, г) W = — min max F(x,z)+ — max F(x, 4)=—; 4 2=1,2,3 *=1 4 4 *=1 4 4 д, e) Г = — min max F(x, z) + — max F(x9 3) + 2 2=1,2 *=1 4 4 дс=1,..^4 + -i- max F(x, 4) = —; 4 * = l 4 4 ж, з) W = — min max F (x, z) 4- 2 2=1,2 *=1 4 + — min max F(x, z) = 4. 2 2=3,4 jc=1 4 4.29. a) W =» min { max min F(*, 2), max min F (jc, г)}=2; *=1 4 2=1,3 x=*l 4 2=2,4 6)fl7 = min { max (©^(x, 1) + ©3F(*, 3)) 4- ©€S4 x=l,...,4 + max (©2FCv, 2) + <o4rF(*, 4))} = *=i 4 15Q
= min min min {s max (ax F (x, 1) + <x8 F (x9 3)) + (*>t)€S9 (Oi,a$)€Si (ai.a*)6S, *=1 4 .+ t max ((hFSx, 2) + a^F(xt 4)) = *=l,...,4 = min {5 min max (a1F(x,l) + + a3JF(jc, 3)) + * min max {a^F{x, 2) + a4JF(*, 4))} = («1.0(4)6 S» x=l 4 = min (so + to) = min (v, w) = —, (s.06S, 3 где 5 = ©j +(D3, f = ©2 + ©4, ©x = 04 s, ©2 = ctg *, ©3 = (X3S, ©4 = aAt, w = min max (ax F(x, l) + q9F (x, 3)) = — — значение иг- (ObaJeS, x=\ 4 • 3 ры с матрицей (F (x9 z))x=\ 4» 2=1,3 w = min max (<x2 F (*, 2) + a4 F (xf 4)) '= (a,,a4)6Sf x=l 4 31 = значение игры с матрицей (F (х9 z))x=\ 4. 9 2=2,4 в) W = max min (©^(и, 1) + (o2F(vt 2) + Ji,v=l 4 0)!,(02,(0,^0 \ ©i+©1+©i=3/4 + «»/70».3) + ^-F(v,4))- = max (4min(^(n, 1), F(v, 2), F(n, 3)) + 4 ^(v, 4)) = l*.v-l 4 14 4j J = max f^-min ( max min(F((i, 1), F(n, 3)), F(v, 2)1 + V-l 4 I 4 ,U=1,...,4 i + ±Fb,t4)}=±. r) U7= min ( max (^Fix, l) + v>sF(x,3)) + ©i+©i-|-C0t=3/4 + max Lf(i, 2)+ J-/7(^4))} = JC=1 4 \ 4 J ) = min min s max (atF{x9 l) + a3F(x, 3)) + •+©r=3/4 + max ((o2F(x, 2) + JJ- /4*, 4))| = *=1 4 4 J 161
= min \sv+ max (a^Fix, 2) + -±-F(x, 4))] = s,©^o I *-i 4 V 4 /J s+0),=3/4 = — min max {sf (10 + F (x, 4)) + 4 <s'.o')GSt *=*! < + «i(3F(xf2) + F(xt4))}=-7-°'aB5 203 4 60 ' где s9 alt a3, v = 10/3 — обозначения из п. б) решения, s = (3/4) s\ ©а = (3/4) ©J, о' = 203/15 — значение игры с матрицей (10 -f F(x, 4), 3F(x,2) f F(x94))x=x 4. д) W = max min (©^(ji, 1) + ©^(v, 2) + M,V=1 4 <D|,<Dt^0 \ ©1+<D,*=l/2 +-i-F(M) + -J-F<v'4>) = = max (-Lmin(F(n, l),F(v,2)) + H,v-1....,4 I 2 + _Lf(h,3)4.-Lf(v,4))=-^.. e)№ = min / max (^(x, 1) + 4~F(*, 3)Y+ + nfcx fco2F(jc,2) + -7-^(^4))) = *=1 4 \ 4 ) ) = min (max (3©, -1 , 4©., 6©, -\ , 2©. + l) + (Х©!<1/2 V \ 2 2 / ж) W= max min KF(n, 1) + «^(v, 2) +- l».v—1 4 «»6S4: a>,-f«>>>=<i),44i)4 + <u8F(H, 3) + w4F(v,4)) = = JL max {min(F(n,l).F(v, 2)) + min(F(|i, 3), F(v, 4))> =3. 2 ji.v«l 4 ^ з) W = min { max KF(*, 1) + ©3F(*, 3)) + ©6S4J • *=1 4 ®t+ti)ss<Ds+<i>4 + max (©2F(jc, 2) + ©4F(jc, 4))} = *=1, ...,4 152
= min (max (3©, + 2©3f 4©!, 6©x + 2©Sf 2©x + 4©8) + 0<<Dt, 0,<l/2 I + max(- ©3, — 4©1 —3©8, 2—(ot—3(03,3+0)!—7<o,J J = = min ( min (— 2a>t + ©, + 1-), \(©1,©,)€Л \ 2 / min (2©. — со, 4 V min . (7©! — 5©8 + 3)) = — f «di.<d»)6B \ 2 / (at(tt,)GC / 2 где Л «x {(©lf ©3) 10 < 2©A < ©з < 1/2}, В = {К, ©з) 10 < ©3 < -L. (03 < 2©lf 5©х — 4©s < ^ J, C= |(©19c^)|<d1<-j-> °>з>°> 5©х —4©8>-M (таким образом, вычисление W свелось к решению трех прос- тых задач линейного программирования). 1 4.30. a) W = max min f (х — zf d© {г) = 0<*<1 со GO J = max min (jc — z)2 = 0. Здесь й — множество всех функций распределения на [0,1]. б) W = min max f (х — z)* d© (z) = 1/4 — значение игры на единичном квадрате с функцией выигрыша (х—г)2 (оно вычислено в решении задачи 4.12). 1/2 1 в) W= max min (у [(х — z)2dz+ (2 —у) ((х — z)*dz) = «ж<1 «К2 V J J / О 1/2 = max min | — ух 1—у+х2 — ДМ ^=—. «х<\ 0<К2 \ 2 * 4 у 2 ^ 12 / 12 1/2 1 r) W = min max (V Ux—z)*dz+ (2—у) Г(*—zfdz\ = —. «р<2 0<*<1 \ J J /3 0 1/2 1 д) W = max min f (* — z)2d©(z), где Q —множество таких 0<др<1 co€Q J 1 функций распределения © на [0, 1], что fzd©(z) = 1/4. В силу 15S
выпуклости функции (х—z) 2 по 2 и неравенства Иенсена [25, с. 193] минимум достигается на функции распределения (1 \ 2 9 4 / 16 е) W = max min \ (x — z)2dto(z) = 1/16, где Q —множество 1 таких функций распределения со на [0, 1], что Г г^со (г) ^ 1/4. о 1 ж)Ц7= max min Г (х — z)2dco(z) = max f* ) = „ 0<*<1 [©€QJ 1/4<*<1 \ 4 / 16 о где ft— множество таких функций распределения © на [0, 1], что ГяЬо(г)< 1/4. 1/2 4.31. а, б) Г = —; в), г) Г= min (у Г (1— г)Чг+ 4 0<!<2 \ J О 1 1/2 + (2-#) jz2dz) = ^-- Для Д). е)> ж) Г=™£ (j(1~ — г)аЖо(г) + I 22d(D(z)J, где ft — множество функций распреде- г 1/2 ления на [0, 1], удовлетворяющих соответствующему интеграль- ному ограничению. . * д) W = -4-, е) Г = —, ж) Г = -4-. Указание: . 16 4 16 заметить, что подинтегральная функция представима в виде max(z2, (1—г)2) и воспользоваться неравенством Иенсена [25]. 1 4.32. a) W = — max min Г г (х + у) dz = 0; 2 *6[-U] уес—Li] J о б)№ = max min min (р \z(x+ y)dz + xei-Li] p6[o,i] убс-м] \ J Г54
о в) W= min max min (p f z(x + y)dz + p6(o.i] *6[-i.u »e[-M] V J i + (l-p)^z(x + y)<b)J=0, х0(р,У,г) = \ 1.0<p<-i-, -1. 4-<P<1- r) flP = min max (p \z{x + y)dz + p€[0.1]. »6[-l,l] *6t-M] \ J t + (l-p)jz(* + </)dz) =0, x0(p, y,z) = 1, 0<p<-y, -1,-г<Р< Ь U д) № = min (p \ max (г(* + */)Wz + Р€СР.1].У6[-1Л]\ jJ*€[-M] l + (1—p)f max (*(* + y))<fe)=0. *o (P> У> z) = -1, -l<z<0, 1, 0<z<l. 4.33. a) W (M0) = — 2, № (M) = 3, W(MRl) - — 2, Г(А1Л)=0, Г(М«,)=1; 6) У.(M0) = 1, *0 ;= 2; Г.(М) = 4, -*0 (1) = x0(3) = 1/ x0 (2) = 2; Г. (Af«.) = 3, x10 (1) = *10 (2) = 1, *1? (3) = 3; W7. (Mr,) = 4. £• (1) = *o (3) = 1, Uo (2) = 2; №. (MR,) = 1, 156
в) W.(Mo) = 0, х0 = 1; г) W.Wo) = -2, х0 = 2; Wl(М) = 4, х0(1) = Г0(3) = lr Г0 (2) = 2; И7. (Мл.) = - 2, *м = 2; Г. (Л*л) = 4, *го (1) = £„ (3) = 1. *20 (2) = 2; V. (Мл) = 1, *8оО)=1> *зо(2) = *зо(3) = 2. 4.34. a) W.(M0) = 0, х0= 1;*^,(Л1) = 3,^(^ = 1/, у = 1,2,3; Г.(Л*Л,) = 3, £0(1)=*10(2) = 1, £0(3) = 3.; Г.(Мл) = 0, £,0) =^о(3) = 1, йо(2) - 2; Г,(МЛ$) = 1, *.0)=1. х9о(2)=хао(3) = 2. б) Обозначим №ф (Л40) = W0, Wt (М) = W, W, {MRl) = Wk,k = = 1. 2, 3. ш <Хе<1/2 1/2<8<1 1<8<5/2 5/2<е £ 1 0 —2 -2 •* 2 1 2 2 » 4 3 3 3 7 i i i i | S 1 3 3 3 £ 3 3 3 —2 1 1 1 | 2 S 3 3 3 2 к" 4 0 0 0 1 S «■4 1 1 1 1 s 2 2 2 2 * 1 1 1 1 1 e 8 2 2 2 2 4.36. Указание: см. решение задачи 1.3. Ответ: наилучший гарантированный результат в играх Г1 и Г2 для первой страны одинаков и равен max VM,(-^~fl где максимум берется по всевозможным перестановкам ин- дексов 1,...,т. 4.36. a) Wi{M)=max(mm(K, D—/С), 0) (&—а). б) Если 2 min(/C, D) >Д то 156
Wi{M)= ВЧЬ-а)\ если 2 min (/C, D) <Df то Wx (M) = {b — a)(D- min (K, D)). 4.37. Наилучший гарантированный результат первого игрока в игре Г равен sup inf F{x, у), где В(х) = {ye N\G(x, у) = = maxG(*, и)}. а) Максимум функции inf F (дс, у) легко найти графически* У€В(х) Он равен 2 и достигается при х0 = 3. б) Функция inf F (х, у) терпит разрыв при х0 = 4. Оптималь- нее*) ной стратегии нет, существует лишь е-оптимальная стратегия хг =4+е, е>0. Наилучший гарантированный результат пер- вого игрока равен 5. 4.38. a) W = 3/2, е-оптимальная стратегия игрока хв:хг{у) = \ . е>0. О, УФ±-* 2 б) W=2, оптимальная стратегия первого игрока х0:хо(1)=^(2)=2,^(3)=Хо(4), = 1. Указание: для решения задачи воспользоваться теоремой. Ю. Б. Гермейера [9, с. 183]. 4.39. а) Решением является оптимальная стратегия в иг- ре Г1, где Af0=[0, оо); ЛГ=[0, а), т. е. х0 = Vcb/a^Наилуч- ший гарантированный результат Центра равен (Vac — Vb)%. б) Оптимальное премирование находится из игры Г2, где N=[0, а); Л10=[0, оо), так как Центр будет знать объем сверхпланового продукта к моменту выплаты премии. При- меняя теорему Ю. Б. Гермейера [9], получаем *г(У) = Ъ In ( —) +в, если у = а , 0, если у Фа- . (У Наилучший гарантированный результат Центра равен ас — Ь — Ь\п (^-\. 157
4.40. Информационная функция позволяет во время опе- рации точно установить интересы противника. Положим для reERh Nk(r) = {tj€EN\R(k,y) = r}t *e=S; Lk = max min max Wk(x, y)\ Dk = {(*, r)<=MQxRk\ max Wn(x, y) >Lk); Rl = {r<=Rk\Lk = min max Wk(xf y)}; x€M0 yGNk{r) Nk(r,x) = {yt=Nk(r)\Wk(x9y)= max W^x.yJ); yi£Nk(r) Kk = max min W(x, у), если Dk=£0, (x,r)GDk yeNk{r,y) -oo. если Dft=0, Tk = min max min W (x, y). r£Rk xeMo V€Nk(rtx) Наилучший гарантированный результат равен min max (/(*, Tk). Доказательство этого факта аналогично доказательству теоремы 3.13 из [9]. 4.41. Обеим фирмам не имеет смысла производить про- дукцию на сумму, превышающую покупательную способ- ность рынка С, поэтому в дальнейшем будем предполагать ^ез.ограничения общности, что px^.Ct qy^C. рх — ах, p<q, C — qy) — ax, p>q; б) min W (jc, p, y, q) = min (px9 max (C — pK, 0)) — ax; *)W(x,p,y,q) = \pX. **' I min (px, y*Q в) max minW(x, p, y, q) = { x,P У»Я [(VC-VaK)\C<4aK, С > 4aK; i-°K> r) min maxW(x, p, y, q) = aK\ и.я *.p 2—• Хг (p, q) = [ min(/C, j, \Ж t ^i < К C — qy b 158
<*<->= i V£<t где X± = sup W (x, p, y, q) = (q — a) min (K, — ), *.p \ Я I Я2= supW(x,p, y,q) = (C-qy) (1-"f"). P>Q д) В случае отсутствия информации наибольшая гаранти- рованная прибыль— 16 млн. р., оптимальное производство — 6 млн. бутылок, оптимальная цена — 62/s Р- В случае полной информированности наибольшая гаран- тированная ПрибЫЛЬ — 284/9МЛН. р. 4.42. а) Оптимальная стратегия х°: x°t = 0, t = 1,... , 7\. т - наилучший гарантированный результат W(M) = (V Dt — i0W- Таким образом, если себестоимость продукции не меньше неустойки, то для минимизации расходов продукцию не сле- дует производить совсем. б) Пусть ** — произвольная оптимальная стратегия. Покажем* что для j? необходимо выполнено: x] + tfLi<Dtt t=lt... tT— 1, xt+it-i = xI, где хт = —. В самом деле, если хт + *r-i =■ хт> то зат- Y + P раты на последнем отрезке времени "составят а(хт — fr—i)+ + y(Dr — *т). Если хт + tV-i >*т> то в худшем случае (при ут = dr) затраты на последнем отрезке возрастут на величину (хт + tr—1 — хт) (а + р) по сравнению с затратами при хт 4- *V-i= = Xj. Если Xj + tV-i < Xj, то в худшем случае (при ут = Ьт) затраты на последнем отрезке возрастут "на величину (хт — Хт — — fr-i) (Y— а)« Таким образом, для оптимальной стратегии х* необходимо выполнено хт -г tV—i = хт. Неравенства х) + i/_i < < D*, / = 1,... , Г— 1 отражают простой факт: незачем произ- водить лишнюю продукцию, поскольку ее нужно хранить. По- кажем, что^для произвольной (не обязательно оптимальной) стратегии х наихудшим является вектор у0 такой, что t/} = Dty /=1,..*, Т—1. Действительно, в силу выпуклости критерия W(x, у) для наихудшего у0 tf\ совпадает либо с du либо с Dti /=1,..., Т—1. Но если t/> = dt9 то на следующем^ (/+1)-м, отрезке оперирующей стороне можно производить, продукции на Ц меньше, чем в случае, когда спрос на /-м от- 159»
резке удовлетворен полностью, так как (J<a^ Отсюда сле- дует, что оптимальная стратегия х° такова, что*?+ it-x = Di9 /=1,..., Т— 1, х£ + /г—1 = х*т и наилучший гарантированный результат равен г(до-.(5>+4-*)+ *^z+L. 4.43. а) Положим М[ = {1, 3, 5}, Af* = {2, 4}, тогда W (М) = max min max W (xf у) = 3. a=l,2 yGN x€Ma б) Положим Nl = {1, 3, 5}, N* •= {2, 4, 6}, тогда W(M) = max min max min W(x9 y) = 2. cc=1.2 (J-1.2 ,€Afa ^^0 в) Пусть Ea — операция взятия математического ожида- ния случайной величины, зависящей от случайного парамет- ра а, принимающего значения 1, 2 с вероятностями 1/2; Elyt JE^ — операции взятия математического ожидания случайной величины, зависящей от случайного параметра у, принимаю- щего с вероятностями 7з значения соответственно из мно- жеств #*= {1, 3, 5}, ЛГ*= {2, 4, 6}. Тогда W (Щ = Еа min max Е* W (х, у) = 3. 4.44. Докажем, что v = Пусть для определенности гп>п. Очевидно, что второй иг- рок, выбрав на первом шаге /, реализующее min max aih обеспечивает себе проигрыш не более v. Остается указать стратегию первого игрока, обеспечивающую ему выигрыш не менее v. Обозначим через to(/) одну из реализаций шаха*/. Выкинем из М какое-либо I$E{i\i=io(j)> j^N} и обозначим лолученное множество через Mi. Обозначим через i"i(/) одну из реализаций таха*/. Выкинем из Mi какое-либо i§>E{t|/= =ii(/), j^Ni} и обозначим-полученное множество через М2 и т. д. Из процесса построения множеств Мь. видно, что maxa//= max а## для j^Nk-i. Последнее означает, что пер- 160 Э-1.»*ел1« max min aih min max a£h 1$N t^M ttl^, /z, ш > n.
вый игрок выбирая на Л-м шаге множество Мц9 обеспечивает себе выигрыш не менее v. 4.45. а) Можно. Утверждение легко доказать примени* несколько раз известное неравенство SiJjf^JjSif, где / — произвольная функция, зависящая от Х\ и tjj. б) Нельзя. Пусть Mi=N}={— 1,1}, F(x, у, z)=xix2yiy2. Тогда SlJiJ2S2F= 1>—l=JiSiS2JzF. Если же ЛГ1=Л^1= = {—1,1}, ЛГ2=ЛГ2={0,1}, F(xu х2, уи Уг, ги z2)=Xiyi+x2y2, то Vi/iV = - 1 < 1 = J&StJtF. в), Для доказательства вместе с неравенством, указанным в решении п. а), следует применить неравенства 4.46. а) Пусть /i=2m+l, положим где *2*+1 —*2f—1^ т+1 '-- <*2Ж< i+t\ > ' = 0,1, ... ,т. т+1 Т т+1 Тогда W(x?) = —. Если же предположить, что существует — т+1 стратегия x=(xlt ... , *2m+i)> гарантирующая результат мень- ший 1/(т+ 1), то *2—*#< ГТ~» ** «^2^' "• • • t^2m+2 — *2w < ^ , -, • m -f-1 Сложив эти неравенства, получим 1 = дсгш+г — *о< *• Пусть теперь л = 2т, положим ^« / 1 1 , Л m m , \ \ т + 1 * т + 1 Т т+1 \ т + 1 ^ J 1 Тогда W(&) = т , -—(- е. Предположим, что стратегия х — = (*j, ... , лг2т) гарантирует результат меньший или равный 1/(т + 1). Тогда x%t —хп-2 < 1/(т + 1), f = 1, ... , т. Сложив эти неравенства, получим Jc2w<m/(m+ 1). Так как Х2т-\*<Хгт> то 1 — Jt2m-i > 1/(яН- 1), а это противоречит предположению. let
€) Если п = 2, то хг = 1/2, дс2 = 1/2 + е. Если я = 3, то #1 — — > #2 — ~Г~> *3 — Если п = 4, *j = 2/5, л:2 = 3/5, Y+8' f(*i)>fiXf) *з = Х4 = 1 f а:3 + е, / (аг3) > max {/ (лг^, / (*2)}, [х2 + е, f(x9)<f(x2), /(^)</(х2). 4.47. а) Пусть jci^x*^ ... ^дсп. Нетрудно установить, что sup W(х, f) = -£-тах {2xlt х2—хг хп — х„-и 2(1 —*„)}, minsup W(xff)= -^-, *«=(-*-, -J- 2/l"^1 V x feUK) V " 2n9 \ 2/i 2n 2n ) б) Пусть x — произвольная последовательная стратегия jc= (jet,..., дгп) — результат применения хк функции, тождест- венно равной 0 на [0,1] (пусть лч^л:2<4 ... ^#п). Положим Д (t) = К min 11 — х£1 Тогда, поскольку fx^L (К), /* (**) = =0, t=l,...,я, результатом применения стратегии дек функ- ции fx является вектор х\ следовательно, sup W(*, /)>№(*, /J = -у-max {2^, jc2 — jcx, ... ... 9хп-хп-и 2(l-xj}>-|k Таким образом, никакая последовательная стратегия не может гарантировать результата лучше /С/2я. 4.48. Задачу отыскания оптимальной квадратурной фор- мулы можно записать следующим образом. Вычислить ве- личину т = 1 inf sup inf sup If/(t)dt — /1, *€[0,1Г *€ 162
где Uy = {f^L(K)\f(xt) = yt,l=\ n), а также значения лг0 и J (x, у), реализующие нижние грани. Для произвольной функции /el*,w <plAt)<nt)<<&.y(t),Je-lo, 1], где 4^(t)^ vain{y,+K\t-x,\). Нетрудно убедиться, что ф^ , q£ е £*,у. Следовательно, 1 1 sup и/(/)Л-/| = шах{ия^(*)Л-/|. |J^(0«-/|}. О Предполагая, что хг < л:2 < ... < лгл, имеем 1 1 г* /=2 a«.li,<o*-/l-T(i<.w*-j*.«*)= '''о о о /*2 -(t/,-*//-,)2) + -f (1-*„)2. Для получения последнего равенства достаточно вычислить полусумму площадей двух равнобедренных треугольников с вершинами (хи */i), (*п, Уп), основаниями, лежащими на пря- мых /=0, /=1, и боковыми сторонами с угловыми коэффи- циентами ±/С, а также п—\ параллелограммов, /-й из кото- 163
рых определен двумя вершинами (#j_i, t/j-i), (xj, t/j) и угло- выми коэффициентами сторон ±/С, /=2,..., п. Теперь не со- ставляет труда найти дс0. Очевидно, что - к г* 4- sup inf sup \ / (t) dt — J yeix JeE* f€LXty IJ n +^E(*/-*/-i>i+4-(1-*«>i- /«2 верхняя грань при этом достигается при таких у> что t/i= ... = t/n. Максимизируя по х правую часть равенства, находим - ( * 3 2п — 1 \ *°~1 2/1 ' 2/1 ' ••• ' 2/t J' 4.49. Пусть г = ———, целое I определяется из условия 4/1 Тогда (2i-l)jr<±(2i + l)jr>± *|+1 = — + 2 / ^4-2 = #*-н и——» • • • * хп— Xi+\ н , наилучший гарантированный результат равен г. 4.50. Для доказательства достаточно рассмотреть такую функцию/, что f(Xi+i) /(аг)<0, если *i+i—аг>Ьг— *i+i; /(Хг+1)/(6г-)<0, если хг-+1—cn<bi—дсг+i, где (а*, 6i)— интер- вал локализации корня после i шагов поиска, дсг+i — выбор оперирующей стороны на (*+1)-м шаге. 4.61. а) Пусть Г школьников уже сделали разрезы, l<t< <я—1 и торт разрезан на доли величиной дс/, ../,jc|:0< i <х\ < А < ... < х\, V х\ = 1. Положим xt = (дс/, ... , х\). /=1 Стратегию (t + 1)-го школьника можно тогда описать как выбор вектора *w (хс) = д,+1 = (*/+ь ... , *Ш), такого, что *^ь ... ... , лс'+l — упорядоченные в порядке возрастания числа х\9... ... , х[~\ a, xi — а, */+1 *', где 0<а<х£, 1 < / < i. 164
При этом можно считать, что, выбирая себе кусок торта, каж- дый школьник берет наибольший^из оставшихся. Функция выиг* рыша f-ro школьника тогда tWc(х) = х«"~/+1, <=1, ... ,л. Опишем одну из ситуаций равновесия. Второй школьник отрезает долю x2=1/ai. Если все предшествующие отре- зали 1/я, то (&+1)-й отрезает 1/п. Если k-й впервые отрезал не 1/пу то в случае л£< 1/п оставшиеся школьники делят долю х{ на п—&-t-l равных долей, в случае же х$~1 > 1/п остав- шиеся школьники делят х% нал — й+1 равных долей х\<\1п. б) Для упрощения обозначений пусть х — наименьшая из долей, на которые разрезает торт второй школьник. Если *>1/3, то выигрыш третьего максимизирует единственная стратегия — разделить долю 1—х пополам. При этом второй получит (1—дс)/2. Отсюда видно, что ни один дс>1/3 не входит ни в одну ситуацию равновесия. Пусть л^1/3. Тогда максимальный выигрыш х третьему игроку доставляют лишь те стратегии, которые состоят в разрезании доли 1—х на две, меньшая из которых больше или равна х. Обозначая эту меньшую долю через у(х), имеем х^.у(х)^:(1— х)/2, 0^x^1/3. Выберем любую такую функ- цию у, определенную на [0, 1/3]. Положим #(х) = (1—х)/2 лри хе [1/3, 1]. Выберем любое такое дс0, что 1/(л:0)= max у(х). <Х*<1/3 ^ Проведенные рассуждения и тот факт, что у(х) — выигрыш второго игрока, показывают, что (дсо, у) — ситуа- ция равновесия, ситуаций равновесия другого типа не сущест- вует. в) Наилучший гарантированный результат первого школьника равен 1/п9 второго — равен 1/[2(я — 1]), остальных — равен 0. 4.52. Рассмотрим отображение Y:M0-+-2Nt * Y(x) ~ {t/e N\G(xt у) = max G(x, и)} и абсолютно оптимальную стратегию уа второго игрока (ya(x)s €F(4 хеМ0), удовлетворяющую условию F(*> Уа(*)) = ma* F(*f У)> Х€=Мй. yeY(x) •Отображение Y и функция max F(x,y) полунепрерывны сверху y€Y(x) на М0 (см. задачу 3.7), и потому найдется х0еМ0, такой, что F(x0t Уа(х0)) = max F(x, уа (х)). Ситуация (х0, #д) является ситуацией равновесия в игре Г1. 165
4.53. 08 = V.= I, 0</<-f, 4 1 ' Sl< l 1 1 S l<± T-T<l<1' /, о < i < _i_ is* -L ±sis'± 16' 16 ^ ^ 8 * 1 l si< 1 -L -Lsi< l T'T<;<T' T*T</<T' T'T</<1' f9 = o« = 1 ' S 1 <Г X 1 l s к l T'T<1<1> — — <l < — 32' 32 16 ' 1 ! si <? l 1 l SI < 3 1 3 Si < l ЛИТЕРАТУРА 1. Айзеке P. Дифференциальные игры. M., «Мир», 1967. 2. А к о ф Р., С а с и е н и М. Основы исследования операций. М., «Мир»,. 1971. 3. Беллман Р. Динамическое программирование. М., ИЛ, I960. 4. Вагнер Г. Основы исследования операций. Т. 1—3. М., «Мир», 1973* 5. В а с и л ь е в Ф. П. Лекции по методам решения экстремальных за- дач. М., Изд-во Моск. ун-та, 1974. 6. В е н т ц е л ь Е. С. Исследование операций. М., «Советское радио», 1972. 7. В о р о б ь е в Н. Н. Теория игр. Лекции для экономистов — киберне- тиков. М., Изд-во Ленингр. ун-та, 1974. 8. Г е р м е й е р Ю. Б. Введение в теорию исследования операций. М., «Наука», 1971. 9. Гермейер Ю. Б. Игры с непротивоположными интересами. М., «На- ука», 1976. iO. Гнеденко Б. В., Коваленко И. Н. Введение в теорию массово- го обслуживания. М., «Наука», 1966. 11. Грень Е. Статистические игры и их применение. М., «Статистика»,. 1975. 166
12. Данскин Дж. М. Теория максимина. М., «Советское радио», 1970. 13. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс. М., «Наука», 1972. 14. И о ф ф е А. Д., Тихомиров В. М. Теория экстремальных задач. М, «Наука», 1974. 15. Карлин С. Математические методы в теории игр, программирова- нии и экономике. М., «Мир», 1964. 16. Карманов В. Г. Математическое программирование. М., «Наука», 1975. 17. Карр Ч., Хоув Ч. Количественные методы принятия решений в управлении и экономике. М., «Мир», 1966. 18. Кофман А., Дебазей Г. Сетевые методы планирования и их при- менение. М., «Прогресс», 1968. 19. Мак-Кинси Дж. Введение в теорию игр. М., Физматгиз, 1960. 20. Моисеев Н. Н. Численные методы в теории оптимальных систем. М., «Наука», 1971. 21. Никайдо X. Выпуклые структуры и математическая экономика. М., «Мир», 1972. 22. Оуэн Г. Теория игр. М., «Наука», 1971. 23. Понтрягин Л. С, Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процессов. М., Физматгиз, 1961. 24. С а а т и Т. Целочисленные методы оптимизации и связанные с ними экстремальные проблемы. М., «Мир», 1973. 25. Ф е л л е р В. Введение в теорию вероятностей и ее приложения. Т. 2. М., «Мир», 1967. 26. Ч е р н и к о в С. Н. Линейные неравенства. AJ., «Наука», 1968. 27. Ш кур б а В. В. Задача трех станков. М., «Наука», 1976. 28. I s b е 11 I. R. An optimal search pattern. — «Naval. Res. Logist. Quart.», 1957, 4, p. 357—359.
ОГЛАВЛЕНИЕ Предисловие 3 Некоторые теоретические сведения и обо- значения . . 4 ЗАДАЧИ Глава 1. Составление моделей операций и оценка эффек- тивности стратегий 9 Глава 2. Оптимальные стратегии в операциях без неопре- деленных факторов 30 Глава 3. Задачи на минимакс и седловые точки ... 41 Глава 4. Оптимальные решения при различных вариантах информированности 57 ОТВЕТЫ И РЕШЕНИЯ Глава 1. 71 Глава 2. 98 Глава 3. 115 Глава 4. 139 Литература. 166 ЗАДАЧИ ПО ИССЛЕДОВАНИЮ ОПЕРАЦИЙ Зав. редакцией А. А. Локшин Редактор О. В. Семененко Обложка художника Р. X Абрамова Технический редактор В И. Овчинникова Корректоры Л. А. Айдарбекова, И. А. Мутников а ИБ № 703 Тематический план 1979 г № 79 Сдано в набор 20.04.78. Подписано к печати 18.10 78 Л-115652 Формат 60X90'/i6 Бумага тип. № 3 Гарнитура литературная. Высокая печать Усл. печ. л. 10,5 Уч -изд. л 10,47 Тираж 7630 экз. Зак. № 373 Цена 35 коп. Изд. Mfe 520 Издательство Московского университета Москва, К-9, ул Герцена, 5/7 Типография Изд-ва МГУ Москва, Ленинские горы
УДК 519.9 Печатается по постановлению Редакционно-издательского совета Московского университета Рецензенты: Чл.-кор. АН СССР Я. Я. Моисеев, проф. Я. С. Краснощекое |Ю. Б. Гермейер,! В. В. Морозов, А. Г. Сухарев, В. В. Федоров. Задачи по исследованию операций. Учебное по- собие. М., Изд-во Моск. ун-та, 1979. 167 с, 13 ил., библиогр. 28 назв. Задачник содержит как упражнения, полезные при первоначаль- ном ознакомлении с основными понятиями и результатами теории ис- следования операций, так и задачи повышенной трудности, рассчитан- ные на читателя, обладающего соответствующей математической под- готовкой. Пособие соответствует курсу «Исследование операций», чита- емому на факультете вычислительной математики и кибернетики МГУ. 3 20203~°45 79-79 1702070000 077(02)-79 |(§) Издательство Московского университета, 1979 г.